Geoscience Reference
In-Depth Information
E
N
16.1
Quelques rappels de statistique,
x étant une variable aléatoire.
CART
Moyenne
. Soit
x
, la moyenne de n valeurs de x : x
1
, x
2
, …, x
n
, on a
x
1
++++
n
x
2
x
3
x
n
…
x
=
------------------------------------------------------------
. Cette moyenne est un estimateur sans biais de l'espé-
rance mathématique de x, avec laquelle on le confond souvent.
Variance
. La variance de
ce
s valeurs de x, var(x
i
), est la moyenne des carrés de
leurs écarts à la moyenne
x
n
∑
2
x
i
x
(
-
)
2
2
2
x
1
x
+
x
2
x
+
+
x
n
x
(
-
)
(
-
)
…
(
-
)
var x
()
=
---------------------------------------------------------------------------------------------------
=
i
--------------------------------
=
1
n
n
n
∑
n
x
i
2
----------------x
2
x
2
x
2
i
=
1
on montre que
var x
()
=
=
(espérance mathématique du carré
-
-
de x moins le carré de l'espérance mathématique de x), formule plus simple à
calculer. Sa racine carrée
s
i
est appelée
écart-type
:
À partir d'une série de valeurs d'une variable aléatoire, on montre que
la meilleure estimation de la variance var(x) de cette variable aléatoire est
=
var x
()
σ
i
n
∑
n1
2
x
i
x
(
-
)
i
=
1
donnée par la formule
var
()
=
--------------------------------
et celle de son écart-type
s
par
-
n
∑
n1
2
x
i
x
(
-
)
n
n1
=
i
=
1
=
σ
--------------------------------
σ
i
-------------
-
-
Loi normale
. Beaucoup de variables aléatoires x, notamment les moyennes de
mesures, suivent une loi normale dont la densité de probabilité (y) est représen-
tée par une courbe en cloche dite courbe de Gauss dont l'équation est :
2
xx
(
-
)
-
----------------------
1
2
πσ
2
2
σ
y
=
----------------e
La probabilité, pour une variable aléatoire suivant une loi normale d'être située à
moins d'un écart-type de la moyenne est de 68 % (intervalle de confiance au seuil
de 32 %), celle d'en être située à moins de 2 écarts-types est de 95 % (intervalle
de confiance au seuil de 5 %).
Régression linéaire
. x étant une valeur contrôlée, et y une variable aléatoire
dépendante de x, on montre que la droite qui rend au mieux compte de la rela-
tion entre x et y, avec certaines conditions fréquemment admissibles (en particulier
variable normale, variance constante ou
homoscédasticité
), passe par le point