Introduction à la Statistique Inférentielle
5
Les (Xi) sont indépendantes car le processus de choix de toute variable Xi est le même
indépendamment de la valeur obtenue.
ii) tirage exhaustif ou sans remise: l'indépendance est en défaut car par exemple, si x et y
sont deux éléments distincts de l'ensemble {x1,...,xN}, on a P(X2=y/X1=y)=0 car y ne peut
être choisi à l'étape suivante, alors que P(X2=y/X1=x) = 1/(N-1) et donc la loi de X2 dépend
de celle de X1. Cependant, si N est grand comparativement à n, les variables aléatoires
peuvent être considérées comme presque indépendantes. Ceci est illustré par
l'exemple suivant.
Exemple 3: P = {1,...,1000} est notre population de taille N=1000. Un échantillon de taille
n=10 est tiré sans remise. Quelle est la probabilité que toutes les 10 valeurs échantillonnées
soient > 200?
Si X1,..., X10 sont indépendantes et, puisque P(Xi > 200) = 800/1000, i, on a:
P(X1> 200,..., X10 > 200) =
P(X1>200) =
= 0,107374.
Calcul exact: Soit la v.a. Y = nombre de Xi > 200 parmi n. Alors, Y suit la loi
hypergéométrique H(N,n,r) avec N=1000, n=10, r=800, et donc
P (Y=10) = P(X1 >200,..., X10 >200) =
/
= 0,106164,
valeur qui est très proche de celle obtenue sous l'hypothèse d'indépendance
Dans la suite du cours, nous utilisons la définition 1 comme définition d'un échantillon
aléatoire.
1.2 - Statistiques basées sur un échantillon aléatoire
Il est d'usage dans la pratique de résumer les n valeurs x1,..., xn observées d'un échantillon
X = () par quelques caractéristiques simples telles que la moyenne, la variance,
l'étendue, la plus grande valeur, etc. Ces caractéristiques sont elles-mêmes des réalisations
ou observations de variables aléatoires qui sont fonctions de l'échantillon aléatoire X.
Définition 2:
Soit un échantillon de taille n de X et soit T() une fonction vectorielle
définie sur l'espace image du vecteur X=(). Alors la variable aléatoire ou vecteur
aléatoire défini par T=T(X) est appelée statistique. La distribution de probabilité de la
statistique est appelée distribution échantillonnale de T.
Exemple4 :
est une statistique
est sa valeur observée
Remarque:
a) La définition d'une statistique est assez large, mais il est sous-entendu qu'une
statistique ne peut dépendre d'un paramètre.