STATISTIQUE I) Résumé d`une série par le couple (médiane

publicité
STATISTIQUE
I) Résumé d’une série par le couple (médiane ; écart interquartile)
1) La médiane (vue en 2nde) : mesure de tendance centrale
Définition : La médiane Me d'une série ordonnée par ordre croissant partage cette série en deux parties telles que la
moitié au moins prend des valeurs inférieures ou égales à la médiane.
• Si le nombre de données est pair, N = 2p : la médiane est la moyenne des pième et (p + 1)ième valeurs.
• Si le nombre de données est impair, N = 2 p+ 1 : la médiane est la (p + 1)ième valeur.
2) Les quartiles
Définition : Les valeurs d’une série d’effectif N sont rangées par ordre croissant.
N
.
4
3N
• Le troisième quartile Q3 de la série est la valeur xj dont l’indice j est le plus petit entier supérieur à
.
4
• Le premier quartile Q1 de la série est la valeur xi dont l’indice i est le plus petit entier supérieur à
Exemples :
3) L’écart interquartile : mesure de dispersion
Définition :
• L’intervalle interquartile est l’intervalle [Q1 ; Q3 ].
• L’écart interquartile est la différence Q = Q3 . Q1 .
Remarques : • Le couple (médiane ; écart interquartile) est robuste par rapport aux valeurs extrêmes, mais sa
détermination (les quartiles) n’est pas très pratique.
‚ Plus l’écart interquartile est grand, plus la dispersion est importante.
4) Diagramme en boîte
Ces diagrammes s’utilisent pour représenter une série de taille importante où les valeurs extrêmes ne sont pas
essentielles. Les diagrammes en boîte mettent en valeur la dispersion d’une répartition.
xmin ou D1
Q1
Me
Q3
xmax ou D9
3
9
12
14
18
Exemple :
Q3 = 14
Q1 = 9
xmin = 3
xmax = 18
Me = 12
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Statistique 1/2
II) Résumé d’une série par le couple (moyenne ; écart-type)
1) La moyenne (vue en 2nde) : mesure de tendance centrale
Exemple : Soit la série de 20 valeurs donnée par le tableau suivant
xi 6 6 7 8 8 9 10 10 11 12 12 12 14 14 15 15 15 16 16 18
Définition : Soit une série de valeurs xi .
• Sans les effectifs avec un effectif total N:
∑ xi .
x=
N
∑ ni xi .
• Avec les effectifs n i : x =
∑ ni
• Avec les fréquences f i =
D’où le tableau :
xi
ni
fi
6
2
0.1
7
1
0.05
8
9
2
1
0.1 0.05
10
2
0.1
11
12
1
3
0.05 0.15
14
2
0.1
15
16
3
2
0.15 0.1
18
1
0.05
6 + 6 + L + 18
= 11.7 .
20
6 × 2 + 7 × 1 + 8 × 2 + L + 18 × 1
• x=
= 11.7 .
20
• x = 6 × 0.1 + 7 × 0.05 + 8 × 0.1+ L+ 18 × 0.05 = 11.7
• x=
ni
: x = ∑ f i xi .
∑ ni
2) La variance
Définition : Soit une série de valeurs xi .
∑(x − x)
• Sans les effectifs avec un effectif total N: V =
i
N
∑n (x − x)
• Avec les effectifs n i : V =
∑n
i
i
2
.
2
.
i
Remarque : L’utilisation des listes sur la calculatrice est efficace pour calculer la variance. On calcule successivement
les carrés des écarts puis leurs produits par les effectifs. Enfin, la somme de ces produits divisés par le nombre de
données donne la Variance.
3) L’écart type: mesure de dispersion
Définition : L’écart type noté s est la racine carrée de la variance V : s = V .
Remarques :
• Le couple (moyenne ; écart-type) est très sensible aux valeurs extrêmes, mais sa détermination par les formules
précédentes est aisée.
‚ Plus l’écart type est grand, plus la dispersion est importante.
4) Propriété : La moyenne x d’une série minimise la fonction « dispersion autour d’un point x »
∑ n ( x − x)
d :x a
∑n
i
i
2
et le minimum obtenu pour x est la variance V.
i
III) Influence d’une transformation affine des données
Propriété : Soit a et b deux nombres réels, a étant non nul.
Soit une série S dont les valeurs de caractère xi sont affectées des coefficients n i et la série S’ dont les valeurs du
caractère a xi + b sont affectées des mêmes coefficients n i .
Si la série S a pour écart type s et pour écart interquartile Q, alors la série S’ a pour écart type s’ = |a| s et pour écart
interquartile Q’ = |a| Q.
Remarques :
• La série S’ a pour moyenne x ′ = a x + b et pour médiane Me’ = a Me + b.
‚ Cette propriété permet un changement d’origine et/ou d’échelle pour le calcul de l’écart type et de l’écart
interquartile.
Statistique 2/2
Téléchargement