CHAPITRE 8 Les mesures de dispersion Les mesures de dispersion améliorent la description des séries statistiques en quantifiant l’étalement, la variabilité et l’homogénéité des données. Toutefois, les mesures de dispersion ne se calculent que pour les variables quantitatives. 1. L’étendue 1.1. Introduction à l’étendue. L’étendue, symbolisée par E, caractérise l’étalement d’une série par l’écart entre la valeur maximale et la valeur minimale d’une série E = Vmax − Vmin 1.2. Étendue pour des variables groupées par valeurs. Afin de calculer l’étendue pour une variable quantitative discrète, il suffit de soustraire la plus grande valeur à la plus petite valeur. Exemple 8.1. Trouvons l’étendue. Tab. 1. Répartition des répondants, selon le niveau d’aptitude à la lecture. Niveau Nombre de répondants Cumulatif des répondants 1 17 17 2 23 40 3 55 95 4 155 250 Total 250 E = Vmax − Vmin =4−1 = 3 niveaux 35 36 8. LES MESURES DE DISPERSION 1.3. Étendue pour des variables groupées par classe. Afin de calculer l’étendue pour une variable quantitative continue, il suffit de soustraire la borne supérieure de la classe supérieure à la borne inférieur de la classe inférieur. Exemple 8.2. Trouvons l’étendue. Tab. 2. Répartition des monarques d’Angleterre (roi ou reine) selon la durée de leur règne, 827-1952. Durée du règne Nombre de monarques Fréquences cumulées 0-10 22 22 10-20 16 38 20-30 11 49 30-40 7 56 40-50 1 57 50-60 3 60 Total 60 Source : R. Porkess, Dictionary of Statistics, Londres, Collins, 1988, p.70. E = Limsup − Liminf = 60 − 0 = 60 ans 2. L’écart-type et la variance La description de l’étalement d’une distribution peut être affinée. Pour ce faire, on utilise la variance et l’écart-type qui tiennent compte de l’ensemble des données. Plus l’écart-type est faible, plus les données sont dispersées autour de la moyenne. Inversement, plus l’écart-type est élévée, plus les données sont dispersées loin de la moyenne. 2.1. Le calcul de l’écart-type pour des variables groupées par valeurs. L’écart-type d’une population de taille N est symbolisée par ÍP N σ= (xi − µ)2 i=1 N L’écart-type d’un échantillon de taille n est symbolisée par Î s= P (x − x̄) f k i=1 i n−1 2 i 2. L’ÉCART-TYPE ET LA VARIANCE 37 L’écart-type est la racine carrée de la moyenne des écarts entre les valeurs et la moyenne. 2.2. Le calcul de l’écart-type pour des variables groupées par classes. L’écart-type d’un échantillon de taille n groupées en classe est symbolisée par Î P (m − x̄) f k i s= 2 i i=1 n−1 L’écart-type est la racine carrée de la moyenne des écarts entre les milieux des classes et la moyenne. Exemple 8.3. Trouvons l’écart-type. Tab. 3. Répartition des répondants, selon le niveau d’aptitude à la lecture. Niveau Nombre de répondants Cumulatif des répondants 1 17 17 2 23 40 3 55 95 4 155 250 Total 250 Î Supposons que nous savons que la moyenne est 3, 39 . P (x − x̄) f k 2 i s= i i=1 s n−1 (1 − 3, 39)2 × 17 + (2 − 3, 39)2 × 23 + (3 − 3, 39)2 × 55 + (4 − 3, 39)2 × 155 249 = 0, 91 niveau = Exemple 8.4. Trouvons l’étendue. Supposons que nous savons que la moyenne est 18. Î s= P (m − x̄) f k i=1 s i 2 i n−1 (5 − 18)2 × 22 + (15 − 18)2 × 16 + ... + (55 − 18)2 × 3 249 = 13, 81 ans = 38 8. LES MESURES DE DISPERSION Tab. 4. Répartition des monarques d’Angleterre (roi ou reine) selon la durée de leur règne, 827-1952. Durée du règne Nombre de monarques Fréquences cumulées 0-10 22 22 10-20 16 38 20-30 11 49 30-40 7 56 40-50 1 57 50-60 3 60 Total 60 Source : R. Porkess, Dictionary of Statistics, Londres, Collins, 1988, p.70. Il est souvent très long de faire le calcul de l’écart-type à la main. Il est préférable d’utiliser sa calculatrice. Vous pouvez consulter le guide de la calculatrice sur le site Internet. 2.3. La variance. La variance est le carré de l’écart-type. L’inconvénient de la variance est qu’elle n’est pas exprimée dans l’unité de la variable. 3. Le coefficient de variation Le coefficient de variation permet de comparer la variabilité de deux séries qui ont des moyennes très différentes ou même qui ne sont pas exprimées dans les mêmes unités puisque le coefficient de variation exprime l’écart-type en pourcentage de la moyenne. s CV = × 100% x̄ Le coefficient de variation donne l’homogénéité de la série, si le coefficient de variation est inférieur à 15%, on considère que les données sont homogènes et inversement, si le coefficient de variation est supérieur à 15%, on dit que les données sont hétérogènes.