II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode n Moyenne calculée sur un échantillon =MOYENNE() Moyenne calculée sur la population 81 87 90 94 97 83 87 91 94 97 84 87 91 94 98 84 88 91 95 98 100 102 106 110 116 100 103 107 110 116 101 103 107 111 117 101 104 107 112 117 84 85 88 89 91 92 95 96 98 99 99 101 101 104 104 108 109 112 113 119 119 86 89 93 96 99 86 89 93 96 99 86 90 93 96 99 87 90 93 97 99 101 105 109 113 122 101 106 109 114 123 101 106 109 114 123 102 106 109 115 123 x x i 1 i n N x i 1 i N n x x i 1 n i 10 134 100.34 101 II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Variance/écart-type tronquée Quartiles Médiane Mode =MOYENNE.REDUITE() Avec n=101, une moyenne tronquée de 5 % enlève 0.05*101=5.05 4 (pour préserver la symétrie le nombre de valeurs supprimées est arrondi au multiple de 2 inférieur) observations à chaque bout de l’échantillon. II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Variance/écart-type tronquée Quartiles Médiane Mode 81 87 90 94 97 83 87 91 94 97 84 87 91 94 98 84 88 91 95 98 100 102 106 110 116 100 103 107 110 116 101 103 107 111 117 101 104 107 112 117 84 85 88 89 91 92 95 96 98 99 99 101 101 104 104 108 109 112 113 119 119 86 89 93 96 99 86 89 93 96 99 86 90 93 96 99 87 90 93 97 99 101 105 109 113 122 101 106 109 114 123 101 106 109 114 123 102 106 109 115 123 Moyenne tronquée à5%= 100.25 II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode Médiane=valeur de l’observation centrale lorsque les données sont classées (rangées) par ordre croissant ou décroissant. 1 Rang de la médiane (n 1) 1 2 NB : quand il y a un nombre paire d’observations, la médiane est égale à la moyenne des deux observations centrales (algorithme utilisé par Excel). =MEDIANE() II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode 81 87 90 94 97 83 87 91 94 97 84 87 91 94 98 84 88 91 95 98 100 102 106 110 116 100 103 107 110 116 101 103 107 111 117 101 104 107 112 117 Médiane M E Valeur de la 51ème valeur : 84 85 88 89 91 92 95 96 98 99 99 101 101 104 104 108 109 112 113 119 119 86 89 93 96 99 86 89 93 96 99 86 90 93 96 99 87 90 93 97 99 101 105 109 113 122 101 106 109 114 123 101 106 109 114 123 102 106 109 115 123 II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode Mode : Variables discrètes : valeur du caractère pour lequel l’effectif observé est maximal. Variables continues : si les classes sont d’amplitudes égales, classe pour laquelle l’effectif observé est maximal sinon (classes d’amplitudes différentes), classe ayant la plus forte densité. =MODE() II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode 81 87 90 94 97 83 87 91 94 97 84 87 91 94 98 84 88 91 95 98 100 102 106 110 116 100 103 107 110 116 101 103 107 111 117 101 104 107 112 117 84 85 88 89 91 92 95 96 98 99 99 101 101 104 104 108 109 112 113 119 119 86 89 93 96 99 86 89 93 96 99 86 90 93 96 99 87 90 93 97 99 101 105 109 113 122 101 106 109 114 123 101 106 109 114 123 102 106 109 115 123 Mode 101 II. Les variables quantitatives 25% 20% 15% 10% 5% 0% II. Les variables quantitatives 3.0% 2.5% 2.0% 1.5% 1.0% 0.5% 0.0% Distribution symétrique Moyenne=Médiane=Mode Distribution asymétrique 1 000 3 000 3 000 3 000 5 000 5 000 7 000 8 000 9 000 56 000 S = 100 000 Mode Médiane Moyenne Distribution asymétrique Mode Médiane Moyenne II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode Etendue=différence entre la valeur maximale et la valeur minimale, c’est la mesure la plus simple de la dispersion mais elle est très (trop) sensible aux valeurs extrêmes. Max=123 Min=81 Etendue=42 =MAX() et =MIN() II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode Variance=moyenne des différences élevées au carré entre la valeur de chaque observation et la moyenne. n Variance calculée sur un échantillon =VAR() Variance calculée sur la population =VAR.P() s2 2 x x i i 1 n 1 N 2 x i 1 2 i N II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode Variance=moyenne des différences élevées au carré entre la valeur de chaque observation et la moyenne. n Variance calculée sur un échantillon n x x i 1 2 i 11 010.55 s2 x x i 1 2 i n 1 11 010.55 s 110.11 101 1 2 II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode Ecart-type=racine carrée de la variance, l’écart-type s’exprime dans la même unité de mesure que la variable étudiée ce qui rend les comparaisons avec la moyenne plus aisées. Ecart-type calculé sur s s2 =ECARTYPE() un échantillon Ecart-type calculé sur la population s 110.11 10.49 2 =ECARTYPEP() II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Coefficient de variation Médiane Quartiles Mode Ecart-type=racine carrée de la variance, l’écart-type s’exprime dans la même unité de mesure que la variable étudiée ce qui rend les comparaisons avec la moyenne plus aisées. Le Coefficient de Variation mesure de façon relative la dispersion d’une série autour de sa moyenne. Ce coefficient étant sans unité, il permet de comparer des distributions entre elles. II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Coefficient de variation Médiane Quartiles Mode Le Coefficient de Variation mesure de façon relative la dispersion d’une série autour de sa moyenne. Ce coefficient étant sans unité, il permet de comparer des distributions entre elles. s 10.49 Coefficient de variation 10 . 46 % x 100.34 calculé sur un échantillon Coefficient de variation calculé sur la population II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode Quartiles (qui appartiennent à la famille des quantiles qui comprend également les déciles, les centiles,…) : comme leur nom l’indique, les quartiles permettent de partager en quatre parties d’effectifs identiques une série de valeurs classées par ordre croissant ou décroissant. Ils sont notés Q1, Q2 et Q3 (selon cette définition, Q2 est Q2 donc égal à la médiane). Q1 Q3 =QUARTILE(Zone; 1 2 3 ) II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode Quartiles = les quartiles (Q1, Q2 et Q3) permettent de partager en quatre parties d’effectifs identiques une série de valeurs classées par ordre croissant ou décroissant. i Rang de Qi (n 1) 1 4 NB : quand le rang de Qi n’est pas un nombre entier, Q1 et Q3 sont égaux à la moyenne des deux observations qui encadrent leur rang (algorithme légèrement différent sous Excel). II. Les variables quantitatives Tendance centrale et indicateur de dispersion Quartiles = les quartiles (Q1, Q2 et Q3) permettent de partager en quatre parties d’effectifs identiques une série de valeurs classées par ordre croissant ou décroissant. 1 Rang de Q1 (101 1) 1 26 4 2 Rang de Q2 (101 1) 1 51 4 3 Rang de Q3 (101 1) 1 76 4 II. Les variables quantitatives Tendance centrale et indicateur de dispersion =QUARTILE(;1, 2 ou 3) Quartiles = les quartiles… Rang de Q1 26 Rang de Q2 51 Rang de Q3 76 81 87 90 94 97 Q2=ME= X51=99 100 102 106 110 116 83 87 91 94 97 84 87 91 84 88 91 85 89 Q1=X26=92 92 94 98 84 88 91 95 98 86 89 86 89 86 90 87 90 93 96 99 93 96 99 93 96 99 93 97 99 95 96 98 99 99 100 101 101 101 101 101 101 103 103 104 104 104 105 106 107 107 107 108 108 Q3= X76=108 109 109 110 111 112 112 113 113 114 116 117 117 119 119 122 123 101 102 106 106 109 109 114 115 123 123 II. Les variables quantitatives Tendance centrale et indicateur de dispersion Etendue Moyenne arithmétique Variance/écart-type Médiane Intervalle Inter-Quartiles Mode Intervalle Inter-Quartiles (IIQ) =[ Q1 ; Q3]. Cet indicateur, peu sensible aux valeurs extrêmes, indique entre quelle valeur minimum et quelle valeur maximum se situent la moitié (centrale) des individus. Étendue Inter-Quartiles (EIQ) = Q3 - Q1. Cet indicateur permet de mesurer la dispersion des données autour de la médiane. II. Les variables quantitatives Tendance centrale et indicateur de dispersion Représentation graphique Box-Plot 140 130 Q3+1.5*EIQ=108+1.5*16 Valeur Max=123 120 110 100 90 80 70 60 Q3=108 ME=Q2=99 Q1=92 x 100.34 Valeur Min=81 Q1-1.5*EIQ=92-1.5*16 II. Les variables quantitatives Comment recalculer les principaux indicateurs de tendance centrale et de dispersion à partir d’un tableau de distribution Intervalles [80;87[ [87;94[ [94;101[ [101;108[ [108;115[ [115;122[ [122;129[ Fréquences Fréquences Centres Effectifs (n i ) (f i ) Cumulées (F i ) (x i ) 9 9% 9% 83,5 21 21% 30% 90,5 23 23% 52% 97,5 22 22% 74% 104,5 15 15% 89% 111,5 7 7% 96% 118,5 4 4% 100% 125,5 II. Les variables quantitatives Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode Intervalles Effectifs (n i ) [80;87[ [87;94[ [94;101[ [101;108[ [108;115[ [115;122[ [122;129[ 9 21 23 22 15 7 4 Fréquences Fréquences Centres (f i ) Cumulées (F i ) (x i ) 9% 9% 83,5 21% 30% 90,5 23% 52% 97,5 22% 74% 104,5 15% 89% 111,5 7% 96% 118,5 4% 100% 125,5 fixi 7,4 18,8 22,2 22,8 16,6 8,2 5,0 S 100,97 A comparer à x 100.34 II. Les variables quantitatives Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode Intervalles Effectifs (n i ) [80;87[ [87;94[ [94;101[ [101;108[ [108;115[ [115;122[ [122;129[ 9 21 23 22 15 7 4 Fréquences Fréquences Centres (f i ) Cumulées (F i ) (x i ) 9% 9% 83,5 21% 30% 90,5 23% 52% 97,5 22% 74% 104,5 15% 89% 111,5 7% 96% 118,5 4% 100% 125,5 fixi fixi² 7,4 18,8 22,2 22,8 16,6 8,2 5,0 621,3 1702,9 2164,8 2378,7 1846,4 973,2 623,8 S 100,97 10311,04 A comparer à s²=110.11 et s=10.49 II. Les variables quantitatives Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode Intervalles Effectifs (n i ) [80;87[ [87;94[ [94;101[ [101;108[ [108;115[ [115;122[ [122;129[ 9 21 23 22 15 7 4 Fréquences Fréquences (f i ) Cumulées (F i ) 8,91% 8,91% 20,79% 29,70% 22,77% 52,48% 21,78% 74,26% 14,85% 89,11% 6,93% 96,04% 3,96% 100,00% II. Les variables quantitatives Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode 100% 90% Q3 80% 70% 60% Me 50% 40% Q1 30% 20% 10% 0% 80 90 100 110 120 130 II. Les variables quantitatives Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode 60% 52.48 % 50.00 % 29.70 % 20% 94 101 10% 0% 80 90 100 110 II. Les variables quantitatives Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode 60% Intervalles Effectifs (n i ) [80;87[ [87;94[ [94;101[ [101;108[ [108;115[ [115;122[ [122;129[ 9 21 23 22 15 7 4 52.48 % 50.00 % Fréquences Fréquences (f i ) Cumulées (F i ) 8,91% 8,91% 20,79% 29,70% 22,77% 52,48% 20% 21,78% 74,26% 14,85% 89,11% 10% 6,93% 96,04% 0% 3,96% 100,00% 29.70 % 94 80 90 101 100 101 94 x 94 x 100.24 52.48 29.70 50 29.70 110 II. Les variables quantitatives Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Mode Intervalles Effectifs (n i ) [80;87[ [87;94[ [94;101[ [101;108[ [108;115[ [115;122[ [122;129[ 9 21 23 22 15 7 4 Fréquences Fréquences (f i ) Cumulées (F i ) 8,91% 8,91% 20,79% 29,70% 22,77% 52,48% 21,78% 74,26% 14,85% 89,11% 6,93% 96,04% 3,96% 100,00% 94 87 x 87 x 92.42 Q1 92 29.70 8.91 25 8.91 115 108 x 108 x 108.35 Q3 108 89.11 74.26 75 74.26 II. Les variables quantitatives Etendue Moyenne arithmétique Variance/écart-type Médiane Quartiles Classe Modale ! Bornes Effectifs [80;87[ [87;94[ [94;101[ [101;108[ [108;115[ [115;122[ [122;129[ 9 21 23 22 15 7 4 Fréquences 8.91% 20.79% 22.77% 21.78% 14.85% 6.93% 3.96% Fréquences cumulées 8.91% 29.70% 52.48% 74.26% 89.11% 96.04% 100.00% Les classes ont toutes des amplitudes égales…