Tendance centrale et indicateur de dispersion

publicité
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
n
Moyenne calculée sur
un échantillon
=MOYENNE()
Moyenne calculée sur
la population
81
87
90
94
97
83
87
91
94
97
84
87
91
94
98
84
88
91
95
98
100
102
106
110
116
100
103
107
110
116
101
103
107
111
117
101
104
107
112
117
84 85
88 89
91 92
95 96
98 99
99
101 101
104 104
108 109
112 113
119 119
86
89
93
96
99
86
89
93
96
99
86
90
93
96
99
87
90
93
97
99
101
105
109
113
122
101
106
109
114
123
101
106
109
114
123
102
106
109
115
123
x
x
i 1
i
n
N

x
i 1
i
N
n
x
x
i 1
n
i
10 134

 100.34
101
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Variance/écart-type
tronquée
Quartiles
Médiane
Mode
=MOYENNE.REDUITE()
Avec n=101, une moyenne tronquée de 5 % enlève
0.05*101=5.05  4 (pour préserver la symétrie le
nombre de valeurs supprimées est arrondi au
multiple de 2 inférieur) observations à chaque bout
de l’échantillon.
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Variance/écart-type
tronquée
Quartiles
Médiane
Mode
81
87
90
94
97
83
87
91
94
97
84
87
91
94
98
84
88
91
95
98
100
102
106
110
116
100
103
107
110
116
101
103
107
111
117
101
104
107
112
117
84 85
88 89
91 92
95 96
98 99
99
101 101
104 104
108 109
112 113
119 119
86
89
93
96
99
86
89
93
96
99
86
90
93
96
99
87
90
93
97
99
101
105
109
113
122
101
106
109
114
123
101
106
109
114
123
102
106
109
115
123
Moyenne
tronquée
à5%=
100.25
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
Médiane=valeur de l’observation centrale lorsque les
données sont classées (rangées) par ordre croissant ou
décroissant.
1
Rang de la médiane  (n  1)  1
2
NB : quand il y a un nombre paire d’observations, la
médiane est égale à la moyenne des deux observations
centrales (algorithme utilisé par Excel).
=MEDIANE()
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
81
87
90
94
97
83
87
91
94
97
84
87
91
94
98
84
88
91
95
98
100
102
106
110
116
100
103
107
110
116
101
103
107
111
117
101
104
107
112
117
Médiane  M E  Valeur de la 51ème valeur :
84 85
88 89
91 92
95 96
98 99
99
101 101
104 104
108 109
112 113
119 119
86
89
93
96
99
86
89
93
96
99
86
90
93
96
99
87
90
93
97
99
101
105
109
113
122
101
106
109
114
123
101
106
109
114
123
102
106
109
115
123
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
Mode :
Variables discrètes : valeur du caractère pour lequel
l’effectif observé est maximal.
Variables continues : si les classes sont d’amplitudes
égales, classe pour laquelle l’effectif observé est
maximal sinon (classes d’amplitudes différentes),
classe ayant la plus forte densité.
=MODE()
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
81
87
90
94
97
83
87
91
94
97
84
87
91
94
98
84
88
91
95
98
100
102
106
110
116
100
103
107
110
116
101
103
107
111
117
101
104
107
112
117
84 85
88 89
91 92
95 96
98 99
99
101 101
104 104
108 109
112 113
119 119
86
89
93
96
99
86
89
93
96
99
86
90
93
96
99
87
90
93
97
99
101
105
109
113
122
101
106
109
114
123
101
106
109
114
123
102
106
109
115
123
Mode  101
II. Les variables quantitatives
25%
20%
15%
10%
5%
0%
II. Les variables quantitatives
3.0%
2.5%
2.0%
1.5%
1.0%
0.5%
0.0%
Distribution symétrique
Moyenne=Médiane=Mode
Distribution asymétrique
1 000
3 000
3 000
3 000
5 000
5 000
7 000
8 000
9 000
56 000
S = 100 000
Mode
Médiane
Moyenne
Distribution asymétrique
Mode
Médiane
Moyenne
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
Etendue=différence entre la valeur maximale et la valeur
minimale, c’est la mesure la plus simple de la dispersion
mais elle est très (trop) sensible aux valeurs extrêmes.
Max=123
Min=81
Etendue=42
=MAX() et =MIN()
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
Variance=moyenne des différences élevées au carré
entre la valeur de chaque observation et la moyenne.
n
Variance calculée sur
un échantillon
=VAR()
Variance calculée sur
la population
=VAR.P()
s2 
2


x

x
 i
i 1
n 1
N
2 
 x   
i 1
2
i
N
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
Variance=moyenne des différences élevées au carré
entre la valeur de chaque observation et la moyenne.
n
Variance calculée sur
un échantillon
n
 x  x 
i 1
2
i
 11 010.55
s2 
 x  x 
i 1
2
i
n 1
11 010.55
s 
 110.11
101  1
2
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
Ecart-type=racine carrée de la variance, l’écart-type
s’exprime dans la même unité de mesure que la variable
étudiée ce qui rend les comparaisons avec la moyenne
plus aisées.
Ecart-type calculé sur
s  s2
=ECARTYPE()
un échantillon
Ecart-type calculé sur
la population
s 
110.11  10.49
  2

=ECARTYPEP()
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Coefficient de variation
Médiane
Quartiles
Mode
Ecart-type=racine carrée de la variance, l’écart-type
s’exprime dans la même unité de mesure que la variable
étudiée ce qui rend les comparaisons avec la moyenne
plus aisées.
Le Coefficient de Variation mesure de façon relative la
dispersion d’une série autour de sa moyenne.
Ce coefficient étant sans unité, il permet de comparer des
distributions entre elles.
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Coefficient de variation
Médiane
Quartiles
Mode
Le Coefficient de Variation mesure de façon relative la
dispersion d’une série autour de sa moyenne.
Ce coefficient étant sans unité, il permet de comparer des
distributions entre elles.
s  10.49

Coefficient de variation


10
.
46
%


x  100.34

calculé sur un échantillon
Coefficient de variation
calculé sur la population


II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
Quartiles (qui appartiennent à la famille des quantiles
qui comprend également les déciles, les centiles,…) :
comme leur nom l’indique, les quartiles permettent de
partager en quatre parties d’effectifs identiques une série
de valeurs classées par ordre croissant ou décroissant. Ils
sont notés Q1, Q2 et Q3 (selon cette définition, Q2 est
Q2
donc égal à la médiane).
Q1
Q3
=QUARTILE(Zone; 1 2 3 )
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
Quartiles = les quartiles (Q1, Q2 et Q3) permettent de
partager en quatre parties d’effectifs identiques une série
de valeurs classées par ordre croissant ou décroissant.
i
Rang de Qi  (n  1)  1
4
NB : quand le rang de Qi n’est pas un nombre entier, Q1
et Q3 sont égaux à la moyenne des deux observations qui
encadrent leur rang (algorithme légèrement différent sous
Excel).
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Quartiles = les quartiles (Q1, Q2 et Q3) permettent de
partager en quatre parties d’effectifs identiques une série
de valeurs classées par ordre croissant ou décroissant.
1
Rang de Q1  (101  1)  1  26
4
2
Rang de Q2  (101  1)  1  51
4
3
Rang de Q3  (101  1)  1  76
4
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
=QUARTILE(;1, 2 ou 3)
Quartiles = les quartiles…
Rang de Q1  26
Rang de Q2  51
Rang de Q3  76
81
87
90
94
97
Q2=ME= X51=99
100
102
106
110
116
83
87
91
94
97
84
87
91
84
88
91
85
89
Q1=X26=92
92
94
98
84
88
91
95
98
86
89
86
89
86
90
87
90
93
96
99
93
96
99
93
96
99
93
97
99
95 96
98 99
99
100 101 101 101 101 101 101
103 103 104 104 104 105 106
107 107 107 108
108
Q3= X76=108
109 109
110 111 112 112 113 113 114
116 117 117 119 119 122 123
101 102
106 106
109 109
114 115
123 123
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Intervalle Inter-Quartiles
Mode
Intervalle Inter-Quartiles (IIQ) =[ Q1 ; Q3].
Cet indicateur, peu sensible aux valeurs extrêmes,
indique entre quelle valeur minimum et quelle valeur
maximum se situent la moitié (centrale) des individus.
Étendue Inter-Quartiles (EIQ) = Q3 - Q1.
Cet indicateur permet de mesurer la dispersion des
données autour de la médiane.
II. Les variables quantitatives
Tendance centrale et indicateur de dispersion
Représentation graphique  Box-Plot
140
130
Q3+1.5*EIQ=108+1.5*16
Valeur Max=123
120
110
100
90
80
70
60
Q3=108
ME=Q2=99
Q1=92
x  100.34
Valeur Min=81
Q1-1.5*EIQ=92-1.5*16
II. Les variables quantitatives
Comment recalculer les principaux indicateurs
de tendance centrale et de dispersion
à partir d’un tableau de distribution
Intervalles
[80;87[
[87;94[
[94;101[
[101;108[
[108;115[
[115;122[
[122;129[
Fréquences Fréquences Centres
Effectifs (n i )
(f i )
Cumulées (F i )
(x i )
9
9%
9%
83,5
21
21%
30%
90,5
23
23%
52%
97,5
22
22%
74%
104,5
15
15%
89%
111,5
7
7%
96%
118,5
4
4%
100%
125,5
II. Les variables quantitatives
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
Intervalles Effectifs (n i )
[80;87[
[87;94[
[94;101[
[101;108[
[108;115[
[115;122[
[122;129[
9
21
23
22
15
7
4
Fréquences Fréquences Centres
(f i )
Cumulées (F i )
(x i )
9%
9%
83,5
21%
30%
90,5
23%
52%
97,5
22%
74%
104,5
15%
89%
111,5
7%
96%
118,5
4%
100%
125,5
fixi
7,4
18,8
22,2
22,8
16,6
8,2
5,0
S 100,97
A comparer à x  100.34
II. Les variables quantitatives
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
Intervalles Effectifs (n i )
[80;87[
[87;94[
[94;101[
[101;108[
[108;115[
[115;122[
[122;129[
9
21
23
22
15
7
4
Fréquences Fréquences Centres
(f i )
Cumulées (F i )
(x i )
9%
9%
83,5
21%
30%
90,5
23%
52%
97,5
22%
74%
104,5
15%
89%
111,5
7%
96%
118,5
4%
100%
125,5
fixi
fixi²
7,4
18,8
22,2
22,8
16,6
8,2
5,0
621,3
1702,9
2164,8
2378,7
1846,4
973,2
623,8
S 100,97
10311,04
A comparer à s²=110.11 et s=10.49
II. Les variables quantitatives
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
Intervalles Effectifs (n i )
[80;87[
[87;94[
[94;101[
[101;108[
[108;115[
[115;122[
[122;129[
9
21
23
22
15
7
4
Fréquences Fréquences
(f i )
Cumulées (F i )
8,91%
8,91%
20,79%
29,70%
22,77%
52,48%
21,78%
74,26%
14,85%
89,11%
6,93%
96,04%
3,96%
100,00%
II. Les variables quantitatives
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
100%
90%
Q3
80%
70%
60%
Me
50%
40%
Q1
30%
20%
10%
0%
80
90
100
110
120
130
II. Les variables quantitatives
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
60%
52.48 %
50.00 %
29.70 %
20%
94
101
10%
0%
80
90
100
110
II. Les variables quantitatives
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
60%
Intervalles Effectifs (n i )
[80;87[
[87;94[
[94;101[
[101;108[
[108;115[
[115;122[
[122;129[
9
21
23
22
15
7
4
52.48 %
50.00 %
Fréquences Fréquences
(f i )
Cumulées (F i )
8,91%
8,91%
20,79%
29,70%
22,77%
52,48%
20%
21,78%
74,26%
14,85%
89,11%
10%
6,93%
96,04%
0%
3,96%
100,00%
29.70 %
94
80
90
101
100
101  94
x  94

 x  100.24
52.48  29.70 50  29.70
110
II. Les variables quantitatives
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Mode
Intervalles Effectifs (n i )
[80;87[
[87;94[
[94;101[
[101;108[
[108;115[
[115;122[
[122;129[
9
21
23
22
15
7
4
Fréquences Fréquences
(f i )
Cumulées (F i )
8,91%
8,91%
20,79%
29,70%
22,77%
52,48%
21,78%
74,26%
14,85%
89,11%
6,93%
96,04%
3,96%
100,00%
94  87
x  87

 x  92.42 Q1  92
29.70  8.91 25  8.91
115  108
x  108

 x  108.35 Q3  108
89.11  74.26 75  74.26
II. Les variables quantitatives
Etendue
Moyenne arithmétique
Variance/écart-type
Médiane
Quartiles
Classe Modale
!
Bornes
Effectifs
[80;87[
[87;94[
[94;101[
[101;108[
[108;115[
[115;122[
[122;129[
9
21
23
22
15
7
4
Fréquences
8.91%
20.79%
22.77%
21.78%
14.85%
6.93%
3.96%
Fréquences
cumulées
8.91%
29.70%
52.48%
74.26%
89.11%
96.04%
100.00%
Les classes ont toutes des amplitudes égales…
Téléchargement