COURS STATS
STATISTIQUES
On rappelle que les statistiques ont pour but d’étudier des séries de nombres appelés VALEURS de la série .
Chaque valeur peut figurer plusieurs fois dans la série ; ce nombre d’apparitions s’appelle l’EFFECTIF de cette valeur.
Il s’agit, cette année comme en seconde, d’apprendre à résumer des séries statistiques :
- par des CARACTERIQUES DE POSITION, qui sont des valeurs centrales pour la série (moyenne, médiane,...)
- par des CARACTERISTIQUES DE DISPERSION, qui mesurent la plus ou moins grande homogénéité des valeurs de
la série autour de la valeur centrale considérée (étendue, écart interquartile, écart – type, …).
Les définitions indiquées en gras sont à connaître par cœur. Pour illustrer ces différentes définitions, on considère ici deux
séries, l’une discrète (c’est à dire rangée par valeurs distinctes), l’autre continue (les valeurs sont rangées en classes).
EXEMPLE 1 (SERIE DISCRETE)
Nous prendrons la série des notes sur 10 obtenues à un contrôle par les 35 élèves d’une classe :
x
(notes) 0 1 2 3 4 5 6 7 8 9 10
n
(nombres d’élèves) 0 1 3 4 2 5 7 5 4 3 1
Effectifs cumulés croissants
EXEMPLE 2 (SERIE CONTINUE)
Nous prenons la série des âges des 440 habitants d’une commune, rangée par classes (intervalles) de 20 ans.
Classes d’âges [ 0 ; 20 [ [ 20 ; 40 [ [ 40 ; 60 [ [ 60 ; 80 [ [ 80 ; 100 [
Nombre d’habitants 90 113 146 71 20
Effectifs cumulés croissants
I. MEDIANE ET INTERVALLE INTER-QUARTILES
La médiane Me d’une série statistique est la plus petite valeur telle qu’au moins 50 % des valeurs de la
série lui sont inférieures ou égales.
Le premier quartile Q
1
est la plus petite valeur telle qu’au moins 25 % des valeurs de la série lui sont
inférieures ou égales.
Le troisième quartile Q
3
est la plus petite valeur telle qu’au moins 75 % des valeurs de la série lui sont
inférieures ou égales.
L’intervalle [ Q
1
; Q
3
] s’appelle l’intervalle interquartile de la série.
Sa longueur Eq = Q
3
– Q
1
s’appelle l’écart interquartile.
L’écart interquartile est une mesure de dispersion qui est associée à la médiane
L’intervalle interquartile [ Q
1
; Q
3
] contient environ 50 % des valeurs de la série.
Concrètement, on détermine ces caractéristiques en faisant le calcul ou le graphique des effectifs cumulés croissants :
Dans l’exemple 1 : On calcule les effectifs cumulés croissants sur une ligne rajoutée au tableau.
La médiane est la plus petite valeur dont l’effectif cumulé croissant est supérieur ou à égal à la moitié de l’effectif total.
On a : 35 × 0,50 = ……… ; donc : Me = …………….
35 × 0,25 = …………. ; donc Q
1
= …………… 35 × 0,75 = ………….. . Donc : Q
3
= ……….
Donc [ Q
1
; Q
3
] = [ … ; … ] et Eq (écart interquartile) = …. .
Dans l’exemple 2 : On dessine ( le faire au verso) le graphique des effectifs cumulés croissants .
On peut encore préciser médiane et quartiles par extrapolation (voir avec le professeur)
On a : 440 × 0,50 = ……. ; 440 × 0,25 = …….. ; 440 × 0,75 = ……. ;
donc : Me ≈ ……… Q
1
≈ ………. Q
3
≈ ………..
(Rappelons par ailleurs comment on détermine des valeurs approchées par interpolation linéaire).
On résume parfois la série en un schéma indiquant sa médiane, son
intervalle interquartiles. Ce schéma s’appelle le diagramme de Tuckey
(ou boite à moustache) de la série.