Chapitre III - Statistiques
1. Médiane et écart interquartile
1.1. Cas des séries discrètes (les données prennent des valeurs isolées : notes, années, quantités...)
Définition 1. Des indicateurs de position : médiane, premier et troisième quartile
Quand une série statistique est rangée par ordre croissant,
la valeur diane est celle qui partage cette série en deux parties de même effectif.
le 1 er quartile est la plus petite valeur Q1telle qu’au moins 25 % des valeurs sont inférieures ou égales à Q1.
le 3 ème quartile est la plus petite valeur Q3telle qu’au moins 75 % des valeurs sont inférieures ou égales à Q3.
Définition 2. Un indicateur de dispersion : l’écart interquartile
L’écart interquartile dune série statistique est la différence entre le troisième et le premier quartile.
eI=Q3Q1
Remarque.
50 % des valeurs sont inférieures à la médiane et 50 % des valeurs sont supérieures à la médiane.
L’écart interquartile correspond à l’étendue de la série statistique après élimination de 25% des valeurs les plus
faibles et de 25% des valeurs les plus fortes. Il ne dépend pas des valeurs extrêmes.
Exemple 1. On étudie le Q.I. d’une population de pangolins ayant assisté à un cours de matmatiques (série A) :
11,11,8,13,12,7,8,9,10,13,13,12,11,8,10
On commence par ranger cette rie dans l’ordre croissant.
La série A ci-dessous posde un nombre impair de valeurs (15 valeurs) :
7,8,8,8,9,10,10
7 valeu rs
,11,
m éd ia ne
11,11,12,12,13,13,13
7valeu rs
La médiane :Me=11 (15 = 2 ×7 + 1 donc la médiane est le 8enombre)
Le premier quartile :Q1= 8 (25 % de 15 : 15
4= 3,75 donc le premier quartile est le 4enombre)
Le troisme quartile :Q3=12 (75 % de 15 : 3×15
4=11,25 donc le premier quartile est le 12enombre)
Lécart interquartile :eI=12 8 = 4
On peut résumer cette série par un diagramme en boîtes :
Me
Q1Q2
Xm in Xm ax
7 8 9 10 11 12 13
Fréquences et fréquences cumulées pour déterminer des proportions ou Me,Q1et Q3(à 25 %, 50 % et 75%)
Q.I. 7 8 9 10 11 12 13
effectifs 1 3 1 2 3 2 3 effectif total : 15
fréquences
1
15 0,066
ou 6,7 %
3
15 0,20
ou 20 % 6,7 % 13,3 % 20 % 13,3 % 20 %
fréquences cumulées 6,7 % 26,7 % 33,3 % 46,7 % 66,7 % 80 % 100 %
Exemple 2. On étudie le Q.I. d’une 2epopulation de pangolins ayant assisté à un cours de matmatiques poussé (série B) :
La série B ci-dessous possède un nombre pair de valeurs (14 valeurs) :
2,5,6,7,8,8,9
7 valeu rs
,
médiane
10,12,12,15,16,17,19
7valeu rs
La médiane :Me= 9,5(14 = 2 ×7donc la médiane est la moyenne du 7eet du 8enombre)
Le premier quartile :Q1= 7 et le troisième quartile :Q3=15
Lécart interquartile :eI=15 9,5 = 5,5
On peut résumer cette série par un diagramme en boîtes :
Xm in Xm a x
7 8 9 10 11 12 13
2 3 4 5 6 14 15 16 17 18 19
Q1Q2
Me
1.2. Cas des séries continues (les données ne sont pas isolées et sont réparties en classes : durée, poids...)
Définition 3. Quand une série statistique continue est répartie en classes (intervalles), la classe diane est la classe
qui contient la médiane.
Exemple 3. Pour une population de 25 pangolins, on étudie le temps quotidien passé à lustrer ses belles écailles.
Durées (en min) [0; 5[ [5; 10[ [10;20[ [20;30[ [30;50[
effectifs 4 6 8 3 4
fréquences 0,16 0,24 0,32 0,12 0,16
fréquences cumulées croissantes 0,16 0,40 0,72 0,84 1
densités (sur chaque classe) 4
5= 0,86
5= 1,28
10 = 0,83
10 = 0,34
20 = 0,2
La 13evaleur de la série appartient à l’intervalle [10;20[qui est donc la classe médiane de cette série.
En supposant les effectifs répartis de manre uniforme sur chaque intervalle, on peut déterminer une valeur approchée de la médiane,
du premier et du troisième quartile à l’aide de la courbe des fréquences cumulées croissantes :
0 5 10 20 30 50
Durée
(en min)
Fréquence
0,5
1
Q17Q323
Me13,3
On peut repsenter cette série par un histogramme (l’aire de chaque rectangle est proportionnelle aux effectifs des classes):
Pour cela on calcule la densisur chaque classe, soit la répartition des effectifs par unité (de durée ici).
Par exemple, un effectif de 4 sur l’intervalle [0; 5[ revient à un effectif de 0,8 sur chacun des intervalles [0; 1[ ;[1; 2[ ;[2; 3[ ;[3; 4[ ;[4; 5[.
0 5 10 20 30 50
Durée
(en min)
1 pangolin
4
2. Moyenne et écart-type
2.1. Cas des séries discrètes (les dones prennent des valeurs isolées : notes, années, quantités...)
Soit une série statistique répartie ainsi : Valeurs x1x2xp
Effectifs n1n2np
et d’effectif total N=n1+n2++np.
Tale ES1 Chapitre III - Statistiques
2
Définition 4. Un indicateur de position : la moyenne
La moyenne d’une série statistique est le nombre :
x¯ = n1x1+n2x2++npxp
N
Définition 5. Un indicateur de dispersion : l’étendue
L’étendue dune série statistique est la différence entre la plus grande valeur et la plus petite valeur de la série.
e=xmax xmin
Exemple 4. On étudie le Q.I. d’une population de pangolins ayant assisté à un cours de matmatiques (série A) :
11,11,8,13,12,7,8,9,10,13,13,12,11,8,10
La moyenne de la série A est : x¯ = 1×7 + 3 ×8 + 1 ×9 + 2 ×1 0 + 3 ×11 + 2 ×12 + 3 ×13
15 =52
5=10,4
Létendue :e=13 7 = 6
Exemple 5. On étudie le Q.I. d’une 2epopulation de pangolins ayant assisté à un cours de matmatiques poussé (série B) :
2,5,6,7,8,8,9,10,12,12,15,16,17,19
La moyenne de la série B est : x¯ = 2 + 5 + 6 + 7 + 2 ×8 + 9 + 10 + 2 ×12 +15 +1 6 +1 7 +19
14 =73
710,43
Létendue :e=19 2 = 17
Définition 6. Un autre indicateur de dispersion : l’écart type
La variance Vd’une série statistique est la moyenne des carrés des écarts avec la moyenne.
V=n1(x1x¯)2+n2(x2x¯)2++np(xpx¯)2
Nque l’on note V=1
NX
p
i=1
ni(xix¯)2
L’écart type sd’une série statistique est la racine carrée de la variance :
s=V
Remarque. La variance et l’écart type permettent de mesurer la dispersion autour de la moyenne.
Exemple 6. On étudie le Q.I. d’une population de pangolins témoin (n’ayant suivi aucun cours de maths). Il y a 25 pangolins au total.
Q.I. 0 1 2 3 4 5 6
effectifs 5 9 7 2 0 1 1
écarts à la moyenne 01,6 = 1,6 1 1,6 = 0,6 2 1,6 = 0,4 3 1,6 = 1,4 4 1,6 = 2,4 5 1,6 = 3,4 6 1,6 = 4,4
carrés des écarts (1,6)2= 2,56 0,36 0,16 1,96 5,76 11,56 19,36
Moyenne de la série : x¯ = 5×0 + 9 ×1 + 7 ×2 + 2 ×3 + 0 ×4 + 1 ×5 + 1 ×6
25 =8
5= 1,6
Moyenne de la série des écarts à la moyenne :
Variance :V=5×2,56 + 9 ×0,3 6 + 7 ×0,16 + 2 ×1,96 + 0 ×5,76 + 1 ×11,56 + 1 ×19 ,3 6
25 = 2,08
Écart type :s=V
= 2,08
1,44
2.2. Cas des séries continues (les données ne sont pas isolées et sont réparties en classes : durée, poids...)
Exemple 7. Pour une population de 25 pangolins, on étudie le temps quotidien passé à lustrer ses belles écailles.
Durées (en min) [0; 5[ [5; 10[ [10;20[ [20;30[ [30;50[
centres des classes 2,5 7,5 15 25 40
effectifs 4 6 8 3 4
La moyenne de la série se calcule à l’aide des centres des classes : x¯ = 4×2,5 + 6 ×7,5 + 8 ×15 + 3 ×25 + 4 ×4 0
25 =4 10
25 =16,4min
À la calculatrice, on montre que l’écart type :s12,19 min
3. Pour résumer ou comparer
En règle générale, on retient au choix :
un indicateur de position : moyenne ou médiane
un couple (indicateur de position ; indicateur de dispersion) :
(moyenne ; écart type) ou (médiane ; écart interquartile)
pour résumer une série statistique et éventuellement la comparer avec une autre série statistique.
Tale ES1 Chapitre III - Statistiques
3
1 / 3 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !