programme 2011 mathématiques ch.4 Ch.4 : Statistiques

publicité
1e S - programme 2011 –mathématiques – ch.4 – cahier élève
Page 1 sur 14
Ch.4 : Statistiques
Exercice n°A page 286 : Calculer une médiane et une moyenne
Déterminer la médiane et la moyenne de chacune des deux séries suivantes :
Série A : 12 – 5 – 13 – 8 – 14 – 11 – 4 – 11 – 3 – 3 – 14 – 3 – 5 – 12 – 7 – 7 – 7 – 7 – 16 – 15 – 4.
Série B :
5
7
9 10 12 14 15 16 18
Note
3
4
6
7
3
1
4
1
Effectif 2
Série
Moyenne à 0,01 près
Médiane
A
B
8,62 11,29
7
12
Exercice n°B page 286 : Quartiles
Vrai ou faux ?
On s'intéresse à la série B de notes de l'exercice A. Préciser si les affirmations suivantes sont vraies.
Série B :
5
7
9 10 12 14 15 16 18
Note
3
4
6
7
3
1
4
1
Effectif 2
1) Le premier quartile de la série est égal à 8.
2) Le troisième quartile de la série est égal à 14.
3) L'écart interquartile de la série est égal à 5.
1)
Faux : c’est 9 .
2)
Vrai .
3)
Vrai .
Exercice n°C page 286 : Explorer les propriétés des indicateurs
Vrai ou faux ?
Un examen a permis à 100 candidats de se présenter et chacun a obtenu une note entière
Indication : L'étendue
comprise entre 0 et 20. Pour être reçu, un candidat doit avoir une note supérieure ou égale est l'écart entre la valeur
minimale et la valeur
à 10. La moyenne des 100 notes est 10, la médiane 12 et l'étendue 18.
maximale du caractère.
Préciser si les affirmations suivantes sont vraies ou fausses.
1) Si une des notes est 20, il n'y a pas de 0.
3) Il y a exactement 45 reçus à l'examen.
2) Si une des notes est 3, il y a un 20.
4) La moyenne des collés est inférieure ou égale à 8.
1)
Vrai : sinon 20 – 0  18.
2)
Faux .
3)
Faux : la moitié (50) des candidats a une note supérieure ou égale à 12.
4)
Faux .
1 MÉDIANE, QUARTILES, DÉCILES
RAPPELS ET DÉFINITIONS
Soit x1 , x2 , … , xn une série statistique de n valeurs rangées dans l’ordre croissant.
n+1
n n
si n est impair, ou, la moyenne de celles de rangs et + 1, si n est
2
2 2

La médiane est la valeur de rang

pair.
Le premier quartile Q1 est la plus petite valeur xj de la série, telle qu’au moins 25 % des valeurs sont

inférieures ou égales à Q1 .
Le troisième quartile Q3 est la plus petite valeur xj de la série, telle qu’au moins 75 % des valeurs sont
inférieures ou égales à Q3 .


L'intervalle [Q1 ; Q3] est appelé intervalle interquartile.
Son étendue Q3 – Q1 est appelée écart interquartile : c'est une mesure de la dispersion liée à la médiane.
Remarques :
 Le terme de « deuxième quartile » n'est pas utilisé : il correspond à la médiane de la série statistique.
 Pour déterminer, les quartiles ou les déciles, il faut ordonner les séries de valeurs dans l'ordre croissant.
H. Rorthais (Lycée Polyvalent du Sacré Cœur à Nantes)
http://www.sacrecoeur.nantes.e-lyco.fr
1e S - programme 2011 –mathématiques – ch.4 – cahier élève
Exemple :
On donne les notes obtenues à un examen par 27 candidats :
1 2 3 4 5 6 7 8 9 10 11
Rang
3 4 4 5 6 6 6 7 8 8 8
Note
Page 2 sur 14
12 13 14
9 10 11
Rang
Note
15 16 17 18 19 20 21 22 23 24 25 26 27
11 12 12 12 12 12 14 15 15 15 17 17 18
27  0,25 = 6,75 : le premier quartile est donc la 7e valeur ; ainsi Q1 = 6.
27  0,75 = 20,25 : le troisième quartile est donc la 21e valeur ; ainsi Q3 = 14.
L'intervalle interquartile [6 ; 14] contient au moins la moitié des notes ; l'écart interquartile est 14 – 6 = 8.
DÉFINITIONS
Soit x1 , x2 , … , xn une série statistique de n valeurs.

Le premier décile d1 est la plus petite valeur xj de la série, telle qu’au moins 10 % des valeurs sont inférieures
ou égales à d1 .

Le neuvième décile d9 est la plus petite valeur xj de la série, telle qu’au moins 90 % des valeurs sont
inférieures ou égales à d9 .
Exemple :
Sur l'exemple précédent, on a : 27  0,10 = 2,7 : le premier décile est la 3e valeur; ainsi d1 = 4.
27  0,9 = 24,3 : le neuvième décile est donc la 25e valeur ; ainsi d9 = 17.
Exercice n°1 page 291
Pour chacune des séries suivantes, déterminer la médiane, les quartiles Q1 et Q3 ainsi que les déciles d1 et d9 :
a) Série A : 1 – 2,5 – 3 – 4,2 – 5,3 – 7 – 9 - 10,2 – 12 – 15 – 17 – 20 – 21,7 – 25 – 27 – 50 – 54 – 60 – 63.
b) Série B : 13 – 17 – 35 – 12 – 20 – 45 – 67 – 54 – 23 – 34 – 26 – 12 – 22 – 69 – 46.
a)
d1 Q1 Med Q3 d9
15
27 60
Série A 2,5 5,3
b) Série B : 12 – 12 – 13 – 17 – 20 – 22 – 23 – 26 – 34 – 35 – 45 – 46 – 54 – 67 – 69.
d1 Q1 Med Q3 d9
26
46 67
Série B 12 17
Exercice n°1 page 308 Moyenne et médiane
Déterminer la moyenne et la médiane des séries 1 et 2 :
Série 1 : 4 ; 3 ; 5 ; 4 ; 6 ; 7 ; 2 ; 6 ; 9 ; 10.
Série 2 : 12 ; 16 ; 10 ; 8 ; 20 ; 19 ; 15.
Moyenne Médiane
5,6
5,5
Série 1
14,3
15
Série 2
Exercice n°2 page 308 Effectifs cumulés, médiane, quartiles
On a interrogé les 250 élèves de première d'un lycée
Nombre
0
1
2
3
4 5 6 7 8
sur leur nombre de frères et sœurs. Voici les
Effectif
80 90 46 20 8 3 1 1 1
résultats :
Fréquence (en %)
1) Recopier et compléter le tableau avec les
Fréquences cumulées
fréquences et les fréquences cumulées.
2) Quel pourcentage d'élèves ont trois frères et sœurs ou moins ?
3) Déterminer la médiane de la série, puis le premier et le troisième quartile. Traduire chaque résultat par une phrase
en français.
1) Nombre
0 1
2
3
4
5
6
7
8
80 90 46
20
8
3
1
1
1
Effectif
32 36 18,4
8
3,2 1,2 0,4 0,4 0,4
Fréquence (%)
Fréquences cumulées 32 68 86,4 94,4 97,6 98,8 99,2 99,6 100
2)
94,4 % .
3) La médiane est 1 : 50 % des élèves au moins ont au plus un frère ou une sœur.
Q1 = 0 et Q3 = 2 .
Exercice n°12 page 299 Q.C.M.
Pour chacune des questions suivantes, déterminer toutes les réponses correctes.
Soit une série statistique de médiane Me, de quartiles Q1 et Q3 et de déciles d1 et d9 .
H. Rorthais (Lycée Polyvalent du Sacré Cœur à Nantes)
http://www.sacrecoeur.nantes.e-lyco.fr
1e S - programme 2011 –mathématiques – ch.4 – cahier élève
1) La médiane est toujours :
a) la moyenne de Q1
b) comprise entre Q1
et Q3
Page 3 sur 14
c) positive
et d9
2) Entre d1 et d9 , on trouve environ :
a) 10 % des valeurs
b) 80 % des valeurs
c) 90 % des valeurs
3) Environ 15 % des valeurs de la série se
situent entre :
a) d1 et Q1
b) entre Q1 et Me
c) entre Q3 et d9
1)
b et c .
2)
b.
3)
a et c .
Exercice n°40 page 305 Robustesse : moyenne ou médiane
On cherche à savoir, suivant les situations, lequel des indicateurs est le plus robuste, c'est-à-dire le moins sensible à de
petits changements des valeurs de la série.
On prendra comme exemple deux villes, Joli-Bois et Ville-Belle. Dans ces deux villes, on a relevé l'évolution de la valeur
de 40 appartements, entre 2008 et 2010. On exprime cette valeur en dizaine de milliers d'euros (voir les graphiques ciaprès).
1) a) Dans le cas de Ville-Belle, recopier et
Valeur
50 60 70 80 90 100 110 120 130 140 150
compléter le tableau suivant :
(en k€)
b) À priori, y a-t-il une grande évolution
2008
entre 2008 et 2010 ?
2010
c) Déterminer la moyenne et la médiane
en 2008 et 2010.
Lequel des deux indicateurs paraît le plus robuste ?
1) a)
Valeur
2008
2010
50 60 70 80 90 100 110 120 130 140 150
2 3 3 4 5
7
5
5
3
3
0
0 3 3 4 5
7
5
5
3
3
2
b) Il y a a priori peu d’évolution.
c) La moyenne est passée de 98 à 103 et la médiane de 100 à 100 .
La moyenne a augmenté de 3 %.
2) Effectuer la même étude qu'à la question 1) pour la ville de Joli-Bois.
2) Valeur 50 60 70 80 90 100 110 120 130 140 150
2008
2010
4
4
5
5
6
6
4
4
1
0
1
0
4
6
5
5
6
6
2
2
2
2
Au vu des deux tableaux, il y a peu d’évolution. La moyenne est passée de 95,75 à 96,5 et la médiane de 95 à 110.
La médiane a donc augmenté de 15 %, contre moins de 1 % pour la moyenne : la moyenne est plus robuste.
3) Comment décrire la différence entre les situations des deux villes ?
3) La distribution des valeurs dans la ville de Joli-Bois est bimodale, avec un trou aux alentours de la médiane, tandis
que celle de Ville-Belle est fortement regroupée autour de la moyenne, avec peu de valeurs extrêmes.
Exercice n°42 page 306 Effet de structure
Voici la répartition des salaires annuels, en euros, dans deux entreprises, par
Entreprise Employés Cadres
catégorie de salarié.
SILOR
171 000 37 700
SILOR compte 126 employés et 34 cadres alors que SOLIR compte 88 employés
Entreprise Employés Cadres
et 72 cadres.
SOLIR
147 000 32 000
Le PDG de SOLIR affirme que ses salariés sont en moyenne mieux payés que
ceux de SILOR.
« Impossible, répond le PDG de SILOR, les employés, comme les cadres sont mieux payés chez moi que chez vous ! »
Comment expliquer ce paradoxe ?
H. Rorthais (Lycée Polyvalent du Sacré Cœur à Nantes)
http://www.sacrecoeur.nantes.e-lyco.fr
1e S - programme 2011 –mathématiques – ch.4 – cahier élève
Employés
effectif moyenne
Page 4 sur 14
Cadres
effectif moyenne
Salariés
effectif moyenne
total
total
total
Entreprise
171 000 €
126
1 357,14 € 37 700 €
34
1 670,45 € 548 000 €
160
3 425 €
SILOR
Entreprise
147 000 €
88
1 670,45 € 32 000 €
72
4 444,44 € 467 000 €
160
2 918,75 €
SOLIR
Catégorie par catégorie, les salariés de SILOR sont mieux payés que ceux de SOLIR. Mais comme l’entreprise SOLIR
compte proportionnellement plus de cadres que l’entreprise SILOR, le salaire moyen des salariés de SILOR est plus élevé
(2 478 contre 22 485).
2 DIAGRAMME EN BOÎTE
Une échelle étant choisie, le diagramme en boîte est formé d'un rectangle dont les extrémités représentent les
premier et troisième quartiles.
Cette « boîte » est partagée par un trait vertical
représentant la médiane.
Elle est prolongée, à gauche et à droite, par deux traits
horizontaux, appelés les « moustaches » dont les
extrémités sont les premier et neuvième déciles.
Souvent, lorsqu'elles sont connues, on indique les
valeurs extrêmes de la série.
Remarques :

Un tel diagramme s'appelle diagramme en boîte ou diagramme à moustaches ou encore diagramme de Tukey.

Pour la calculatrice, les extrémités des moustaches sont le min et le max.
Exercice corrigé : Représenter une série statistique par un diagramme en boîte
Le tableau ci-dessous donne la distribution des salaires nets annuels en 2007 en France dans les
collectivités territoriales (Source INSEE).
d1
d2
d3
d4
d6
d7
d8
d9
médiane
14 293 15 491 16 241 17 365
18 464
19 789 21 478 23 991 28 983
On sait de plus que le premier quartile est 15 991 et le troisième quartile est 22 315.
1) Représenter ces données par un diagramme en boîte.
2) À l'aide de ce diagramme, commenter la répartition des salaires.
Solution :
Méthode :
1)

Choisir une échelle qui permet
de représenter toutes les
données.

Dessiner la boîte dont les bords
représentent les premier et
troisième quartiles.

Partager cette boîte par un trait représentant la médiane.

Prolonger la boîte par les « moustaches » dont les extrémités sont les premier et neuvième déciles.
2) Les bas salaires sont plus concentrés que les hauts salaires.
 La dissymétrie de la boîte
En effet, 25 % des salaires inférieurs à la médiane sont compris entre
correspond à une répartition
non uniforme des salaires.
15 991 et 18 464, soit dans un intervalle d'amplitude égale à environ
2 500, tandis que 25 % des salaires supérieurs à la médiane sont
compris entre 18 464 et 22 315, soit dans un intervalle d'amplitude égale à environ 4 000.
De plus, 15 % des salaires sont compris entre 14 293 € et 15 991 €, soit dans un intervalle d'amplitude égale
à environ 1 700, tandis que 15 % des salaires sont compris entre 22 315 € et 28 983 €, soit dans un
intervalle d'amplitude égale à environ 6 650.
Exercice n°2 page 291
Une maternité a étudié les tailles des bébés nés à terme au cours d'une année.
Elle constate que 10 % des bébés ont une taille inférieure ou égale à 44 cm, que 10 % ont une taille supérieure ou égale
à 54 cm.
Un quart des bébés mesure plus de 52 cm et les trois quarts plus de 47 cm. De plus, la moitié des bébés mesurent
49 cm.
Représenter ces données par un diagramme en boîte.
H. Rorthais (Lycée Polyvalent du Sacré Cœur à Nantes)
http://www.sacrecoeur.nantes.e-lyco.fr
1e S - programme 2011 –mathématiques – ch.4 – cahier élève
Page 5 sur 14
On a d1 = 44 et d9 = 54 ; Med = 49 ; Q1= 47 et Q3 = 52.
44
45
46
47
48
49
50
51
52
53
Taille (cm)
Exercice n°3 page 291
Représenter chacune des séries de l'exercice 1 par un diagramme en boîte.
a) Série A : 1 - 2,5 – 3 – 4,2 – 5,3 – 7 – 9 - 10,2 – 12 – 15 – 17 – 20 – 21,7 – 25 – 27 – 50 – 54 – 60 – 63.
b) Série B : 13 – 17 – 35 – 12 – 20 – 45 – 67 – 54 – 23 – 34 – 26 – 12 – 22 – 69 – 46.
a)
b)
d1 Q1 Med Q3 d9
d1 Q1 Med Q3 d9
Série A
2,5 5,3
15
27
Série B
60
12
17
26
46
67
Exercice n°19 page 300 Q.C.M.
Donner la bonne réponse.
Une grande surface compte en fin d'année le nombre de chèques cadeaux vendus.
Ces chèques cadeaux sont de cinq types :
5
Montant
5 € ; 10 € ; 20 € ; 50 € ; 100 €.
Nombre de chèques 24
1) Le nombre total de chèques vendus est :
a) 5.
b) 100.
c) 97.
10 20 50 100
48 19 2
4
1) 24 + 48 + 19 + 2 + 4 = 97. Réponse c .
2) L'écart interquartile est :
a) 18,5.
2)
b) 10.
c) 67,5.
1
3
 97 = 24,25 et  97 = 72,75.
4
4
Q1 est la 25e valeur, soit 10 ; et Q3 est la 73e valeur, soit 20 ; donc l’écart interquartile est : 20 – 10 = 10.
Réponse b .
3) Soit M la médiane de la série :
a) le trait représentant M est au centre de la boîte du diagramme en boîte.
b) le trait représentant M est décalé vers la droite de la boîte du diagramme en boîte.
c) le trait représentant M est décalé vers la gauche de la boîte du diagramme en boîte.
3)
1
 97 = 48,5, donc M est la 49e valeur, soit 10.
2
Les extrémités du diagramme, les minimum et maximum, sont : 5 et 100.
Réponse c .
4) 25 % des plus petits chèques cadeaux ont une valeur inférieure ou égale à :
a) 10.
b) 7,5.
c) 5.
4) Q1 = 10. Réponse a .
Exercice n°20 page 301 Vrai ou faux ?
Préciser si les affirmations suivantes sont vraies ou fausses. Justifier la réponse.
La répartition des salaires dans une entreprise privée est donnée par le diagramme en boîte cicontre.
1) 25 % des femmes ont un salaire inférieur à 1 000 €.
2) Les salaires des hommes sont supérieurs à 1 000 €.
3) La moitié des hommes gagne autant ou plus que les trois quarts des femmes.
4) L'écart interquartile pour les salaires des hommes est le double de celui des salaires des
femmes.
5) Le pourcentage des salaires dont le montant est compris entre 1 000 € et 1 550 € est 75 %.
H. Rorthais (Lycée Polyvalent du Sacré Cœur à Nantes)
http://www.sacrecoeur.nantes.e-lyco.fr
1e S - programme 2011 –mathématiques – ch.4 – cahier élève
Page 6 sur 14
1)
Vrai , car Q1  1 000 € pour les femmes.
2)
Vrai si les extrémités représentent les extrema, faux s’il s’agit des déciles.
3)
Vrai , car M  1 550 € pour les hommes, et Q3  1 550 € pour les femmes.
4)
Faux , car Q3 – Q1  1 700 – 1 100  600 € pour les hommes, et Q3 – Q1  1 550 – 1 000 = 550 € pour les femmes.
5)
Faux , car c’est 50 % pour les femmes et pour les hommes.
Exercice n°22 page 301 Calcul et représentation graphique
Déterminer la médiane, le premier et le troisième quartile des séries suivantes, puis en proposer un diagramme en boîte.
1 – 3 – 5 – 6 – 8 – 7 – 9 – 12 – 11 – 6 – 12 – 9 – 12 – 16 – 13 – 17 – 18 – 15.
Série A
Série B
8 9 11 12 14 16 19 20
Note
2 4 3 2 1
Effectif 2 3 5
Avec la calculatrice :
Diagramme en boîte sur la calculatrice
On entre les valeurs xi dans la liste 1 et les effectifs ni dans la liste 2.
On obtient la boite » avec
:
On commence par régler
les données dans
, puis Grph 1 et
activer la trace :
On règle les affichages du
graphique avec 2nd STAT
PLOT.
Puis avec WINDOW pour et
xmin et avec GRAPH on
obtient :
Attention : les extrémités des moustaches sont le minimum et le maximum et non pas les déciles.
Série A : 1 – 3 – 5 – 6 – 6 – 7 – 8 – 9 – 9 – 11 – 12 –12 – 12 – 13 – 15 – 16 – 17 – 18.
min
3
Série A
8
Série B
Q1 Med Q3 max
6
10
13 18
11
12
16 20
Exercice n°4 page 291
Pendant 80 jours, on a relevé le niveau d'eau (en mètre) dans un réservoir et dressé le diagramme suivant :
1) Identifier les paramètres statistiques que l'on connaît grâce à ce diagramme en boîte.
2) Déterminer le nombre minimum de jours où le niveau de l'eau :
a) est inférieur ou égal à 1,8 m ;
b) est d'au moins 2 m ;
c) est compris entre 1,2 m et 2 m.
1) Le minimum de la série est 0,5 m et le maximum 2,5 m.
Le premier décile d1 est égal à 0,8 m et le neuvième décile d9 à 2.
Le premier quartile est égal à 0,8 m et le troisième à 1,8 m.
La médiane est égale à 1,6 m.
2) a) Au moins 75 % des jours, soit 60 jours.
b) 10 % des jours, soit 8 jours.
c) 65 % des jours, soit 52 jours.
Exercice n°5 page 294 Exploiter et comparer des diagrammes en boîte
Les diagrammes en boîte ci-dessous représentent les salaires annuels (en milliers d'euros) en Ile-de-France et dans les
régions françaises hors Ile-de-France.
Ile-de-France
H. Rorthais (Lycée Polyvalent du Sacré Cœur à Nantes)
http://www.sacrecoeur.nantes.e-lyco.fr
1e S - programme 2011 –mathématiques – ch.4 – cahier élève
Page 7 sur 14
Régions hors Ile-de-France
1) Préciser pour l'Ile-de-France et pour les régions hors Ile-de-France les valeurs des premier et neuvième déciles, des
premier et troisième quartiles, de la médiane et de l'écart interquartile.
2) En comparant les deux diagrammes en boîte, quelles différences peut-on relever ?
1) Pour l'Ile-de-France, on a :
d1 = 11,4, Q1 = 14,8, Me = 19,7, Q3 = 28,6, d9 = 42,2 et Q3 – Q1 = 13,8.
Pour les régions hors Ile-de-France, on a :
d1 = 10,5, Q1 = 12,5, Me = 15,7, Q3 = 20,5, d9 = 28 et Q3 – Q1 = 8.
2) La comparaison des deux boîtes à moustache permet non seulement de
constater que les salaires en Ile-de-France sont supérieurs aux salaires
de la Province, mais qu'ils sont sensiblement plus dispersés. En effet, les
écarts interquartiles sont de 13,8 pour l'Ile-de-France et de 8 pour la
Province.
On peut également remarquer que les hauts salaires sont beaucoup plus
dispersés en Ile-de-France : la moustache de droite [Q3 ; d9] est presque
deux fois plus ample pour l'Ile-de-France que pour la Province.
Les bords de la boîte correspondent aux
quartiles, le trait dans la boîte à la
médiane et les extrémités des
moustaches aux 1er et 9e déciles.
Des représentations en « diagramme en
boîte » à la même échelle permettent de
comparer des séries statistiques et
d'évaluer la dispersion de la « moitié
centrale » (intervalle [Q1 ; Q3]) autour de
la médiane : plus la boîte est resserrée
autour de la médiane, moins grande est
la dispersion.
Exercice n°13 page 299 Vrai ou faux ?
Préciser dans chaque cas si les affirmations suivantes sont vraies ou fausses.
1) Le premier quartile de la série ci-dessous est 12.
14 – 7 – 6 – 12 – 7 – 20 – 18 – 2 – 12 – 13 – 1 – 19 – 3 – 5 – 8.
1) 1 – 2 – 3 – 5 – 6 – 7 – 7 – 8 – 12 – 12 – 13 – 14 – 18 – 19 – 20.
Il y a 15 valeurs, et
1
 15 = 3,75, donc Q1 est la 4e valeur : Q1 = 5.
4
L’affirmation est fausse .
2) Une série contient 500 valeurs ; le premier décile vaut 50.
2) On ne connait pas les valeurs, jute leur quantité, on ne peut pas trouvé le premier décile.
L’affirmation est fausse .
3) Dans un diagramme en boîte, la médiane se trouve toujours au centre de la boîte.
3) L’affirmation est fausse .
4) Si on ajoute 10 à toutes les valeurs d'une série, alors la longueur de la boîte reste inchangée.
4) L’affirmation est vraie .
Exercice n°14 page 299 Vrai ou faux ?
Préciser dans chaque cas si les affirmations suivantes sont vraies ou fausses.
Dans une usine de fabrications d'ampoules de 20 watts, on a
prélevé 200 ampoules et mesuré leur puissance. Les données
collectées ont permis de réaliser le diagramme ci-dessous.
1) Au moins 100 ampoules ont une puissance comprise entre
19,3 W et 21 W.
2) La puissance moyenne des 200 ampoules est 20 W.
3) Au moins 75 % des ampoules ont une puissance effective de 21,4 W.
4) Au plus 19 ampoules ont une puissance strictement inférieure à 19 W.
1)
Vrai , cela représente la moitié des valeurs.
2)
Faux , c’est la médiane.
3)
Faux , c’est 90 %.
4)
Vrai , car d1 = 19 W.
Exercice n°18 page 300 À partir des quartiles et des déciles
Voici les paramètres de la série des notes obtenues par 160 candidats à une épreuve lors d'un concours :
Min = 3 ; d1 = 5 ; Q1 = 8 ; Me = 10 ; Q3 = 14 ; d9 = 16 ; Max = 19.
1) a) Combien de candidats ont obtenu une note d'au moins 10 ? d'au moins 14 ?
b) Toute note strictement inférieure à 5 est éliminatoire. Combien de candidats sont éliminés à cause de cette
épreuve ?
2) Exprimer en pourcentage la proportion de notes n vérifiant :
H. Rorthais (Lycée Polyvalent du Sacré Cœur à Nantes)
http://www.sacrecoeur.nantes.e-lyco.fr
1e S - programme 2011 –mathématiques – ch.4 – cahier élève
Page 8 sur 14
a) n < 14 ;
b) 8  n ;
c) 10  n < 16.
3) Les candidats sont classés dans l'ordre décroissant des notes. Quel est l'écart des notes entre le 41e candidat et le
121e ?
1) a) 80 ont eu au moins 10, 40 au moins 14.
b) On sait que 16 candidats ont obtenu une note inférieure ou égale à 5, mais on ne peut pas dire combien ont
eu une note strictement inférieure à 5, sauf à supposer que tous les candidats ont eu des notes différentes.
2) a) n < 14 : 75 % .
b)
25 % .
c)
40 % .
3) 16 – 8 = 12 .
Exercice n°21 page 301 Diagramme en boîte
On a représenté le diagramme en boîte d'une série, les extrémités des
moustaches correspondant aux déciles d1 et d9 .
On sait que la médiane est 12, et le premier quartile 8.
Déterminer le troisième quartile et le décile d9 de la série.
On peut déduire de l'énoncé qu'un carreau représente deux unités. Le troisième quartile est donc égale à 14 et le
neuvième décile à 21 .
Exercice n°23 page 301 Comparaison de diagrammes
Les diagrammes en boîte ci-contre représentent les répartitions des salaires mensuels, en euros,
des employés de deux entreprises E1 et E2 .
Commenter ces diagrammes.
Les salaires médians sont identiques, mais l’entreprise E2 a un premier quartile et un deuxième quartile nettement
supérieurs à la première. Toutefois, l’écart inter-décile est supérieur dans la deuxième entreprise, le premier décile étant
plus faible, et le dernier décile plus élevé.
Exercice n°25 page 302 À partir d'un histogramme
L'histogramme suivant représente une série statistique
On suppose que la répartition est uniforme à l'intérieur de chaque classe.
1) Déterminer une approximation de la médiane, des premier et troisième
quartiles, et des premier et neuvième déciles.
2) Construire le diagramme en boite associé à cette série.
1)
Valeur
Effectif
Fréquence
Fréquence
cumulée
[10 ; 15[
[15 ; 20[
[20 ; 25[
[25 ; 30[
[30 ; 35[
[35 ; 40[
[40 ; 45[
[45 ; 50[
[50 ; 55[
[55 ; 60[
250
250
200
200
150
75
75
75
50
50
18 %
18 %
15 %
15 %
11 %
5%
5%
5%
4%
4%
18 %
36 %
51 %
65 %
76 %
82 %
87 %
93 %
96 %
100 %
Médiane : 24,7 ; d1 : 12,8 ; Q1 : 16,9 ; Q3 : 34,4 ; d9 : 47,5 .
H. Rorthais (Lycée Polyvalent du Sacré Cœur à Nantes)
http://www.sacrecoeur.nantes.e-lyco.fr
1e S - programme 2011 –mathématiques – ch.4 – cahier élève
Page 9 sur 14
2)
3 VARIANCE ET ÉCART TYPE
Notation : Le symbole 
On utilise le symbole  pour écrire de façon condensée une somme de nombres. Si par exemple on pose :
a1 = 1, a2 = 3, a3 = 5, a4 = 7, a5 = 9, a6 = 11, alors :
6
 ai = a1 + a2 + a3 + a4 + a5 + a6 = 36.
i=1
PROPRIÉTÉS ET DÉFINITION

Soit x1 , x2 , … , xn, une série statistique de n valeurs et de moyenne x .

Soit f la fonction définie sur IR par :
x


1
[(x – x)2 + (x2 – x)2 + … + (xn – x)2]
n 1
ou
x


1
n
n

(xi – x)2.
i=1
f (x) est la moyenne des carrés des écarts entre la valeur x et les valeurs de la série.

Le minimum de f s'appelle la variance de la série et est noté V.

Il est atteint pour x = x :
V=
1
n
n

n

 (xi – x )2 = n  xi2 – x2 .
1
i=1
i=1
C'est la moyenne des carrés des écarts entre les valeurs de la série et la valeur moyenne.
C'est aussi l'écart entre la moyenne des carrés des valeurs de la série et le carré de la moyenne.
Démonstration :
Voir la démonstration à l'exercice 38, page 305.
Remarque :
Une variance est un nombre positif ou nul.
En pratique :
Cas d'une série statistique donnée par un tableau d'effectifs :
On considère la série statistique donnée par le tableau ci-contre.
La variance V de cette série est égale à :
V=
1
n1 + n2 + … nk
k

 ni (xi – x)2 =
i=1
1
n1 + n2 + … nk
k
Valeur
x1 x2 … xk
Effectif n1 n2 … nk

 ni xi2 – x 2.
i=1
V est la « moyenne pondérée des carrés des écarts à la moyenne ».
DÉFINITIONS
Soit x1 , x2 , … , xn une série statistique de n valeurs. et de variance V.
On appelle écart type le nombre noté s avec s = V.
Remarque :
De façon habituelle, on note l'écart type s en statistique et  en probabilité.
Exemple :
Deux élèves A et B décident de comparer leurs notes :
 Les notes de l'élève A sont : 8 ; 11 ; 6 ; 13 ; 12 ; 9 ; 11 ;
la moyenne est mA = 10 ; l'écart type est sA =

36
 2,27 ;
7
Les notes de l'élève B sont : 10 ; 7 ; 7 ; 13 ; 13 ; 8 ; 12 ;
la moyenne est mB = 10 ; l'écart type est sB =
44
 2,51.
7
Les deux élèves ont la même moyenne 10, mais l'écart type de la série A est inférieur à celui de la série B. Les
notes de l'élève A sont plus regroupées autour de la moyenne que celles de l'élève B au sens de l'écart type,
puisque sA < sB .
H. Rorthais (Lycée Polyvalent du Sacré Cœur à Nantes)
http://www.sacrecoeur.nantes.e-lyco.fr
1e S - programme 2011 –mathématiques – ch.4 – cahier élève
Page 10 sur 14
Interprétation :
L'écart type d'une série statistique est une mesure de la dispersion liée à la moyenne : elle rend compte de la
répartition des données autour de la moyenne.
Exercice n°5 page 293
Calculer la moyenne et l'écart type de chacune des séries suivantes :
a)
11
7
14
8
9
15
10
6
b)
102,6
102,3
106,8
101,8
107,4
100,9
104,3
101,8
101,5
103
100
108,5
107,4
109,2
80
a) Moyenne :
= 10 .
8
1
Variance :  872 – 102 = 9.
8
Écart type :
b)
103,1
108,5
101,7
102,1
102,6
104,5
xi
11
xi2
121 49 196 64 81 225 100 36
7
14
8
9
15
10
6
Total
80
872
9= 3 .
xi
102,6
102,3
106,8
101,8
107,4
100,9
104,3
101,8
103,1
102,1
xi2
10526,8
10465,3
11406,2
10363,2
11534,8
10180,8
10878,5
10363,2
10629,6
10424,4
xi
101,5
108,5
102,6
108,5
107,4
109,2
101,7
104,5
Total
2080
10342,9
10920,3
216477,9
103
100
xi2
10302,3 10609 10000 11772,3 10526,8 11772,3 11534,8 11924,6
102,6 + 102,3 + … 2 080
Moyenne :
=
= 104 .
20
20
1
1
Variance :
(102,62 + 102,32 + …) – 1042 =
 216 477,9 – 1042 = 7,895.
20
20
Écart type
7,895  2,81 .
Exercice corrigé : Calculer et utiliser un écart type
On considère la série statistique donnée par le tableau ci-dessous :
Valeur xi 3 4
5 6 7 8 9 10
Effectif ni
3 14 19 26 23 13 1 1

1) Déterminer la moyenne x et l'écart type s de la série statistique au moyen de la calculatrice.


2) Calculer le pourcentage des valeurs de la série qui appartiennent à l'intervalle [x – s ; x + s].
 Voir les fiches Calculatrices, page 394.
Solution :
1) On entre les valeurs xi dans la liste 1 et les effectifs ni dans la liste 2.
puis
Pour cela on utilise :

sur TI : la touche

sur Casio :
.
.
On doit indiquer à la calculatrice :
la liste contenant les xi et la liste
On active le traitement avec
:
Pour TI avec l'instruction : Stats 1-Var L1, L2.
Pour Casio, avec
Méthode :
contenant les ni ou les fi .
d'abord on choisit les listes :
et on lance le traitement avec 1-
Var.

on obtient la moyenne x = 6 et x  1,42
l'écart type s.


2) On a : x – s  4,58 et x + s  7,42.
Dans l'intervalle [4,58 ; 7,42] il y a 19 + 26 + 23 valeurs, soit 68, pour
un effectif total de n = 100. Donc 68 % des valeurs appartiennent à


[ x – s ; x + s].
On remarque que la calculatrice a
aussi calculé  ni xi2 qui vaut 3 802,
ce qui permet de retrouver la
variance : V =
3 802 2
– x = 2,02
100
et la valeur exacte de l'écart type
qui est la racine carrée de la
H. Rorthais (Lycée Polyvalent du Sacré Cœur à Nantes)
http://www.sacrecoeur.nantes.e-lyco.fr
1e S - programme 2011 –mathématiques – ch.4 – cahier élève
Page 11 sur 14
variance : s = 2,02  1,42.
Exercice n°6 pages 294-295 Comparer deux séries statistiques à l'aide du couple « moyenne ;
écart type »
Le tableau ci-dessous donne la hauteur des précipitations mensuelles moyennes
(en mm) à Paris et à Nice, établies sur plusieurs décennies :
Jan.
Fév.
Mars
Avril
Mai
Juin
52,4
43,7
48,5
53
65,0
54,3
Paris
85,1
59,7
60,9
69,2
49,4
38,3
Nice
Juil.
Août
Sept.
Oct.
Nov.
Déc.
63,1
43,0
54,7
59,7
52,0
58,7
Paris
15,4
23,9
75,6
143,9
94,3
87,6
Nice

1) Pour chacune de ces deux villes, calculer la moyenne annuelle x des
précipitations et l'écart type s.
2) À l'aide de ces indicateurs, comparer les séries des précipitations mensuelles
à Paris et à Nice.

1) Pour Paris, on a x  54,0 et s  6,6.

Pour Nice, on a x  66,9 et s  33,2.

On utilise : x =
1

x , V = xi2 – x 2 et s = V,
n i
ou directement les fonctions de la calculatrice.
2) La hauteur des précipitations est plus importante en moyenne à Nice qu'à Paris.
L'écart type, beaucoup plus grand à Nice, indique des valeurs plus dispersées autour de
la moyenne qu'à Paris.
En observant les données plus en détail, on constate que les précipitations sont plus
régulières à Paris qu'à Nice avec peu de variations à Paris selon les mois, et de fortes
variations à Nice avec une période plutôt sèche en été et une période très humide en
automne et en hiver.
La comparaison des
moyennes donne une
indication sur la quantité
de pluie et la comparaison
des écarts types sur la
dispersion des données
autour de la moyenne.
Exercice n°7 page 295 Exploiter l'histogramme d'un caractère quantitatif continu
L'histogramme ci-contre donne la répartition des différentes tailles des
élèves d'une classe de Première.
1) Dresser un tableau des tailles regroupées en classes d'amplitude 10,
avec les effectifs et les centres des classes.
2) Calculer, à partir du regroupement en classes, une valeur
approximative de la taille moyenne t et de l'écart type s.
3) Montrer que plus de 90 % des élèves ont une taille comprise dans
l'intervalle [t – 2s ; t + 2s].
1)
Taille
Centre ci
Effectif ni
2) On a : t =
[140 ; 150[ [150 ; 160[ [160 ; 170[ [170 ; 180[ [180 ; 190[
145
155
165
175
185
1
9
13
6
1
 ni ci
 ni
=
Une valeur approximative de la
moyenne et de l'écart type
s'obtient en remplaçant chaque
classe par son centre.
Attention : dans le calcul de V, le
carré ne porte que sur les valeurs
ci et non sur les effectifs ni .
4 920
.
30
Une valeur approximative de la taille moyenne est 164 cm.
On a : V =
 ni ci2
 ni
– t2 =
Les données sont regroupées en
intervalles semi-fermés, appelés
classes, dont l'amplitude
correspond à la largeur des
rectangles de l'histogramme.
809 150
– 1642, soit V  75,66.
30
On a : s = V, soit s  8,7.
Une valeur approximative de l'écart type est 8,7 cm.
3) On a t – 2s  146,6 et t + 2s  181,4.
Toutes les tailles comprises entre 150 et 180 appartiennent à l'intervalle
[t – 2s ; t + 2s].
Il y en a 28 parmi les 30. La proportion est 28 : 30, soit environ 93 %. Donc plus
de 90 % des élèves ont une taille comprise dans l'intervalle [t – 2s ; t + 2s].
On détermine l'intervalle [t – 2s ; t
+ 2s] et l'effectif des valeurs dont
on est sûr de leur appartenance à
cet intervalle.
Exercice n°11 page 299 Q.C.M.
Pour chacune des questions suivantes, déterminer toutes les réponses correctes.

Soit une série statistique de n valeurs, de moyenne x , de variance V et d'écart type s.
1
1
1) Une formule donnant la valeur de V est :


a)
( x – xi)2
b)
(xi – x)2
n
H. Rorthais (Lycée Polyvalent du Sacré Cœur à Nantes)
n

c) x 2 –
1
x2
n i
http://www.sacrecoeur.nantes.e-lyco.fr
1e S - programme 2011 –mathématiques – ch.4 – cahier élève
2) Pour une série de 30 valeurs comprises
entre 0 et 10, on peut avoir :
3) Si les valeurs xi sont pondérées par les
fréquences fi , alors on a :
1)
a et b .
2)
b et c .
3)
a et c .
a) s = –1
Page 12 sur 14
b) s = 15

a) x =  fi xi
b) V =
c) s = 2,3

 (fi xi – x)2
c) V =

 fi (xi – x)2
Exercice n°15 page 299 Vrai ou faux ?
Préciser dans chaque cas si les affirmations suivantes sont vraies ou fausses.
1) Si deux séries statistiques ont la même moyenne et le même effectif, alors elles sont confondues.
2) La variance mesure la dispersion d'une série autour de sa moyenne.
3) Tous les élèves d'une classe ont obtenu 12 à un contrôle. La série de leurs notes a pour moyenne 12 et pour écart
type 0.
1)
Faux .
2)
Vrai .
3)
Vrai .
Exercice n°27 page 303 Vrai ou faux ?
Préciser si les affirmations suivantes sont vraies ou fausses. Justifier la réponse.

On considère une série statistique de moyenne x , de variance V et d'écart type s.
1) V est un nombre positif ou nul.
2) L'écart type n'est jamais nul.
3) Si x = 0, toutes les valeurs de la série sont nulles.
4) Si s = 0, toutes les valeurs de la série sont nulles.

5) L'écart entre une valeur de la série et x ne peut pas dépasser 4s.
1)
Vrai , car c’est une somme de carrés.
2)
Faux : cela signifie que tous les termes de la série sont égaux.
3)
Faux , car les écarts se compensent.
4)
Faux (tous les termes sont égaux).
5)
Faux : on peut imaginer une série de 100 valeurs nulles et une valeur égale à 100.
Exercice n°28 page 303 Q.C.M.
Donner l'unique bonne réponse.
1) Pour une série de 5 données, la variance est égale à 6 et pour une autre série de 15 données, la variance est égale à
8.
Les moyennes des deux séries sont égales.
Alors la variance des 20 observations est égale à :
a) 14.
b) 6.
c) 7,5.
2) Deux séries de même effectif ont même moyenne et même écart type. Elles ont alors nécessairement :
a) même médiane.
b) même écart interquartile.
c) même variance.
1) Réponse c .
2) Réponse c .
Exercice n°29 page 303
Le tableau ci-contre donne la répartition des notes obtenues à un
Note
contrôle de math. par les 25 élèves d'une classe de Première :
Effectif

1) Calculer la note moyenne x et l'écart type s.


2) Déterminer la fréquence des élèves dont la note appartient à [ x – s ; x + s].
3 5 7 8 10 11 13 14 17
1 2 1 5 4 1 7 3 1

1) x = 10,44 et s  3,37 .


2) [ x – s ; x + s] = [7,07 ; 13,81]
Il y a 5 + 4 + 1 + 7 = 17 valeurs, soit une fréquence de
17
= 0,68 .
25
Exercice n°30 page 303
On donne la série statistique suivante :
1) Avec la calculatrice, entrer les valeurs de 0 à 5 dans la liste 1 et les effectifs
H. Rorthais (Lycée Polyvalent du Sacré Cœur à Nantes)
3 2 3 3 1 5 4 3 1 5
2 1 4 3 3 0 1 3 3 1
http://www.sacrecoeur.nantes.e-lyco.fr
1e S - programme 2011 –mathématiques – ch.4 – cahier élève
correspondants en liste 2.
2) Calculer l'écart type de cette série.
1)
Page 13 sur 14
2 4 2 4 0 0 2 2 3 2
3 2 3 3 1 5 4 3 1 5
2) Écart type : 1,36 (à 0,01 près).
Exercice n°32 page 303 Écart type, moyenne et pourcentage
Dans un journal, on a comptabilisé le nombre de lignes de chaque petite annonce.
On a obtenu le tableau de répartition suivant :
1
2
3
4
5
6
Nombre de lignes
1) Calculer la moyenne et l'écart type de cette série.
8 21 39 22 7
Nombre d'annonces 2
2) Quel est le pourcentage d'annonces dont le nombre de lignes présente un écart avec la moyenne supérieur à l'écart
type ?
1) Moyenne : 3,93 ; écart type : 1,10 .
2) Il y a 17 valeurs, soit 17 % de l’effectif.
Exercice n°36 page 304 Comparaison de deux séries
On a relevé, pendant 30 jours consécutifs, le nombre d'entrées
dans deux salles de cinéma.
On a obtenu les résultats suivants :
Salle A
219, 259, 225, 227, 236, 190, 240, 269,
229, 236, 238, 231, 192, 210, 225, 222,
241, 203, 214, 209, 217, 213, 216, 206,
175, 229, 242, 243, 226, 266.
Salle B
262, 246, 212, 231, 229, 228, 216, 213,
222, 235, 210, 264, 185, 211, 232, 229,
170, 223, 226, 223, 197, 260, 228, 250,
246, 174, 224, 207, 205.
Comparer les dispersions de ces deux séries autour de leur moyenne.
Salle A : écart type de 20,8.
Salle B : écart type de 23,7 : la dispersion est plus forte.
Exercice n°37 page 304 Écart type d'une série en classes
Le tableau suivant donne la répartition des clients d'une
boutique selon le montant, en euros, de leurs achats :
On supposera que l'effectif est concentré au centre des
classes.
1) Calculer la moyenne et l'écart type de cette série.
2) Quel est le pourcentage de clients dont le montant des
achats présente un écart avec la moyenne supérieur à
deux fois l'écart type ?
Montant des
achats (en €)
Nombre de
clients
[0 ; 15[
[15 ; 30[
[30 ; 60[
[60 ; 120[
[120 ; 240]
57
135
104
52
12
Montant des achats (en €)
Centre des classes (en €)
Nombre de clients
[0 ; 15[ [15 ; 30[ [30 ; 60[ [60 ; 120[ [120 ; 240]
7,5
22,5
45
90
180
57
135
104
52
12
 57  7,5 + 135  22,5 + 104  45 + 52  90 + 12  180 14 985
1) Moyenne : x =
=
= 41,625 .
57 + 135 + 104 + 52 + 12
360
1 092 150 14 9852 168 623 775
Variance : V =
–
=
 1 301,11
360
129 600
 360 
168 623 775
Écart type : s =
 36,071 .
129 600


2) [ x – 2s ; x + 2s]  [–30,5 ; 113,8].
12
Il y a 12 valeurs, soit
 100  3,3 % .
360
Exercice n°41 page 306 Sensibilité aux valeurs extrêmes
Un groupe de 8 élèves a obtenu les moyennes suivantes en mathématiques au cours du premier trimestre de l'année
scolaire : 8, 8, 9, 10, 10, 11, 12, 12.
1) Déterminer la moyenne et l'écart type de la série, ainsi que la médiane et l'écart interquartile.
2) Au deuxième trimestre, deux nouveaux élèves rejoignent le groupe, avec des moyennes respectives de 4 et 14.
a) Déterminer les paramètres statistiques de la nouvelle série.
b) Quelle est à 1 % près la variation en pourcentage de chacun des paramètres ?
Lequel des deux couples d'indicateurs paraît le moins sensible aux valeurs extrêmes, entre moyenne/écart type
et médiane/écart interquartile ?
H. Rorthais (Lycée Polyvalent du Sacré Cœur à Nantes)
http://www.sacrecoeur.nantes.e-lyco.fr
1e S - programme 2011 –mathématiques – ch.4 – cahier élève
1)
2) a)
b)
Moyenne
Écart type
Médiane
10
9,8
2%
1,5
2,6
73 %
10
10
0%
[Q1 ; Q3]
[8 ; 11]
[8 ; 12]
Page 14 sur 14
Q3 – Q1
3
4
33 %
C’est le couple médiane/écart interquartile .
H. Rorthais (Lycée Polyvalent du Sacré Cœur à Nantes)
http://www.sacrecoeur.nantes.e-lyco.fr
Téléchargement