Seconde Chapitre 4 : « Statistiques

publicité
Seconde
Chapitre 4 : « Statistiques »
Page 1 sur 10
I) Vocabulaire
Histoire des statistiques
Bien que le nom de statistique soit relativement récent, cette activité semble exister dès la naissance des
premières structures sociales. On trace de recensement en Chine ou en Égypte 2500 ans avant JC. Le rôle de
collecteur de données est souvent tenu par des guildes marchandes, puis par les intendants de l'État.
Ce n'est que vers 1700 que l'on voit apparaître le rôle prévisionnel des statistiques avec la construction des
premières tables de mortalité. En 1800 cette activité prend son plein essor. Des règles précises sur la collecte
et l'interprétation des données furent édictées.
Application des statistiques :
Elles concernent des domaines d'application aussi divers que l'actuariat, l'agriculture, l'anthropologie,
l'archéologie, l'audit, la biologie, la biopharmacie, la chimie, la climatologie, le contrôle de qualité, la
criminologie, la cristallographie, la démographie, la dentisterie, le droit, l'écologie, l'économie, l'économétrie,
l'éducation, l'épidémiologie, les finances, la génétique, la géographie, la géologie, l'histoire, l'hydrologie,
l'industrie, l'ingénierie, les jeux, la linguistique, la littérature, le management, le marketing, la médecine, la
météorologie, l'ophtalmologie, la pharmacologie, la physique, la planification, la politologie, la psychologie,
la sociologie, les sondages, la théologie, la zoologie, l’informatique et plus récemment internet et ses moteurs
de recherches.
Effectuer une étude statistique consiste à recueillir, présenter et interpréter des informations.
Une série statistique est l’ensemble des résultats bruts obtenus lors d’une enquête.
L’ensemble des personnes ou objets étudiés se nomme la population étudiée.
Chaque personne ou chaque objet de l’étude est un individu.
L’objet de l’étude est le caractère.
Les différentes valeurs du caractère sont les modalités.
L’effectif d’une modalité est le nombre d’individu qui possède cette valeur du caractère.
L’effectif total est la somme de tous les effectifs. C’est la taille de la population.
La fréquence d’une modalité est la proportion que représente l’effectif de cette modalité par rapport à
l’effectif total. Elle s’obtient en divisant l’effectif par l’effectif total.
Seconde
Chapitre 4 : « Statistiques »
Page 2 sur 10
1) Caractère qualitatif
Exemple 1 : On étudie la série statistique suivante qui donne les affectations des 840 élèves du lycée qui
étaient en seconde en 2013-2014.
Voeux
effectifs
Fréquences
1ere L
82
1ere ES
185
1ere S
250
1ere STI 2 D
88
1ere STMG
151
Autres
84
Total
840
1) Compléter les phrases suivantes :
La population est
Les individus sont
Le caractère étudié est
Les modalités du caractère sont
Le caractère est qualitatif car
2) Compléter le tableau en indiquant les fréquences. Arrondir au dixième.
3) Construire un diagramme en bâtons de cette série à partir des fréquences.
30
20
10
0
4) On appelle mode le ou les caractères dont l’effectif est le plus important.
Pour cette série le mode est :
Exemple 2 : On étudie la série statistique suivante qui donne les collèges d’origine des élèves du lycée en
seconde en 2014-2015.
Collège
Weiler
Eluard
Wallon
Pompidou
Daudet
Bellevue
Delacroix
Ste Thérèse
Autres
Effectifs
109
105
91
88
87
77
57
44
91
Fréquences en %
1) Compléter les phrases suivantes :
La population étudiée est
Les individus sont
Le caractère étudié est
C’est un caractère qualitatif car
2) Compléter le tableau en indiquant les fréquences. Mettre le résultat en % et arrondir à l’unité.
total
Seconde
Chapitre 4 : « Statistiques »
Page 3 sur 10
3) Compléter te tableau de proportionnalité suivant :
Collège
Weiler
Eluard
Wallon
Pompidou
Daudet
Bellevue
Ste
Delacroix
Thérèse
Autres
total
Fréquences
100
en %
Angles en
×1,8
180
degrés
4) Construire le diagramme semi-circulaire de cette série :
2) Caractère quantitatif discret (à valeurs discontinues)
Exemple 3 :
On étudie la série statistique suivante qui donne le nombre d’enfants par famille dans une commune :
Nb d’enfants
0
1
2
3
4
5
6
7
Effectif
10
80
95
18
21
5
0
1
Fréquence
1) Compléter les phrases suivantes :
La population est
Le caractère étudié est
Le caractère est quantitatif car
On dit qu’il est discret car ses
L’effectif total est
Le mode de cette série est
2) Quelle est la moyenne de la série ?
3) Compléter le tableau en indiquant les fréquences. Arrondir au centième.
Seconde
Chapitre 4 : « Statistiques »
Page 4 sur 10
5) Réaliser un diagramme en bâtons de cette série à partir des fréquences.
0,5
0,4
0,3
0,2
0,1
0
0
1
2
3
4
5
6
7
8
3) Caractère quantitatif continu
Exemple 4 : Voici les temps moyens de parcours du domicile des élèves jusqu’au lycée :
Temps en min
[0 ;5[
[5 ;10[
[10 ;20[
[20 ;50[
[50 ;90[
Effectif
20
40
90
96
4
[20 ;50[
[50 ;90[
Fréquences
1) Compléter les phrases suivantes :
La population est
Le caractère étudié est
Le caractère est
On dit qu’il est continu car ses
L’effectif total est
2) Compléter le tableau en calculant les fréquences. Arrondir au centième.
3) On souhaite calculer la moyenne de cette série.
Quel problème se pose ?
4) Compléter le tableau en calculant les centres des classes.
A savoir, le centre d’un intervalle fini est la moyenne de ses bornes.
Temps en min
[0 ;5[
[5 ;10[
Fréquences
Centre
5) Calculer alors la moyenne de cette série ?
6) Cette moyenne est-elle fiable ?
[10 ;20[
Seconde
Chapitre 4 : « Statistiques »
4) Calcul de la moyenne avec le logiciel pronote
Exemple 5 :
Voici le relevé des notes d’un élève.
Calculer sa moyenne.
Exemple 6 :
Voici le relevé des notes d’un élève.
Calculer sa moyenne.
Exemple 7 :
Voici le relevé des notes d’un élève.
Calculer sa moyenne.
Exemple 8 :
Voici le relevé des notes d’un élève.
Calculer sa moyenne.
Page 5 sur 10
Seconde
Chapitre 4 : « Statistiques »
Page 6 sur 10
II) Médianes et quartiles
1) Effectifs cumulés croissants
Exemple 9 :
Une enquête sur le temps de travail personnel quotidien des élèves de terminale du lycée donne :
Temps en heures
Effectif
ECC
FCC
ECD
FCD
[0 ;1[
136
[1 ;2[
303
[2 ;3[
272
[3 ;4[
81
1) Compléter le tableau
2) Quel est le % d’élèves qui travaillent plus de deux heures par jour ?
3) Quel est le % d’élèves qui travaillent moins de 4 heures par jours ?
4) Construire le polygone des fréquences cumulées croissantes :
Dans ce cas des ECC, on prend la borne gauche de l’intervalle comme référence
100
90
80
70
60
50
40
30
20
10
0
0
1
2
3
4
5
[4 ;5[
17
Seconde
Chapitre 4 : « Statistiques »
Page 7 sur 10
2) Médiane
On considère une série statistique à caractère quantitatif discret.
On suppose que les valeurs du caractère sont rangées dans l’ordre croissant.
La médiane est une valeur du caractère qui partage la série en deux groupes de même effectif, l’un est
composé des valeurs inférieures à la médiane, l’autre est composé des valeurs supérieures à la valeur de la
moyenne.
Si la série comporte N valeurs rangées dans l’ordre croissant :
Si N est impair, la médiane est la
N +1
ième valeur.
2
Si N est pair, la médiane est la moyenne entre la
N
N
ième valeur et la + 1 ième valeur.
2
2
Exemple 10 : Dans une classe de seconde, on a relevé la taille des élèves. Déterminer la médiane.
Taille en cm 150 155 160 162 163 165 166 167 168 170 173 174 176 178 179
Effectif
1
1
2
1
2
3
1
2
1
1
2
1
1
2
1
ECC
Exemple 11 : Dans une classe de seconde, on a relevé la taille des élèves. Déterminer la médiane.
Taille en cm
Effectif
157 159 162 163 164 165 166 167 169 171 173 176 177 178 180
1
2
2
1
3
3
1
3
1
2
2
4
4
1
3
ECC
3) Les quartiles
Les quartiles d’une série sont trois valeurs du caractère qui partagent la série en quatre groupes de même
effectif. On les note par ordre croissant Q1 , Q2 et Q3 . La valeur Q2 est la médiane.
Cela signifie que 25% de la population a une valeur du caractère inférieure à Q1, que 25% de la
population a une valeur du caractère comprise entre Q1 et Me, que 25% de la population a une valeur du
caractère comprise entre Me et Q3, que 25% de la population a une valeur du caractère supérieure à Q1.
Seconde
Chapitre 4 : « Statistiques »
Page 8 sur 10
Exemple 12 : Voici les notes d’une classe de seconde
Note
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Effectif
1
3
4
6
6
4
4
0
2
3
0
0
0
1
0
ECC
FCC
1) Compléter la ligne des effectifs cumulés croissants.
Déterminer la médiane et le premier et le troisième quartile de la série.
2) Compléter la ligne des fréquences cumulées.
Retrouver Q1 , Me et Q3 en utilisant les fréquences cumulées.
3) Tracer ci-dessous le polygone des effectifs cumulés croissants.
Retrouver graphiquement la médiane et les quartiles.
100
90
80
70
60
50
40
30
20
10
0
0
2
4
6
8
10
12
14
16
18
20
Seconde
Chapitre 4 : « Statistiques »
Page 9 sur 10
III) Caractéristiques de dispersion
1) Etendue
L’étendue d’une série est la différence entre ses valeurs extrêmes.
Elle renseigne sur la dispersion de la série.
On peut caractériser une série par la donnée de la moyenne et de l’étendue.
2) Ecart interquartile
L’écart interquartile d’une série est la différence entre les deux quartiles : Q3 − Q1 .
Il renseigne sur la dispersion de la série.
On peut caractériser une série par la donnée de la médiane et de l’intervalle interquartile.
On représente alors ces caractéristiques par une boite à moustaches :
Min
Med
Q1
Max
Max
Q3
Exemple 13 :
1) Voici la taille des élèves dans une première classe de seconde.
Calculer, pour chaque série, sa moyenne et son étendue.
150 155 160 162 163 165 166 167 168 170 173 174 176 178 179
Taille en cm
1
Effectif
1
2
1
2
3
1
2
1
1
2
1
1
3
1
2) Voici la taille des élèves dans une première classe de seconde.
Calculer, pour chaque série, sa moyenne et son étendue.
157 159 162 163 164 165 166 167 169 171 173 176 177 178 180
Taille en cm
1
Effectif
2
2
1
3
3
1
3
1
2
2
4
4
1
3) Réaliser les boites à moustaches. Comparer alors les deux séries.
150
152
154
156
158
160
162
164
166
168
170
172
174
176
178
180
150
152
154
156
158
160
162
164
166
168
170
172
174
176
178
180
3
Seconde
Chapitre 4 : « Statistiques »
Page 10 sur 10
80
70
80
70
60
60
50
50
40
40
30
30
20
20
10
10
80
80
70
70
60
60
50
50
40
40
30
30
20
20
10
10
Téléchargement