cours statistiques

publicité
Chapitre 5 : Statistiques
I. Définir et représenter une série statistique
1. Vocabulaire
•
•
!
!
!
Population
La population est un ensemble de personnes ou d'objets, appelés individus, sur
lesquels porte l’étude statistique.
Par exemple, les élèves de la classe de seconde.
Caractère
Le caractère d’une série statistique est la propriété étudiée sur chaque individu. Il est
dit :
qualitatif
Lorsqu’il ne prend pas que des valeurs numériques : la couleur des yeux des élèves de
la classe.
Quantitatif discret
Lorsqu’il ne prend qu’un nombre fini de valeurs numériques : nombre de frères et
sœurs des élèves de seconde.
Quantitatif continu
Lorsqu’il peut prendre une infinité de valeurs numériques : salaires des employés
d’une entreprise.
2. Effectifs et fréquences
Définition
•
•
L'effectif d'une valeur est le nombre d'individus de la population prenant cette valeur.
La fréquence d'une valeur est le quotient de l'effectif de cette valeur par l'effectif
total.
effectif de la valeur
Ainsi on a : fréquence d'une valeur =
.
effectif total
Exemple
Sur un parking, on étudie la couleur des voitures.
Le caractère étudié est qualitatif.
La distribution des effectifs est donnée dans le tableau ci-dessous :
L'effectif de la valeur grise est 18.
18 9
= .
32 16
Cette fréquence vaut aussi 0,5625 ou 56,25 %.
La fréquence de la valeur grise est
2nde
Effectif
18
7
5
2
32 (total)
Chapitre 5 : Statistiques
Couleur
Grise
Blanche
Bleue
Rouge
1
3. Effectif cumulé croissant
Définition
L'effectif cumulé croissant (ecc.) d'une valeur est la somme des effectifs des valeurs qui lui
sont inférieures ou égales.
On définit de même la fréquence cumulée croissante.
Exemple
Dans un village, on a dénombré les foyers selon leur nombre d'enfants. On a consigné les
résultats dans le tableau ci-dessous :
Nombre d'enfants
0
1
2
3
4
5
Nombre de foyers
68 44 38 28 14
8
Effectif cumulé croissant 68 112 150 178 192 200
Dans ce tableau, on lit que 38 foyers ont 2 enfants. De plus, on lit que 150 foyers ont au plus
2 enfants.
À partir des effectifs, on peut dresser le tableau des fréquences.
Nombre d'enfants
0
1
2
3
4
5
Fréquence
0,34 0,22 0,19 0,14 0,07 0,04
Fréquence cumulée croissante 0,34 0,56 0,75 0,89 0,96
1
Dans ce tableau, on lit que 14 % des foyers ont 3 enfants. De plus on lit que 89 % des foyers
ont au plus 3 enfants.
4. Représentation d’une série statistique
Caractère quantitatif
discret ou qualitatif
Diagramme en bâtons
2nde
Tout type de caractère
Caractère quantitatif continu
Diagramme circulaire
Histogramme
Chapitre 5 : Statistiques
Selon le type de caractère, on utilise différentes représentations graphiques :
2
Exercice 1
Un centre animalier a répertorié le nombre de chatons nés sur 50 portées :
nombre de chatons
3
4
5
6
7
8
9
Fréquence
0,04 0,14 0,22 0,16 0,24 0,14 0,06
1. Calculer les fréquences cumulées croissantes de cette série.
2. Quel est, en pourcentage, le nombre de portées qui comptent au plus 5 chatons ?
3. Représenter la série dans un diagramme circulaire.
Exercice 2
Une enquête sur le temps de travail personnel quotidien des élèves en classe de seconde d'un
lycée a donné les résultats ci-dessous :
temps de travail en heures Effectif
40
[0;1[
[1; 2[
[2;3[ [3; 4[ [4;5[ 95
86
24
5
1. Calculer les fréquences, les fréquences cumulées décroissantes.
2. En déduire le pourcentage d'élèves qui travaillent plus de 2 heures par jour.
3. Représenter graphiquement les fréquences cumulées décroissantes.
2nde
Chapitre 5 : Statistiques
Solution
3
II. Paramètres d'une série statistique
1. La moyenne
Définition
On considère une série statistique dont les valeurs de caractère sont x1 , x2 ,..., x p et les effectifs
associés : n1 , n2 ,..., n p .
La moyenne de cette série statistique, notée x , a pour valeur :
n × x + n × x + ...n p × x p
x= 1 1 2 2
n1 + n2 + ... + n p
Si on note fi la fréquence de la valeur xi alors :
x = f1 x1 + f 2 x2 + ... f p x p
Remarque
Lorsque le caractère est continu, pour calculer la moyenne on utilise le centre des classes.
2. La médiane
Définition
La médiane d'une série statistique est le nombre noté M e , tel que :
• 50 % au moins des individus ont une valeur du caractère inférieure ou égale à M e .
• 50 % au moins des individus ont une valeur supérieure ou égale à M e .
Méthode
•
•
On range d'abord la série de n valeurs par ordre croissant des valeurs :
n +1
Si l’effectif n est impair, la médiane est la valeur de la série de rang
.
2
•
Si l’effectif n est pair, on prend comme médiane la moyenne des valeurs de rang
n
et
2
n
+ 1.
2
Exemples
•
2nde
11 + 1
= 6 ) M e = x6 = 8 .
2
x +x
12
7+8
= 7,5 .
1;1;1;3;5;7;8;8;8;8;11;11 . Il y a 12 valeurs ( = 6 ) M e = 6 7 =
2
2
2
1;1;3;5;5; 8;9;9;9;10;11. Il y a 11 valeurs (
Chapitre 5 : Statistiques
•
4
Exercice 3
On étudie l'âge des professeurs de collège :
- Collège A : 30 ; 28 ; 47 ; 30 ; 44 ; 60 ; 50 ; 26 ; 29 ; 37 ; 30 ; 29 ; 58 ; 59 ; 28.
- Collège B : 35 ; 37 ; 50 ; 24 ; 42 ; 24 ; 36 ; 52 ; 43 ; 27 ; 55 ; 49 ; 41 ; 24 ; 39 ; 46.
1. Calculer la moyenne d'âge des professeurs du collège A, puis du collège B.
2. Déterminer la valeur médiane de l'âge des professeurs du collège A, puis du collège B.
3. Dans quel collège les professeurs sont majoritairement plus jeunes ?
Remarque
Lorsque le caractère est quantitatif continu, la médiane correspond la valeur du caractère
ayant une fréquence cumulée croissante de 0,5.
Exercice 4
Un magasin de chaussures a relevé le montant des achats de chaque client sur une semaine.
Dépense (en €)
Effectif
]0;40[ [40;80[ [80;100[ [100;200]
350
320
210
120
1. Calculer la dépense moyenne des clients.
2. Calculer les fréquences et les fréquences cumulées croissantes. Retrouver la moyenne.
3. Faire le graphique des fréquences cumulées croissantes. En déduire la médiane.
Solution : x = 63,10€
On lit sur le graphique M e = 60
3. Les quartiles
Définition
•
2nde
Le premier quartile est la plus petite valeur de la série statistique telle qu'au moins 25 %
des données soient inférieures ou égales à cette valeur. Il se note Q1 .
Le troisième quartile est la plus petite valeur de la série statistique telle qu'au moins 75 %
des données soient inférieures ou égales à cette valeur. Il se note Q3 .
Chapitre 5 : Statistiques
•
5
Méthode
•
•
•
On range d'abord la série de n valeurs par ordre croissant des valeurs :
le rang du premier quartile est 0, 25 × effectif total , arrondi si nécessaire toujours par
excès.
le rang du troisième quartile est 0, 75 × effectif total , arrondi si nécessaire toujours par
excès.
4. Les indicateurs de dispersions
Définition
•
•
L’étendue d’une série statistique est la différence entre la plus grande et la plus petite
valeur de cette série.
L’intervalle [Q1; Q3 ] est appelé intervalle interquartile.
•
L'écart Q3 − Q1 est appelé l’écart interquartile.
Exercice 5
On relève les dépenses de 15 clients d'un magasin lors d'une journée sans promotion :
10 ; 18 ; 11 ; 40 ; 14 ; 15 ; 67 ; 20 ; 27 ; 7 ; 34 ; 42 ; 44 ; 51 ; 60.
1. Quel est l'étendue de la série ?
2. Déterminer l'intervalle interquartile.
Exercice 6
On s'intéresse à la série statistique suivante :
valeur du caractère
Effectif
[5;10[ [10;15[ [15; 20[ [20;30[ 12
20
8
40
1. Faire le graphique des fréquences cumulées croissantes.
2. En déduire l’intervalle interquartile.
2nde
Chapitre 5 : Statistiques
(Réponse Q1 = 12, Q3 = 25 ).
6
III. Echantillonnage
Il est parfois impossible ou trop coûteux de recueillir des données sur l’ensemble d’une
population. On étudie alors un échantillon de cette population à l’aide d’un sondage.
1. Fluctuation d’échantillonnage
Echantillon
•
•
•
Lancer 100 fois un dé et noter la liste des résultats obtenus.
Prélever 100 ampoules d’une chaîne de fabrication. La tester, puis noter à chaque fois
si elle est conforme ou non.
Interroger 100 personnes au hasard et noter à chaque fois leur couleur préférée.
Ces 3 situations consistent à noter les résultats obtenus en répétant 100 fois, de manière
indépendante, la même expérience. On dit qu’on a constitué, à chaque fois, un échantillon de
taille 100.
Définition
•
•
Lorsqu’on étudie une partie de la population, on dit qu’on étudie un échantillon.
Le nombre d’individus formant l’échantillon est appelé taille de l’échantillon.
Echantillon de Bernoulli
On appelle épreuve de Bernoulli une expérience qui n’a que deux issues possibles : le succès
ou l’échec.
Exemples
Obtenir pile ou face, répondre oui ou non un sondage, gagner ou perdre à un jeu …
2. Intervalle de fluctuation
On étudie un échantillon d’épreuves de Bernoulli, et on s’intéresse à l’une des deux issues
« succès ». On note p la probabilité qu’elle se réalise.
Si on analyse un grand nombre d’échantillons ( n ≥ 25 ), et que l’on observe à chaque fois la
fréquence d’apparition f de l’issue choisie, on s’aperçoit que pour une probabilité p comprise
entre 0,2 et 0,8, au moins 95 % des fréquences appartiennent à l’intervalle
1
1 ⎤
⎡
I = ⎢p−
;p+
, appeler intervalle de fluctuation.
n
n ⎥⎦
⎣
2nde
Chapitre 5 : Statistiques
Propriété
7
Exemples
On lance une pièce équilibrée et on s’intéresse ou fait obtenir pile : p = 0,5 .
Pour 100 échantillons, on a I = [ 0, 4;0,6 ] , ce Pour 400 échantillons, on a I = [ 0, 45;0,55 ] ,
qui signifie que dans plus de 95 % des cas la ce qui signifie que dans plus de 95 % des cas
fréquence d’apparition du pile est comprise
la fréquence d’apparition du pile est
entre 0,4 et 0,6.
comprise entre 0,45 et 0,55.
Prise de décision
•
•
Si f ∈I , on accepte la condition faite sur p au seuil 0,95.
Si f ∉I , on rejette la condition faite sur p au seuil 0,95.
Exercices 7
Au Casino Cartouche, sur 2500 lancers de dé, 1150 ont donné un nombre pair.
Les dés semblent-ils truqués ?
Réponse :
I = [ 0, 48;0,52 ] , f = 0, 46 ∉I ,une enquête s’impose.
Exercices 8
Les 10000 employés d'une entreprise doivent être consultés sur la nouvelle couleur du sigle
de l'entreprise : vert ou rouge. Inquiète du résultat, la direction, qui a fait campagne pour le
rouge, a interrogé un échantillon de 100 employés sur leur choix et 54 % ont répondu rouge.
Que peut-on en conclure ?
Réponse :
p ∈[ 0, 44;0,64 ] , on ne peut rien conclure).
On souhaite savoir si une entreprise exerce une discrimination à l’embauche vis-à-vis du
personnel féminin.
S’il n’y a pas de discrimination, la proportion de femmes dans cette entreprise devrait être
représentative de la proportion de femmes dans la population active. On admet que la
proportion de femmes dans la population active est 0,5.
1. En utilisant l’intervalle de fluctuation au seuil 0,95, déterminer si une entreprise contenant
1183 femmes sur 2 540 salariés exerce une discrimination à l’égard des femmes.
2. Quel doit être le nombre minimal de femmes dans cette entreprise pour que la proportion p
de femmes appartienne à l’interval1e de fluctuation ?
Réponse :
1. I = [ 0, 48;0,52 ] , f = 0, 466 ∉I .
x
≥ 0, 48 , d’où x ≥ 1220 .
2. On veut que f ≥ 0, 48 cad
2540
2nde
Chapitre 5 : Statistiques
Exercices 9
8
Téléchargement