Chapitre 5 : Statistiques I. Définir et représenter une série statistique 1. Vocabulaire • • ! ! ! Population La population est un ensemble de personnes ou d'objets, appelés individus, sur lesquels porte l’étude statistique. Par exemple, les élèves de la classe de seconde. Caractère Le caractère d’une série statistique est la propriété étudiée sur chaque individu. Il est dit : qualitatif Lorsqu’il ne prend pas que des valeurs numériques : la couleur des yeux des élèves de la classe. Quantitatif discret Lorsqu’il ne prend qu’un nombre fini de valeurs numériques : nombre de frères et sœurs des élèves de seconde. Quantitatif continu Lorsqu’il peut prendre une infinité de valeurs numériques : salaires des employés d’une entreprise. 2. Effectifs et fréquences Définition • • L'effectif d'une valeur est le nombre d'individus de la population prenant cette valeur. La fréquence d'une valeur est le quotient de l'effectif de cette valeur par l'effectif total. effectif de la valeur Ainsi on a : fréquence d'une valeur = . effectif total Exemple Sur un parking, on étudie la couleur des voitures. Le caractère étudié est qualitatif. La distribution des effectifs est donnée dans le tableau ci-dessous : L'effectif de la valeur grise est 18. 18 9 = . 32 16 Cette fréquence vaut aussi 0,5625 ou 56,25 %. La fréquence de la valeur grise est 2nde Effectif 18 7 5 2 32 (total) Chapitre 5 : Statistiques Couleur Grise Blanche Bleue Rouge 1 3. Effectif cumulé croissant Définition L'effectif cumulé croissant (ecc.) d'une valeur est la somme des effectifs des valeurs qui lui sont inférieures ou égales. On définit de même la fréquence cumulée croissante. Exemple Dans un village, on a dénombré les foyers selon leur nombre d'enfants. On a consigné les résultats dans le tableau ci-dessous : Nombre d'enfants 0 1 2 3 4 5 Nombre de foyers 68 44 38 28 14 8 Effectif cumulé croissant 68 112 150 178 192 200 Dans ce tableau, on lit que 38 foyers ont 2 enfants. De plus, on lit que 150 foyers ont au plus 2 enfants. À partir des effectifs, on peut dresser le tableau des fréquences. Nombre d'enfants 0 1 2 3 4 5 Fréquence 0,34 0,22 0,19 0,14 0,07 0,04 Fréquence cumulée croissante 0,34 0,56 0,75 0,89 0,96 1 Dans ce tableau, on lit que 14 % des foyers ont 3 enfants. De plus on lit que 89 % des foyers ont au plus 3 enfants. 4. Représentation d’une série statistique Caractère quantitatif discret ou qualitatif Diagramme en bâtons 2nde Tout type de caractère Caractère quantitatif continu Diagramme circulaire Histogramme Chapitre 5 : Statistiques Selon le type de caractère, on utilise différentes représentations graphiques : 2 Exercice 1 Un centre animalier a répertorié le nombre de chatons nés sur 50 portées : nombre de chatons 3 4 5 6 7 8 9 Fréquence 0,04 0,14 0,22 0,16 0,24 0,14 0,06 1. Calculer les fréquences cumulées croissantes de cette série. 2. Quel est, en pourcentage, le nombre de portées qui comptent au plus 5 chatons ? 3. Représenter la série dans un diagramme circulaire. Exercice 2 Une enquête sur le temps de travail personnel quotidien des élèves en classe de seconde d'un lycée a donné les résultats ci-dessous : temps de travail en heures Effectif 40 [0;1[ [1; 2[ [2;3[ [3; 4[ [4;5[ 95 86 24 5 1. Calculer les fréquences, les fréquences cumulées décroissantes. 2. En déduire le pourcentage d'élèves qui travaillent plus de 2 heures par jour. 3. Représenter graphiquement les fréquences cumulées décroissantes. 2nde Chapitre 5 : Statistiques Solution 3 II. Paramètres d'une série statistique 1. La moyenne Définition On considère une série statistique dont les valeurs de caractère sont x1 , x2 ,..., x p et les effectifs associés : n1 , n2 ,..., n p . La moyenne de cette série statistique, notée x , a pour valeur : n × x + n × x + ...n p × x p x= 1 1 2 2 n1 + n2 + ... + n p Si on note fi la fréquence de la valeur xi alors : x = f1 x1 + f 2 x2 + ... f p x p Remarque Lorsque le caractère est continu, pour calculer la moyenne on utilise le centre des classes. 2. La médiane Définition La médiane d'une série statistique est le nombre noté M e , tel que : • 50 % au moins des individus ont une valeur du caractère inférieure ou égale à M e . • 50 % au moins des individus ont une valeur supérieure ou égale à M e . Méthode • • On range d'abord la série de n valeurs par ordre croissant des valeurs : n +1 Si l’effectif n est impair, la médiane est la valeur de la série de rang . 2 • Si l’effectif n est pair, on prend comme médiane la moyenne des valeurs de rang n et 2 n + 1. 2 Exemples • 2nde 11 + 1 = 6 ) M e = x6 = 8 . 2 x +x 12 7+8 = 7,5 . 1;1;1;3;5;7;8;8;8;8;11;11 . Il y a 12 valeurs ( = 6 ) M e = 6 7 = 2 2 2 1;1;3;5;5; 8;9;9;9;10;11. Il y a 11 valeurs ( Chapitre 5 : Statistiques • 4 Exercice 3 On étudie l'âge des professeurs de collège : - Collège A : 30 ; 28 ; 47 ; 30 ; 44 ; 60 ; 50 ; 26 ; 29 ; 37 ; 30 ; 29 ; 58 ; 59 ; 28. - Collège B : 35 ; 37 ; 50 ; 24 ; 42 ; 24 ; 36 ; 52 ; 43 ; 27 ; 55 ; 49 ; 41 ; 24 ; 39 ; 46. 1. Calculer la moyenne d'âge des professeurs du collège A, puis du collège B. 2. Déterminer la valeur médiane de l'âge des professeurs du collège A, puis du collège B. 3. Dans quel collège les professeurs sont majoritairement plus jeunes ? Remarque Lorsque le caractère est quantitatif continu, la médiane correspond la valeur du caractère ayant une fréquence cumulée croissante de 0,5. Exercice 4 Un magasin de chaussures a relevé le montant des achats de chaque client sur une semaine. Dépense (en €) Effectif ]0;40[ [40;80[ [80;100[ [100;200] 350 320 210 120 1. Calculer la dépense moyenne des clients. 2. Calculer les fréquences et les fréquences cumulées croissantes. Retrouver la moyenne. 3. Faire le graphique des fréquences cumulées croissantes. En déduire la médiane. Solution : x = 63,10€ On lit sur le graphique M e = 60 3. Les quartiles Définition • 2nde Le premier quartile est la plus petite valeur de la série statistique telle qu'au moins 25 % des données soient inférieures ou égales à cette valeur. Il se note Q1 . Le troisième quartile est la plus petite valeur de la série statistique telle qu'au moins 75 % des données soient inférieures ou égales à cette valeur. Il se note Q3 . Chapitre 5 : Statistiques • 5 Méthode • • • On range d'abord la série de n valeurs par ordre croissant des valeurs : le rang du premier quartile est 0, 25 × effectif total , arrondi si nécessaire toujours par excès. le rang du troisième quartile est 0, 75 × effectif total , arrondi si nécessaire toujours par excès. 4. Les indicateurs de dispersions Définition • • L’étendue d’une série statistique est la différence entre la plus grande et la plus petite valeur de cette série. L’intervalle [Q1; Q3 ] est appelé intervalle interquartile. • L'écart Q3 − Q1 est appelé l’écart interquartile. Exercice 5 On relève les dépenses de 15 clients d'un magasin lors d'une journée sans promotion : 10 ; 18 ; 11 ; 40 ; 14 ; 15 ; 67 ; 20 ; 27 ; 7 ; 34 ; 42 ; 44 ; 51 ; 60. 1. Quel est l'étendue de la série ? 2. Déterminer l'intervalle interquartile. Exercice 6 On s'intéresse à la série statistique suivante : valeur du caractère Effectif [5;10[ [10;15[ [15; 20[ [20;30[ 12 20 8 40 1. Faire le graphique des fréquences cumulées croissantes. 2. En déduire l’intervalle interquartile. 2nde Chapitre 5 : Statistiques (Réponse Q1 = 12, Q3 = 25 ). 6 III. Echantillonnage Il est parfois impossible ou trop coûteux de recueillir des données sur l’ensemble d’une population. On étudie alors un échantillon de cette population à l’aide d’un sondage. 1. Fluctuation d’échantillonnage Echantillon • • • Lancer 100 fois un dé et noter la liste des résultats obtenus. Prélever 100 ampoules d’une chaîne de fabrication. La tester, puis noter à chaque fois si elle est conforme ou non. Interroger 100 personnes au hasard et noter à chaque fois leur couleur préférée. Ces 3 situations consistent à noter les résultats obtenus en répétant 100 fois, de manière indépendante, la même expérience. On dit qu’on a constitué, à chaque fois, un échantillon de taille 100. Définition • • Lorsqu’on étudie une partie de la population, on dit qu’on étudie un échantillon. Le nombre d’individus formant l’échantillon est appelé taille de l’échantillon. Echantillon de Bernoulli On appelle épreuve de Bernoulli une expérience qui n’a que deux issues possibles : le succès ou l’échec. Exemples Obtenir pile ou face, répondre oui ou non un sondage, gagner ou perdre à un jeu … 2. Intervalle de fluctuation On étudie un échantillon d’épreuves de Bernoulli, et on s’intéresse à l’une des deux issues « succès ». On note p la probabilité qu’elle se réalise. Si on analyse un grand nombre d’échantillons ( n ≥ 25 ), et que l’on observe à chaque fois la fréquence d’apparition f de l’issue choisie, on s’aperçoit que pour une probabilité p comprise entre 0,2 et 0,8, au moins 95 % des fréquences appartiennent à l’intervalle 1 1 ⎤ ⎡ I = ⎢p− ;p+ , appeler intervalle de fluctuation. n n ⎥⎦ ⎣ 2nde Chapitre 5 : Statistiques Propriété 7 Exemples On lance une pièce équilibrée et on s’intéresse ou fait obtenir pile : p = 0,5 . Pour 100 échantillons, on a I = [ 0, 4;0,6 ] , ce Pour 400 échantillons, on a I = [ 0, 45;0,55 ] , qui signifie que dans plus de 95 % des cas la ce qui signifie que dans plus de 95 % des cas fréquence d’apparition du pile est comprise la fréquence d’apparition du pile est entre 0,4 et 0,6. comprise entre 0,45 et 0,55. Prise de décision • • Si f ∈I , on accepte la condition faite sur p au seuil 0,95. Si f ∉I , on rejette la condition faite sur p au seuil 0,95. Exercices 7 Au Casino Cartouche, sur 2500 lancers de dé, 1150 ont donné un nombre pair. Les dés semblent-ils truqués ? Réponse : I = [ 0, 48;0,52 ] , f = 0, 46 ∉I ,une enquête s’impose. Exercices 8 Les 10000 employés d'une entreprise doivent être consultés sur la nouvelle couleur du sigle de l'entreprise : vert ou rouge. Inquiète du résultat, la direction, qui a fait campagne pour le rouge, a interrogé un échantillon de 100 employés sur leur choix et 54 % ont répondu rouge. Que peut-on en conclure ? Réponse : p ∈[ 0, 44;0,64 ] , on ne peut rien conclure). On souhaite savoir si une entreprise exerce une discrimination à l’embauche vis-à-vis du personnel féminin. S’il n’y a pas de discrimination, la proportion de femmes dans cette entreprise devrait être représentative de la proportion de femmes dans la population active. On admet que la proportion de femmes dans la population active est 0,5. 1. En utilisant l’intervalle de fluctuation au seuil 0,95, déterminer si une entreprise contenant 1183 femmes sur 2 540 salariés exerce une discrimination à l’égard des femmes. 2. Quel doit être le nombre minimal de femmes dans cette entreprise pour que la proportion p de femmes appartienne à l’interval1e de fluctuation ? Réponse : 1. I = [ 0, 48;0,52 ] , f = 0, 466 ∉I . x ≥ 0, 48 , d’où x ≥ 1220 . 2. On veut que f ≥ 0, 48 cad 2540 2nde Chapitre 5 : Statistiques Exercices 9 8