CHAPITRE 4: LES STATISTIQUES I- Vocabulaire Les statistiques consistent à étudier un caractère d’une certaine population. Exemple: on peut s’intéresser à la dernière note obtenue en mathématiques (c’est le caractère) par les élèves de seconde du lycée (c’est la population). Un caractère peut être quantitatif ou qualitatif. Exemple: la couleur des cheveux est un caractère qualitatif, la taille est un caractère quantitatif. Le mode d’une série statistique est la valeur de la série qui a l’effectif le plus important. Exemple: si les notes obtenues par dix élèves sont: 12;7;8;15;12;18;12;8;9;15 alors le mode de cette série est 12. L’étendue d’une série statistique est la différence entre la valeur maximale de la série et la valeur minimale. Exemple: pour l’exemple précédent, l’étendue est de 18-7=11. Pour résumer une série statistique donnée sous forme de liste, on complète un tableau des effectifs. Note 7 8 9 12 15 18 Exemple Effectif 1 2 1 3 2 1 La fréquence d’apparition de chacune des effectif valeurs est donnée par la formule: effectif total La fréquence peut être donnée sous forme décimale ou en pourcentage. Un pourcentage est une fraction ayant pour dénominateur 100, par exemple 0,352 vaut en pourcentage 35,2 soit 100 35,2%. Exemple: le tableau des fréquences de l’exemple précédent est: Note 7 8 9 12 15 18 Fréquence 0,1 0,2 0,1 0,3 0,2 0,1 II- La moyenne La moyenne d’une série statistique x, est notée x, et peut être calculée de différentes manières: -si la série de N valeurs est donnée sous forme de liste: x1, x2, x3…, xN alors x= x1+x2+x3+…+xN N -si la série de N valeurs est donnée sous forme de tableau des effectifs: valeurs x1 x2 … xP effectif n1 n1*x1+n2*x2+…+nP*xP alors x= N n2 … nP -si la série de N valeurs est donnée sous forme de tableau des fréquences: X1 X2 … xP Fréquence F1 F2 … fP Valeur Alors x=f1*x1+f2*x2+…+fP*Xp Exemple: calculer la moyenne de la série Valeurs 7 9 10 13 18 Effectif 3 1 2 4 1 x= 3x7+1x9+2x10+4x13+1x18 11 21+9+20+52+18 x= 11 x= 120 11 x=10,90 Lorsque dans une série statistique, une valeur semble trop éloignée des autres, on l’écarte dans le calcul de la moyenne et on obtient ce qu’on appelle une moyenne élaguée. Exemple: calculer la moyenne de la série: 9;10;10;11,5;12;13;19 x= 9+10+10+11,5+12+13+19 7 x= 84,5 7 x=12,07 Xe= 9+10+10+11,5+12+13 65,5 Xe= 6 6 Xe≈10,9 III- La médiane 1) Définition La médiane d’une série statistique est la valeur de la série, notée Me, qui partage la série en deux groupes de même effectif. 2) Médiane d’un caractère discret Pour déterminer la médiane d’un caractère discret, on commence par ranger les valeurs dans l’ordre croissant. -Si la série comporte un nombre impaire de valeurs. Exemple: si la série comporte 11 valeurs, la médiane est la 6ème valeur. -Si la série comporte un nombre paire de valeurs. Exemple: si la série comporte 8 valeurs, la médiane est la moyenne des 4ème et 5ème valeurs. La 4ème et la 5ème valeurs forment un intervalle. 3) Médiane d’un caractère continu Un caractère est dit continu si les valeurs sont regroupés en classe. Si on étudie la taille des élèves d’une classe, on risque d’avoir autant de tailles différentes que d’élève. Il est alors opportun pour regrouper les valeurs sous forme d’intervalle. Exemple: Taill [145; [150; [155; [160; [165; [170; [175; [180; e 150[ 155[ 160[ 165[ 170[ 175[ 180[ 185] Effe 1 ctif 2 1 5 10 3 6 2 Pour déterminer la médiane de cette série, il faut d’abord dresser le tableau des effectifs cumulés croissants (ou décroissants), et pour ce faire on remplace chaque intervalle par l’encadrement correspondant. Pour le tableau des effectifs cumulés croissants, on retient la « partie supérieure » de l’encadrement alors que pour les effectifs cumulés décroissants, on retient la « partie inférieure ». On a alors: tail x<150 x<155 x<160 x<165 x<170 x<175 x<180 x≤185 le EC 1 C 3 4 9 19 22 28 30 On place ensuite les points dans un repère. En reliant les points, on obtient le polygone des effectifs cumulés croissants (resp. décroissants). La médiane de la série est l’abscisse du point du polygone ayant pour ordonnée effectif total/2. Ici, la médiane est d’environ 167 cm. IV- Les quartiles Le premier quartile, noté Q1, d’une série statistique est la valeur de la série telle que au moins ¼ des valeurs soient inférieur à Q1. Le troisième quartile, noté Q3, d’une série statistique est la valeur de la série telle que au moins ¾ des valeurs soient inférieurs à Q3. Remarque: comme pour la médiane, pour déterminer les quartiles, il faut commencer par ranger les valeurs de la série dans l’ordre croissant. Exemple: déterminer la médiane et les quartiles de la série suivante: -6;-3;-0,2;7;9;13;15;17;18;21;35. L’effectif total est 11 donc la valeur médiane est la 6ème valeur de la série soit 13. Le premier quartile, Q1, est la 3ème valeur soit -0,2. Q1:11/4=2,75 Le troisième quartile, Q3, est la 9ème valeur soit 18. Q3:11x3/4=8,25 L’écart interquartile Q3-Q1. On peut représenter la série à l’aide d’un diagramme en boite: min Q1 Me Q3 max valeurs Remarque: pour un caractère continu, on procède de la même manière que pour la médiane: Q1 est alors l’abscisse du point des effectifs cumulés croissants ayant pour ordonnée: effectif total/4. Q3 es l’abscisse du polygone des effectifs cumulés croissants ayant pour ordonnée: effectif totalx3/4. V- Présentation d’une série statistique Pour une meilleur lisibilité, une série statistique peut être de différentes manières. a) Le diagramme en bâton Exemple: au large de l’Afrique du sud, on a répertorié les tailles de 96 requins. Taille 1,5 2 2,5 3 3,5 4 4,5 effecti 7 f 10 24 32 18 4 1 b) Le diagramme circulaire Pour l’exemple précédent: TAILLE (m) 1 2 3 4 5 6 7 c) L’histogramme L’histogramme est une présentation adopté aux caractères continus. Exemple: un supermarché a relevé es dépenses de ses clients: Dépenses [0;10[ [10;30[ [30;50[ [50;100] effectif 16 8 10 12 [0;10[ [10;30[ [30;50[ [50;100] EFFECTIF