Résumé Statistiques 2nde 4 1/3 1 Vocabulaire Le but d’une étude statistique est de recueillir des données, de les classer, de faire une représentation graphique (diagramme en bâtons ou histogramme par exemple) de faire des calculs (moyenne, écart-type . . .) et éventuellement de faire des prévisions • Tableau d’effectifs Exemple : Le tableau ci-dessous représente les notes obtenues par les élèves d’une classe à un contrôle : Note (x i ) 7 9 11 12 15 Effectif (n i ) 3 5 8 10 4 La population est l’ensemble des élèves de la classe Le caractère étudié est la note à un contrôle, ce caractère est quantitatif (on peut le mesurer avec un nombre) Les nombres (x i ) sont les différentes valeurs du caractère ici : x 1 = 7 x 2 = 9 x 3 = 11 x 4 = 12 x 5 = 15 Les nombres (n i ) sont les effectifs des différentes valeurs du caractère. Ceci se traduit par : Il y a 3 élèves qui ont eu 7 , 5 élèves qui ont eu 9, 8 qui ont eu 11, 10 qui ont eu 12 et 4 qui ont eu 15 5 X n i = n 1 + n 2 + n 3 + n 4 + n 5 = 30 L’effectif total est N = i =1 Remarque : On rencontre parfois des tableaux d’effectifs où les valeurs sont regroupées en classe (des intervalles) • Tableau des effectifs cumulés croissants Il y a 3 élèves qui ont eu une note inférieure ou égale à 7, 8 élèves qui ont eu une note inférieure ou égale à 9, 16 élèves qui ont eu une note inférieure ou égale à 11, etc... (On retrouve en dernière colonne l’effectif total) Note É (x i ) 7 9 11 12 15 Effectif (n i ) 3 8 16 26 30 • Tableau des effectifs cumulés décroissants (On retrouve en première colonne l’effectif total) Note Ê (x i ) 7 9 11 12 15 Effectif (n i ) 30 27 22 14 4 • Fréquence La fréquence f i d’une valeur du caractère x i est le rapport entre l’effectif de cette valeur et l’effectif total f i = Une fréquence est un nombre compris entre 0 et 1. La somme des fréquences égale 1. • Mode le mode est la valeur du caractère qui a le plus grand effectif. 5 X fi = f1 + f2 + f3 + f4 + f5 = 1 i =1 • Etendue L’étendue est la différence entre la plus grande valeur et la plus petite valeur du caractère. 2 Représentation Selon le type du caractère de la série statistique, on choisira : Un diagramme en bâtons : en abscisse les valeurs du caractère, en ordonnéee l’effectif Un histogramme : Lorsque les valeurs du caractère sont regroupées en intervalles. On dessine des rectangles qui ont pour base l’intervalle et qui ont une hauteur telle que l’aire du rectangle est proportionnelle à l’effectif. ni N Résumé Statistiques 2nde 4 2/3 Un diagramme circulaire : l’effectif de chaque valeur est représenté par un angle proportionnel à cet effectif. L’effectif total est alors représenté par 360◦ pour les diagrammes circulaires et 180◦ pour les diagrammes semi-circulaires 3 Moyennes On considère une série statistique dont les N valeurs sont données par x 1 , x 2 . . . x 5 , d’effectifs associés n 1 ,n 2 , . . . n 5 Définition 5 X La moyenne est : n1 x1 + n2 x2 + n3 x3 + n4 x4 + n5 x5 x= = n1 + n2 + n3 + n4 + n5 Si on connait les fréquences, la moyenne est ni × xi i =1 N = 3 × 7 + 5 × 9 + 8 × 11 + 10 × 12 + 4 × 15 ≈ 11,1 30 x = f 1 × x1 + f 2 × x2 + · · · + f 5 × x5 = 5 X f i × xi i =1 La note moyenne de la classe au contrôle est donc de 11,1 environ Lorsque les valeurs sont regroupées en classe (des intervalles) on choisit pour valeur x i le centre de chaque intervalle. 4 Médiane Quartiles La médiane est un nombre qui partage la population en deux parties de même effectif. La moitié des valeurs du caractère sont inférieures à la médiane et la moitié des valeurs sont supérieures à la médiane. Dans la pratique on procède ainsi : Définition On range les valeurs par ordre croissant : • S’il y a un nombre impair de valeurs (2n + 1 valeurs) La médiane est la valeur de rang n + 1 (c’est celle qui est au milieu) • S’il y a un nombre pair de valeurs (2n valeurs) la médiane est la moyenne entre la valeur de rang n et celle de rang n + 1 (On fait la moyenne entre les deux valeurs situées au milieu) De même on peut définir les quartiles qui séparent la population en quatre parties Le premier quartile Q1 est la plus petite valeur q de la série telle qu’au moins 25% des données soient inférieures ou égales à q Le troisième quartile Q3 est la plus petite valeur q 0 de la série telle qu’au moins 75% des données soient inférieures ou égales à q 0 Le premier décile D1 est la plus petite valeur q de la série telle qu’au moins 10% des données soient inférieures ou égales à q Le neuvième décile D9 est la plus petite valeur q 0 de la série telle qu’au moins 90% des données soient inférieures ou égales à q’ On peut ensuite tracer une boîte à moustaches Résumé Statistiques 2nde 4 3/3 5 Pourcentages Rappel : µ ¶ t Pour augmenter un nombre de t %, on le multiplie par 1 + 100 µ ¶ t Pour diminuer un nombre de t %, on le multiplie par 1 − 100 6 Intervalle de fluctuation Si on lance un dé non truqué, la probabilité d’obtenir un six est de 1/6, pourtant si on le lance 120 fois, il sera assez rare de tomber 20 1 exactement 20 fois sur le six, c’est-à-dire d’obtenir une fréquence d’apparition du six de = . 120 6 On dit que la fréquence fluctue autour de 1/6. On appelle ce phénomène, fluctuation de la fréquence. Cependant on a le résultat suivant : Propriété Lorsque l’on prélève un échantillon de taille n dans une population où la fréquence d’un caractère est p alors sous réserve que n Ê 50, np ʸ5 et n(1 − p) Ê 5, la probabilité que cet échnatillon fournisse une fréquence appartenant à l’intervalle · 1 1 est au moins égale à 0,95 p − p ;p + p n n L’intervalle est appellé intervalle de fluctuation de la fréquence f au seuil de 95%