Seconde Chapitre 4 : « Statistiques » Page 1 sur 10 I) Vocabulaire Histoire des statistiques Bien que le nom de statistique soit relativement récent, cette activité semble exister dès la naissance des premières structures sociales. On trace de recensement en Chine ou en Égypte 2500 ans avant JC. Le rôle de collecteur de données est souvent tenu par des guildes marchandes, puis par les intendants de l'État. Ce n'est que vers 1700 que l'on voit apparaître le rôle prévisionnel des statistiques avec la construction des premières tables de mortalité. En 1800 cette activité prend son plein essor. Des règles précises sur la collecte et l'interprétation des données furent édictées. Application des statistiques : Elles concernent des domaines d'application aussi divers que l'actuariat, l'agriculture, l'anthropologie, l'archéologie, l'audit, la biologie, la biopharmacie, la chimie, la climatologie, le contrôle de qualité, la criminologie, la cristallographie, la démographie, la dentisterie, le droit, l'écologie, l'économie, l'économétrie, l'éducation, l'épidémiologie, les finances, la génétique, la géographie, la géologie, l'histoire, l'hydrologie, l'industrie, l'ingénierie, les jeux, la linguistique, la littérature, le management, le marketing, la médecine, la météorologie, l'ophtalmologie, la pharmacologie, la physique, la planification, la politologie, la psychologie, la sociologie, les sondages, la théologie, la zoologie, l’informatique et plus récemment internet et ses moteurs de recherches. Effectuer une étude statistique consiste à recueillir, présenter et interpréter des informations. Une série statistique est l’ensemble des résultats bruts obtenus lors d’une enquête. L’ensemble des personnes ou objets étudiés se nomme la population étudiée. Chaque personne ou chaque objet de l’étude est un individu. L’objet de l’étude est le caractère. Les différentes valeurs du caractère sont les modalités. L’effectif d’une modalité est le nombre d’individu qui possède cette valeur du caractère. L’effectif total est la somme de tous les effectifs. C’est la taille de la population. La fréquence d’une modalité est la proportion que représente l’effectif de cette modalité par rapport à l’effectif total. Elle s’obtient en divisant l’effectif par l’effectif total. Seconde Chapitre 4 : « Statistiques » Page 2 sur 10 1) Caractère qualitatif Exemple 1 : On étudie la série statistique suivante qui donne les affectations des 840 élèves du lycée qui étaient en seconde en 2013-2014. Voeux effectifs Fréquences 1ere L 82 1ere ES 185 1ere S 250 1ere STI 2 D 88 1ere STMG 151 Autres 84 Total 840 1) Compléter les phrases suivantes : La population est Les individus sont Le caractère étudié est Les modalités du caractère sont Le caractère est qualitatif car 2) Compléter le tableau en indiquant les fréquences. Arrondir au dixième. 3) Construire un diagramme en bâtons de cette série à partir des fréquences. 30 20 10 0 4) On appelle mode le ou les caractères dont l’effectif est le plus important. Pour cette série le mode est : Exemple 2 : On étudie la série statistique suivante qui donne les collèges d’origine des élèves du lycée en seconde en 2014-2015. Collège Weiler Eluard Wallon Pompidou Daudet Bellevue Delacroix Ste Thérèse Autres Effectifs 109 105 91 88 87 77 57 44 91 Fréquences en % 1) Compléter les phrases suivantes : La population étudiée est Les individus sont Le caractère étudié est C’est un caractère qualitatif car 2) Compléter le tableau en indiquant les fréquences. Mettre le résultat en % et arrondir à l’unité. total Seconde Chapitre 4 : « Statistiques » Page 3 sur 10 3) Compléter te tableau de proportionnalité suivant : Collège Weiler Eluard Wallon Pompidou Daudet Bellevue Ste Delacroix Thérèse Autres total Fréquences 100 en % Angles en ×1,8 180 degrés 4) Construire le diagramme semi-circulaire de cette série : 2) Caractère quantitatif discret (à valeurs discontinues) Exemple 3 : On étudie la série statistique suivante qui donne le nombre d’enfants par famille dans une commune : Nb d’enfants 0 1 2 3 4 5 6 7 Effectif 10 80 95 18 21 5 0 1 Fréquence 1) Compléter les phrases suivantes : La population est Le caractère étudié est Le caractère est quantitatif car On dit qu’il est discret car ses L’effectif total est Le mode de cette série est 2) Quelle est la moyenne de la série ? 3) Compléter le tableau en indiquant les fréquences. Arrondir au centième. Seconde Chapitre 4 : « Statistiques » Page 4 sur 10 5) Réaliser un diagramme en bâtons de cette série à partir des fréquences. 0,5 0,4 0,3 0,2 0,1 0 0 1 2 3 4 5 6 7 8 3) Caractère quantitatif continu Exemple 4 : Voici les temps moyens de parcours du domicile des élèves jusqu’au lycée : Temps en min [0 ;5[ [5 ;10[ [10 ;20[ [20 ;50[ [50 ;90[ Effectif 20 40 90 96 4 [20 ;50[ [50 ;90[ Fréquences 1) Compléter les phrases suivantes : La population est Le caractère étudié est Le caractère est On dit qu’il est continu car ses L’effectif total est 2) Compléter le tableau en calculant les fréquences. Arrondir au centième. 3) On souhaite calculer la moyenne de cette série. Quel problème se pose ? 4) Compléter le tableau en calculant les centres des classes. A savoir, le centre d’un intervalle fini est la moyenne de ses bornes. Temps en min [0 ;5[ [5 ;10[ Fréquences Centre 5) Calculer alors la moyenne de cette série ? 6) Cette moyenne est-elle fiable ? [10 ;20[ Seconde Chapitre 4 : « Statistiques » 4) Calcul de la moyenne avec le logiciel pronote Exemple 5 : Voici le relevé des notes d’un élève. Calculer sa moyenne. Exemple 6 : Voici le relevé des notes d’un élève. Calculer sa moyenne. Exemple 7 : Voici le relevé des notes d’un élève. Calculer sa moyenne. Exemple 8 : Voici le relevé des notes d’un élève. Calculer sa moyenne. Page 5 sur 10 Seconde Chapitre 4 : « Statistiques » Page 6 sur 10 II) Médianes et quartiles 1) Effectifs cumulés croissants Exemple 9 : Une enquête sur le temps de travail personnel quotidien des élèves de terminale du lycée donne : Temps en heures Effectif ECC FCC ECD FCD [0 ;1[ 136 [1 ;2[ 303 [2 ;3[ 272 [3 ;4[ 81 1) Compléter le tableau 2) Quel est le % d’élèves qui travaillent plus de deux heures par jour ? 3) Quel est le % d’élèves qui travaillent moins de 4 heures par jours ? 4) Construire le polygone des fréquences cumulées croissantes : Dans ce cas des ECC, on prend la borne gauche de l’intervalle comme référence 100 90 80 70 60 50 40 30 20 10 0 0 1 2 3 4 5 [4 ;5[ 17 Seconde Chapitre 4 : « Statistiques » Page 7 sur 10 2) Médiane On considère une série statistique à caractère quantitatif discret. On suppose que les valeurs du caractère sont rangées dans l’ordre croissant. La médiane est une valeur du caractère qui partage la série en deux groupes de même effectif, l’un est composé des valeurs inférieures à la médiane, l’autre est composé des valeurs supérieures à la valeur de la moyenne. Si la série comporte N valeurs rangées dans l’ordre croissant : Si N est impair, la médiane est la N +1 ième valeur. 2 Si N est pair, la médiane est la moyenne entre la N N ième valeur et la + 1 ième valeur. 2 2 Exemple 10 : Dans une classe de seconde, on a relevé la taille des élèves. Déterminer la médiane. Taille en cm 150 155 160 162 163 165 166 167 168 170 173 174 176 178 179 Effectif 1 1 2 1 2 3 1 2 1 1 2 1 1 2 1 ECC Exemple 11 : Dans une classe de seconde, on a relevé la taille des élèves. Déterminer la médiane. Taille en cm Effectif 157 159 162 163 164 165 166 167 169 171 173 176 177 178 180 1 2 2 1 3 3 1 3 1 2 2 4 4 1 3 ECC 3) Les quartiles Les quartiles d’une série sont trois valeurs du caractère qui partagent la série en quatre groupes de même effectif. On les note par ordre croissant Q1 , Q2 et Q3 . La valeur Q2 est la médiane. Cela signifie que 25% de la population a une valeur du caractère inférieure à Q1, que 25% de la population a une valeur du caractère comprise entre Q1 et Me, que 25% de la population a une valeur du caractère comprise entre Me et Q3, que 25% de la population a une valeur du caractère supérieure à Q1. Seconde Chapitre 4 : « Statistiques » Page 8 sur 10 Exemple 12 : Voici les notes d’une classe de seconde Note 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Effectif 1 3 4 6 6 4 4 0 2 3 0 0 0 1 0 ECC FCC 1) Compléter la ligne des effectifs cumulés croissants. Déterminer la médiane et le premier et le troisième quartile de la série. 2) Compléter la ligne des fréquences cumulées. Retrouver Q1 , Me et Q3 en utilisant les fréquences cumulées. 3) Tracer ci-dessous le polygone des effectifs cumulés croissants. Retrouver graphiquement la médiane et les quartiles. 100 90 80 70 60 50 40 30 20 10 0 0 2 4 6 8 10 12 14 16 18 20 Seconde Chapitre 4 : « Statistiques » Page 9 sur 10 III) Caractéristiques de dispersion 1) Etendue L’étendue d’une série est la différence entre ses valeurs extrêmes. Elle renseigne sur la dispersion de la série. On peut caractériser une série par la donnée de la moyenne et de l’étendue. 2) Ecart interquartile L’écart interquartile d’une série est la différence entre les deux quartiles : Q3 − Q1 . Il renseigne sur la dispersion de la série. On peut caractériser une série par la donnée de la médiane et de l’intervalle interquartile. On représente alors ces caractéristiques par une boite à moustaches : Min Med Q1 Max Max Q3 Exemple 13 : 1) Voici la taille des élèves dans une première classe de seconde. Calculer, pour chaque série, sa moyenne et son étendue. 150 155 160 162 163 165 166 167 168 170 173 174 176 178 179 Taille en cm 1 Effectif 1 2 1 2 3 1 2 1 1 2 1 1 3 1 2) Voici la taille des élèves dans une première classe de seconde. Calculer, pour chaque série, sa moyenne et son étendue. 157 159 162 163 164 165 166 167 169 171 173 176 177 178 180 Taille en cm 1 Effectif 2 2 1 3 3 1 3 1 2 2 4 4 1 3) Réaliser les boites à moustaches. Comparer alors les deux séries. 150 152 154 156 158 160 162 164 166 168 170 172 174 176 178 180 150 152 154 156 158 160 162 164 166 168 170 172 174 176 178 180 3 Seconde Chapitre 4 : « Statistiques » Page 10 sur 10 80 70 80 70 60 60 50 50 40 40 30 30 20 20 10 10 80 80 70 70 60 60 50 50 40 40 30 30 20 20 10 10