Statistiques- Echantillonnage QCM p.266 I. Présentation 1) Vocabulaire Une étude statistique porte sur un ensemble ( de personnes, d’animaux, d’objets, … ) appelé population. Chaque élément de la population est un individu. L’aspect étudié est nommé caractère ou variable. Les résultats obtenus après observation donnent une série statistique. Il existe des séries à une ou plusieurs variables. Lorsque les variables prennent des valeurs numériques ( exemple : notes, tailles, âges, … ), les variables sont dites quantitatives ( si la variable prend n’importe quelle valeur dans un intervalle donné, la variable est dite continue , si elle prend des valeurs isolées, la variable est dite discrète ). Dans le cas contraire, les variables sont dites qualitatives (nationalité, couleurs, … ) ; les différentes possibilités du caractère sont appelées modalités ( la commune de résidence pour des élèves de première fréquentant un lycée). 2) Effectifs cumulés, fréquences cumulées Définition : Les effectifs cumulés croissants donnent les effectifs des valeurs inférieures ou égales à chaque valeur du caractère. De manière similaire, on peut étudier les effectifs cumulés décroissants. Les fréquences cumulées croissantes donnent les fréquences des valeurs inférieures ou égales à chaque valeur du caractère. De manière similaire, on peut étudier les fréquences cumulées décroissants. Exemple : Notes 6 7 8 9 10 11 12 Effectifs 1 2 4 6 5 1 1 Effectifs cumulés croissants 1 3 7 13 18 19 20 Ex 39 p.288 1 http://playmaths.free.fr II. Représentations graphiques 1) Diagramme circulaire Dans un diagramme circulaire, l’angle au centre est proportionnel à l’effectif. Notes effectifs Angle 6 1 18° 7 2 36° 8 4 72° 9 6 108° 10 5 90° 11 1 18° 12 1 18° 2) Diagramme en bâtons Les valeurs du caractère sont classées dans l’ordre croissant, la hauteur des bâtons est proportionnelle à l’effectif. 3) Fréquences cumulées croissantes Ex 4-5 p.282 4) Histogramme L’histogramme est utilisé lorsque les valeurs du caractère étudié sont regroupées en classes. Dans tout histogramme, les effectifs des classes sont proportionnels aux aires des rectangles qui les représentent. Par conséquent, dans le cas particulier d’un histogramme à pas constant, les effectifs des classes sont proportionnels aux hauteurs des rectangles qui les représentent. Cela n’est plus le cas d’un histogramme à pas non constant. Exemple : Valeur du caractère X Fréquence en % [0 ; 4 [ 15 [4 ; 5 [ 25 [5 ; 6 [ 30 [6 ; 8 [ 20 [8 ; 10 [ 10 La première classe est représentée par un rectangle dont l’aire est 3 cm² ; comme sa largeur est de 4 cm, sa hauteur sera de 0,75 cm. Ex de la feuille supplémentaire Ex 41 p.288 2 http://playmaths.free.fr III. Paramètres statistiques On considère la série suivante : Valeur xi 12 13 17 18 19 Effectif ni 4 7 2 9 3 1) La moyenne p La moyenne est le nombre x tel que : x = Error! = Error! ni xi . i1 Dans l’exemple, la moyenne est 15,68 : 12 4 13 7 ... 19 3 392 x = 15,68 25 25 Exemple2 : Les classes de 2nde 1 et 2nde 8 comptent respectivement 28 et 33 élèves. Les élèves ont fait le même contrôle. La moyenne de 2nde 1 est de 9,8, celle de 2nde 8 est de 10,4. La moyenne des notes sur les deux classes est donc : 28 9,8 33 10,4 617,6 x 10,1 28 33 61 Ex 8-9-10 p.283 Ex 44-45 p.289 2) La médiane La médiane est la valeur qui sépare la population en deux sous-ensembles de même effectif. C’est la valeur qui correspond à la fréquence cumulée croissante égale à 50 %. Dans l’exemple, la médiane est 17 ( l’effectif total est 25 ; le 13ème élément a une valeur de 17 ) 3) Quartiles et déciles Les quartiles Q1, Q2 et Q3 partagent la série en quatre parties. Le quartile Q1 est la plus petite valeur telle que au moins le quart de la série prend une valeur inférieure ou égale à Q1. Le quartile Q3 est la plus petite valeur telle que au moins les trois quarts de la série prend une valeur inférieure ou égale à Q3. L’intervalle [Q1 ; Q3] est l’intervalle interquartile. De la même manière, les déciles partagent la série en 10 parties. Q1 = 13 ; Q3 = 18 ; Remarques : Le deuxième quartile correspond à la médiane. Les déciles séparent une série en dix sous-ensembles ; la médiane est alors le cinquième décile. 3 http://playmaths.free.fr Ex 6-7-11-12-13-17-18-19 p.284 IV. Echantillonnage 1) Echantillon Un échantillon de taille n est constitué des résultats de n répétitions indépendantes de la mêm expérience aléatoire. 2) Fluctuation d’échantillonnage Exemple : Dans un lycée, il y a 63% de filles. Dans 10 échantillons de taille 50 des élèves de ce lycée, les fréquences observées fluctuent autour de la proportion dans la population totale. Echantillon Pourcentage de filles 1 2 3 4 5 6 7 8 9 10 62% 68% 60% 68% 66% 68% 68% 44% 66% 70% Dans une population, on s’intéresse à l’apparition d’un certain caractère. (ici, les filles). On note p la proportion d’individus présentant ce caractère dans la population totale (ici, 63%). On prélève un échantillon dans la population, et on note f la fréquence d’apparition observée dans cet échantillon. En observant plusieurs échantillons, prélevés dans la même population, on constate que la fréquence observée fluctue autour de la proportion p. Ce phénomène, dû au hasard dans la constitution des échantillons est appelé fluctuation d’échantillonnage. 3) Intervalle de fluctuation Définition : Un intervalle de fluctuation de la fréquence f au seuil de 95% est un intervalle I tel que, pour au moins 95% de l’ensemble des écahntillons possibles, la fréquence observée appartient à I. Remarque : Pour une même situation, il existe plusieurs intervalles de fluctuation au seuil de 95%. Propriété : Pour une proportion théorique p comprise entre 0,2 et 0,8 et des échantillons de taille n avec n≥25, on peut utiliser comme intervalle de fluctuation de la fréquence observée f au 1 1 :p seuil de 95% l’intervalle p . Cet intervalle contient 95% des échantillons de n n taille n possibles. Ex 21-22-23-25-26 p.285 4 http://playmaths.free.fr