Chapitre IV 2nde D4 -1- CHAPITRE IV : STATISTIQUES Statistique vient du mot latin status, qui signifie l’Etat, car les premières statistiques ont consisté à recenser les populations. I) Vocabulaire des séries statistiques et représentations graphiques. 1) Statistique descriptive. Définitions : La population est l’ensemble sur lequel porte l’observation : on étudie un caractère bien précisé sur les individus de cette population : on collecte et on dépouille les données. Un échantillon est une partie de la population. La liste des valeurs (ou modalités) prise par le caractère constitue la série statistique. Lorsque le caractère étudié prend des valeurs numériques (cad des nombres), le caractère est quantitatif ; sinon le caractère est qualitatif. Un caractère quantitatif est discret lorsqu’il ne prend que quelques valeurs isolées (il ne peut prendre qu’un nombre fini de valeurs numériques). Un caractère quantitatif est continu lorsqu’il peut prendre toutes les valeurs d’un intervalle (il peut prendre une infinité de valeurs numériques). Remarques : pour un caractère qualitatif, on parle plutôt de modalités. Pour un caractère quantitatif, on parle de variable. Exemples : Avoir le brevet des collèges est un caractère qualitatif prenant deux valeurs : oui ou non. La couleur des yeux, le mois de naissance, le sport pratiqué sont aussi des caractères qualitatifs. Le nombre de frère(s)&sœur(s) (les valeurs sont 0 ;1 ;2 ;3…), la pointure de chaussures, le nombre de fois où l’on a joué au tiercé la semaine dernière, sont des caractères quantitatifs discrets. La taille ou le poids des élèves sont des caractères quantitatifs continus. Il arrive qu’un caractère quantitatif continu soit rendu discret : c’est le cas si l’on donne la taille arrondie au cm. 2) Effectif et fréquence. Définitions : L’effectif d’une valeur du caractère est le nombre d’individus de la population ayant cette valeur. La fréquence de la valeur est le quotient de l’effectif de cette valeur par l’effectif total : effectif de la valeur fréquence de la valeur . effectif total L’ensemble des fréquences de toutes les valeurs du caractère est la distribution des fréquences de la série statistique. Remarques : l’effectif d’une valeur étant inférieur à l’effectif total, une fréquence est toujours un nombre compris entre 0 et 1. On exprime souvent une fréquence par un pourcentage. La somme des fréquences est toujours égale à 1. Emilie Bouchez 2007-2008 Chapitre IV 2nde D4 -2- Exemple 1 : Population : Caractère : Série statistique à caractère Mois xi Nombre d’élèves ni Janvier Février Mars Avril Mai Juin Juillet Août Septembre Octobre Novembre Décembre (L’effectif total de la série est noté N : N n1 n2 n3 ... nk ) Exemple 2 : Population : Caractère : Série statistique à caractère 0 1 Nombre de frères&soeurs xi 2 3 Nombre d’élèves ni Exemple 3 : Population : Caractère : Série statistique à caractère L’ensemble des valeurs est alors découpé en classes qui peuvent être de même amplitude ou non. ( l’amplitude d’une classe a; b est égale à b-a. ) Tailles (en m) 1,5;1,6 1,6;1,65 1,65;1,7 1,7;1,8 1,8;1,9 Effectifs ni Définition : Pour un caractère quantitatif, quand les valeurs ( ou les classes) sont rangées par ordre croissant, on appelle effectif cumulé croissant d’une valeur ( ou d’une classe) la somme des effectifs de cette valeur ( ou cette classe) et de ceux qui la précèdent. On définit de même l’effectif cumulé décroissant. Exemple : A partir de l’exemple précédent, on a : Tailles (en m) 1,5;1,6 1,6;1,65 1,65;1,7 1,7;1,8 1,8;1,9 Effectifs cumulés croissants Emilie Bouchez 2007-2008 Chapitre IV 2nde D4 -33) Représentation graphique. a) Diagramme en bâtons ou en barres : Utilisé pour représenter graphiquement une série statistique dont le caractère est discret. On représente sur l’axe des abscisses les différentes valeurs du caractère et, sur l’axe des ordonnées, les effectifs. La hauteur des barres est proportionnelle à l’effectif. b) Histogramme : Utilisé pour représenter graphiquement une série statistique dont le caractère est continu. L’aire de chaque rectangle est proportionnelle à l’effectif. Sa largeur correspond à l’amplitude de l’intervalle de chaque classe. On représente en abscisses les différentes classes du caractère. c) Diagramme circulaire : Utilisé pour représenter graphiquement une série statistique dont le caractère est discret. L’angle d’ouverture de chaque secteur est proportionnel à l’effectif. effectif de la valeur angle du secteur 360 effectif total angle du secteur fréquence de la valeur 360 ou II) Mesures en statistiques. 1) Etendue et moyenne. On considère une série statistique quantitative sur une population de N individus au total. Définitions : L’étendue d’une série statistique est la différence entre les valeurs extêmes du caractère : e xmax xmin . Pour une série statistique dont les valeurs du caractère sont x1 , x2 ,..., xk et les effectifs associés n1 , n2 ,..., nk , la moyenne (pondérée) de la série statistique, notée x , a pour valeur : n x n x .... nk xk x 1 1 2 2 où N n1 n2 n3 ... nk est l’effectif total. N k qui s’écrit aussi x ni xi i 1 k n i 1 k n x i 1 i i N i Soit encore en fonction des fréquences f i : x f1 x1 f 2 x2 .... f k xk k qui s’écrit aussi x fi xi i 1 Remarque : Si les valeurs sont regroupées dans des classes, on prend le centre des classes pour calculer la moyenne. Emilie Bouchez 2007-2008 Chapitre IV -4- 2nde D4 Propriétés de la moyenne : Linéarité : _si on multiplie toutes les valeurs de la série par un nombre a non nul, alors la moyenne est multipliée par le nombre a ; _si on ajoute à toutes les valeurs de la série un nombre b, alors la moyenne est augmentée de b. Ainsi, si une série de valeurs xi a pour moyenne x , la série a xi +b a pour moyenne a x +b. A l’aide de moyennes de sous-groupes : Une série est séparée en deux sous-groupes d’effectifs M et P. Si on connaît les moyennes y et z des deux sous-groupes, alors la moyenne de la série totale est : x M y P z M P Moyenne élaguée : Lorsque les valeurs extrêmes (maximum ou minimum) semblent douteuses, ou ne rentrent pas dans le cadre de l’étude, on peut faire un calcul de moyenne élaguée en les retirant de la série. 2) Médiane. Définition : La médiane (notée Me) partage la population en deux parties de telle sorte que au moins 50% des individus prennent une valeur inférieure ou égale à la médiane et au moins 50% des individus prennent une valeur supérieure ou égale à la médiane. Détermination de la médiane : Cas d’un caractère quantitatif discret : On considère une série statistique dont les valeurs du caractère sont rangées par ordre croissant, chacune des valeurs figurant un nombre de fois égal à son effectif. Si le nombre de données est impair, donc de la forme 2n 1 , alors la médiane de la série statistique est le terme du milieu, c’est-à-dire le terme de rang n 1. Si le nombre de données est pair, donc de la forme 2n, alors la médiane de la série statistique est la demi-somme des termes de rangs n et n 1. Cas d’un caractère quantitatif continu : On trace la courbe des fréquences cumulées croissantes. L’abscisse du point 1 d’ordonnée est la médiane de la série statistique. 2 3) Mode et classe modale. Définition : Dans le cas d’une série qualitative, ou quantitative discrète, le mode est la modalité du caractère qui a le plus grand effectif. Dans le cas d’une série regroupée en classe, la classe modale est la classe ayant le plus grand effectif uniquement lorsque les classes sont d’égale amplitude. Emilie Bouchez 2007-2008 Chapitre IV -5- 2nde D4 Remarque : mode, médiane et moyenne sont des mesures de tendance centrale, ou mesures de position. L’étendue est une mesure de dispersion. Emilie Bouchez 2007-2008