La statistique descriptive Plan Distribution de fréquences Distribution de fréquences cumulatives Mesures de la tendance centrale Mesures de variabilité Distribution des fréquences Définition: C’est une liste de valeurs dans un échantillon. Exemple: x= {60, 38, 41, 45, 40, 75, 31, 35, 45, 46, 55, 61, 40, 15, 58, 71, 46, 53, 65, 54, 41, 56, 45, 65, 69, 50, 54, 41, 57, 44, 75, 30, 44, 30, 63, 44, 58, 34, 33, 66, 49, 42, 58, 70, 28, 49, 47, 47, 58, 38} Habituellement, pour des fins de visualisation, la liste est regroupée en classe. Distribution des fréquences Largeur des classes = 1 Distribution des fréquences Largeur des classes = 5 Distribution des fréquences Largeur des classes = 10 Distribution des fréquences Largeur des classes = 20 Transformation des fréquences absolues en fréquences relatives fréquence absolue fréquence relative = n Formes des distributions de fréquences I II V Modalité III VI Courbure (kurtosis) IV VII Symétrie - unimodale : I, IV,V, VI, VII - Mesokurtique : I, II - symétrique : I, II, III, V, VI - bimodale : II - Platykurtique : V - asymétrique : IV, VII - Rectangulaire : III - Leptokurtique : IV,VI,VII Fréquences cumulées Largeur des classes = 10 Fréquences cumulées Largeur des classes = 10 0,96 80 Mesures de tendances centrales Tendance centrale: Score typique qui représente les données. 3 mesures sont habituellement utilisées: Mode: la valeur qui apparaît le plus souvent dans la série de données Médiane: la valeur qui divise la série de données en 2 parties égales (50%/50%) Moyenne: « Le centre de gravité », le poids des valeurs au dessus de la moyenne balance les valeurs en dessous. Moyenne Mesures de tendances centrales et de variabilités Exemple: x={0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4}; n=20 Mode = 1 Médiane = 1 1 x x Moyenne = n n i 1 i (Où, x représente le score et n, le nombre de sujets.) =(0+0+0+0+0+0+1+1+1+1+ 1+1+1+2+2+2+2+3+3+4)/20=1, 25 Calcul de la moyenne pour des données groupées Nb d’enfants Fréquence 0 6 1 7 2 4 3 2 4 1 1 n x f i xi n i 1 Où f représente la fréquence x (0 6 1 7 2 4 3 2 4 1) / 20 x (0 7 8 6 4) / 20 25 / 20 1, 25 Calcul de la moyenne des moyennes n k x 30 77 20 83 25 80 x pondéré n x i 1 k i i n i 1 i Où k représente le groupe x p (30 77 22 83 25 80) /(30 20 25) x p (2310 1660 2000) / 75 79,6 Relations entre les mesures de tendances centrales Symétrique Mode Médiane Moyenne Asymétrie positive Asymétrie négative Mode Mode Médiane Médiane Moyenne Moyenne Mesures de variabilité Mesures de variabilités L’étendue: distance de la distribution Exemple: x={0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4} n=20 L’étendue: Max(x)-Min(x) = 4 – 0 = 4 Mesures de variabilités La variance: distance (déviation) quadratique moyenne par rapport à la moyenne Exemple: x={13,19,11,17}; Moyenne=60/4=15 Somme des distances moyennes xi x 13 15 19 15 11 15 17 15 Somme des distances moyennes quadratiques ( xi x ) 2 4 4 2 0 n (x x ) 2 (13 15) 2 (19 15) 2 16 (11 15) 2 16 (17 15) 2 Distance quadratique moyenne par rapport à la moyenne 4 4 40 i 1 i n 1 2 40 13.3 3 Mesures de variabilités L’écart-type: distance (déviation) moyenne par rapport à la moyenne Exemple: x={13,19,11,17}; Moyenne=60/4=15 Distance moyenne par rapport à la moyenne n (x x ) i 1 i n 1 2 40 3.65 3 Degrés de liberté Population = {1, 2, 3} Moyenne = 2 Écart-type = 0.6667 Mesures de variabilités Degrés de liberté Résumé et notations Échantillon Population n n Variance s2 (x x ) i 1 2 i n 1 2 n Écart-type s (x x ) i 1 i n 1 (x ) i 1 2 i n n 2 (x ) i 1 i n 2