Distribution des fréquences

publicité
La statistique descriptive
Plan




Distribution de fréquences
Distribution de fréquences cumulatives
Mesures de la tendance centrale
Mesures de variabilité
Distribution des fréquences

Définition: C’est une liste de valeurs dans un
échantillon.
Exemple:
x= {60, 38, 41, 45, 40, 75, 31, 35, 45, 46, 55, 61, 40, 15, 58, 71, 46, 53, 65, 54, 41,
56, 45, 65, 69, 50, 54, 41, 57, 44, 75, 30, 44, 30, 63, 44, 58, 34, 33, 66, 49, 42, 58,
70, 28, 49, 47, 47, 58, 38}

Habituellement, pour des fins de visualisation, la liste est
regroupée en classe.
Distribution des fréquences
Largeur des classes = 1
Distribution des fréquences
Largeur des classes = 5
Distribution des fréquences
Largeur des classes = 10
Distribution des fréquences
Largeur des classes = 20
Transformation des fréquences
absolues en fréquences relatives
fréquence absolue
fréquence relative =
n
Formes des distributions de
fréquences
I
II
V
Modalité
III
VI
Courbure (kurtosis)
IV
VII
Symétrie
- unimodale : I, IV,V, VI, VII
- Mesokurtique : I, II
- symétrique : I, II, III, V, VI
- bimodale : II
- Platykurtique : V
- asymétrique : IV, VII
- Rectangulaire : III
- Leptokurtique : IV,VI,VII
Fréquences cumulées
Largeur des classes = 10
Fréquences cumulées
Largeur des classes = 10
0,96
80
Mesures de tendances centrales

Tendance centrale: Score typique qui représente les données.

3 mesures sont habituellement utilisées:



Mode: la valeur qui apparaît le plus souvent dans la série de données
Médiane: la valeur qui divise la série de données en 2 parties égales (50%/50%)
Moyenne: « Le centre de gravité », le poids des valeurs au dessus de la
moyenne balance les valeurs en dessous.
Moyenne
Mesures de tendances centrales et de
variabilités



Exemple: x={0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 2, 2,
2, 2, 3, 3, 4}; n=20
Mode = 1
Médiane = 1
1
x

x
Moyenne =

n
n

i 1
i
(Où, x représente le score et n, le nombre de sujets.)
=(0+0+0+0+0+0+1+1+1+1+
1+1+1+2+2+2+2+3+3+4)/20=1, 25
Calcul de la moyenne pour des
données groupées
Nb d’enfants
Fréquence
0
6
1
7
2
4
3
2
4
1
1 n
x   f i xi
n i 1
Où f représente la fréquence
x  (0  6  1 7  2  4  3  2  4 1) / 20
x  (0  7  8  6  4) / 20  25 / 20  1, 25
Calcul de la moyenne des moyennes
n
k
x
30
77
20
83
25
80
x pondéré 
n x
i 1
k
i i
n
i 1
i
Où k représente le groupe
x p  (30  77  22  83  25  80) /(30  20  25)
x p  (2310  1660  2000) / 75  79,6
Relations entre les mesures de
tendances centrales
Symétrique
Mode
Médiane
Moyenne
Asymétrie positive
Asymétrie négative
Mode
Mode
Médiane
Médiane
Moyenne
Moyenne
Mesures de variabilité
Mesures de variabilités

L’étendue: distance de la distribution
Exemple:
x={0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4}
n=20

L’étendue: Max(x)-Min(x) = 4 – 0 = 4
Mesures de variabilités
La variance:
distance (déviation) quadratique moyenne
par rapport à la moyenne
 Exemple: x={13,19,11,17}; Moyenne=60/4=15
Somme des
distances moyennes
xi  x
13  15
19  15
11  15
17  15

Somme des
distances moyennes
quadratiques
( xi  x )
 2
 4
 4
 2
 0
n
 (x  x )
2
(13  15) 2

(19  15) 2
 16
(11  15) 2
 16
(17  15) 2


Distance quadratique
moyenne par rapport
à la moyenne
4
4
 40
i 1
i
n 1
2

40
 13.3
3
Mesures de variabilités
L’écart-type: distance (déviation) moyenne
par rapport à la moyenne
 Exemple: x={13,19,11,17}; Moyenne=60/4=15
Distance moyenne par
rapport à la moyenne
n
 (x  x )
i 1
i
n 1
2

40
 3.65
3
Degrés de liberté
Population = {1, 2, 3}
Moyenne = 2 Écart-type = 0.6667
Mesures de variabilités
Degrés de
liberté
Résumé et notations
Échantillon
Population
n
n
Variance
s2 
 (x  x )
i 1
2
i
n 1
2 
n
Écart-type
s
 (x  x )
i 1
i
n 1
 (x  )
i 1
2
i
n
n
2

 (x  )
i 1
i
n
2
Téléchargement