Les mesures de tendance centrale

publicité
Les mesures de tendance
centrale
Plan de la séance
1 – Les mesures de tendance centrale
1.1 – Le mode
1.2 – La médiane
1.3 – La moyenne
2 – Quelle mesure utiliser?
1 – Les mesures de tendance centrale
Une mesure de tendance centrale est une
valeur typique ou représentative d’un ensemble
de scores
Les 3 mesures les plus utilisées sont :
1 – le mode
2 – la médiane
3 – la moyenne
1.1 – Le mode
Le mode est la valeur d’une variable qui se
répète le plus souvent
Il renseigne sur la valeur qui se retrouve le plus
souvent dans une distribution
 défini pour tout les types de variables
1.1 – Le mode
Ex. : Évaluation d’un programme
f
pourcentage
Excellent
15
11.1
Très bon
47
34.8
Bon
34
25.2
Acceptable
29
21.5
Médiocre
10
7.4
135
100
Total
mode
Appréciation
1.1 – Le mode
Ex. : État matrimonial
Mode
1.1 – Le mode
Ex. :
mode
Poids à la naissance
[1000-1500[
[1500-2000[
[2000-2500[
[2500-3000[
[3000-3500[
[3500-4000[
[4000-4500[
[4500-5000[
Total
Nombre d’enfants
1
2
7
30
64
43
11
2
160
1.1 – Le mode
Lorsque 2 valeurs ont une fréquence semblable
la variable est dite bimodale
Ex. :
modes
1.2 – La médiane
La médiane est la valeur qui divise en 2 parties
égales un ensemble ordonné de scores
i.e. c’est le point en dessous duquel se trouve la
moitié des cas et au-dessus dequel se trouve
l’autre moitié
 défini pour les variables ‘ordonnées’
1.2 – La médiane
Comment déterminer la médiane?
Si le nombre d’observation est impair:
1 – Disposez les scores en ordre croissant
2 – La médiane est la valeur du score central
i.e. la valeur dont le rang est (N+1)/2
Si le nombre d’observation est pair:
1 – Disposez les scores en ordre croissant
2 – La médiane est la moyenne des 2 scores
centraux
1.2 – La médiane
Ex. : Salaire de 5 employés d’une entreprise
 La médiane est donnée par la valeur
de l’observation de rang (N+1)/2 = (5+1)/2 = 3
Données brutes
41 500
64 750
42 000
42 250
55 000
rang
1
5
2
3
4
Scores ordonnés
41 500
42 000
42 500
55 000
64 750
1.2 – La médiane
Ex. : Salaire de 6 employés d’une entreprise
 La médiane est la moyenne des 2 scores centraux
Données brutes
Scores ordonnées
41 500
64 750
42 000
42 250
41 500
42 000
42 250
55 000
55 000
58 550
58 550
64 750
42 250 + 55 000
2
= 48 625
1.2 – La médiane
Ex. : Le revenu du ménage
Revenu en
milliers
f
Pourcentages
cumulatifs
...
54
31
48.4
55
163
50.4
56
19
50.6
...
Total
100.0
La médiane est donc de 55 ooo
Note : Quand il y a beaucoup d’observations, on peut
déterminer la médiane à partir des pourcentages
cumulatifs
1.2 – La médiane
médiane
Un avantage de la médiane est qu’elle n’est pas affectée
par les valeurs extrêmes
Série A
51
Série B
10
Série C
51
52
54
55
56
52
54
55
56
52
54
55
56
56
59
56
59
56
100
1.3 – La moyenne
La moyenne est la somme des scores divisée
par le nombre total d’observations
moyenne = Σxi
N
 moyenne d’une population : μ
moyenne d’un échantillon : x
 défini pour les variables intervalles/ratio
1.3 – La moyenne
Ex. : À partir de données brutes
Âge des répondants : 21, 32, 25, 26, 29, 22, 27
x = 21 + 32 + 25 + 26 + 29 + 22 + 27 = 26
7
Pour cet échantillon, l’âge moyen est de 26 ans
1.3 – La moyenne
Ex. : À partir d’un tableau de fréquence
Salaire
hebdomadaire
170
200
400
650
Total
f
10
20
10
7
47
x = (170 * 10) + (200 * 20) + (400 * 10) + (650 * 7) = 303.2
47
1.3 – La moyenne
La moyenne pour les variables dichotomiques
Pour une variable dichotomique codée
0
x= 1
la moyenne de la variable est en fait la proportion
de la catégorie ‘1’
En effet :
moyenne = Σxi = nb. d’obs. codée 1
n
nb. total d’obs.
1.3 – La moyenne
Un désavantage de la moyenne est qu’elle est affectée
par les valeurs extrêmes
x
Série A
Série B
Série C
51
52
10
52
51
52
54
55
56
54
55
56
54
55
56
56
59
56
59
56
100
54.7
48.9
60.6
2 – Quelle mesure utiliser?
En résumé :
variable nominale: mode
variable ordinale: mode ou médiane
variable intervalle/ratio: mode, médiane ou moyenne
2 – Quelle mesure utiliser?
Pour les variables d’intervalles/ratio, le choix de
la mesure de tendance centrale dépend de la
distribution de la variable
→ La variable est-elle symétrique?
Est-ce qu’il y a des valeurs extrêmes?
2 – Quelle mesure utiliser?
Ex. : Salaire d’une entreprise
Président
Vice-président
Directeur
Contremaître
Employé
1
1
6
5
10
48 000
20 000
5 000
4 000
2 000
médiane
mode
Pour la médiane:
N = 23 → (N+1)/2 = 12
Pour la moyenne
(1*48000) + (1*20000) + (6*5000) + (5*4000) + (10*2000) = 6 000
23
Téléchargement