1
PLAN
Chapitre 2 : Mesures de tendance centrale et mesures de position
2.1 Caractéristiques d’une distribution de fréquences
2.2 Mesures du centre : mode, médiane, moyenne
2.2.1 Mode
2.2.2 Médiane
2.2.3 Moyenne
2.2.4 Comparaison des mesures de tendance centrale
2.3 Divers types de moyennes à utiliser dans des cas spécifiques
2.3.1 Moyenne géométrique
2.3.2 Moyenne harmonique
2.3.3 Moyenne quadratique
2.3.4 Michemin
2.4 Mesures de position
2.4.1 Centiles
2.4.2 Rang centile
Chapitre 2 : Mesures de tendance centrale et de position
2.1 Caractéristiques d’une distribution de fréquences
Nous avons vu que les données brutes sont ordonnées, condensées ou regroupées en classes,
selon le cas. On obtient ainsi une distribution de fréquences que nous appellerons aussi
simplement distribution. Schématiquement :
données brutes
ordonner (données rangées)
condenser (données condensées)
regrouper dans des classes (données groupées)
Établir une distribution statistique, c’est oublier le caractère individuel pour passer au
caractère d’ensemble.
Divers graphiques nous aident à visualiser la distribution d’une variable statistique X, tels
l’histogramme – ou sa variante, le polygone des fréquences , ou encore le diagramme en
boîte, que nous verrons plus tard.
Histogramme, polygone des fréquences ou diagramme en boîte
permettent de
visualiser grossièrement :
Le centre (mode, médiane, moyenne)
L’étalement (étendue)
La position (centiles)
La dispersion (variance, écart-type)
La forme (symétrie, dissymétrie)
L’existence éventuelle de données atypiques ou extrêmes
2
2.2 Mesures du centre : mode, médiane, moyenne
Le mode est la modalité ayant le plus fort effectif.
La médiane mesure le centre des données lorsqu’elles ont été ordonnées de la plus petite à la
plus grande. Seule la position des modalités compte.
La moyenne mesure également le centre des données, mais cette fois la grandeur effective des
données est prise en compte.
Au lieu de dire mode, médiane ou moyenne de la distribution d’une variable statistique X, on
peut dire, beaucoup plus simplement, mode médiane ou moyenne de X.
2.2.1 Mode
1. Données rangées : la modalité qui apparaît le plus fréquemment
Exemple : si les données sont 2,3,5,5,5,6,6,8, le mode est 5.
2. Données condensées : la modalité ayant le plus fort effectif
3. Données groupées en classes :
1. Déterminer la classe modale (celle du plus haut effectif)
2. Utiliser la formule
momo LbMo
21
1
, où
bmo est la borne inférieure de la classe modale
1 est la différence entre la fréquence de la classe modale et la fréquence de la classe
qui précède
2 est la différence entre la fréquence de la classe modale et la fréquence de la classe
qui suit
Lmo est la largeur de la classe modale
2.2.2 Médiane
La médiane intervient par exemple dans la définition de la pauvreté au sein d’une population.
La définition la plus fréquemment utilisée de la notion de pauvreté est basée sur la
comparaison du revenu disponible d'un individu à la médiane des revenus disponibles de la
population. Le seuil de pauvreté monétaire est le revenu (des personnes ou des ménages) égal
à 60 % du revenu médian, selon l'usage international. Les personnes ou ménages ayant un
revenu inférieur à ce seuil sont dits en état de pauvreté monétaire.
Comment calcule-t-on la médiane ? Il convient à nouveau de distinguer les trois cas (données
rangées, condensées, regroupées dans des classes)
1. Données rangées :
si N impair, c’est la
ème
N)
21
(
donnée
Ex. : 3, 7, 360, 5234, 10'000
c’est 360
3
si N pair, milieu entre la
ème
N)
2
(
et la
ème
N)1
2
(
donnée
Ex. : 1, 2, 2, 2, 5, 6, 6, 6, 7, 7
médiane =
265
= 5.5
Ex. : 1, 2, 2, 2, 5, 5, 6, 6, 7, 7
médiane =
255
= 5
2. Données condensées :
La définition est la même que pour les données rangées
Un moyen simple pour déterminer la médiane lorsque les données ont été
condensées : on prend la première modalité dont la fréquence relative
cumulée (Fi) dépasse 0.5. Si la fréquence relative cumulée atteint une
valeur exacte de 0.5, on choisit le nombre à mi-chemin (en l’occurrence la
moyenne) entre la modalité concernée et la suivante.
3. Données groupées en classes :
La médiane n’est autre que le centile C50. Nous avons appris à calculer les centiles Cα pour
toutes les valeurs de α grâce à une formule établie dans le chapitre 1 (Chapitre 1, § 1.3.6,
formule (4)). Cette formule a été établie, rappelons-nous, en pratiquant l’interpolation linéaire
sur l’ogive. Nous nous contenterons ici de changer un peu les notations des différents
constituants de cette formule de manière à nous conformer à celles du livre d’Ouellet.
Remarque pratique
Si l’on doit calculer la médiane, il est inutile (bien trop long, et contreproductif à cause du
risque d’erreur) d’effectuer à chaque fois une interpolation linéaire à l’aide du théorème de
Thalès. Celui-ci a été utilisé une fois pour toutes pour démontrer la formule, il nous reste
ensuite à appliquer celle-ci directement (et correctement).
Comment calculer la médiane ?
1. Déterminer classe médiane (il s’agit de la première classe où la fréquence relative
cumulée atteint ou dépasse 0.5) → regarder les Fi
2. Utiliser la formule (cf. Chapitre 1, § 1.3.6, formule (4))
4
md
md
md
md L
fF
bMd
1
5.0
bmd est la borne inférieure de la classe médiane
Lmd est la largeur de la classe médiane
fmd est la fréquence relative de la classe médiane
Fmd-1 est la fréquence relative cumulée de la classe précédant la classe médiane
Médiane = valeur x pour laquelle l’ogive F(x) = ½.
Équivalent : valeur qui partage l’histogramme en deux surfaces égales
F(x)
0b0
1
bk
0.5
C50
méd
Illustration : Considérons la distribution suivante :
Effectifs (ni)
fi
Fi
[5,0[
2
0.250
0.250
[10,5[
5
0.625
0.875
[15,10[
1
0.125
1
O giv e
0
0.2
0.4
0.6
0.8
1
0 5 10 15
7
F(x)
H istog ram m e
1
2
5
0
1
2
3
4
5
6
7
S
5
.75
625.0 25.05.0
5
5.0 1
md
md
md
md L
fF
bMd
2.2.3 Moyenne
Tiré de Daniel Pennac, Chagrin d’école, Folio Gallimard 2007, Prix Renaudot 2007, le petit
texte qui suit :
Comme je descendais des collines du XXe arrondissement vers mon bureau, l’idée
m’est venue d’évaluer les élèves que je croisais sur ma route, en me livrant à un calcul
méthodique : 100 euros de baskets, 110 de jeans, 120 de blouson, 80 de sac à dos, 180 de
baladeur (à 90 décibels la ravageuse tournée auditive), 90 euros pour le téléphone portable
multifonction, sans préjuger de ce que contiennent les trousses, que je vous fais, bon prix, à
50 euros, le tout monté sur des rollers flambants neufs, à 150 euros la paire, Total : 880
euros. J’ai vérifié, les jours suivants, à l’aller comme au retour, en comparant avec les prix
affichés dans les vitrines qui se trouvaient sur mon chemin. Tous mes calculs aboutissaient
aux alentours de 900 euros. C’est une estimation moyenne par enfant de la classe moyenne
doté de parents à revenus moyens, dans le Paris d’aujourd’hui. Le prix d’un élève parisien
remis à neuf, disons à la fin des vacances de Noël, dans une société qui envisage sa jeunesse
avant tout comme une clientèle, un marché, un champ de cibles. Des enfant clients, donc,
avec ou sans moyens, ceux des grandes villes comme ceux des banlieues, entraînés dans la
même aspiration à la consommation, dans le même universel aspirateur à désirs, pauvres et
riches, grands et petits, garçons et filles, siphonnés pêle-mêle par l’unique et tourbillonnante
sollicitation : Consommer ! C'est-à-dire changer de produit, vouloir du neuf, le dernier cri.
La marque ! Et que ça se sache ! Si leurs marques étaient des médailles, les gosses de nos
rues sonneraient comme des généraux d’opérette.
Sans transition… Définition de la moyenne dans les trois situations (données rangées,
condensées, groupées dans des classes).
1. Données rangées
N
x
N
ii
1
(population) ou
n
x
x
n
ii
1
(échantillon)
2. Données condensées
N
xn
k
iii
1
(population) ou
n
xn
x
k
iii
1
(échantillon)
(k est le nombre de modalités différentes).
1 / 20 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !