introduction - Luca Scuderi

Téléchargement

PLAN

Chapitre 2 : Mesures de tendance centrale et mesures de position

2.1 Caractéristiques d’une distribution de fréquences

2.2 Mesures du centre : mode, médiane, moyenne

2.2.1 Mode

2.2.2 Médiane

2.2.3 Moyenne

2.2.4 Comparaison des mesures de tendance centrale

2.3 Divers types de moyennes à utiliser dans des cas spécifiques

2.3.1 Moyenne géométrique

2.3.2 Moyenne harmonique

2.3.3 Moyenne quadratique

2.3.4 Mi–chemin

2.4 Mesures de position

2.4.1 Centiles

2.4.2 Rang centile

Chapitre 2 : Mesures de tendance centrale et de position

2.1 Caractéristiques d’une distribution de fréquences

Nous avons vu que les données brutes sont ordonnées, condensées ou regroupées en classes,

selon le cas. On obtient ainsi une distribution de fréquences que nous appellerons aussi

simplement distribution. Schématiquement :

données brutes



ordonner (données rangées)



condenser (données condensées)



regrouper dans des classes (données groupées)

Établir une distribution statistique, c’est oublier le caractère individuel pour passer au

caractère d’ensemble.

Divers graphiques nous aident à visualiser la distribution d’une variable statistique X, tels

l’histogramme – ou sa variante, le polygone des fréquences –, ou encore le diagramme en

boîte, que nous verrons plus tard.

Histogramme, polygone des fréquences ou diagramme en boîte



permettent de

visualiser grossièrement :

 Le centre (mode, médiane, moyenne)

 L’étalement (étendue)

 La position (centiles)

 La dispersion (variance, écart-type)

 La forme (symétrie, dissymétrie)

 L’existence éventuelle de données atypiques ou extrêmes

2.2 Mesures du centre : mode, médiane, moyenne

Le mode est la modalité ayant le plus fort effectif.

La médiane mesure le centre des données lorsqu’elles ont été ordonnées de la plus petite à la

plus grande. Seule la position des modalités compte.

La moyenne mesure également le centre des données, mais cette fois la grandeur effective des

données est prise en compte.

Au lieu de dire mode, médiane ou moyenne de la distribution d’une variable statistique X, on

peut dire, beaucoup plus simplement, mode médiane ou moyenne de X.

2.2.1 Mode

1. Données rangées : la modalité qui apparaît le plus fréquemment

Exemple : si les données sont 2,3,5,5,5,6,6,8, le mode est 5.

2. Données condensées : la modalité ayant le plus fort effectif

3. Données groupées en classes :

1. Déterminer la classe modale (celle du plus haut effectif)

2. Utiliser la formule

momo LbMo 



















, où

bmo est la borne inférieure de la classe modale

∆1 est la différence entre la fréquence de la classe modale et la fréquence de la classe

qui précède

∆2 est la différence entre la fréquence de la classe modale et la fréquence de la classe

qui suit

Lmo est la largeur de la classe modale

2.2.2 Médiane

La médiane intervient par exemple dans la définition de la pauvreté au sein d’une population.

La définition la plus fréquemment utilisée de la notion de pauvreté est basée sur la

comparaison du revenu disponible d'un individu à la médiane des revenus disponibles de la

population. Le seuil de pauvreté monétaire est le revenu (des personnes ou des ménages) égal

à 60 % du revenu médian, selon l'usage international. Les personnes ou ménages ayant un

revenu inférieur à ce seuil sont dits en état de pauvreté monétaire.

Comment calcule-t-on la médiane ? Il convient à nouveau de distinguer les trois cas (données

rangées, condensées, regroupées dans des classes)

1. Données rangées :

 si N impair, c’est la

ème

(

donnée

 Ex. : ‒ 3, 7, 360, 5234, 10'000



c’est 360

 si N pair, milieu entre la

ème

(

et la

ème

N)1

(

donnée

 Ex. : 1, 2, 2, 2, 5, 6, 6, 6, 7, 7



médiane =

265

= 5.5

 Ex. : 1, 2, 2, 2, 5, 5, 6, 6, 7, 7



médiane =

255 

= 5

2. Données condensées :

 La définition est la même que pour les données rangées

 Un moyen simple pour déterminer la médiane lorsque les données ont été

condensées : on prend la première modalité dont la fréquence relative

cumulée (Fi) dépasse 0.5. Si la fréquence relative cumulée atteint une

valeur exacte de 0.5, on choisit le nombre à mi-chemin (en l’occurrence la

moyenne) entre la modalité concernée et la suivante.

3. Données groupées en classes :

La médiane n’est autre que le centile C50. Nous avons appris à calculer les centiles Cα pour

toutes les valeurs de α grâce à une formule établie dans le chapitre 1 (Chapitre 1, § 1.3.6,

formule (4)). Cette formule a été établie, rappelons-nous, en pratiquant l’interpolation linéaire

sur l’ogive. Nous nous contenterons ici de changer un peu les notations des différents

constituants de cette formule de manière à nous conformer à celles du livre d’Ouellet.

Remarque pratique

Si l’on doit calculer la médiane, il est inutile (bien trop long, et contreproductif à cause du

risque d’erreur) d’effectuer à chaque fois une interpolation linéaire à l’aide du théorème de

Thalès. Celui-ci a été utilisé une fois pour toutes pour démontrer la formule, il nous reste

ensuite à appliquer celle-ci directement (et correctement…).

Comment calculer la médiane ?

1. Déterminer classe médiane (il s’agit de la première classe où la fréquence relative

cumulée atteint ou dépasse 0.5) → regarder les Fi

2. Utiliser la formule (cf. Chapitre 1, § 1.3.6, formule (4))

md L

bMd 













 1

5.0

où

bmd est la borne inférieure de la classe médiane

Lmd est la largeur de la classe médiane

fmd est la fréquence relative de la classe médiane

Fmd-1 est la fréquence relative cumulée de la classe précédant la classe médiane

Médiane = valeur x pour laquelle l’ogive F(x) = ½.

Équivalent : valeur qui partage l’histogramme en deux surfaces égales

F(x)

0b0

0.5

C50

méd

Illustration : Considérons la distribution suivante :

Classes

Effectifs (ni)

[5,0[

0.250

[10,5[

0.625

0.875

[15,10[

0.125

O giv e

0.2

0.4

0.6

0.8

0 5 10 15

F(x)

H istog ram m e

.75

625.0 25.05.0

5.0 1

















 md

md L

bMd

2.2.3 Moyenne

Tiré de Daniel Pennac, Chagrin d’école, Folio Gallimard 2007, Prix Renaudot 2007, le petit

texte qui suit :

Comme je descendais des collines du XXe arrondissement vers mon bureau, l’idée

m’est venue d’évaluer les élèves que je croisais sur ma route, en me livrant à un calcul

méthodique : 100 euros de baskets, 110 de jeans, 120 de blouson, 80 de sac à dos, 180 de

baladeur (à 90 décibels la ravageuse tournée auditive), 90 euros pour le téléphone portable

multifonction, sans préjuger de ce que contiennent les trousses, que je vous fais, bon prix, à

50 euros, le tout monté sur des rollers flambants neufs, à 150 euros la paire, Total : 880

euros. J’ai vérifié, les jours suivants, à l’aller comme au retour, en comparant avec les prix

affichés dans les vitrines qui se trouvaient sur mon chemin. Tous mes calculs aboutissaient

aux alentours de 900 euros. C’est une estimation moyenne par enfant de la classe moyenne

doté de parents à revenus moyens, dans le Paris d’aujourd’hui. Le prix d’un élève parisien

remis à neuf, disons à la fin des vacances de Noël, dans une société qui envisage sa jeunesse

avant tout comme une clientèle, un marché, un champ de cibles. Des enfant clients, donc,

avec ou sans moyens, ceux des grandes villes comme ceux des banlieues, entraînés dans la

même aspiration à la consommation, dans le même universel aspirateur à désirs, pauvres et

riches, grands et petits, garçons et filles, siphonnés pêle-mêle par l’unique et tourbillonnante

sollicitation : Consommer ! C'est-à-dire changer de produit, vouloir du neuf, le dernier cri.

La marque ! Et que ça se sache ! Si leurs marques étaient des médailles, les gosses de nos

rues sonneraient comme des généraux d’opérette.

Sans transition… Définition de la moyenne dans les trois situations (données rangées,

condensées, groupées dans des classes).

1. Données rangées





1



(population) ou





1

(échantillon)

2. Données condensées

iii





1



(population) ou

iii





1

(échantillon)

(k est le nombre de modalités différentes).

1 / 20 100%

Documents connexes

Cours

Les notes de cours

Paramètres de position

introduction - Luca Scuderi

Télécharger le fichier

Correction devoir (statistiques) Exercice 1

Correction de Devoir surveillé sur statistiques et équations

..TRAITEMENT DE DONNÉES STATISTIQUES.. Effectuer une étude

Calcul de la médiane d`une série statistique

EX 1 :( 3 points ) Le tableau suivant donne la distance entre le

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

introduction - Luca Scuderi

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

introduction - Luca Scuderi

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib