Les valeurs d`une série statistique d`effectif total n sont rangées par

publicité
Chapitre 8
STATISTIQUES
I. Autour de la médiane
1. Médiane et quartiles
Les valeurs d’une série statistique d’effectif total n sont rangées par ordre croissant : x1 Â x2 Â…Âxn .
Définition
La médiane Me de la série statistique est :

sa valeur centrale lorsque son effectif total n est impair ;

la demi-somme de ses deux valeurs centrales lorsque n est pair.
C’est un paramètre de tendance centrale qui indique le centre de la série.
Définitions

Le premier quartile Q1 est la plus petite des valeurs de la série telle qu’au moins 25 % des données soient
inférieures ou égales à Q1 ;

Le troisième quartile Q3 est la plus petite des valeurs de la série telle qu’au moins 75 % des données soient
inférieures ou égales à Q3.
Méthode pratique
Le rang de Q1 est le premier entier supérieur ou égal à 0,25n.
Le rang de Q3 est le premier entier supérieur ou égal à 0,75n.
Définitions

Le rang de L’intervalle interquartile est l’intervalle [Q1 ;Q3] ;

L’écart interquartile est le nombre positif Q3− Q1.
2. Diagramme en boîte
Les cinq nombres Min, Q1, Me, Q3 et Max permettent de résumer une série statistique.
On les représente graphiquement par un diagramme en boîte (boxplot sur la calculatrice) :
3. Exemple
Voici la liste des températures en degrés Celsius relevées sous abri à différents moments d’une journée, rangées dans l’ordre
croissant : 3 – 3,8 – 4,5 – 4,8 – 5 – 5,5 – 5,7 – 5,8 – 6,2 – 7 – 7,3 – 8,2 – 9 – 9,2 – 9,5 – 9,7.
Effectif total : n=16
Médiane : demi-somme des 8ème et 9ème valeurs donc Me=Error!=6
Premier quartile : 0,25n=4 donc Q1 est la 4ème valeur soit Q1=4,8
Troisième quartile : 0,75n=12 donc Q3 est la 12ème valeur soit Q3=8,2
3
9,7
4,8
3
4
5
6
6
8,2
7
8
9
Chapitre 8
STATISTIQUES
II. Autour de la moyenne
Soit une série statistique prenant les valeurs x1, x2, …, xp avec les effectifs n1, n2, …, np tels que n1+n2+…+ np =n.
1. Moyenne
Définition
La moyenne de la série statistique est le nombre Ò;x défini par :
Ò;x=Error!=Error!E r r o r !ou encore Error!=Er r o r !avec Error!= Error!(fréquences).
C’est un paramètre de tendance centrale qui indique le centre de gravité de la série.
2. Variance et écart type
Propriété
La moyenne de la série statistique est le réel qui rend minimale la fonction f définie sur  par f(x)=Error!Error!.
Démonstration
f( x)=Error!Error!
f( x)=Error!Error!
f( x)=Error!Error!−Error!x +Error!
Ainsi f( x)=ax 2+bx+c avec a=Error!=1, b= Error!=-2Error! et c=Error!.
f( x) a donc pour forme canonique aError! =Error!− Error!=Error!−Error!
2
Pour tout réel x, (x−Ò;x) Ã0 donc f( x)Ã- Error!. Ainsi f admet un minimum − Error! en x=Error!.
Définition
La variance de la série statistique est le réel positif V=Error!Error!
Sa racine carrée s= V est appelée écart type de la série.
Propriété
La variance est également donnée par la formule V=Error!Error!−Error!=Error!E rro r!−Error!
Démonstration
V=f (Ò;x ) où f la fonction définie sur Ë par f( x)=Error!Error!, or fError! est le minimum de la fonction f
donc V=-Error!=-Error!=-Error!=-Erro r!
Exemple
On a relevé les prix en euros d’un même produit dans différents points de vente : 20 – 22 – 22 – 24 – 25 – 28
La moyenne de cette série est Ò;x=23,5.
V=Error!−Error!=Error!ó6,58 et só2,57.
Chapitre 8
STATISTIQUES
III. Transformation affine des données
Propriété (admise)
Soient a et b deux réels ( aý0).
Si S est une série statistique (xi ;ni )1 i p de médiane Me, d’écart interquartile I, de moyenne Ò;x et d’écart type s et
alors la série S’ (axi +b ;ni )1 i p admet pour médiane Me′=aMe+b, pour écart interquartile I′= | a | ×I, pour moyenne
Ò;x′= aÒ;x+b et pour écart type s′= | a | ×s.
Exemple
Une agence propose des voyages organisés dont le prix moyen est de 540 € avec un écart type de 254 € et un prix médian de
450 € avec un écart interquartile de 275 €.
Le voyagiste décide de minorer tous ses prix de 10 % et de demander 50 € de frais de dossier.
Le nouveau prix yi d’un voyage se déduit de l’ancien prix xi par la formule yi =0,9xi +50.
La nouvelle série de prix est donc l’image de l’ancienne par la fonction affine x  0,9x+50.
On peut donc en déduire les paramètres :
 moyenne : Ò;y=0,9×540+50=536 ;
 écart type : sy =0,9×254=228,6 ;
 médiane : Mey =0,9×450+50=455 ;
 écart interquartile : 0,9×275=247,5.
IV. Résumer une série statistique
Si on souhaite retenir un seul paramètre pour résumer une série statistique, on choisit un paramètre de position : la moyenne ou
la médiane.
Si on veut aussi rendre compte de la dispersion des données autour de ce paramètre central, on lui associe un paramètre de
dispersion : l’écart type ou l’écart interquartile. On obtient alors un couple de paramètres qui permet de résumer
convenablement la série et de faciliter la comparaison de plusieurs séries.

Le couple (Me ;Q3−Q1)
Le partage des données en 4 parties de même effectif conduit à associer la médiane à l’écart interquartile :
Le couple ainsi formé donne à la fois une indication de tendance centrale de la série et la longueur de l’intervalle
contenant la moitié centrale des valeurs.
Plus Q3− Q1 est petit, plus les valeurs centrales de la série se concentrent autour de la médiane Me.
Ce couple est peu sensible aux valeurs extrêmes qui sont parfois suspectes.

Le couple (Ò;x ;s)
Le lien qui unit la moyenne et la variance conduit à associer la moyenne et l’écart type.
Le couple ainsi formé donne à la fois une indication de tendance centrale et une mesure des carrés des écarts à la moyenne
de toutes les valeurs de la série.
Plus s est petit, plus les valeurs de la série se concentrent autour de la moyenne Ò;x.
Cependant, ce couple donne beaucoup de poids aux valeurs extrêmes.
prix de vente en
euro d’un litre de
super sans plomb
prix de vente en
euro d’un litre de
gasoil
0.66
0.51
0.69
0.54
0.69
0.55
0.72
0.55
0.79
0.59
0.79
0.61
0.8
0.63
Chapitre 8
STATISTIQUES
0.82
0.66
0.9
0.67
0.93
0.67
0.94
0.68
0.95
0.71
0.95
0.72
0.98
0.75
0.99
0.81
1.06
1.1
Super sans plomb :
 e=0,4
 Q3−Q1=0,23 et Error!=0,575 donc Q3−Q1 représente 57,5 % de l’étendue.
 L’intervalle interquartile [ Q1 ;Q3]=[0,72 ;0,95] contient 10 valeurs sur les 16 de la série, soit 62,5 % des valeurs.
Gasoil :
 e=0,59
 Q3−Q1=0,16 et Error!=0,27 donc Q3−Q1 représente 27 % de l’étendue.
 L’intervalle interquartile [ Q1 ;Q3]=[0,55 ;0,71] contient 10 valeurs sur les 16 de la série, soit 62,5 % des valeurs.
Téléchargement