chap 4 statistiques

publicité
Chapitre IV :
STATISTIQUES
I. Diagramme en boîte
1. Rappel : médiane, quartiles
Définition de la médiane
La médiane d’une série statistique est la valeur qui partage cette série en deux groupes de même
effectif :
• les valeurs inférieures ou égales à la valeur médiane.
• les valeurs supérieures ou égales à la valeur médiane.
Deux cas se présentent :
• si la série est de taille impaire (N=2n+1), la médiane est donnée par la (n+1)-ième valeur (la
série étant rangée dans l’ordre croissant)
• si la série est de taille paire (N = 2n), la médiane est la demi-somme des n-ième et (n+1)-ième
valeurs (la série étant rangée dans l’ordre décroissant)
Définitions de !! et !!
On appelle premier quartile d'une série la plus petite valeur !! des termes de la série pour
laquelle au moins un quart (25%) des données sont inférieures ou égales à !! .
On appelle troisième quartile d'une série la plus petite valeur !! des termes de la série pour
laquelle au moins trois quarts (75%) des données sont inférieures ou égales à !! .
L’écart interquartile est la différence entre le 3ème quartile et le 1er quartile : !! − !! .
Remarques :
• La médiane et les quartiles sont des paramètres de position.
•
L’écart interquartile est un paramètre de dispersion.
Exemple 1 (série discrète) : Pour les 2 séries, déterminer !", !! et !! .
Un professeur a classé par ordre croissant les notes des 13 garçons et des 14 filles d’une classe.
Garçons : 7 8 9 9
Filles : 7 7 9 9
10 10 11 12
10 11 12 13
13
13
13
14
14
14
14
15
17
15
15
Exemple 2 ( série discrète présentée sous forme de tableau) : A la question « Depuis
combien d’années résidez-vous dans la même ville », les cinquante personnes interrogées ont
donné les réponses suivantes :
Nombre d’années
1
2
3
4
5
6
Plus de 6
Total
Effectifs
2
4
5
10
6
12
11
Effectifs cumulés
2
6
11
21
27
39
50
50
Déterminer !", !! et !! .
Exemple 3 (série continue) : Déterminer !", !! et !! .
Une compagnie de taxi a relevé les distances parcourues d ( en milliers de kilomètres) de ses
véhicules.
d
[0 ; 40[
[40 ; 80[
[80 ; 120[
[120 ; 160[
[160 ; 200]
Effectif
10
21
9
6
4
2. Diagramme en boîte
Considérons la série statistique suivante :
Valeur du
caractère
Effectif
30
45
50
60
70
2
3
2
2
2
On vérifie que Me =50, Q1 = 45 et Q3 = 60. D’autre part, la plus petite valeur de cette série est 30,
la plus grande 70.
On peut représenter graphiquement ces résultats de la manière suivante :
……………………………………………………………………………………………………………..
Un tel graphique est appelé diagramme en boîte.
II.
Moyenne, variance et écart-type
1. Moyenne
On considère la série discrète suivante :
Valeurs x1 x2 … xp
Effectif n1 n2 … np
L’effectif total est souvent noté N. On a ainsi N = n1+ n2 + …+np =
n1x1 + n2x2 + …… + npxp
La moyenne de cette série est x– =
n1 + n2 + …… + np
Remarque : La moyenne est un paramètre de position.
i= p
∑n
i
i =1
2. Variance et écart-type
Nous allons définir un nouveau paramètre qui permet de mesurer la dispersion des valeurs
!! autour de la moyenne !. Pour cela, on calcule la moyenne des carrés des écarts !! − ! .
Définitions :
La variance V d’une série statistique est la moyenne des carrés des écarts entre chaque valeur xi
1
) ) ² + n (x –
et la moyenne x . On a donc : V =
( n1 ( x1 – SYMBOL 190\f"Symbol"\h\s8
x)
2
2
N
SYMBOL 190\f"Symbol"\h\s8
) ) ² + … + n ( x – SYMBOL 190\f"Symbol"\h\s8
))² )=
x)
x)
p
p
1
x)
∑ n i ( x i – SYMBOL 190\f"Symbol"\h\s8
N
i=1
p
) ) ².
L’écart type s est la racine carrée de la variance : s =
V.
Remarques :
•
L’écart type est un paramètre de dispersion. Plus l’écart type est petit, plus les valeurs de la
série sont concentrées autour de la moyenne.
•
Dans le cas d’une série continue, on remplace les xi par le centre des classes.
•
On peut également obtenir la moyenne et l’écart type à l’aide du menu statistique de la
calculatrice.
Propriété admise : Formule de Koening
p
1
V=
n i x 2i – SYMBOL 190\f"Symbol"\h\s8
x)
∑
N
i=1
)²
3. Exercices de base
Exercice 1:
Voici les notes du 3ème trimestre obtenue par Adeline et Barbara :
Adeline : 12 – 11 – 15 – 8 – 9
Barbara : 5 – 8 – 15 – 10 – 17
Calculer la moyenne, la variance puis l’écart type (arrondi à 10-2 près) des notes d’Adeline et de
Barbara.
Exercice 2:
Voici les résultats obtenus par deux tireurs au cours des 30 tirs d’un entraînement. Par exemple, le
tireur T a obtenu 8 fois 50 points.
Points
50 30 20 10 0
Tireur T 8 9 8 4 1
Tireur S 6 16 3
3 2
Calculer la moyenne, la variance puis l’écart type (arrondi à 10-2 près) de la série des deux tireurs.
Exercice 3:
On a relevé la taille de 65 adolescents et on a obtenu la série suivante :
Taille en cm
[150 ; 160[ [160 ; 170[ [170 ; 180[ [180 ; 190[
Centre de la classe
Effectif
6
13
35
11
Calculer une valeur approximative de l’écart type de cette série.
Conclusion : Résumer une série, c’est indiquer la répartition des données en utilisant différents
indicateurs. On utilise habituellement un paramètre de position indiquant une tendance centrale
et un paramètre de dispersion. Ainsi, pour résumer une série, on peut déterminer l’un des couples
suivants :
•
Me et l’écart-interquartile (peu sensible aux valeurs extrêmes) ;
•
Moyenne et écart-type (sensible aux valeurs extrêmes).
Téléchargement