1
I. Vocabulaire
Une étude statistique porte sur un ensemble ( de personnes, d’animaux, d’objets, … ) appelé
population.
Chaque élément de la population est un individu.
L’aspect étudié est nommé caractère ou variable.
Les résultats obtenus après observation donnent une série statistique.
Il existe des séries à une ou plusieurs variables.
Lorsque les variables prennent des valeurs numériques ( exemple : notes, tailles, âges, … ), les
variables sont dites quantitatives (si la variable prend n’importe quelle valeur dans un intervalle
donné, la variable est dite continue , si elle prend des valeurs isolées, la variable est dite discrète)
Dans le cas contraire, les variables sont dites qualitatives (nationalité, couleurs, … ) ; les
différentes possibilités du caractère sont appelées modalités ( la commune de résidence pour des
élèves de première fréquentant un lycée … ).
II. Statistiques à une variable
1) Vocabulaire :
Un atelier conditionne du fil sous forme de bobines. Une série de 50 mesures a donné le tableau
suivant, où xi désigne la masse d’une bobine en grammes.
xi
496
497
498
499
500
501
502
503
504
Effectif ni
1
3
12
10
5
9
5
3
2
L’effectif total, noté N, est le nombre d’individus de la population étudiée. Ici, N = 50.
On a :
12 1
... p
pi
i
N n n n n
.
Le nombre d’individus pour lesquels la variable prend une valeur ( ou modalité ) est l’effectif de
cette valeur, noté
i
n
. Ici, n1 = 1 ; n2 = 3 ; …
La fréquence, notée fi, d’une valeur de la variable est le quotient de l’effectif de cette valeur par
l’effectif total. Ici, f1 = 1
50 ; …
Si la variable est quantitative, l’effectif cumulé croissant d’une valeur xi ( ou fréquence cumulée
croissante) est égale à la somme des effectifs ( ou fréquences ) des valeurs inférieures ou égales à
xi.
xi
498
500
503
504
Effectifs cumulés
croissants
16
31
48
50
2) Représentations graphiques
Diagramme en bâtons : Il est formé de bâtons dont l’abscisse est la valeur xi et la hauteur l’effectif
ni.
Histogramme : Lorsque les valeurs sont regroupées en classes, on représente la série par des
rectangles de base chacune des classes et dont l’aire est proportionnelle à l’effectif de la classe.
Diagramme cumulatif : Lorsque la série est regroupée en classes, le diagramme des effectifs
cumulés croissants est formé des segments reliant les points ayant pour abscisse l’extrémité xi de
chaque classe, et pour ordonnée Ni, l’effectif cumulé croissant de la valeur xi.
3) Paramètres de position
Dans le cas d’une série regroupée en classes, les calculs suivants s’effectuent en remplaçant
chaque valeur xi par le centre de chaque classe.
Statistique à une variable
(Rappel de 1° ES )
2
a) Le mode
Le mode est la valeur du caractère qui a le plus grand effectif.
Dans un cas de variable continue, on parle de classe modale, le mode étant alors le centre de la
classe.
Dans l’exemple, le mode est 498 ( 12 est le plus grand effectif )
b) La médiane
La médiane est la valeur qui sépare la population en deux sous-ensembles de même effectif.
C’est la valeur qui correspond à la fréquence cumulée croissante égale à 50 %.
Dans l’exemple, la médiane est 499 ( l’effectif total est 50 ; le 26ème élément a une valeur de 499 )
c) Les Quartiles
L’idée générale est de partager la population en quatre parties de même effectif.
Etant donné une série statistique de médiane M dont la liste des valeurs est rangée dans l’ordre
croissant (il s’agit de la même liste que celle qu’on utilise pour déterminer la médiane).
En coupant la liste en deux sous-séries de même effectif (Attention : quand l’effectif total est
impair, la médiane ne doit pas être incluse dans les sous-séries) :
On appelle premier quartile le réel noté Q1 égal à la médiane de la sous-série inférieure.
On appelle troisième quartile le réel noté Q3 égal à la médiane de la sous-série supérieure.
L’écart interquartile est égal à Q3−Q1.
]Q1;Q3[ est appelé intervalle interquartile.
d) Diagramme en boîtes.
Le diagramme en boîtes d’une série statistique se construit alors de la façon suivante :
(les valeurs du caractère sont en abscisse - min et max représentent les valeurs minimales et
maximales du caractère)
I Interprétation :
25% de la population admet une valeur du caractère entre min et Q1
25% de la population admet une valeur du caractère entre Q1 et M
25% de la population admet une valeur du caractère entre M et Q3
25% de la population admet une valeur du caractère entre Q3 et max
e) La moyenne
La moyenne est le nombre
x
tel que :
x
= n1x1+n2x2+…+npxp
N = 1
N
1
p
ii
inx
.
Dans l’exemple, la moyenne est 499,78 :
x
=
496 1 497 2 ... 504 4 24989 499,78
50 50
  
4) Paramètres de dispersion
a) L’étendue
L’étendue d’une série statistique est la différence entre la plus grande valeur et la plus petite
valeur prise par le caractère.
Dans l’exemple, l’étendue est 8 ( 504 – 496 = 7 )
b) La variance
3
La variance, notée V, est la moyenne des carrés des écarts entre les valeurs du caractère et la
moyenne
x
. Elle est telle que :
V =
2
1()
p
ii
in x x
N
=
2
2
1
p
ii
inx x
N
Variance = moyenne des carrés carré de la moyenne
Dans l’exemple, la variance est :
xi
496
497
498
499
500
501
502
503
504
Total
Effectif
ni
1
3
12
10
5
9
5
3
2
50
xi2
24601
6
24700
9
24800
4
24900
1
25000
0
25100
1
25200
4
25300
9
25401
6
ni xi2
24601
6
74102
7
29760
48
24900
10
12500
00
22590
09
12600
20
75902
7
50803
2
1248918
9
V = 12489189
50 499,78² = 3,7316
c) L’écart type
L’écart type, noté
, est la racine carrée de la variance σ = V
Dans l’exemple, l’écart-type est :
= V
1,93
1 / 3 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !