Les données statistiques qui font l’objet d’une étude peuvent-être de différents types : effectifs, fréquences, taux, moyennes …
Paramètres d’une série statistique 1
S
Ex : On a relevé la taille de 65 adolescents
La variable étudiée est la taille, elle est dite quantitative continue ,
Ex : Une variable quantitative qui ne peut prendre que des valeurs isolées
taille
(en cm)
[
150 ; 160
[
[
160 ; 170
[
[
170 ; 180
[
[
180 ; 190
[
effectif 6 13 35 11
car elle peut prendre toutes les valeurs d’un intervalle de R.
est dite quantitative discrète.
valeur
1 2 3 4 5 6 7 8 9
1 1 2 6 10 5 2 2 1
7 5 1 1 2 0 1 6 7
1. Rappels
-
x
1
, x
2
, … , x
k
sont les valeurs d’une série statistique ou les centres des classes si ces valeurs sont regroupées en classes ;
-
n
1
, n
2
, … , n
k
sont les effectifs respectifs des valeurs x
1
, x
2
, … , x
k
;
-
f
1
, f
2
, … , f
k
sont les fréquences respectives des valeurs x
1
, x
2
, … , x
k
;
- n
est l’effectif total :
n = n
1
+ n
2
+ … + n
k
.
n =
k
i = 1
2. Caractéristiques de position de tendance centrale
- le(s)
mode
(s) : une valeur dont l’effectif associé est le plus grand
son intérêt est lié au fait qu’il désigne une valeur de la variable qui revient le plus souvent à l’occasion des observations faites.
-
médiane
:
M
e
, qui partage la population étudiée en deux groupes de même effectif ;
c’est la valeur de la variable qui correspond à une fréquence cumulée égale à 0,5 .
pour une variable statistique continue, on peut calculer la médiane à partir d’une interpolation linéaire
-
moyenne :
=
( )
1 1 2 2 1 1 2 2
1... ...
+ + + = + + +
k
i = 1
1
n
∑
3. Activité montrer que les séries statistiques A et B ont même moyenne, même médiane.
Ont-elles même étendue ? (
mesure de dispersion
)
Pour étudier la répartition des valeurs d’une série, on définit les quartiles et un nouvel outil graphique : le diagramme en boîte.
4. Caractéristiques de dispersion : l’intervalle interquartile et l’écart interquartile.
pour éviter d’effectuer des calculs sur des valeurs extrêmes et souvent aberrantes, face au phénomène étudié, on choisit souvent de les écarter.
avec l’intervalle interquartile, on perd de l’information mais on gagne en homogénéité.
-
premier quartile :
Q
1
, d’une distribution statistique est la valeur telle que
25 %
des valeurs prises par la variable
lui soient inférieures et 75 % supérieures.
-
troisième quartile :
Q
3
, d’une distribution statistique est la valeur telle que
75 %
des valeurs prises par la variable
lui soient inférieures et 25 % supérieures.
en conséquence, le deuxième quartile se confond avec la médiane. Pour une variable statistique continue,Q
1
correspond à une fréquence cumulée de 0,25
Q
3
correspond à une fréquence cumulée de 0,75
-
intervalle interquartile : [
Q
1
;
Q
3
]
contient
50 %
des observations
-
écart interquartile :
Q
3
– Q
1
, mesure la dispersion des valeurs de la série autour de la médiane.
Remarque : de la même manière, les déciles partagent la série en dix parties ; D
9
– D
1
est l’écart interdécile.