Les données statistiques qui font l’objet d’une étude peuvent-être de différents types : effectifs, fréquences, taux, moyennes …
Paramètres d’une série statistique 1
ière
S
Ex : On a relevé la taille de 65 adolescents
La variable étudiée est la taille, elle est dite quantitative continue ,
Ex : Une variable quantitative qui ne peut prendre que des valeurs isolées
taille
(en cm)
[
150 ; 160
[
[
160 ; 170
[
[
170 ; 180
[
[
180 ; 190
[
effectif 6 13 35 11
car elle peut prendre toutes les valeurs d’un intervalle de R.
est dite quantitative discrète.
valeur
1 2 3 4 5 6 7 8 9
effectif série A
1 1 2 6 10 5 2 2 1
effectif série B
7 5 1 1 2 0 1 6 7
1. Rappels
-
x
1
, x
2
, … , x
k
sont les valeurs d’une série statistique ou les centres des classes si ces valeurs sont regroupées en classes ;
-
n
1
, n
2
, … , n
k
sont les effectifs respectifs des valeurs x
1
, x
2
, … , x
k
;
-
f
1
, f
2
, … , f
k
sont les fréquences respectives des valeurs x
1
, x
2
, … , x
k
;
- n
est l’effectif total :
n = n
1
+ n
2
+ … + n
k
.
n =
k
i = 1
k
2. Caractéristiques de position de tendance centrale
- le(s)
mode
(s) : une valeur dont l’effectif associé est le plus grand
son intérêt est lié au fait qu’il désigne une valeur de la variable qui revient le plus souvent à l’occasion des observations faites.
-
médiane
:
M
e
, qui partage la population étudiée en deux groupes de même effectif ;
c’est la valeur de la variable qui correspond à une fréquence cumulée égale à 0,5 .
pour une variable statistique continue, on peut calculer la médiane à partir d’une interpolation linéaire
-
moyenne :
x
=
( )
1 1 2 2 1 1 2 2
1... ...
k k k k
n x n x n x f x f x f x
n
+ + + = + + +
k
i i
i = 1
1
x =
n x
n
3. Activité montrer que les séries statistiques A et B ont même moyenne, même médiane.
Ont-elles même étendue ? (
mesure de dispersion
)
Pour étudier la répartition des valeurs d’une série, on définit les quartiles et un nouvel outil graphique : le diagramme en boîte.
4. Caractéristiques de dispersion : l’intervalle interquartile et l’écart interquartile.
pour éviter d’effectuer des calculs sur des valeurs extrêmes et souvent aberrantes, face au phénomène étudié, on choisit souvent de les écarter.
avec l’intervalle interquartile, on perd de l’information mais on gagne en homogénéité.
-
premier quartile :
Q
1
, d’une distribution statistique est la valeur telle que
25 %
des valeurs prises par la variable
lui soient inférieures et 75 % supérieures.
-
troisième quartile :
Q
3
, d’une distribution statistique est la valeur telle que
75 %
des valeurs prises par la variable
lui soient inférieures et 25 % supérieures.
en conséquence, le deuxième quartile se confond avec la médiane. Pour une variable statistique continue,Q
1
correspond à une fréquence cumulée de 0,25
Q
3
correspond à une fréquence cumulée de 0,75
-
intervalle interquartile : [
Q
1
;
Q
3
]
contient
50 %
des observations
-
écart interquartile :
Q
3
– Q
1
, mesure la dispersion des valeurs de la série autour de la médiane.
Remarque : de la même manière, les déciles partagent la série en dix parties ; D
9
– D
1
est l’écart interdécile.
les précipitations sont plus régulières à Paris
( série moins dispersée ),
pour Nice plus de la moitié des mois ont des précipitations supérieures au maximum de Paris…
5. Diagramme en boîte
Ex (
sur une série statistique de petite taille
) : les valeurs sont les suivantes : 7 - 9 - 10 - 12 - 15 - 18 - 20 - 25 - 26
Pour Q
1
on prend la valeur x
i
dont l’indice i est le plus petit entier supérieur ou égal à
n
4
.
Pour Q
3
on prend la valeur x
j
dont l’indice j est le plus petit entier supérieur ou égal à
3n
4
.
Ex :
comparer deux séries statistiques à l’aide de leurs diagrammes en boîte
les valeurs des séries suivantes
( rangées par ordre croissant )
donnent les précipitations moyennes mensuelles
en mm
à Nice et à Paris
6. Caractéristiques de dispersion : Variance et écart type empiriques
l’ écart type est une moyenne d’écarts, c’est un des indicateurs de dispersion les plus utilisés ,il se définit à partir de la variance.
- moyenne des carrés des écarts
:
soit une série statistique ( x
1
, x
2
, … , x
n
) de taille n
.
La fonction f
définie sur R par
f
( x ) =
( )
2
i
i =1
1
x
n
x
n
,
moyenne des carrés des écarts de chaque terme au réel x
, admet un minimum en
x
.
-
variance : V,
d’une série statistique ( x
1
, x
2
, … , x
n
) de taille n
, c’est le minimum de la fonction f : x ֏
( )
2
i
i =1
1
x
n
x
n
V =
( )
2
i
i =1
1
x
nx
n
ou encore
V =
2
2
i
i =1
1
x
nx
n
lorsque la série est connue par toutes les valeurs x
1
, x
2
, … , x
k
et les effectifs n
i
, ou les fréquences f
i
correspondantes,
la variance est le réel égal à la moyenne des valeurs
( )
2
i
x
x
pondérés par les effectifs n
i
, ou par les fréquences f
i
.
V =
( )
k
2
i i
i =1
1
x
n x
n
=
( )
k
2
i i
i =1
x
f x
V =
k2
2
i i
i =1
1
x
n x
n
avec
n
=
k
i = 1
k
-
écart type :
c’est la racine carrée de la variance.
s
=
V
s
mesure l’étalement de la distribution autour de la moyenne.
Ex : deux élèves Camille et Mylène ont 10 de moyenne, avec 9 et 11 pour Camille et 4 et 16 pour Mylène
pour Camille :
V
=
( ) ( )
2 2
9 10 11 10
1 1
2 2
+ −
+
== 1 ; l’écart type
s
=
1
=1.
Pour
Mylène :
V
=
( ) ( )
2 2
4 10 16 10
36 36
2 2
+ − +
== 36 ;
s
=
36
= 6
7. Résumé d’une série statistique
on résume souvent une série statistique par une mesure de tendance centrale associée à une mesure de dispersion.
le couple ( moyenne, écart type ) qui à l’inconvénient d’associer deux mesures sensibles aux valeurs extrêmes.
le couple ( médiane , écart interquartile ) qui n’a pas ce défaut mais dont la détermination est moins pratique.
la médiane et l’écart interquartile : Q
3
– Q
1
sont dits « robustes » par rapport aux valeurs extrêmes.
1 / 2 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !