STATISTIQUES

publicité
COURS STATS
STATISTIQUES
On rappelle que les statistiques ont pour but d’étudier des séries de nombres appelés VALEURS de la série .
Chaque valeur peut figurer plusieurs fois dans la série ; ce nombre d’apparitions s’appelle l’EFFECTIF de cette valeur.
Il s’agit, cette année comme en seconde, d’apprendre à résumer des séries statistiques :
par des CARACTERIQUES DE POSITION, qui sont des valeurs centrales pour la série (moyenne, médiane,...)
par des CARACTERISTIQUES DE DISPERSION, qui mesurent la plus ou moins grande homogénéité des valeurs de
la série autour de la valeur centrale considérée (étendue, écart interquartile, écart – type, …).
Les définitions indiquées en gras sont à connaître par cœur. Pour illustrer ces différentes définitions, on considère ici deux
séries, l’une discrète (c’est à dire rangée par valeurs distinctes), l’autre continue (les valeurs sont rangées en classes).
EXEMPLE 1 (SERIE DISCRETE)
Nous prendrons la série des notes sur 10 obtenues à un contrôle par les 35 élèves d’une classe :
VALEURS x i (notes)
EFFECTIFS n i (nombres d’élèves)
0
0
1
1
2
3
3
4
4
2
5
5
6
7
7
5
8
4
9
3
10
1
Effectifs cumulés croissants
EXEMPLE 2 (SERIE CONTINUE)
Nous prenons la série des âges des 440 habitants d’une commune, rangée par classes (intervalles) de 20 ans.
Classes d’âges
Nombre d’habitants
[ 0 ; 20 [
90
[ 20 ; 40 [
113
[ 40 ; 60 [
146
[ 60 ; 80 [
71
[ 80 ; 100 [
20
Effectifs cumulés croissants
I.
MEDIANE ET INTERVALLE INTER-QUARTILES
La médiane Me d’une série statistique est la plus petite valeur telle qu’au moins 50 % des valeurs de la
série lui sont inférieures ou égales.
Le premier quartile Q 1 est la plus petite valeur telle qu’au moins 25 % des valeurs de la série lui sont
inférieures ou égales.
Le troisième quartile Q 3 est la plus petite valeur telle qu’au moins 75 % des valeurs de la série lui sont
inférieures ou égales.
L’intervalle [ Q 1 ; Q 3 ] s’appelle l’intervalle interquartile de la série.
Sa longueur Eq = Q 3 – Q 1 s’appelle l’écart interquartile.
L’écart interquartile est une mesure de dispersion qui est associée à la médiane
L’intervalle interquartile [ Q 1 ; Q 3 ] contient environ 50 % des valeurs de la série.
Concrètement, on détermine ces caractéristiques en faisant le calcul ou le graphique des effectifs cumulés croissants :
Dans l’exemple 1 :
On calcule les effectifs cumulés croissants sur une ligne rajoutée au tableau.
La médiane est la plus petite valeur dont l’effectif cumulé croissant est supérieur ou à égal à la moitié de l’effectif total.
On a : 35 × 0,50 = ……… ; donc : Me = …………….
35 × 0,25 = …………. ; donc Q 1 = ……………
35 × 0,75 = ………….. . Donc : Q 3 = ……….
Donc [ Q 1 ; Q 3 ] = [ … ; … ] et
Eq (écart interquartile) = …. .
Dans l’exemple 2 :
On dessine ( le faire au verso) le graphique des effectifs cumulés croissants .
On peut encore préciser médiane et quartiles par extrapolation (voir avec le professeur)
On a : 440 × 0,50 = ……. ; 440 × 0,25 = …….. ; 440 × 0,75 = ……. ;
donc : Me ≈ ………
Q 1 ≈ ……….
Q 3 ≈ ………..
(Rappelons par ailleurs comment on détermine des valeurs approchées par interpolation linéaire).
On résume parfois la série en un schéma indiquant sa médiane, son
intervalle interquartiles. Ce schéma s’appelle le diagramme de Tuckey
(ou boite à moustache) de la série.
II.
MOYENNE ET ECART-TYPE
a)
Définitions
La moyenne d’une série de p valeurs x 1 , x 2 , x 3 , …. , x p d’effectifs respectifs n 1 , n 2 , n 3 , … , n p est le
i=p
i=p
x × n 1 + x 2 × n 2 + x 3 × n 3 + …. + x p × n p
nombre x = 1
(abrégé en : ∑ x i × n i / ∑ n i ) .
n 1 + n 2 + n 3 + …. + n p
i=1
i=1
La variance V de cette série est la moyenne des carrés des écarts avec la moyenne, autrement dit :
i=p
i=p
(
x –x 1 ) 2 × n 1 + (
x – x 2 ) 2 × n 2 + ……… (
x – x p ) 2 × n p
V=
(abrégé : ∑ (
x – x i ) 2 × n i / ∑ n i ) .
n 1 + n 2 + …. + n p
i=1
i=1
L’écart – type σ x de la série est égal à la racine carrée de la variance :
σx=
V .
L’écart-type σ x est une mesure de dispersion associée à la moyenne.
Le pourcentage de valeurs appartenant à
l’intervalle [x – σx ;x + σx ] est un indicateur de la dispersion des valeurs de la série.
Dans l’exemple1 :
x ≈ ………………….
.
V ≈ …………………… ..
σx
≈ ……………………... .
Dans l’exemple 2
x ≈ ………………….
V = ……………………….
σ x ≈ …………..…………...
(rappel : dans le cas d’une série rangée en classes, on prend comme valeurs les valeurs centrales des classes) :
b) Utilisation de la calculatrice
Sur TEXAS :
STAT puis EDIT pour entrer les valeurs en liste 1 et les effectifs en liste 2 ;
puis : STATS CALC 1-VARSTATS L1, L2 pour obtenir les caractéristiques.
Sur CASIO :
MENU STATS pour entrer les valeurs et effectifs ; puis CALC puis 1 VAR pour obtenir les
caractéristiques ;
mais de fréquentes erreurs sont dues à un mauvais réglage des listes : bien vérifier dans SET
qu’on a bien la List 1 (liste des valeurs) dans 1 VAR X et la List 2 (liste des effectifs ou fréquences) dans 1 VAR F.
A titre d’exemple, on peut vérifier les résultats des paragraphes précédents.
III.
EFFET D’UNE TRANSFORMATION AFFINE SUR LES
CARACTERISTIQUES DE POSITION ET DE DISPERSION D’UNE SERIE
Soit une série s formée de p valeurs x 1 , x 2 , x 3 , …. , x p d’effectifs respectifs n 1 , n 2 , n 3 , … , n p .
Soient
x la moyenne , σ l’écart - type, m la médiane et e l’écart interquartile de cette série.
On considère une fonction affine f (x) = a x + b .
On considère la nouvelle série S dont les valeurs sont les images des valeurs de la série s par la f, c’est à dire a x 1 + b
, a x 2 + b , a x 3 + b , …. , a x p + b d’affectifs respectifs n 1 , n 2 , n 3 , … , n p .
Soient X la moyenne, Σ l’écart – type , ME la médiane et EQ l’écart interquartile de cette série S.
Alors on a , d’une part :
d’autre part :
X = a
x + b
ME = a m + b
et
et
Σ = a × σ
,
EQ = a  × e .
Dans l’exemple 1 : supposons qu’on multiplie par a = 2 les notes de chaque élève de la classe prise en exemple plus haut,
puis qu’on leur soustrait 1 (donc b = – 1 ) . Les moyenne, écart – type, médiane et écart interquartiles de la nouvelle série de
notes sont alors:
X ≈ ………………………….. ….. ……………. ; Σ ≈ ………………………………………….. ;
ME ≈ …………………………………………..
; EQ ≈ ………………… ……………………... .
Corrigé partie I : calculs ou estimations graphiques de médianes et de quartiles
Corrigé partie II : calculs de moyennes et d’écart-types
Téléchargement