Statistique - Le Web Pedagogique

publicité
Chapitre IV
2nde D4
-1-
CHAPITRE IV : STATISTIQUES
Statistique vient du mot latin status, qui signifie l’Etat, car les premières statistiques
ont consisté à recenser les populations.
I)
Vocabulaire des séries statistiques et représentations graphiques.
1) Statistique descriptive.
Définitions :
La population est l’ensemble sur lequel porte l’observation : on étudie un caractère bien
précisé sur les individus de cette population : on collecte et on dépouille les données.
Un échantillon est une partie de la population.
La liste des valeurs (ou modalités) prise par le caractère constitue la série statistique.
Lorsque le caractère étudié prend des valeurs numériques (cad des nombres), le caractère est
quantitatif ; sinon le caractère est qualitatif.
Un caractère quantitatif est discret lorsqu’il ne prend que quelques valeurs isolées (il ne peut
prendre qu’un nombre fini de valeurs numériques).
Un caractère quantitatif est continu lorsqu’il peut prendre toutes les valeurs d’un intervalle
(il peut prendre une infinité de valeurs numériques).
Remarques : pour un caractère qualitatif, on parle plutôt de modalités. Pour un caractère
quantitatif, on parle de variable.
Exemples :
Avoir le brevet des collèges est un caractère qualitatif prenant deux valeurs : oui ou non. La
couleur des yeux, le mois de naissance, le sport pratiqué sont aussi des caractères qualitatifs.
Le nombre de frère(s)&sœur(s) (les valeurs sont 0 ;1 ;2 ;3…), la pointure de chaussures, le
nombre de fois où l’on a joué au tiercé la semaine dernière, sont des caractères quantitatifs
discrets.
La taille ou le poids des élèves sont des caractères quantitatifs continus.
Il arrive qu’un caractère quantitatif continu soit rendu discret : c’est le cas si l’on donne la
taille arrondie au cm.
2) Effectif et fréquence.
Définitions :
L’effectif d’une valeur du caractère est le nombre d’individus de la population ayant cette
valeur.
La fréquence de la valeur est le quotient de l’effectif de cette valeur par l’effectif total :
effectif de la valeur
fréquence de la valeur 
.
effectif total
L’ensemble des fréquences de toutes les valeurs du caractère est la distribution des
fréquences de la série statistique.
Remarques : l’effectif d’une valeur étant inférieur à l’effectif total, une fréquence est toujours
un nombre compris entre 0 et 1. On exprime souvent une fréquence par un pourcentage. La
somme des fréquences est toujours égale à 1.
Emilie Bouchez
2007-2008
Chapitre IV
2nde D4
-2-
Exemple 1 :
Population :
Caractère :
Série statistique à caractère
Mois xi
Nombre
d’élèves
ni
Janvier
Février
Mars
Avril
Mai
Juin
Juillet
Août
Septembre
Octobre
Novembre
Décembre
(L’effectif total de la série est noté N : N  n1  n2  n3  ...  nk )
Exemple 2 :
Population :
Caractère :
Série statistique à caractère
0
1
Nombre de
frères&soeurs xi
2
3
Nombre d’élèves ni
Exemple 3 :
Population :
Caractère :
Série statistique à caractère
L’ensemble des valeurs est alors découpé en classes qui peuvent être de même
amplitude ou non.
( l’amplitude d’une classe  a; b est égale à b-a. )
Tailles (en m)
1,5;1,6
1,6;1,65
1,65;1,7
1,7;1,8
1,8;1,9
Effectifs ni
Définition : Pour un caractère quantitatif, quand les valeurs ( ou les classes) sont rangées par
ordre croissant, on appelle effectif cumulé croissant d’une valeur ( ou d’une classe) la
somme des effectifs de cette valeur ( ou cette classe) et de ceux qui la précèdent.
On définit de même l’effectif cumulé décroissant.
Exemple :
A partir de l’exemple précédent, on a :
Tailles (en m)
1,5;1,6
1,6;1,65
1,65;1,7
1,7;1,8
1,8;1,9
Effectifs cumulés
croissants
Emilie Bouchez
2007-2008
Chapitre IV
2nde D4
-33) Représentation graphique.
a) Diagramme en bâtons ou en barres :
Utilisé pour représenter graphiquement une série statistique dont le caractère est
discret.
On représente sur l’axe des abscisses les différentes valeurs du caractère et, sur
l’axe des ordonnées, les effectifs.
La hauteur des barres est proportionnelle à l’effectif.
b) Histogramme :
Utilisé pour représenter graphiquement une série statistique dont le caractère est
continu.
L’aire de chaque rectangle est proportionnelle à l’effectif.
Sa largeur correspond à l’amplitude de l’intervalle de chaque classe. On représente
en abscisses les différentes classes du caractère.
c) Diagramme circulaire :
Utilisé pour représenter graphiquement une série statistique dont le caractère est
discret.
L’angle d’ouverture de chaque secteur est proportionnel à l’effectif.
effectif de la valeur
angle du secteur 
 360
effectif total
angle du secteur  fréquence de la valeur  360
ou
II)
Mesures en statistiques.
1) Etendue et moyenne.
On considère une série statistique quantitative sur une population de N individus au
total.
Définitions :
L’étendue d’une série statistique est la différence entre les valeurs extêmes du caractère :
e  xmax  xmin .
Pour une série statistique dont les valeurs du caractère sont x1 , x2 ,..., xk et les effectifs
associés n1 , n2 ,..., nk , la moyenne (pondérée) de la série statistique, notée x , a pour valeur :
n  x  n  x  ....  nk  xk
x 1 1 2 2
où N  n1  n2  n3  ...  nk est l’effectif total.
N
k
qui s’écrit aussi x 
 ni  xi
i 1
k
n
i 1
k

n  x
i 1
i
i
N
i
Soit encore en fonction des fréquences f i : x  f1  x1  f 2  x2  ....  f k  xk
k
qui s’écrit aussi x   fi  xi
i 1
Remarque : Si les valeurs sont regroupées dans des classes, on prend le centre des classes
pour calculer la moyenne.
Emilie Bouchez
2007-2008
Chapitre IV
-4-
2nde D4
Propriétés de la moyenne :
Linéarité :
_si on multiplie toutes les valeurs de la série par un nombre a non nul, alors la moyenne est
multipliée par le nombre a ;
_si on ajoute à toutes les valeurs de la série un nombre b, alors la moyenne est augmentée de b.
Ainsi, si une série de valeurs xi a pour moyenne x , la série a xi +b a pour moyenne a x +b.
A l’aide de moyennes de sous-groupes :
Une série est séparée en deux sous-groupes d’effectifs M et P.
Si on connaît les moyennes y et z des deux sous-groupes, alors la moyenne de la série totale
est :
x
M  y  P z
M P
Moyenne élaguée :
Lorsque les valeurs extrêmes (maximum ou minimum) semblent douteuses, ou ne rentrent pas
dans le cadre de l’étude, on peut faire un calcul de moyenne élaguée en les retirant de la série.
2) Médiane.
Définition : La médiane (notée Me) partage la population en deux parties de telle sorte que au
moins 50% des individus prennent une valeur inférieure ou égale à la médiane et au moins
50% des individus prennent une valeur supérieure ou égale à la médiane.
Détermination de la médiane :
Cas d’un caractère quantitatif discret :
On considère une série statistique dont les valeurs du caractère sont rangées par ordre
croissant, chacune des valeurs figurant un nombre de fois égal à son effectif.
Si le nombre de données est impair, donc de la forme 2n  1 , alors la médiane de la série
statistique est le terme du milieu, c’est-à-dire le terme de rang n  1.
Si le nombre de données est pair, donc de la forme 2n, alors la médiane de la série
statistique est la demi-somme des termes de rangs n et n  1.
Cas d’un caractère quantitatif continu :
On trace la courbe des fréquences cumulées croissantes. L’abscisse du point
1
d’ordonnée
est la médiane de la série statistique.
2
3) Mode et classe modale.
Définition : Dans le cas d’une série qualitative, ou quantitative discrète, le mode est la
modalité du caractère qui a le plus grand effectif.
Dans le cas d’une série regroupée en classe, la classe modale est la classe ayant le plus grand
effectif uniquement lorsque les classes sont d’égale amplitude.
Emilie Bouchez
2007-2008
Chapitre IV
-5-
2nde D4
Remarque : mode, médiane et moyenne sont des mesures de tendance centrale, ou mesures
de position. L’étendue est une mesure de dispersion.
Emilie Bouchez
2007-2008
Téléchargement