QCM p.266 - Playmaths

publicité
Statistiques- Echantillonnage
QCM p.266
I.
Présentation
1) Vocabulaire
Une étude statistique porte sur un ensemble ( de personnes, d’animaux, d’objets, … ) appelé
population.
Chaque élément de la population est un individu.
L’aspect étudié est nommé caractère ou variable.
Les résultats obtenus après observation donnent une série statistique.
Il existe des séries à une ou plusieurs variables.
Lorsque les variables prennent des valeurs numériques ( exemple : notes, tailles, âges, … ),
les variables sont dites quantitatives ( si la variable prend n’importe quelle valeur dans un
intervalle donné, la variable est dite continue , si elle prend des valeurs isolées, la variable
est dite discrète ).
Dans le cas contraire, les variables sont dites qualitatives (nationalité, couleurs, … ) ; les
différentes possibilités du caractère sont appelées modalités ( la commune de résidence
pour des élèves de première fréquentant un lycée).
2) Effectifs cumulés, fréquences cumulées
Définition :
Les effectifs cumulés croissants donnent les effectifs des valeurs inférieures ou égales à
chaque valeur du caractère.
De manière similaire, on peut étudier les effectifs cumulés décroissants.
Les fréquences cumulées croissantes donnent les fréquences des valeurs inférieures ou
égales à chaque valeur du caractère.
De manière similaire, on peut étudier les fréquences cumulées décroissants.
Exemple :
Notes
6
7
8
9
10
11
12
Effectifs
1
2
4
6
5
1
1
Effectifs cumulés
croissants
1
3
7
13
18
19
20
Ex 39 p.288
1
http://playmaths.free.fr
II. Représentations graphiques
1) Diagramme circulaire
Dans un diagramme circulaire, l’angle au centre est proportionnel à l’effectif.
Notes effectifs
Angle
6
1
18°
7
2
36°
8
4
72°
9
6
108°
10
5
90°
11
1
18°
12
1
18°
2) Diagramme en bâtons
Les valeurs du caractère sont classées dans l’ordre
croissant, la hauteur des bâtons est proportionnelle à
l’effectif.
3) Fréquences cumulées croissantes
Ex 4-5 p.282
4) Histogramme
L’histogramme est utilisé lorsque les valeurs du caractère étudié sont regroupées en classes.
Dans tout histogramme, les effectifs des classes sont proportionnels aux aires des
rectangles qui les représentent.
Par conséquent, dans le cas particulier d’un histogramme à pas constant, les effectifs des
classes sont proportionnels aux hauteurs des rectangles qui les représentent.
Cela n’est plus le cas d’un histogramme à pas non constant.
Exemple :
Valeur du
caractère X
Fréquence
en %
[0 ; 4 [
15
[4 ; 5 [
25
[5 ; 6 [
30
[6 ; 8 [
20
[8 ; 10 [
10
La première classe est représentée par un rectangle dont l’aire est 3 cm² ; comme sa
largeur est de 4 cm, sa hauteur sera de 0,75 cm.
Ex de la feuille supplémentaire
Ex 41 p.288
2
http://playmaths.free.fr
III. Paramètres statistiques
On considère la série suivante :
Valeur xi
12
13
17
18
19
Effectif ni
4
7
2
9
3
1) La moyenne
p
La moyenne est le nombre x tel que : x = Error! = Error!  ni xi .
i1
Dans l’exemple, la moyenne est 15,68 :
12  4  13  7  ...  19  3 392
x =

 15,68
25
25
Exemple2 :
Les classes de 2nde 1 et 2nde 8 comptent respectivement 28 et 33 élèves. Les élèves ont fait
le même contrôle.
La moyenne de 2nde 1 est de 9,8, celle de 2nde 8 est de 10,4.
La moyenne des notes sur les deux classes est donc :
28  9,8  33  10,4 617,6
x

 10,1
28  33
61
Ex 8-9-10 p.283
Ex 44-45 p.289
2) La médiane
La médiane est la valeur qui sépare la population en deux sous-ensembles de même effectif.
C’est la valeur qui correspond à la fréquence cumulée croissante égale à 50 %.
Dans l’exemple, la médiane est 17 ( l’effectif total est 25 ; le 13ème élément a une valeur de
17 )
3) Quartiles et déciles
Les quartiles Q1, Q2 et Q3 partagent la série en quatre parties.
Le quartile Q1 est la plus petite valeur telle que au moins le quart de la série prend une
valeur inférieure ou égale à Q1.
Le quartile Q3 est la plus petite valeur telle que au moins les trois quarts de la série prend
une valeur inférieure ou égale à Q3.
L’intervalle [Q1 ; Q3] est l’intervalle interquartile.
De la même manière, les déciles partagent la série en 10 parties.
Q1 = 13 ;
Q3 = 18 ;
Remarques :
Le deuxième quartile correspond à la médiane.
Les déciles séparent une série en dix sous-ensembles ; la médiane est alors le cinquième
décile.
3
http://playmaths.free.fr
Ex 6-7-11-12-13-17-18-19 p.284
IV. Echantillonnage
1) Echantillon
Un échantillon de taille n est constitué des résultats de n répétitions indépendantes de la
mêm expérience aléatoire.
2) Fluctuation d’échantillonnage
Exemple :
Dans un lycée, il y a 63% de filles.
Dans 10 échantillons de taille 50 des élèves de ce lycée, les fréquences observées fluctuent
autour de la proportion dans la population totale.
Echantillon
Pourcentage de filles
1
2
3
4
5
6
7
8
9
10
62%
68%
60%
68%
66%
68%
68%
44%
66%
70%
Dans une population, on s’intéresse à l’apparition d’un certain caractère. (ici, les filles). On
note p la proportion d’individus présentant ce caractère dans la population totale (ici, 63%).
On prélève un échantillon dans la population, et on note f la fréquence d’apparition
observée dans cet échantillon.
En observant plusieurs échantillons, prélevés dans la même population, on constate que la
fréquence observée fluctue autour de la proportion p. Ce phénomène, dû au hasard dans la
constitution des échantillons est appelé fluctuation d’échantillonnage.
3) Intervalle de fluctuation
Définition :
Un intervalle de fluctuation de la fréquence f au seuil de 95% est un intervalle I tel que,
pour au moins 95% de l’ensemble des écahntillons possibles, la fréquence observée
appartient à I.
Remarque : Pour une même situation, il existe plusieurs intervalles de fluctuation au seuil de
95%.
Propriété :
Pour une proportion théorique p comprise entre 0,2 et 0,8 et des échantillons de taille n
avec n≥25, on peut utiliser comme intervalle de fluctuation de la fréquence observée f au
1
1 

:p
seuil de 95% l’intervalle p 
 . Cet intervalle contient 95% des échantillons de
n
n

taille n possibles.
Ex 21-22-23-25-26 p.285
4
http://playmaths.free.fr
Téléchargement