Résumé du cours

publicité
Résumé Statistiques
2nde 4
1/3
1 Vocabulaire
Le but d’une étude statistique est de recueillir des données, de les classer, de faire une représentation graphique (diagramme en
bâtons ou histogramme par exemple) de faire des calculs (moyenne, écart-type . . .) et éventuellement de faire des prévisions
• Tableau d’effectifs
Exemple : Le tableau ci-dessous représente les notes obtenues par les élèves
d’une classe à un contrôle :
Note (x i ) 7 9 11 12 15
Effectif (n i ) 3 5 8 10 4
La population est l’ensemble des élèves de la classe
Le caractère étudié est la note à un contrôle, ce caractère est quantitatif (on peut le mesurer avec un nombre)
Les nombres (x i ) sont les différentes valeurs du caractère ici : x 1 = 7 x 2 = 9 x 3 = 11 x 4 = 12 x 5 = 15
Les nombres (n i ) sont les effectifs des différentes valeurs du caractère. Ceci se traduit par :
Il y a 3 élèves qui ont eu 7 , 5 élèves qui ont eu 9, 8 qui ont eu 11, 10 qui ont eu 12 et 4 qui ont eu 15
5
X
n i = n 1 + n 2 + n 3 + n 4 + n 5 = 30
L’effectif total est N =
i =1
Remarque : On rencontre parfois des tableaux d’effectifs où les valeurs sont regroupées en classe (des intervalles)
• Tableau des effectifs cumulés croissants
Il y a 3 élèves qui ont eu une note inférieure ou égale à 7, 8 élèves qui ont eu
une note inférieure ou égale à 9, 16 élèves qui ont eu une note inférieure ou
égale à 11, etc...
(On retrouve en dernière colonne l’effectif total)
Note É (x i ) 7 9 11 12 15
Effectif (n i ) 3 8 16 26 30
• Tableau des effectifs cumulés décroissants
(On retrouve en première colonne l’effectif total)
Note Ê (x i ) 7
9 11 12 15
Effectif (n i ) 30 27 22 14 4
• Fréquence
La fréquence f i d’une valeur du caractère x i est le rapport entre l’effectif de cette valeur et l’effectif total f i =
Une fréquence est un nombre compris entre 0 et 1. La somme des fréquences égale 1.
• Mode le mode est la valeur du caractère qui a le plus grand effectif.
5
X
fi = f1 + f2 + f3 + f4 + f5 = 1
i =1
• Etendue L’étendue est la différence entre la plus grande valeur et la plus petite valeur du caractère.
2 Représentation
Selon le type du caractère de la série statistique, on choisira :
Un diagramme en bâtons :
en abscisse les valeurs du caractère,
en ordonnéee l’effectif
Un histogramme :
Lorsque les valeurs du caractère sont regroupées en intervalles.
On dessine des rectangles qui ont pour base l’intervalle et qui
ont une hauteur telle que l’aire du rectangle est proportionnelle à l’effectif.
ni
N
Résumé Statistiques
2nde 4
2/3
Un diagramme circulaire :
l’effectif de chaque valeur est représenté par un angle proportionnel à cet effectif.
L’effectif total est alors représenté par 360◦ pour les diagrammes circulaires et 180◦ pour
les diagrammes semi-circulaires
3 Moyennes
On considère une série statistique dont les N valeurs sont données par x 1 , x 2 . . . x 5 , d’effectifs associés n 1 ,n 2 , . . . n 5
Définition
5
X
La moyenne est :
n1 x1 + n2 x2 + n3 x3 + n4 x4 + n5 x5
x=
=
n1 + n2 + n3 + n4 + n5
Si on connait les fréquences, la moyenne est
ni × xi
i =1
N
=
3 × 7 + 5 × 9 + 8 × 11 + 10 × 12 + 4 × 15
≈ 11,1
30
x = f 1 × x1 + f 2 × x2 + · · · + f 5 × x5 =
5
X
f i × xi
i =1
La note moyenne de la classe au contrôle est donc de 11,1 environ
Lorsque les valeurs sont regroupées en classe (des intervalles) on choisit pour valeur x i le centre de chaque intervalle.
4 Médiane
Quartiles
La médiane est un nombre qui partage la population en deux parties de même effectif. La moitié des valeurs du caractère sont
inférieures à la médiane et la moitié des valeurs sont supérieures à la médiane.
Dans la pratique on procède ainsi :
Définition
On range les valeurs par ordre croissant :
• S’il y a un nombre impair de valeurs (2n + 1 valeurs) La médiane est la valeur de rang n + 1
(c’est celle qui est au milieu)
• S’il y a un nombre pair de valeurs (2n valeurs) la médiane est la moyenne entre la valeur de rang n et celle de rang n + 1
(On fait la moyenne entre les deux valeurs situées au milieu)
De même on peut définir les quartiles qui séparent la population en quatre parties
Le premier quartile Q1 est la plus petite valeur q de la série telle qu’au moins 25% des données soient inférieures ou égales à q
Le troisième quartile Q3 est la plus petite valeur q 0 de la série telle qu’au moins 75% des données soient inférieures ou égales à q 0
Le premier décile D1 est la plus petite valeur q de la série telle qu’au moins 10% des données soient inférieures ou égales à q
Le neuvième décile D9 est la plus petite valeur q 0 de la série telle qu’au moins 90% des données soient inférieures ou égales à q’
On peut ensuite tracer une boîte à moustaches
Résumé Statistiques
2nde 4
3/3
5 Pourcentages
Rappel :
µ
¶
t
Pour augmenter un nombre de t %, on le multiplie par 1 +
100
µ
¶
t
Pour diminuer un nombre de t %, on le multiplie par 1 −
100
6 Intervalle de fluctuation
Si on lance un dé non truqué, la probabilité d’obtenir un six est de 1/6, pourtant si on le lance 120 fois, il sera assez rare de tomber
20
1
exactement 20 fois sur le six, c’est-à-dire d’obtenir une fréquence d’apparition du six de
= .
120 6
On dit que la fréquence fluctue autour de 1/6. On appelle ce phénomène, fluctuation de la fréquence.
Cependant on a le résultat suivant :
Propriété
Lorsque l’on prélève un échantillon de taille n dans une population où la fréquence d’un caractère est p alors sous réserve
que
n Ê 50, np ʸ5 et n(1 − p) Ê 5, la probabilité que cet échnatillon fournisse une fréquence appartenant à l’intervalle
·
1
1
est au moins égale à 0,95
p − p ;p + p
n
n
L’intervalle est appellé intervalle de fluctuation de la fréquence f au seuil de 95%
Téléchargement