Seconde 2016/17 - v.dujardin
Partie 4
Cours de statistiques,
probabilités et
fluctuations
Table des matières
Chapitre 1 : Statistique descriptive................................................................2
Chapitre 2 : Probabilités .............................................................................6
Chapitre 3 : Fluctuations sur les échantillons.............................................11
Nombre de pages : 13
v.dujardin v2.1
Chapitre 1 : Statistique descriptive
Une série statistique est une liste indiquant, pour chaque individu d'une population, la
valeur d'une propriété que l'on étudie, que l'on appelle le caractère (x).
La statistique descriptive vise à donner des informations globales sur la population.
Il n'y a pas d'aléatoire dans cette analyse : elle décrit une population connue,
contrairement aux probabilités.
1 Vocabulaire, notations et représentations usuelles
1.1 Effectif total
L'effectif total d'une population est le nombre d'individus dans la population.
On le note souvent N.
1.2 Effectif
Il est fréquent de présenter une série en donnant les valeurs prises par le
caractère et le nombre d'individus ayant chacune de ces valeurs.
On numérote par un indice les couples de valeurs obtenues, et on note souvent :
xi
les valeurs prises par le caractère.
ni
l'effectif (le nombre d'individu) ayant chacune de ces valeurs.
1.3 Fréquence
Définition 1 : fréquence
La fréquence d'une valeur du caractère
xi
d'effectif
ni
est le rapport de
ni
sur
l'effectif total.
On la note souvent
fi
, avec
fi=ni
N
Remarque :
La fréquence est positive et inférieure à 1 :
0fi1
On donne souvent aux fréquences le format d'un pourcentage
La somme des
fi
d'une série fait 1=100%
Exemple : on étudie les âges dans un groupe d'enfants.
La série brute (liste des
xi
) :
Alain (8ans), Betty (7ans), Carl (6), Dom(10), Eric(6), Fred(7), Gina(7), Heidi(10)
La même série, regroupée en
avec calcul des fréquences
fi
Ages (
xi
)6 7 8 10 Total
Effectifs (
ni
)23128
Fréquences (
fi
)0,25 0,38 0,12 0,25 1
Fréquences (
fi
%) 25 38 12 25 10
v.dujardin v2.1 1
2 Caractéristiques numériques sur les séries
2.1 Mesures de positions
Définition 2 : La moyenne d'une série est la somme des
xi
divisée par l'effectif total.
Notation : on note souvent
̄
x
la moyenne d'une série dont le caractère est noté x.
Propriété 1 : on peut calculer la moyenne comme ci-dessous :
Avec des
(
xi,ni
)
:
̄x
=
x1×n1+…+xp×np
N
Avec des
(
xi,fi
)
:
̄x
=
x1×f1+ …+xp×fp
Preuve :
La première formule consiste à regrouper les mêmes valeurs de
xi
.
L'égalité avec la seconde se prouve comme ceci :
̄x=
x1×n1+…+xp×np
N
=x1×n1
N+ …+xp×np
N
=x1×f1+…+xp×fp
Autres mesures de position (rappels) :
La médiane med est une valeur telle que pour la moitié de la population,
ximed
, et pour l'autre moitié,
ximed
.
Le premier quartile
Q1
est la plus petite valeur de la série telle que pour un
quart de la population,
xiQ1
.
Le troisième quartile
Q3
est la plus petite valeur de la série telle que pour
trois quarts de la population,
xiQ3
.
Ces trois caractéristiques sont des caractéristiques de position.
2.2 Mesures de dispersion
Autour d'une position, une série est plus ou moins dispersée. Pour décrire ce phénomène,
on peut utiliser :
L'étendue : la différence entre la plus grande et la plus petite valeurs de
xi
L'écart interquartile :
Q3Q1
.
Exemple : voir activité 2 (les quatre classes 1A, 1B, 1C et 1D)
2.3 Différences d'un pays à l'autre
Selon les définitions (française, US, UK, etc.), les outils (calculatrice/tableur) peuvent
donner des valeurs différentes selon qu'ils prennent des valeurs de la série ou non.
L'idée générale reste la même : diviser la population en deux moitiés d'égal effectif pour
la médiane, puis en quatre quarts d'égal effectif pour les quartiles.
Les différences de définition entre les pays sont très minimes sur des grandes
populations : on conservera toujours les résultats donnés par les outils à disposition.
v.dujardin v2.1 2
3 Cumul des effectifs ou des fréquences
On cumule classiquement les fréquences et effectifs, en croissant ou en décroissant.
Le principe est d'ajouter pour chaque valeur de
xi
le cumul précédent.
Les cumuls permettent de répondre aux questions du type « combien ou plus de ... »,
« quelle proportion a moins de... »
Exemple avec le cumul croissant :
Ages :
xi
6 7 8 10 Total
Effectifs :
ni
2 3 1 2 8
Cumul croissant
(ECC) 2
2+3=
5
5+1=
6
6+2=
8
Fréquences
fi
0,25 0,38 0,12 0,25 1
Cumul croissant
(FCC) 0,25
0.25+0.38
= 0,63
0.63+0.12
= 0,75
0.75+0.25
= 1
Interprétation des cumuls croissants :
Il y a 6 élèves qui ont 8 ans et moins.
Il y a 0,63=63% des élèves qui ont 7 ans et moins.
Méthode 1 : retrouver les quartiles et la médiane avec les FCC
Pour retrouver le Q1, on recherche la valeur qui correspond à la fréquence
cumulée de 0,25=25% : ici, Q1=6 ans.
Q3 correspond à la FCC égale à 0,75=75% : ici, Q3=8 ans.
Pour retrouver la médiane, on peut rechercher la valeur correspondant à la
fréquence cumulée 0,5 (ou 50%). Ici, la médiane est 7 ans car les enfants de 7 ans
font passer la fréquence cumulée croissante de 25% à 63% : c'est bien l'un d'eux
qui correspond à la moitié de l'effectif.
4 Séries regroupées par classes
Lorsque les données sont continues (nombres réels et pas entiers par exemple), ou
lorsqu'il y a beaucoup de données, on regroupe souvent les valeurs de
xi
dans des
intervalles que l'on appelle des classes.
Exemple : lors d'une épreuve de saut en hauteur, le professeur d'EPS analyse les
performances de sa classe.
Les hauteurs de sauts sont regroupées dans des intervalles de 5cm « de large ».
v.dujardin v2.1 3
4.1 Polygone des FCC
On peut représenter les fréquences cumulées croissantes par un polygone (ou ligne
brisée).
Ce n'est pas exactement une courbe, car les points sont reliés par des segments (à la
règle).
Méthode 2 : tracer un polygone des FCC
Le premier point a pour abscisse la borne de gauche de la
première classe et pour ordonnée 0.
Le second a pour abscisse la borne de droite de la première
classe et pour ordonnée la première FCC.
On continue ainsi.
Il y a au final un point de plus que le nombre de classes.
Avec l'exemple : bien repérer la correspondance du précédent
tableau avec ce graphique.
Remarque : on peut aussi tracer un polygone des effectifs cumulés croissants, des
fréquences cumulées décroissantes... Le principe se transpose.
4.2 Médiane et quartiles sur le polygone des FCC
Méthode 3 : on peut lire des valeurs approchées des médianes et
quartiles sur le polygone des FCC.
Q1
est l'antécédent de 25%
Med est l'antécédent de 50%
Q3
est l'antécédent de 75%
Avec l'exemple :
La lecture d'antécédent donne Q1
97cm Mediane
102cm Q3
110cm
4.3 Moyenne d'une série regoupée par classe
Ne connaissant pas les valeurs de la série, il est impossible de calculer exactement la
moyenne. On peut :
l'estimer en utilisant pour valeur de
xi
les centres des classes.
l'encadrer en utilisant pour valeur de
xi
les bornes des classes.
Avec l'exemple :
Le centre de la classe [90;95[ est
90+95
2
=92,5 (et ainsi de suite...).
La moyenne est environ : moy
7×92,5+15×97,5+8×102,5+7×107,5+13×112,5
50
=
102,9
cm
Encadrement :
7×90+15×95+8×100+7×105+13×110
50
100,4
moy
7×95+15×100+8×105+7×110+13×115
50
105,4
v.dujardin v2.1 4
1 / 13 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !