Chapitre 3 Résumé de statistique
descriptive
3.1 Généralités
La statistique a pour objet de recueillir des observations portant sur des sujets présentant une
certaine propriété et de traduire ces observations par des nombres qui permettent d’avoir des
renseignements sur cette propriété.
Le but de la statistique descriptive est de structurer et de représenter l’information contenue
dans les données.
La population est l’ensemble des sujets observés.
Le caractère est la propriété étudiée sur ces sujets.
3.2 Statistique à 1 variable
3.2.1 Série statistique qualitative
Lorsque le caractère étudié est qualitatif, chaque caractère sera indexé et pour chaque variété
du caractère, on indiquera le nombres des membres de la population ayant cette variété : c’est
une série statistique qualitative.
Exemple :
On considère comme population 100 nouveau-nés et le caractère est le sexe.
On indexe les garçons par G et les filles par F.
La série sera par exemple :
G:63, F:37
3.2.2 Série statistique quantitative
Lorsque le caractère étudié est exprimable directement par un nombre, l’énumération des
nombres exprimant la valeur de ce caractère pour chaque membre de la population étudiée est
une série statistique quantitative.
Exemple :
On considère comme population 20 adolescents et le caractère est la taille exprimée en
centimètres.
La série est obtenue par simple énumération :
155,147,153,154,155,148,151,162,144,159,156,156,161,154,
153,171,165,159,154,155
On obtient une série statistique d’effectifs égaux à 1.
La série sera plus lisible si on note pour chaque valeur du caractère le nombre de personnes
présentant ce caractère : on obtient une série statistique avec effectifs.
"taille"
"effectif"
144
1
147
1
148
1
151
1
153
2
154
3
155
3
156
2
159
2
161
1
162
1
165
1
171
1
Une présentation de ce type s’impose quand la population est grande.
On peut aussi, puisque le caractère n’est discret que par convention, utiliser des classes par
exemple d’étendue 1 cm ou 2 cm pour avoir une représentation plus globale.
On a alors en utilisant des classes d’étendue 2cm :
"taille x"
"effectif"
143.5 ≤ x< 145.5
1
145.5 ≤ x <147.5
1
147.5 ≤ x <149.5
1
149.5 ≤ x <151.5
1
151.5 ≤ x <153.5
2
153.5 ≤ x <155.5
6
155.5 ≤ x <157.5
2
157.5 ≤ x <159.5
2
159.5 ≤ x <161.5
1
161.5 ≤ x <163.5
1
163.5 ≤ x <165.5
1
165.5 ≤ x <167.5
0
167.5 ≤ x <169.5
0
169.5 ≤ x <171.5
1
Ainsi, la fréquence de 155 est 3/20,
et la fréquence cumulée de 155 est :(1+1+1+1+2+3+3)/20=12/20. Exercice Le but de
l’activité est l’étude de la taille (en cm) portant sur 250 individus jouant au basket.
Taille
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
Effectif
4
8
7
18
23
22
24
32
26
25
18
19
10
8
6
L’activité commence par un calcul des paramètres statistiques puis se poursuit avec des
représentations graphiques : diagrammes en bâtons, diagramme en boîte et polygone des
fréquences cumulées croissantes. On tape :
T:=(173+j)$(j=0..14)
On obtient :
173,174,175,176,177,178,179,180,181,182,183,184,185,186,187
On tape :
Ef:=(4 ,8 ,7, 18, 23, 22, 24, 32, 26, 25, 18, 19, 10, 8, 6)
sum(Ef)
On obtient :
250
On tape :
histogramme(tran([[T],[Ef]]))
On obtient :
On tape :
diagramme_batons([[T],[Ef]])
On obtient :
On tape :
moustache([T],[Ef])
On obtient :
On tape :
Efc:=(sum(Ef[j],j=0..k)/250.)$(k=0..size(Ef)-1)
On obtient :
0.016,0.048,0.076,0.148,0.24,0.328,0.424,0.552,0.656,0.756,0.828,0.904,0.94
4,0.976,1.0
On tape :
affichage(nuage_points([[T],[Efc]])),
point_point+epaisseur_point_2),frequences_cumulees(tran([[T],[Ef]]))
On obtient :
On tape :
approx(mean([T],[Ef]))
On obtient :
180.104
On tape :
approx(sttdev([T],[Ef]))
On obtient :
3.27859482096
On tape :
histogramme(tran([[T],[Ef]])),
plotfunc(loi_normale(180.104,3.27859482096,x),x=172..188),
nuage_points(tran([[T],[Ef]/250.]),affichage=1+point_point+epaisseur_point_
2)
On obtient :
3.2.3 Vocabulaire des séries quantitatives à 1 variable
Soit une série quantitative à 1 variable L.
La différence entre la plus grande valeur et la plus petite valeur du caractère effectivement
obtenue est l’étendue de la série L.
Le nombre de membres de la population étudiée est l’effectif total.
Si le caractère est discret, il est commode d’indiquer pour chaque valeur du caractère, le
nombre des membres de la population ayant cette valeur : c’est l’effectif de cette valeur.
Si le caractère est continu, on partage l’intervalle sur lequel s’étendent ces valeurs en
intervalles (en général égaux) que l’on appelle classe. Le nombre des membres de la
population ayant leur valeur dans une classe est l’effectif de cette classe.
La valeur moyenne des bornes d’une classe est le centre de cette classe.
L’effectif cumulé d’une valeur (ou d’une classe) est la somme de l’effectif de cette valeur (ou
de cette classe) et de tous les effectifs des valeurs (ou des classes) qui précèdent.
La fréquence d’une valeur (ou d’une classe) est le rapport de l’effectif de cette valeur (ou de
cette classe) par l’effectif total.
Avec Xcas on tape par exemple :
frequences([1,2,1,1,2,1,2,4,3,3])
On obtient ;
[[1,0.4],[2,0.3],[3,0.2],[4,0.1]]
La fréquence cumulée d’une liste de valeurs (ou d’une classe) est la somme de la fréquence
de cette valeur (ou de cette classe) et de toutes les fréquences des valeurs (ou des classes) qui
la précèdent.
Avec Xcas on tape par exemple :
frequences_cumulee([[0.75,30],[1.75,50],[2.75,20]])
ou
frequences_cumulee([[0.25..1.25,30],[1.25..2.25,50],
[2.25..3.25,20]])
On obtient le diagramme des fréquences cumulées.
L’histogramme des effectifs (resp fréquences) d’un caractère discret ou continu est le
graphique qui permet de visualiser l’effectif (resp fréquences) des différentes valeurs du
caractère : on met en abscisse les différentes valeurs du caractère (ou le centre des différentes
classes), puis on forme des rectangles accolés deux à deux, ses rectangles ont deux cotés
parralléles à l’axe des ordonnées, le coté porté par l’axe des abscisses a pour longueur
l’amplitude de la classe, et l’autre est tel que l’aire du rectangle est égale à l’effectif (resp
fréquences) de la valeur considérée.
L’histogramme des fréquences permet de visualiser les fréquences des différentes classes au
moyen de la surface de rectangles : chaque rectangle correspond à une classe et a pour surface
la fréquence de cette classe.
1 / 10 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !