statistiques-3

Telechargé par Henry Zeemann
http://xmaths.free.fr/ TES Statistiques page 1
STATISTIQUES
I Statistiques à une variable - rappels
Exercice 01
(voir réponses et correction)
On a relevé le prix de vente d'un CD et le nombre de CD vendus chez différents fournisseurs.
Les résultats forment une série statistique à une variable, donnée dans le tableau suivant :
Prix de vente en euros 15 16 17 18 19
Nombre de CD vendus 83 48 32 20 17
Quelles sont les différentes valeurs de la série.
Donner la fréquence correspondant à chacune de ces valeurs.
Donner la moyenne et l'écart-type de la série. Que représentent ces nombres ?
Représenter la série par un diagramme à barres.
Définitions
On considère une série statistique donnée par le tableau suivant :
Valeur : x
i
x
1
x
2
x
3
x
p
Effectif : n
i
n
1
n
2
n
3
n
p
La moyenne de cette série est :
x = n
1
x
x
1
+ n
2
x
x
2
+ n
3
x
x
3
+ … + n
p
x
x
p
n
1
+ n
2
+ n
3
+ … + n
p
=
n
i
x
i
n
i
La moyenne permet d'avoir une idée du "centre" de la série, c'est une mesure de tendance centrale.
La variance de cette série est : V = n
1
x
(x
1
-
x
)
2
+ n
2
x
(x
2
-
x
)
2
+ n
3
x
(x
3
-
x
)
2
+ … + n
p
x
(x
p
-
x
)
2
n
1
+ n
2
+ n
3
+ … + n
p
On note V =
n
i
(x
i
-
x )
2
n
i
; on a aussi V =
n
i
(x
i
)
2
n
i
-
x
2
L'écart-type de cette série est : σ = V
L'écart-type permet d'avoir une idée de la façon dont les valeurs de la série s'écartent par rapport à la
moyenne. C'est une mesure de dispersion.
Un écart-type faible correspond à une série concentrée autour de la moyenne.
Remarques
Si la série statistique n'est pas donnée avec les effectifs mais avec les fréquences f
i
, on a :
x = f
1
x
x
1
+ f
2
x
x
2
+ f
3
x
x
3
+ … + f
p
x
x
p
=
f
i
x
i
et V = f
1
x
(x
1
-
x
)
2
+ f
2
x
(x
2
-
x
)
2
+ f
3
x
(x
3
-
x
)
2
+ … + f
p
x
(x
p
-
x
)
2
=
f
i
(x
i
-
x )
2
Les calculs de moyenne, de variance et d'écart-type sont, pour des séries prenant un grand nombre de
valeurs, des calculs compliqués. Les calculatrices utilisées en mode statistique et les ordinateurs rendent
alors de grands services pour ces calculs.
Propriété
Lorsqu'on augmente (ou lorsqu'on diminue) d'un même nombre r chacune des valeurs du caractère d'une
série statistique, la moyenne augmente (ou diminue) de r.
Lorsqu'on multiplie (ou lorsqu'on divise) par un même nombre non nul k chacune des valeurs du caractère
d'une série statistique, la moyenne est multipliée (ou divisée) par k.
Exercice 02
(voir réponses et correction)
Dans une classe de 30 élèves, la moyenne des 20 filles est 11,5 et la moyenne des 10 garçons est 8,5.
Donner la moyenne de la classe.
http://xmaths.free.fr/ TES Statistiques page 2
Propriété
Soit une série statistique d'effectif N, partagée en deux groupes :
un groupe d'effectif p et de moyenne m
1
un groupe d'effectif q = N - p et de moyenne m
2
Alors la moyenne m de la série est m = p
x
m
1
+ q
x
m
2
N
Définitions
On considère une série, dont les valeurs sont ordonnées (rangées dans l'ordre croissant).
Si la série comporte un nombre pair 2n de termes, la médiane de cette série est la demi-somme de la valeur
du terme de rang n et de la valeur du terme de rang n+1.
Si la série comporte un nombre impair 2n+1 de termes, la médiane de cette série est la valeur du terme de
rang n+1 (c'est-à-dire le terme partageant la série en deux groupes de même effectif).
On appelle premier quartile d'une série la plus petite valeur q des termes de la série pour laquelle au moins
un quart (25%) des données sont inférieures ou égales à q.
On appelle troisième quartile d'une série la plus petite valeur q' des termes de la série pour laquelle au
moins trois quarts (75%) des données sont inférieures ou égales à q'.
On appelle intervalle interquartile l'intervalle [q ; q'].
On appelle écart interquartile l'amplitude de l'intervalle [q ; q'], c'est-à-dire le nombre q' - q.
On appelle premier décile d'une série la plus petite valeur d des termes de la série pour laquelle au moins
un dixième (10%) des données sont inférieures ou égales à d.
On appelle neuvième décile d'une série la plus petite valeur d' des termes de la série pour laquelle au moins
neuf dixièmes (90%) des données sont inférieures ou égales à d'.
On appelle intervalle interdécile l'intervalle [d ; d'].
On appelle écart interdécile l'amplitude de l'intervalle [d ; d'], c'est-à-dire le nombre d' - d.
Exercice 03
(voir réponses et correction)
Déterminer la médiane de chacune des séries :
101 101 105 105 107 108 108 110
87 88 89 89 90 92 92 93 97 99 99
Exercice 04
(voir réponses et correction)
Déterminer la médiane, les quartiles et l'écart interquartile de la série :
11 , 12 , 12 , 13 , 15 , 16 , 16 , 17 , 17 , 18 , 19 , 20 , 22 , 23
Exercice 05
(voir réponses et correction)
Déterminer la médiane, les quartiles, les déciles, l'écart interquartile et l'écart interdécile de la série :
4, 5, 5, 5, 6, 6, 7, 8, 8, 9, 9, 9, 9, 10, 10, 11, 11, 11, 12, 13, 13, 13, 14, 14, 15, 15, 17
Exercice 06
(voir réponses et correction)
Déterminer la moyenne et l'écart-type de la série :
4, 5, 5, 5, 6, 6, 7, 8, 8, 9, 9, 9, 9, 10, 10, 11, 11, 11, 12, 13, 13, 13, 14, 14, 15, 15, 17
Exercice 07
(voir réponses et correction)
Le tableau suivant donne une répartition des salaires mensuels en euros des employés d'une entreprise.
Salaire [1000
;
1200[ [1200
;
1500[ [1500
;
2000[ [2000
;
3000[ [3000
;
10000[
Effectif 326 112 35 8 3
1°) Quel est le nombre d'employés de l'entreprise ?
2°) Quel est le nombre d'employés touchant un salaire mensuel supérieur ou égal à 1200 euros.
3) Représenter les données par un histogramme
(voir éventuellement page suivante)
.
4) Quel est le salaire moyen des employés de l'entreprise ?
http://xmaths.free.fr/ TES Statistiques page 3
Histogramme
Si les données sont regroupées en classes (intervalles), la série peut être représentée par un histogramme.
Dans un histogramme ce sont les aires des rectangles qui correspondent aux effectifs.
(Dans un diagramme à barres ou à bandes, ce sont les hauteurs des barres qui correspondent aux effectifs)
Exemple
On considère la série :
x
i
0 1 2 3 4 5 6 7 8 9 10
11
12
13
14
15
16
17
18
19
20
n
i
3 5 4 5 6 7 7 10
13
20
25
21
23
12
10
5 7 5 3 2 1
Si on regroupe les valeurs dans des classes, on obtient par exemple :
x
i
[0 ; 5,5] ]5,5 ; 8,5] ]8,5 ; 11,5] ]11,5 ; 14,5] ]14,5 ; 20]
n
i
30 30 66 45 23
On peut alors faire les représentations graphiques correspondantes :
Diagramme à barres Histogramme
Exercice 08
(voir réponses et correction)
Un entomologiste a fait des relevés sur la taille de 50 courtilières adultes.
33 35 36 36 37 37 37 38 38 38 39 39 39 39 40 40 40 40 40 41 41 41 41 41 41 41 42 42 42
42 42 42 43 43 43 43 44 44 44 44 45 45 45 46 46 47 47 48 48 50
1°) Organiser les relevés dans le tableau d'effectifs suivant :
Valeur 33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Effectif
Effectif cumulé
croissant
2°) Représenter les données par un diagramme à barres. Un diagramme circulaire serait-il intéressant ?
3°) Calculer la moyenne de la série. Déterminer sa médiane.
4°) Déterminer le 1er et le 3ème quartile puis le 1er et le 9ème décile.
5°) Construire le diagramme en boîte correspondant à la série
(voir éventuellement page suivante)
.
6°) On regroupe les données en classes, c'est-à-dire en intervalles.
Compléter le tableau des effectifs suivants :
Valeur [33 ; 37[
[37;40[ [40 ; 42[
[42 ; 44[
[44 ; 47[
[47 ; 51[
Effectif
Dessiner l'histogramme correspondant.
http://xmaths.free.fr/ TES Statistiques page 4
Construction d'un diagramme en boîte
Ce type de diagramme est aussi appelé diagramme de Tuckey, boîte à moustaches ou boîte à pattes.
Il utilise la médiane, le 1
er
et le 3
ème
quartile, le 1
er
et le 9
ème
décile ou les valeurs extrêmes d'une série.
La construction ci-contre est faite pour une série caractérisée par :
médiane : 113
1
er
quartile : 110 3
ème
quartile : 117
1
er
décile : 108 9
ème
décile : 119
On choisit une graduation verticale permettant de
représenter les différentes valeurs de la série.
On pourra par exemple graduer entre 90 et 130.
Le "corps" du diagramme, c'est-à-dire la "boîte" est
formée d'un rectangle ayant pour extrémité inférieure le
1
er
quartile et pour extrémité supérieure le 3
ème
quartile.
A l'intérieur de ce rectangle on tracera un segment
représentant la médiane.
La largeur du rectangle n'est pas fixée, elle sera choisie
de façon à obtenir un graphique "harmonieux".
Ce rectangle représente les données contenues dans
l'intervalle interquartile.
On repère ensuite les hauteurs correspondant au 1
er
et
au 9
ème
décile, et on trace deux pattes représentant les
données contenues dans l'intervalle interdécile.
(la largeur des pattes n'a pas d'importance).
Facultatif
On peut ensuite terminer le graphique, en faisant figurer
par des points les données qui sont en dehors de
l'intervalle interdécile.
Si certaines données, sont manifestement très éloignées,
on ne les représentera pas, mais on pourra écrire leurs
valeurs au dessous du diagramme.
Remarques
Le graphique est parfois fait en dessinant des pattes
correspondant non pas au 1
er
et au 9
ème
décile, mais
aux valeurs extrêmes (ou au 1
er
et au 99
ème
centile).
Une boîte et des "pattes" courtes indiquent que la
série est assez concentrée autour de sa médiane.
Au contraire une boîte et des "pattes" longues
indiquent que la série est assez dispersée.
Un des avantages de cette représentation, est qu'elle nécessite très peu de calculs.
La représentation peut aussi se faire horizontalement, d'où l'appellation de "boîte à moustaches".
La graduation se trouve alors sur l'axe horizontal,
3
ème
quartile
1
er
quartile
médiane
1
er
décile
9
ème
décile
http://xmaths.free.fr/ TES Statistiques page 5
Exercice 09
(voir réponses et correction)
On a relevé les taux de cholestérol de 200 employés des hôpitaux de Los Angeles victimes de maladie
cardiaque.
270
320
310
250
250
300
250
270
270
190
200
260
260
330
280
280
250
240
330
250
250
230
270
230
240
200
210
240
210
270
210
130
220
290
220
200
220
330
270
260
300
150
350
230
210
250
230
250
220
310
180
280
300
290
190
220
250
230
220
220
200
230
230
220
360
290
270
240
170
190
280
250
270
280
300
240
210
260
190
250
260
240
290
230
270
250
360
190
180
260
350
180
250
280
270
240
220
230
220
220
240
300
280
220
240
230
300
280
220
240
190
170
320
150
320
200
210
270
230
270
270
250
230
290
220
220
310
260
260
230
250
300
200
160
230
270
280
180
300
270
270
270
250
250
240
250
280
210
350
200
230
210
240
200
210
330
200
260
310
160
290
300
320
340
350
170
290
200
140
310
260
260
240
220
180
320
220
300
310
250
240
300
330
240
300
330
200
190
300
240
210
240
200
260
170
270
250
250
270
190
1°) Organiser ces données dans un tableau faisant apparaître les effectifs.
2°) Déterminer la médiane, le 1
er
quartile, le 3
ème
quartile, le 1
er
décile et le 9
ème
décile de la série.
3°) Construire un diagramme en boîte pour représenter la série.
Exercice 10
(voir réponses et correction)
Le tableau ci-dessous indique les résultats aux différentes séries du baccalauréat dans l'académie de
Bordeaux en 1999. (
Source : Direction de la programmation et du développement, MENRT
)
Bac Général Bac Technologique
Bac Pro Total
Admis 12 133 6 133 4 038
Refusés 3 516 1 439 1 119
Total
1°) Reproduire et compléter ce tableau d'effectifs en remplissant la dernière ligne et la dernière colonne qui
sont appelées distributions marginales (marges).
2°) Présenter un tableau similaire dans lequel seront indiquées les fréquences (en pourcentage avec une
décimale) calculées par rapport à l'effectif total.
Que représente la valeur se trouvant à l'intersection de la colonne "Bac Général" et de la ligne "Total" ?
Cette valeur s'appelle fréquence marginale de la catégorie "Bac Général".
Que représente la valeur se trouvant à l'intersection de la ligne "Admis" et de la colonne "Total" ?
Cette valeur s'appelle fréquence marginale de la catégorie "Admis".
3°) Présenter un tableau similaire dans lequel seront indiquées les fréquences (en pourcentage avec une
décimale) calculées par rapport au total de chaque colonne.
Que représente la valeur se trouvant à l'intersection de la colonne "Bac Général" et de la ligne "Admis" ?
Cette valeur s'appelle fréquence conditionnelle de la catégorie "Admis" dans la catégorie "Bac Général".
4°) Présenter un tableau similaire dans lequel seront indiquées les fréquences (en pourcentage avec une
décimale) calculées par rapport au total de chaque ligne.
Que représente la valeur se trouvant à l'intersection de la colonne "Bac Général" et de la ligne "Admis" ?
Cette valeur s'appelle fréquence conditionnelle de la catégorie "Bac Général" dans la catégorie "Admis".
5°) A partir des tableaux précédents, répondre aux questions suivantes :
Quelle est la fréquence des admis au baccalauréat ?
Quelle est la fréquence des "Bac Pro" ?
Quelle est la fréquence des élèves refusés sachant qu'ils présentaient un Bac Technologique ?
Quelle est la fréquence des "Bac Pro" parmi les admis ?
1 / 12 100%

statistiques-3

Telechargé par Henry Zeemann
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !