Statistiques à une variable : Exercices et rappels de cours

http://xmaths.free.fr/ TES − Statistiques page 1

STATISTIQUES

I Statistiques à une variable - rappels

Exercice 01

(voir réponses et correction)

On a relevé le prix de vente d'un CD et le nombre de CD vendus chez différents fournisseurs.

Les résultats forment une série statistique à une variable, donnée dans le tableau suivant :

Prix de vente en euros 15 16 17 18 19

Nombre de CD vendus 83 48 32 20 17

Quelles sont les différentes valeurs de la série.

Donner la fréquence correspondant à chacune de ces valeurs.

Donner la moyenne et l'écart-type de la série. Que représentent ces nombres ?

Représenter la série par un diagramme à barres.

Définitions

On considère une série statistique donnée par le tableau suivant :

Valeur : x

i

x

1

x

2

x

3

… … … x

p

Effectif : n

i

n

1

n

2

n

3

… … … n

p

La moyenne de cette série est :



x = n

1

x

1

+ n

2

x

2

+ n

3

x

3

+ … + n

p

x

p

n

1

+ n

2

+ n

3

+ … + n

p

=

∑

n

i

x

i

∑

n

i

La moyenne permet d'avoir une idée du "centre" de la série, c'est une mesure de tendance centrale.

La variance de cette série est : V = n

1

x

(x

1

-



x

)

2

+ n

2

x

(x

2

-



x

)

2

+ n

3

x

(x

3

-



x

)

2

+ … + n

p

x

(x

p

-



x

)

2

n

1

+ n

2

+ n

3

+ … + n

p

On note V =

∑

n

i

(x

i

-



x )

2

∑

n

i

; on a aussi V =

∑

n

i

(x

i

)

2

∑

n

i

-



x

2

L'écart-type de cette série est : σ = V

L'écart-type permet d'avoir une idée de la façon dont les valeurs de la série s'écartent par rapport à la

moyenne. C'est une mesure de dispersion.

Un écart-type faible correspond à une série concentrée autour de la moyenne.

Remarques

• Si la série statistique n'est pas donnée avec les effectifs mais avec les fréquences f

i

, on a :



x = f

1

x

1

+ f

2

x

2

+ f

3

x

3

+ … + f

p

x

p

=

∑

f

i

x

i

et V = f

1

x

(x

1

-



x

)

2

+ f

2

x

(x

2

-



x

)

2

+ f

3

x

(x

3

-



x

)

2

+ … + f

p

x

(x

p

-



x

)

2

=

∑

f

i

(x

i

-



x )

2

• Les calculs de moyenne, de variance et d'écart-type sont, pour des séries prenant un grand nombre de

valeurs, des calculs compliqués. Les calculatrices utilisées en mode statistique et les ordinateurs rendent

alors de grands services pour ces calculs.

Propriété

Lorsqu'on augmente (ou lorsqu'on diminue) d'un même nombre r chacune des valeurs du caractère d'une

série statistique, la moyenne augmente (ou diminue) de r.

Lorsqu'on multiplie (ou lorsqu'on divise) par un même nombre non nul k chacune des valeurs du caractère

d'une série statistique, la moyenne est multipliée (ou divisée) par k.

Exercice 02

(voir réponses et correction)

Dans une classe de 30 élèves, la moyenne des 20 filles est 11,5 et la moyenne des 10 garçons est 8,5.

Donner la moyenne de la classe.

http://xmaths.free.fr/ TES − Statistiques page 2

Propriété

Soit une série statistique d'effectif N, partagée en deux groupes :

un groupe d'effectif p et de moyenne m

1

un groupe d'effectif q = N - p et de moyenne m

2

Alors la moyenne m de la série est m = p

x

m

1

+ q

x

m

2

N

Définitions

On considère une série, dont les valeurs sont ordonnées (rangées dans l'ordre croissant).

Si la série comporte un nombre pair 2n de termes, la médiane de cette série est la demi-somme de la valeur

du terme de rang n et de la valeur du terme de rang n+1.

Si la série comporte un nombre impair 2n+1 de termes, la médiane de cette série est la valeur du terme de

rang n+1 (c'est-à-dire le terme partageant la série en deux groupes de même effectif).

On appelle premier quartile d'une série la plus petite valeur q des termes de la série pour laquelle au moins

un quart (25%) des données sont inférieures ou égales à q.

On appelle troisième quartile d'une série la plus petite valeur q' des termes de la série pour laquelle au

moins trois quarts (75%) des données sont inférieures ou égales à q'.

On appelle intervalle interquartile l'intervalle [q ; q'].

On appelle écart interquartile l'amplitude de l'intervalle [q ; q'], c'est-à-dire le nombre q' - q.

On appelle premier décile d'une série la plus petite valeur d des termes de la série pour laquelle au moins

un dixième (10%) des données sont inférieures ou égales à d.

On appelle neuvième décile d'une série la plus petite valeur d' des termes de la série pour laquelle au moins

neuf dixièmes (90%) des données sont inférieures ou égales à d'.

On appelle intervalle interdécile l'intervalle [d ; d'].

On appelle écart interdécile l'amplitude de l'intervalle [d ; d'], c'est-à-dire le nombre d' - d.

Exercice 03

(voir réponses et correction)

Déterminer la médiane de chacune des séries :

101 101 105 105 107 108 108 110

87 88 89 89 90 92 92 93 97 99 99

Exercice 04

(voir réponses et correction)

Déterminer la médiane, les quartiles et l'écart interquartile de la série :

11 , 12 , 12 , 13 , 15 , 16 , 16 , 17 , 17 , 18 , 19 , 20 , 22 , 23

Exercice 05

(voir réponses et correction)

Déterminer la médiane, les quartiles, les déciles, l'écart interquartile et l'écart interdécile de la série :

4, 5, 5, 5, 6, 6, 7, 8, 8, 9, 9, 9, 9, 10, 10, 11, 11, 11, 12, 13, 13, 13, 14, 14, 15, 15, 17

Exercice 06

(voir réponses et correction)

Déterminer la moyenne et l'écart-type de la série :

4, 5, 5, 5, 6, 6, 7, 8, 8, 9, 9, 9, 9, 10, 10, 11, 11, 11, 12, 13, 13, 13, 14, 14, 15, 15, 17

Exercice 07

(voir réponses et correction)

Le tableau suivant donne une répartition des salaires mensuels en euros des employés d'une entreprise.

Salaire [1000

;

1200[ [1200

;

1500[ [1500

;

2000[ [2000

;

3000[ [3000

;

10000[

Effectif 326 112 35 8 3

1°) Quel est le nombre d'employés de l'entreprise ?

2°) Quel est le nombre d'employés touchant un salaire mensuel supérieur ou égal à 1200 euros.

3) Représenter les données par un histogramme

(voir éventuellement page suivante)

.

4) Quel est le salaire moyen des employés de l'entreprise ?

http://xmaths.free.fr/ TES − Statistiques page 3

Histogramme

Si les données sont regroupées en classes (intervalles), la série peut être représentée par un histogramme.

Dans un histogramme ce sont les aires des rectangles qui correspondent aux effectifs.

(Dans un diagramme à barres ou à bandes, ce sont les hauteurs des barres qui correspondent aux effectifs)

Exemple

On considère la série :

x

i

0 1 2 3 4 5 6 7 8 9 10

11

12

13

14

15

16

17

18

19

20

n

i

3 5 4 5 6 7 7 10

13

20

25

21

23

12

10

5 7 5 3 2 1

Si on regroupe les valeurs dans des classes, on obtient par exemple :

x

i

[0 ; 5,5] ]5,5 ; 8,5] ]8,5 ; 11,5] ]11,5 ; 14,5] ]14,5 ; 20]

n

i

30 30 66 45 23

On peut alors faire les représentations graphiques correspondantes :

Diagramme à barres Histogramme

Exercice 08

(voir réponses et correction)

Un entomologiste a fait des relevés sur la taille de 50 courtilières adultes.

33 35 36 36 37 37 37 38 38 38 39 39 39 39 40 40 40 40 40 41 41 41 41 41 41 41 42 42 42

42 42 42 43 43 43 43 44 44 44 44 45 45 45 46 46 47 47 48 48 50

1°) Organiser les relevés dans le tableau d'effectifs suivant :

Valeur 33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

Effectif

Effectif cumulé

croissant

2°) Représenter les données par un diagramme à barres. Un diagramme circulaire serait-il intéressant ?

3°) Calculer la moyenne de la série. Déterminer sa médiane.

4°) Déterminer le 1er et le 3ème quartile puis le 1er et le 9ème décile.

5°) Construire le diagramme en boîte correspondant à la série

(voir éventuellement page suivante)

.

6°) On regroupe les données en classes, c'est-à-dire en intervalles.

Compléter le tableau des effectifs suivants :

Valeur [33 ; 37[

[37;40[ [40 ; 42[

[42 ; 44[

[44 ; 47[

[47 ; 51[

Effectif

Dessiner l'histogramme correspondant.

http://xmaths.free.fr/ TES − Statistiques page 4

Construction d'un diagramme en boîte

Ce type de diagramme est aussi appelé diagramme de Tuckey, boîte à moustaches ou boîte à pattes.

Il utilise la médiane, le 1

er

et le 3

ème

quartile, le 1

er

et le 9

ème

décile ou les valeurs extrêmes d'une série.

La construction ci-contre est faite pour une série caractérisée par :

médiane : 113

1

er

quartile : 110 3

ème

quartile : 117

1

er

décile : 108 9

ème

décile : 119

On choisit une graduation verticale permettant de

représenter les différentes valeurs de la série.

On pourra par exemple graduer entre 90 et 130.

Le "corps" du diagramme, c'est-à-dire la "boîte" est

formée d'un rectangle ayant pour extrémité inférieure le

1

er

quartile et pour extrémité supérieure le 3

ème

quartile.

A l'intérieur de ce rectangle on tracera un segment

représentant la médiane.

La largeur du rectangle n'est pas fixée, elle sera choisie

de façon à obtenir un graphique "harmonieux".

Ce rectangle représente les données contenues dans

l'intervalle interquartile.

On repère ensuite les hauteurs correspondant au 1

er

et

au 9

ème

décile, et on trace deux pattes représentant les

données contenues dans l'intervalle interdécile.

(la largeur des pattes n'a pas d'importance).

Facultatif

On peut ensuite terminer le graphique, en faisant figurer

par des points les données qui sont en dehors de

l'intervalle interdécile.

Si certaines données, sont manifestement très éloignées,

on ne les représentera pas, mais on pourra écrire leurs

valeurs au dessous du diagramme.

Remarques

• Le graphique est parfois fait en dessinant des pattes

correspondant non pas au 1

er

et au 9

ème

décile, mais

aux valeurs extrêmes (ou au 1

er

et au 99

ème

centile).

• Une boîte et des "pattes" courtes indiquent que la

série est assez concentrée autour de sa médiane.

Au contraire une boîte et des "pattes" longues

indiquent que la série est assez dispersée.

• Un des avantages de cette représentation, est qu'elle nécessite très peu de calculs.

• La représentation peut aussi se faire horizontalement, d'où l'appellation de "boîte à moustaches".

La graduation se trouve alors sur l'axe horizontal,

3

ème

quartile

1

er

quartile

médiane

1

er

décile

9

ème

décile

http://xmaths.free.fr/ TES − Statistiques page 5

Exercice 09

(voir réponses et correction)

On a relevé les taux de cholestérol de 200 employés des hôpitaux de Los Angeles victimes de maladie

cardiaque.

270

320

310

250

300

250

270

190

200

260

330

280

250

240

330

250

230

270

230

240

200

210

240

210

270

210

130

220

290

220

200

220

330

270

260

300

150

350

230

210

250

230

250

220

310

180

280

300

290

190

220

250

230

220

200

230

220

360

290

270

240

170

190

280

250

270

280

300

240

210

260

190

250

260

240

290

230

270

250

360

190

180

260

350

180

250

280

270

240

220

230

220

240

300

280

220

240

230

300

280

220

240

190

170

320

150

320

200

210

270

230

270

250

230

290

220

310

260

230

250

300

200

160

230

270

280

180

300

270

250

240

250

280

210

350

200

230

210

240

200

210

330

200

260

310

160

290

300

320

340

350

170

290

200

140

310

260

240

220

180

320

220

300

310

250

240

300

330

240

300

330

200

190

300

240

210

240

200

260

170

270

250

270

190

1°) Organiser ces données dans un tableau faisant apparaître les effectifs.

2°) Déterminer la médiane, le 1

er

quartile, le 3

ème

quartile, le 1

er

décile et le 9

ème

décile de la série.

3°) Construire un diagramme en boîte pour représenter la série.

Exercice 10

(voir réponses et correction)

Le tableau ci-dessous indique les résultats aux différentes séries du baccalauréat dans l'académie de

Bordeaux en 1999. (

Source : Direction de la programmation et du développement, MENRT

)

Bac Général Bac Technologique

Bac Pro Total

Admis 12 133 6 133 4 038

Refusés 3 516 1 439 1 119

Total

1°) Reproduire et compléter ce tableau d'effectifs en remplissant la dernière ligne et la dernière colonne qui

sont appelées distributions marginales (marges).

2°) Présenter un tableau similaire dans lequel seront indiquées les fréquences (en pourcentage avec une

décimale) calculées par rapport à l'effectif total.

Que représente la valeur se trouvant à l'intersection de la colonne "Bac Général" et de la ligne "Total" ?

Cette valeur s'appelle fréquence marginale de la catégorie "Bac Général".

Que représente la valeur se trouvant à l'intersection de la ligne "Admis" et de la colonne "Total" ?

Cette valeur s'appelle fréquence marginale de la catégorie "Admis".

3°) Présenter un tableau similaire dans lequel seront indiquées les fréquences (en pourcentage avec une

décimale) calculées par rapport au total de chaque colonne.

Que représente la valeur se trouvant à l'intersection de la colonne "Bac Général" et de la ligne "Admis" ?

Cette valeur s'appelle fréquence conditionnelle de la catégorie "Admis" dans la catégorie "Bac Général".

4°) Présenter un tableau similaire dans lequel seront indiquées les fréquences (en pourcentage avec une

décimale) calculées par rapport au total de chaque ligne.

Que représente la valeur se trouvant à l'intersection de la colonne "Bac Général" et de la ligne "Admis" ?

Cette valeur s'appelle fréquence conditionnelle de la catégorie "Bac Général" dans la catégorie "Admis".

5°) A partir des tableaux précédents, répondre aux questions suivantes :

• Quelle est la fréquence des admis au baccalauréat ?

• Quelle est la fréquence des "Bac Pro" ?

• Quelle est la fréquence des élèves refusés sachant qu'ils présentaient un Bac Technologique ?

• Quelle est la fréquence des "Bac Pro" parmi les admis ?

6

7

8

9

10

11

12

Statistiques à une variable : Exercices et rappels de cours

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Statistiques à une variable : Exercices et rappels de cours

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib