Statistiques 1/3
STATISTIQUES
I) Nature des données description graphique
Dans ce chapitre, on étudie des séries de données liées à des variables quantitatives, c’est-à-dire quand les valeurs sont
numériques (mesures physiques, physiologiques, économiques).
1) Différents types de séries
Les variables étudiées sont de deux types :
ces variables sont discrètes si les valeurs prises sont isolées (nombre de personnes par ménage, nombre de défauts
observés...) ;
ces variables sont continues si les valeurs prises sont dans un intervalle (taille d'une personne, salaire, temps d'écoute
de la télévision, prix d'un article, production...)
Exemples :
Une série continue de taux.
L’histogramme ci-contre représente la répartition
des taux de fécondité de 48 pays d’Europe pour la
période 1995-1999.
La variable étudiée est le taux de fécondité (nombre
moyen d’enfants pour 1000 hab) : cette variable est
quantitative continue, car elle peut prendre toutes les
valeurs de l’intervalle [1 ; 4,5].
Cet histogramme est un histogramme à pas constant,
puisque les classes sont toutes de même largeur 0,5.
Des séries discrètes.
Le tableau ci-contre donne le nombre de ménages
selon leurs tailles pour quelques pays européens en
1995 (en milliers).
La variable étudiée est la taille des ménages et
cette variable est discrète puisqu’elle prend 5
valeurs (1, 2, 3, 4 et « 5 et plus »).
Les 4 séries sont représentées ci-contre par des
courbes.
On aurait pu utiliser des digrammes en bâton,
mais ceux-ci apportent moins de lisibilité lorsque
plusieurs séries sont superposées.
ƒ Une série de fréquences (ou de proportions)
La population d’une petite ville a été consultée sur
l’aménagement d’un réseau de pistes cyclables.
Voici les résultats de la consultation.
Opinions Fréquences Angles en degré
Favorables 56 202
Opposés 19 68
Ne se prononcent
pas 25 90
Total 100 360
La colonne « Angles en degré » permet à l’aide du rapporteur de créer le diagramme en secteur circulaires.
Nombre de personnes
1 2 3 4 5 et plus
Espagne 1538 2967 2640 2907 2059
Finlande 831 689 320 264 118
Pays-bas 1966 2185 861 1022 398
Portugal 449 865 809 747 406
0
5
10
15
20
25
11.5 22.5 33.5 44.5 5
Taux de fécondité
Effectif
0
500
1000
1500
2000
2500
3000
3500
1 2 3 4 5 et plus
Taille des ménages
Nombre de ménages
Espagne
Finlande
Pays-bas
Portugal
56%
19%
25%
Favorables
Opposés
Ne se prononcent pas
Statistiques 2/3
2) Histogramme à pas non constant
Pour représenter une variable quantitative continue dont les
valeurs sont regroupées par classe, on trace des rectangles
dont les aires sont proportionnelles aux effectifs des classes.
Exemple : Le rectangle dans lequel est inscrit le nombre 5
donne l’aire d’un effectif égal à 5.
II) Résumé d’une série par le couple (médiane ; écart interquartile)
1) La médiane (vue en 2nde) : mesure de tendance centrale
Définition : La médiane Me d'une série ordonnée par ordre croissant partage cette série en deux parties telles que la
moitié au moins prend des valeurs inférieures ou égales à la médiane.
Si le nombre de données est pair, N = 2p : la médiane est la moyenne des deux valeurs centrales la pième et la
(p + 1)ième valeur.
Si le nombre de données est impair, N = 2 p+ 1 : la médiane est la (p + 1)ième valeur qui est la valeur centrale.
2) Les quartiles
Définition : Les valeurs xi d’une série d’effectif total N sont rangées par ordre croissant.
Le premier quartile Q1 de la série est la valeur xi dont le rang est :
*
4
N
si
4
N
est entier,
* l’entier immédiatement supérieur à
4
N
si
4
N
n’est pas entier.
Le troisième quartile Q3 de la série est la valeur xi dont le rang est :
*
3
4
N
si
3
4
N
est entier,
* l’entier immédiatement supérieur à
3
4
N
si
3
4
N
n’est pas entier.
3) Les déciles
Définition : Les valeurs xi d’une série d’effectif total N sont rangées par ordre croissant.
Le premier décile D1 de la série est la valeur xi dont le rang est :
*
10
N
si
10
N
est entier,
* l’entier immédiatement supérieur à
10
N
si
10
N
n’est pas entier.
Le neuvième décile D9 de la série est la valeur xi dont le rang est :
*
9
10
N
si
9
10
N
est entier,
* l’entier immédiatement supérieur à
9
10
N
si
9
10
N
n’est pas entier.
3) L’écart interquartile : mesure de dispersion
Définition : L’intervalle interquartile est l’intervalle [Q1 ; Q3].
L’écart interquartile est la différence Q3 . Q1 .
Remarques : Le couple (médiane ; écart interquartile) est robuste par rapport aux valeurs extrêmes, mais sa
détermination (les quartiles) n’est pas très pratique.
Plus l’écart interquartile est grand, plus la dispersion est importante.
Classe [100 ;120[
[120 ;160[
[160 ;180[
[180 ;260[
Effectif
20 30 10 10
100
120
140
160
180
200
220
240
260
280
5
Statistiques 3/3
4) Diagramme en boîte
Ces diagrammes s’utilisent pour représenter une série de taille importante où les valeurs extrêmes ne sont pas
essentielles. Les diagrammes en boîte mettent en valeur la dispersion d’une répartition.
Exemple : Voici une série de valeur xi rangée dans l’ordre croissant et dont on a calculé les effectifs cumulés croissants.
L’effectif total N est 28.
N est pair, il y a donc deux valeurs centrales x14 et x15, donc 34
3,5
2
Me +
==.
7
4
N
=
et 3
3721
4
N
=×=
, donc 17
3
Qx
==
et 321
4
Qx
==
.
2,8
10
N= et 9
25,2
10
N=, donc 13
1
Dx
==
et 926
6
Dx
==
.
0
1
2
3
4
5
6
7
D1
Q1
Me
Q3
D9
x
max
x
min
III) Résumé d’une série par le couple (moyenne ; écart-type)
1) La moyenne (vue en 2nde) : mesure de tendance centrale
Définition : Soit une série de valeurs xi.
Sans les effectifs avec un effectif total N:
i
x
x
N
=
.
Avec les effectifs ni :
ii
i
nx
x
n
=
.
Avec les fréquences fi
i
i
n
n
=
:
f
ii
xx
=
.
2) La variance
Définition : Soit une série de valeurs xi.
Sans les effectifs avec un effectif total N:
( )
2
i
xx
VN
=.
Avec les effectifs ni :
( )
2
ii
i
nxx
Vn
=.
Remarques : L’utilisation des listes sur la calculatrice est efficace pour calculer la variance. On calcule
successivement les carrés des écarts puis leurs produits par les effectifs. Enfin, la somme de ces produits divisés par le
nombre de données donne la Variance.
On peut aussi utiliser les calculs statistiques intégrés de la calculatrice qui ont l’inconvénient d’être automatiques, les
élèves ne voient pas les formules intervenir.
3) L’écart type: mesure de dispersion
Définition : L’écart type noté s est la racine carrée de la variance V :
sV
=.
Remarques : Le couple (moyenne ; écart-type) est très sensible aux valeurs extrêmes, mais sa détermination par les
formules précédentes est aisée.
Plus l’écart type est grand, plus la dispersion est importante.
Valeurs 1 2 3 4 5 6 7
Effectifs cumulés
croissants 3 6 14 22 24 26 28
xmin 1
D1 1
Q1 3
Me 3,5
Q3 4
D9 6
xmax 7
1 / 3 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !