Chapitre 2 : STATISTIQUE UNIDIMENSIONNELLE II. Différentes formes de variables statistiques
Chapitre 2 : Statistique unidimensionnelle
I. Objectifs
L’objectif des outils de statistique descriptive élémentaire est de fournir des
résumés synthétiques de séries de valeurs, adaptés à leur type (qualitatives
ou quantitatives), et observées sur une population ou un échantillon.
Dans le cas d’une seule variable, les notions les plus classiques sont celles de
médiane, quantile, moyenne, fréquence, fréquence cumulée, variance, écart-
type. A ces notions sont associées des représentations graphiques : diagramme
en bâton, diagramme en secteurs, diagramme cumulatif, histogramme, courbe
cumulative, boîte à moustache.
II. Différentes formes de variables statistiques
1. Définition
Population : tout ensemble fini (univers en probabilité)
Individu : tout élément ωde la population (éventualité en probabilité).
Caractère ou variable statistique : toute application X : E où E
est un ensemble quelconque. Le triplet (,E,X)est appelé série statistique.
Dans ce chapitre, X sera appelée souvent variable statistique (variable
aléatoire en probabilité lorsque E R).
Le caractère est dit :
.qualitatif lorsque l’ensemble E n’est pas un ensemble de nombres.
.quantitatif discret lorsque l’ensemble E est une partie discrète finie ou
infinie de R.
.quantitatif continu lorsque l’ensemble E est une partie infinie non dé-
nombrable de R; en général un intervalle que l’on découpe en sous-
intervalles dénommés classes.
Modalité d’un caractère : tout élément de X(). X()est appelé l’ensemble
des observations ou modalités (support de X en probabilité).
Effectif : Si A est une partie de E alors l’effectif de A pour le caractère X est
le nombre d’individus ωtels que X(ω)A.
Leffectif total est la somme de tous les effectifs.
Echantillon : sous ensemble de la population sur lequel sont effectivement
réalisées les observations.
.Taille de l’échantillon n: nombre d’individus de l’échantillon corres-
pondant.
2 septembre 2014 MATHÉMATIQUES. Classe ECS1
Lycée TOUCHARD-WASHINGTON
Page 1 sur 11
Chapitre 2 : STATISTIQUE UNIDIMENSIONNELLE III. Représentations des données statistiques
.Enquête : opération consistant à observer ou mesurer, ou questionner
l’ensemble des individus d’un échantillon.
.Recensement : enquête dans laquelle l’échantillon observé est la popu-
lation tout entière (enquête exhaustive)
.Sondage : enquête dans laquelle l’échantillon observé est un sous-ensemble
strict de la population (enquête non exhaustive)
2. Les variables statistiques qualitatives
Par définition, les observations d’une variable qualitative ne sont pas des va-
leurs numériques.
Lorsque ces modalités sont naturellement ordonnées (par exemple, la men-
tion au bac dans une population d’étudiants), la variable est dite ordinale.
Dans le cas contraire (par exemple, la profession dans une population de per-
sonnes actives, les couleurs) la variable est dite nominale.
3. Les variables statistiques quantitatives
a) Les variables statistiques discrètes
En général, on appelle variable quantitative discrète une variable quantitative
ne prenant que des valeurs entières (plus rarement décimales).
b) Les variables statistiques continues
Une variable quantitative est dite continue lorsque les observations qui lui
sont associées ne sont pas des valeurs précises mais des intervalles réels. Cela
signifie que, dans ce cas, le sous-ensemble de Rdes valeurs possibles de la
variable étudiée a été divisé en rintervalles contigus appelés classes. En gé-
néral, les deux raisons principales qui peuvent amener à considérer comme
continue une variable quantitative sont le grand nombre d’observations dis-
tinctes (un traitement en discret serait dans ce cas peu commode) et le carac-
tère «sensible» d’une variable (il est moins gênant de demander à des indivi-
dus leur classe de salaire que leur salaire précis).
Les classes d’une variable statistique sont des intervalles bornés ; on désigne
par centre de classe, le milieu de l’intervalle.
III. Représentations des données statistiques
1. Tableau statistique
C’est un tableau dont la première ligne (ou colonne) comporte l’ensemble des
robservations distinctes de la variable X. Lorsque la variable est quantitative,
2 septembre 2014 MATHÉMATIQUES. Classe ECS1
Lycée TOUCHARD-WASHINGTON
Page 2 sur 11
Chapitre 2 : STATISTIQUE UNIDIMENSIONNELLE III. Représentations des données statistiques
ces observations sont rangées traditionnellement par ordre croissant et non
répétées.
Dans une seconde ligne (ou colonne), on dispose en face de chaque valeur x
de X, l’effectif qui lui est associé.
Peut être rajoutée, une troisième ligne correspondant à la fréquence (proba-
bilité) de [X=x].
Si la variable statistique est quantitative, on peut rajouter une ligne corres-
pondant à la fréquence cumulée croissante (fonction de répartition en pro-
babilité).
2. Variables statistiques discrètes
a) Diagramme en bâtons
Graphique plan avec l’axe des abscisses représentant les valeurs de X et l’axe
des ordonnées les fréquences ou les effectifs.
b) Diagramme cumulatif
Pour une variable quantitative discrète, le diagramme cumulatif est un gra-
phique plan avec l’axe des abscisses représentant les valeurs de X et l’axe des
ordonnées les fréquences cumulées. Le diagramme est «en marches d’esca-
lier».
3. Variable statistique continue
a) Histogramme
Un histogramme est la juxtaposition de rectangles dont les bases sont les am-
plitudes des classes considérées et dont l’aire du rectangle est égale à la fré-
quence de la classe correspondante. les hauteurs de rectangles sont appelées
densités de fréquence.
b) Courbe cumulative
La courbe cumulative est le graphe de la fréquence cumulée croissante. En
abscisse sont reportées les bornes supérieures de chaque classe ; en ordon-
nées, les fréquences cumulées correspondantes.
4. Autres représentations
a) Secteurs
C’est la représentation camembert. L’angle (ou l’aire) du secteur est propor-
tionnel à l’effectif ou à la fréquence.
2 septembre 2014 MATHÉMATIQUES. Classe ECS1
Lycée TOUCHARD-WASHINGTON
Page 3 sur 11
Chapitre 2 : STATISTIQUE UNIDIMENSIONNELLE IV. Les paramètres pour les variables quantitatives
b) Boites à moustache
Il s’agit d’un graphique très simple qui résume la série à partir de ses valeurs
extrêmes, de ses quartiles et de sa médiane.
Q1
Q2Q3max
min m
IV. Les paramètres pour les variables
quantitatives
1. Remarque
Les règles de calculs sur les espérances/variances/écarts-type des variables
aléatoires s’appliquent aux moyennes/variances/écart-type des séries statis-
tiques.
2. Paramètres de position
a) Moyenne
La moyenne, la variance et l’écart-type d’une variable statistique se calcule
comme en probabilité. Pour les variables continues, dans les formules, on
prend les centres de classes.
b) Quantiles
Définition
La fréquence cumulée F(x) (0F(x)1)donne la proportion d’observa-
tions inférieures ou égales à x. Une approche complémentaire consiste à se
donner a priori une valeur α, comprise entre 0 et 1, et à rechercher αvérifiant
F(tα) = α. La valeur tαest appelée quantile (ou fractile) d’ordre αde la série.
Les quantiles les plus utilisés sont associés à certaines valeurs particulières de
α. Les quantiles tαd’une variable continue peuvent être déterminés de façon
directe à partir de la courbe cumulative. Cela signifie que, par le calcul, on
doit commencer par déterminer la classe dans laquelle se trouve le quantile
cherché, puis le déterminer dans cette classe par interpolation linéaire.
2 septembre 2014 MATHÉMATIQUES. Classe ECS1
Lycée TOUCHARD-WASHINGTON
Page 4 sur 11
Chapitre 2 : STATISTIQUE UNIDIMENSIONNELLE IV. Les paramètres pour les variables quantitatives
Quartiles
La médiane (notation Q2) est le quantile d’ordre 1
2; elle partage donc la série
des observations en deux ensembles d’effectifs égaux. Le premier quartile (Q1)
est le quantile d’ordre 1
4, le troisième quartile (Q3)celui d’ordre 3
4·
Autres quantiles
Les quintiles, déciles et centiles sont également d’usage assez courant.
c) Mode
On appelle mode de X toute modalité d’effectif maximal.
3. Paramètres de dispersion
a) Etendue
c’est la différence entre la modalité maximale et la modalité minimale, c’est à
dire le réel : e=max X()min X(). L’intervalle [min X(),max X()]
contient 100% des effectifs.
b) Ecart moyen à la moyenne
Soit (x1,..., xr)les valeurs de la variable discrète X ou les centres de classe
de la variable continue X. La valeur xia pour fréquence fi. Soit mla moyenne
statistique. L’écart moyen à la moyenne est donnée par la formule :
r
X
i=1
fi|xim|
c) Ecart moyen à la médiane
Désignons par Q2la médiane. L’écart moyen à la médiane (avec les mêmes
conventions que ci-dessus) est donnée par la formule :
r
X
i=1
fi|xiQ2|
d) Ecart inter-quantile
L’écart inter-quantile est donné par : Q3Q1
2 septembre 2014 MATHÉMATIQUES. Classe ECS1
Lycée TOUCHARD-WASHINGTON
Page 5 sur 11
1 / 11 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !