STA230 Cours de Statistique UJF Grenoble
1 Données et Modèles
Ce chapitre présente le vocabulaire de la statistique descriptive sur les données uni-
dimensionelles. La notion de modèle que l’on peut ajuster à un caractère statistique est
assez subtile, et de multiples exemples seront fournis pour aider à sa compréhension.
Elle est pourtant essentielle, même si nous ne mettrons l’accent que sur quelques mo-
dèles de base. Les deux plus importants sont le modèle binomial et le modèle gaussien,
qui devront absolument être compris.
1.1 Données unidimensionnelles
1.1.1 Échantillons
À la base de toute étude statistique, il y a une population, formée d’individus sur
lesquels on observe des caractères. Pour fixer les idées, il est plus facile de penser en
termes de population humaine. Les individus sont des personnes, et les caractères ob-
servés peuvent être morphologiques (taille, poids, couleur des yeux), physiologiques
(groupe sanguin, numération globulaire, taux de cholestérol) ou psychologiques (ré-
actions à des tests ou réponses à une enquête d’opinion). Même si nous choisirons
prioritairement nos exemples dans les caractères humains, il faut garder à l’esprit des
notions de population et de caractère plus générales. Voici quelques exemples.
Population Caractère
Eléments chimiques Nombre d’isotopes
Galaxies Nombre d’étoiles
Etoiles Magnitude
Chromosomes Nombre de gènes
Gènes Nombre de bases protéiques
Villes Taux d’imposition
Pays Produit intérieur brut
Films Recettes
Mois de l’année Montant des exportations
Un caractère est dit :
–qualitatif, si les valeurs ne peuvent pas être ordonnées (groupe sanguin, couleur
des yeux, vote pour un candidat).
–ordinal, si les valeurs peuvent seulement être ordonnées : leurs différences ne sont
pas interprétables (opinions exprimées sur une échelle de valeurs)
–quantitatif, quand les valeurs sont numériques (mesures physiques, physiologiques,
économiques).
Les valeurs que peut prendre un caractère s’appellent les modalités.
Pour des raisons de facilité de traitement informatique ou mathématique, on cherche
à se ramener à des caractères quantitatifs par un codage. Si le caractère initial est quali-
tatif, le codage sera souvent binaire. Le cas le plus simple est celui d’un référendum, où
3