BIOMÉTRIE ET MODÉLISATION
Introduction
Dans une expérimentation ou lors d’une enquête, nous choisissons toujours
un échantillon de n individus sur lequel nous collectons les données ou les s
observations . L’inférence statistique est la technique qui
consiste à extrapoler les résultats obtenus sur cet échantillon sur toute la
population.
En statistique, nous supposons toujours que chacune des observations est
une réalisation des variables aléatoires . Nous supposons aussi
que ces variables aléatoires sont indépendantes et ont une distribution
commune.
Souvent nous ne travaillons pas sur ces variables aléatoires mais sur les
combinaisons linéaires ou les fonctions de ces variables aléatoires.
Certaines des fonctions des variables aléatoires sont utilisées pour estimer
ou prendre des décisions sur les paramètres inconnus d’une population. Par
exemple, si nous avons à estimer le rendement moyen μ d’une culture dans
une région, nous allons prendre un échantillon aléatoire de n producteurs de
cette culture. Nous leur demanderons le rendement obtenu en fin de culture.
Soient ces rendements. Il semble raisonnable d’estimer le
rendement moyen μ par la moyenne sur l’échantillon .
Le caractère bon de cette estimation depend du comportement des
variables aléatoires et l’effet que ce comportement a sur
. Notons que la variable aléatoire est seulement fonction des
variables aléatoires et de la taille de l’échantillon n. est un
exemple d’une statistique.
Une statistique est une combinaison des variables aléatoires. Elle est une
fonction des variables aléatoires dans un échantillon et des constantes
connues.
Les statistiques sont utilisées pour effectuer une inférence c’est-à-dire
estimer et décider à propos des paramètres inconnus de la population.
Puisqu’une statistique est une combinaison des variables aléatoires, elle est
elle-même une variable aléatoire. Donc on peut définir sa distrbution de
probabilité que l’on appelle sampling distribution ou distribution de
l’échantillonnage. Pratiquement, la distribution de l’échantillonnage donne
un modèle théorique de l’histogramme des fréquences des valeurs possibles
de la statistique que nous observons sur chaque échantillon.
En réalité, nous observons une seule fois la statistique sur l’échantillon
définie dans l’étude. Il faut donc toujours garder à l’esprit que l’enquête