L'estimation
1. Concrètement ...
Dernièrement un quotidien affichait en première page : en 30 ans les françaises ont grandi de... je ne sais
plus exactement, disons 7,1 cm. C'est peut-être un peu moins ou un peu plus, cela n'a pas d'importance.
C'était un nombre assez précis, avec une virgule, pas une dizaine ou une quinzaine de centimètres, non
quelque chose de plus précis.
Voilà un bien beau résultat... Mais comment a t-on fait pour l'obtenir? Certainement pas en mesurant
toutes les françaises : pour ce que je sais, ni mon épouse, ni mes filles, ni ma belle mère, ni ma sœ ur, n'ont
reçu la visite d'un quelconque "mesureur". D'ailleurs je ne connais pas beaucoup de gens qui ont été
mesurés. Je ne suis d'ailleurs pas sûr qu'il y a trente ans il y ait eu une opération générale de mesurage. Il
est bien plus raisonnable de penser que les résultats annoncés ne proviennent pas de l'ensemble des
françaises, mais seulement de quelques-unes d'entre elles. Ce qu'en langage statistique on appelle un
échantillon.
Mais dès lors se pose immédiatement la question de la validité des valeurs annoncées maintenant et il y a
trente ans.Examinons comment cela a pu se passer. Si toute la population n'est pas concernée, il a fallu
définir un protocole pour sélectionner un échantillon "représentatif". Chacun connat les liens entre
milieu social, nutrition et taille (liens eux-mêmes mis en évidence par d'autres enquêtes). La constitution
d'un tel échantillon a nécessairement été réalisée selon un ensemble de règles strictes.
Nous laisserons cela aux enquêteurs spécialistes.
Avant de définir ces règles, il leur a fallu toutefois se poser une première série de questions importantes :
quel doit être le nombre d'individus de l'échantillon ? ce nombre influe t'il sur la précision du résultat
obtenu ? de quelle façon ?
Laissons cela aussi de côté pour l'instant. Nous supposerons donc que l'enquêteur soit parvenu à définir
une "taille d'échantillon idéale".
Il réalise donc la collecte de données. Comment le statisticien peut-il utiliser les valeurs recueillies pour
approcher la taille moyenne des femmes dans la population ? Il semble assez naturel de penser qu'il fera
dans un premier temps la moyenne des tailles des individus de l'échantillon.
Et voilà de nouveaux problèmes : tout d'abord ce calcul est-il une bonne façon d'estimer la moyenne
cherchée? Est-il la meilleure façon de faire cette estimation ou ne donne t'il qu'une simple idée du
résultat sur la population?
En second lieu on ne peut ignorer que le résultat de ce calcul dépend de l'échantillon choisi : il y a de
grandes chances que d'un échantillon à l'autre les valeurs trouvées soient un peu (ou très) différentes.
Enfin, il semble raisonnable de penser qu'avec un échantillon de plus grande taille on aurait pu (mais pas
à coup sûr) obtenir une meilleure approximation de ce que l'on cherche.Tout ce que nous avons dit
jusqu'à présent relève d'interrogations de bon sens. On pourrait sans doute y ajouter une question plus
préoccupante encore : une telle estimation a t'elle un sens, une véritable valeur scientifique?
Répondre à ces questions avec un peu d'objectivité demande de définir des outils qui nous y aideront.