Populations et individus
De la difficulté du dialogue entre les disciplines
Claudine Schwartz
L’analyse des jeux de hasard a permis de dégager la notion de probabilité pour des résultats
d’expériences reproductibles (roulettes, dés en sont les représentants emblématiques). La
théorie des probabilités est aussi source de modèles féconds dans des situations concernant
non plus une même expérience qu’on reproduit, mais des mesures prises sur des individus
différents d’une même population. On cherche alors à analyser et expliquer les variations de
certains pourcentages, à faire des prévisions : c’est à ce niveau que la théorie des probabilités
offre des modèles efficaces. Nous allons nous intéresser à ces situations.
Que signifie « dans une certaine population, à une époque donnée, la probabilité d’être
immunisé contre une maladie M est p » ? La probabilité p ci-dessus serait-elle un caractère
propre à chaque individu, partagé à l’identique par tous : on aurait une probabilité p d’être
immunisé comme on a tous 10 doigts ? Quand on parle de probabilités, on cherche
mentalement à se ramener à une situation aléatoire et on dira alors que si on tire au hasard un
individu dans la population de référence, la probabilité qu’il soit immunisé (nous noterons
IM) est p. Cet individu tiré au sort est un être aussi abstrait que le point matériel des
physiciens, le triangle quelconque des mathématiciens, la ménagère de 50 ans du marketing,
le consommateur des économistes. C’est quelqu’un qu’on arriverait à isoler en n’ayant
strictement aucune information sur lui. Pour réaliser cette performance, il faudrait numéroter
les individus et choisir un numéro au hasard avec un simulateur. Car il n’y a ici bien sûr pas
identité devant l’immunisation et le dire reviendrait de fait à considérer les individus comme
indiscernables (telles des boules dans des urnes), sauf en ce qui concerne leur immunisation.
Une probabilité est un macro-paramètre disent les physiciens, un paramètre macrosocial disent les économistes. Parler de la « probabilité d’être immunisé est p » est ainsi
trompeur si on n’a pas réfléchi au sens que cela a : cette probabilité reste un paramètre de
population et ne permet pas de retourner à l’individu. Dans notre exemple d’immunisation,
qu’en est-il de Thomas par exemple ? On a des informations sur lui : supposons connaître son
âge exact et quelques antécédents médicaux. Sous réserve d’avoir un modèle et des données
qui permettent ce calcul, la probabilité qu’il soit immunisé sera celle de tous ceux qui
partagent les mêmes caractéristiques que lui (même âge, mêmes antécédents). On peut
enrichir l’information, le modèle sera plus précis : la probabilité traduit l’information dont on
dispose au niveau d’une population ou d’un sous-groupe, et non plus la fréquence limite d’une
expérience infiniment reproductible et qui ne concernerait que Thomas. Dans le cas de ce
dernier, de nouvelles informations peuvent changer la probabilité qu’il soit immunisé et si on
disposait de « toute » l’information, c'est-à-dire si on savait s’il est ou non immunisé, cette
probabilité deviendrait alors égale à 0 ou à 1.
1
Certains auteurs (par exemple Jules Gavarret1) ont défini la probabilité p qu’un
malade soumis à une médication meure comme étant égale à la moyenne arithmétique des
probabilités pi propres de chaque individu. La probabilité est ainsi pour lui une « chance
moyenne ». Cette formulation a l’avantage de faire sentir que la probabilité n’est pas une
constante de chaque individu et de plus la même pour tous. Mais quand il n’y a pas
d’expériences reproductibles à l’identique pour le même individu cette vision
« microscopique » (individuelle) est gratuite au sen où elle n’entre pas en ligne de compte
dans la construction des modèles qu’on va utiliser.
La nécessité de passer avant toute chose par l’individu pour moyenner ensuite
sur toute une population est aussi culturelle. En Occident la notion d’individu est présente et
fondatrice, on a beaucoup du mal à penser en termes de population (échelle macroscopique)
sans revenir à tout moment à l’individu (échelle microscopique).
Le rôle de la traduction en termes probabilistes de l’information, c'est-à-dire ici la fonction
d’un modèle probabiliste notamment en économie et dans les sciences sociales est clairement
formulée par E. Malinvaud2 :
Le modèle aléatoire est censé représenter le processus générateur des grandeurs étudiées. Ce point de
vue s’impose quand les unités statistiques ne proviennent d’aucun tirage aléatoire, par exemple quand elles
consistent en une même collectivité observée pendant des années successives. Il s’impose aussi généralement
dans l’analyse des résultats obtenus au cours d’enquêtes par sondage aléatoire ; car l’économètre ne cherche
pas alors à obtenir des évaluations sur la population sondée, mais plutôt à dégager les caractéristiques de lois
valables plus généralement ; il désire porter des jugements de probabilité, non sur la valeur de telle ou telle
grandeur dans la population observée, mais sur les caractéristiques permanentes des lois étudiées. »
Dans l’enseignement secondaire, les professeurs de mathématiques travaillent surtout avec
des expériences répétables, les physiciens beaucoup avec du macroscopique, pour un nombre
d’unités statistiques si grand que les fluctuations deviennent inobservables. Les professeurs de
SES utilisent les probabilités pour traduire l’information dont ils disposent et parler de lois
macro-sociales, les professeurs de SVT utilisent tous les aspects décrits. On pourrait dire que
les uns sont « fréquentistes », les autres « bayésiens » ou « subjectivistes », c’est une vieille
histoire… Mais on comprend que le dialogue soit difficile, que l’interdisciplinarité peine à se
développer, même sur un sujet aussi intrinsèquement interdisciplinaire que la statistique.
1
Principes généraux de statistique médicale,
http://www.math.unicaen.fr/irem/spip.php?article117
2
in Méthodes statistiques de l'économétrie, chap. 2 Modèles économiques et induction statistique
2