Estimation indirecte de l'âge : modèles probabilistes et approche statistique
Isabelle Séguy, Luc Buchet, Henri Caussinus, Daniel Courgeau
Résumé
Toute estimation indirecte requiert un modèle reliant l’objet à estimer (ici l’âge calendaire, ou
âge « réel », ou simplement âge) aux données disponibles à cet effet (indicateur biologique,
parfois dénommé ici stade ou âge « osseux »). Aucune liaison déterministe ne pouvant être
espérée, le modèle est probabiliste, l’estimation relève de la statistique.
Formalisons d’abord le modèle et examinons les données nécessaires à son évaluation.
Le tableau 1 décrit la loi de probabilité du couple « âge calendaire - âge osseux » où i est l’âge
osseux et j l’âge réel d’un individu. Nous supposons que les deux âges sont discrétisés, c’est-
à-dire qu’âge osseux i (i = 1,…,l) et âge calendaire j (j = 1,…c) sont des « classes d’âge », non
seulement pour simplifier l’exposé mais aussi parce que cela correspond à la pratique la plus
usuelle. On désigne par pij la probabilité que l’âge osseux soit i et l’âge réel soit j, par πi la
probabilité que l’âge osseux soit i et par pj la probabilité que l’âge réel soit j. Par ailleurs on
notera la probabilité qu’un individu soit d’âge réel j sachant que son âge osseux est i et
pi/j la probabilité qu’un individu soit de stade osseux i sachant que son âge réel est j.
Âge
Totaux
ligne
p11
.
.
.
p1j
.
.
.
p1c
π1
.
.
.
.
.
.
.
.
.
.
.
.
pi1
.
.
.
pij
.
.
.
pic
πi
.
.
.
.
.
.
.
.
.
.
.
.
indicateur
biologique
pl1
.
.
.
plj
.
.
.
plc
πl
Totaux
colonne
p1
.
.
.
pj
.
.
.
pc
1
Tableau 1. Loi de probabilité du couple « âge – indicateur biologique ».
Deux types de questions se posent en pratique :
a) estimation de la structure par âge d’une population, c’est-à-dire des probabilités pj
(j=1,…c) comme c’est le cas en paléodémographie,
b) estimation de l’âge calendaire d’un individu connaissant son stade osseux i, c’est-à-
dire des probabilités pour j=1,…c. C’est le cas en archéologie funéraire lorsque
l’on cherche à estimer l’âge au décès d’un individu isolé.
Les données de référence se présentent comme indiqué dans le tableau 2, étant le nombre
de cas l’âge osseux est i et l’âge réel j. En pratique elles sont enregistrées dans des
conditions différentes de la situation d’intérêt (sinon, elles permettraient l’estimation aisée de
toutes les probabilités en cause, par exemple pj serait estimé par /n). La première question
qui se pose est donc : qu’est-ce qui peut être considéré comme constant, malgré des
différences temporelles et/ ou spatiales, entre la situation analysée et celle dans laquelle les
données de référence ont été obtenues ? Les paléodémographes supposent une condition
d’invariance biologique assurant la permanence de la distribution de l’indicateur biologique à
âge réel donné, c’est-à-dire la constance des probabilités pi/j (celles-ci peuvent donc être
estimées par les nij/n.j ). Le passage aux probabilités pj se fait au moyen de la formule :
pour tout (1)
sous réservé d’avoir une estimation des seconds membres πi, laquelle est tirée des
observations sur le site à l’étude qui se présentent comme les nombres (m1,…, mi ,…, ml )
d’individus dans les différents stades sur un échantillon de m individus au total.
Âge
Totaux
ligne
n11
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
indicateur
biologique
.
.
.
.
.
.
Totaux
colonne
.
.
.
.
.
.
Tableau 2. Distribution observée du couple « âge – caractère biologique » sur un échantillon de
référence.
L’exploitation conjointe de ces donnés de site et de référence fait l’objet de la communication
« Présentation et mise en œuvre d’une nouvelle approche de l’âge à partir d’indicateurs
biologiques (procédure d’inférence bayésienne) », présentée par Luc Buchet, Henri Caussinus
et Daniel Courgeau dans la session 1808, qui traite le premier problème (a) exposé plus haut.
Rappelons seulement deux points importants :
- si l’information apportée par les données mentionnées est théoriquement suffisante,
son utilisation pratique présente quelques difficultés,
- l’estimation ponctuelle (par une seule valeur numérique) d’un pj est très insuffisante
car, fondée sur des échantillons, cette estimation est sujette à une incertitude qu’il
importe de quantifier ; le plus efficace pour cela est d’en fournir la loi de probabilité
(c’est ce qui est fait dans la communication citée ci-dessus).
Supposons maintenant que nous voulions estimer la probabilité qu’un individu donné,
présentant le stade i, ait un âge j (question b ci-dessus). La formule
(2)
permet de le faire en remplaçant les diverses probabilités par leurs estimations. Mais, ici
encore, l’estimation ponctuelle ainsi obtenue est loin d’être suffisante : il convient d’indiquer
sa marge d’incertitude par sa loi de probabilité. Si l’on se reporte à la communication
mentionnée, on voit qu’elle passe par l’estimation de la loi de probabilité des pi/j et qu’elle
fournit une estimation de la distribution des pj. On y trouve donc tous les ingrédients
permettant d’évaluer la loi de probabilité du ainsi estimé. Avec les lois de probabilité
obtenues, on tire au hasard un échantillon de pi/j (pour le stade i considéré et pour j=1,…,c) et
un échantillon de pj (j=1,…,c) ; la formule (2) fournit alors un échantillon de simulant sa
loi de probabilité.
A titre d’exemple, nous traiterons le cas d’individus inhumés hors de la nécropole
mérovingienne de Frénouville, mais à proximité du site, pour lesquels nous évaluerons l’âge
calendaire à partir des stades osseux i, en intégrant la loi de probabilité de cette estimation.
On considère ces individus comme étant issus de la population de Frénouville, dont on a
préalablement estimé la structure par âges par la procédure d’inférence bayésienne.
Pour illustrer le type de résultat que l’on peut obtenir, prenons le cas d’un individu dans le
stade osseux 1 (le plus « jeune ») et considérons deux probabilités conditionnelles à ce stade :
celle que l’âge soit inférieur ou égal à 24 ans et celle d’un âge entre 50 et 54 ans inclus. Les
estimations ponctuelles de ces probabilités sont respectivement 0.671 et 0.015, c’est-à-dire
une probabilité de l’ordre de deux tiers pour un âge inférieur ou égal à 24 ans et une très faible
probabilité pour la classe d’âge plus élevé. A ce niveau cependant on n’a aucune information
sur la précision de ces estimations. Celle-ci est fournie graphiquement par les densités de la
figure 1 et numériquement par quelques quantiles donnés dans le tableau 3.
Figure 1. Densité de probabilité des estimations de la probabilité d’un âge inférieur ou égal à 24 ans
(à gauche) et de la classe d’âge 50-54 ans (à droite) pour un individu de stade osseux 1.
Quantiles
5%
50%
95%
Probabilité d’un âge 24 ans
0.376
0.705
0.807
Probabilité de la classe d’âge 50-54 ans
0.002
0.010
0.044
Tableau 3. Quelques quantiles correspondant aux densités de la figure 1.
On voit, par exemple, que la probabilité de la première classe d’âge est estimée avec une
précision relativement faible : elle se situe entre (environ) 0.60 et 0.75 avec une probabilté de
un demi, mais a 5 chances sur 100 d’être au-dessous de 0.376 et 5 chances sur 100 d’être
supérieure à 0.807. En revanche, la seconde probabilité, très faible comme attendu, est
estimée avec une précision élevée autour de sa médiane 0.010.
Il est possible également d’estimer les pj en référence à d’autres observations sous réserve
d’une nouvelle hypothèse d’invariance : l’invariance spatio-temporelle des πi. Nous en
donnerons un exemple avec des sépultures isolées de religieuses, rapprochées d’une structure
par âges observée dans un autre couvent, à une autre époque.
Dans le cadre du groupe de travail pluridisciplinaire « Atelier Condorcet-Mesures de l’âge
sans état civil », nous avons examiné l’extension des méthodes étudiées plus haut à des
problèmes ressortissant à des domaines différents, mais qui se présentent formellement de
façon similaire. A titre d’exemple, en médecine légale, un expert est appelé à estimer un âge
« réel » j en fonction d’observations anatomiques i, sur un sujet décédé ou sur un individu
vivant. Notre méthode serait aussi applicable en démographie quand il s’agit de réaffecter un
âge civil à des individus dont la déclaration d’âge est soumise à des variations opportunistes.
1 / 4 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !