0.1 Introduction
Historique
L’analysedesdonnéesdesurvievoitlejourauXVII
esiècle, dans le do-
maine de la démographie. L’objectif des analystes de ce siècle est l’estimation,
à partir des registres de décès, de diverses caractéristiques de la population-
son effectif, sa longévité, etc. Ces analyses, très générales, ne sont affinées
qu’à partir du XIXesiècle, avec l’apparition de catégorisations suivant des
‹‹variables exogènes›› (sexe, nationalité, catégories socio-professionnelles...).
Durant ce siècle, apparaîssent également les premières modélisations conser-
nant la probabilité de mourir à un certain âge, probabilité qui sera par la
suite désignée sous le terme de ‹‹fonction de risque››.
En 1951, Weibull conçoit un modèle paramétrique dans le domaine de la
fiabilité ; à cet effet, il fournit une nouvelle distribution de probabilité qui sera
par la suite fréquement utilisée en analyse de la survie : la ‹‹loi de Weibull››.
En 1958, Kaplan et Meier présentent d’importants résultats concernant
l’estimation non-paramétrique de la fonction de survie ; de l’estimateur ré-
sultant, ils étudient l’espérence, la variance et les propriétés asymptotiques.
L’analyse des données de survie a pour première particularité de ne con-
cerner que des variables aléatoires positives.
Une deuxième particularité de cette analyse est l’incomplétude des
données-différente de la troncature, qui équivaut à une perte d’information.
Analysant la survenue d’un certain type d’événement, nous qualifierons de
‹‹donnée complète›› un temps coorespondant à l’observation de la survenue
de l’événement, et de ‹‹donnée incomplète› › un temps correspondant à
l’absence d’observation de cet événement. Nous emploierons respectivement,
par la suite, les termes de donnée non censurée et de donnée censurée.
Enfin, la troisième particularité de l’analyse des données de survie est la
terminologie s’y rattachant. Outre les termes conçus à l’origine de cette
analyse (tels que fonction de survie, fonction de risque).
Constitution et perspectives de mémoire.
Lemémoiresecomportedecinqchapitres.
Au premier chapitre on présente une introduction sur la distribution de
survie et les résultats consernant la théorie des données censurées.
3