Sous la direction de : Ourida SADKI, M.C.A à l’Université d’Oum El Bouagui
RÉPUBLIQUE ALGÉRIENNE DÉMOCRATIQUE ET POPULAIRE
MINISTÈRE DE L’ENSEIGNEMENT SUPÉRIEUR ET DE LA RECHERCHE SCIENTIFIQUE
UNIVERSITÉ DES SCIENCES ET TECHNOLOGIE DE HOUARI BOUMEDIENNE
FACULTÉ DES MATHÉMATIQUES
DÉPARTEMENT DES PROBABILITÉS STATISTIQUES
RÉSUMÉ DU MÉMOIRE DE MAGISTER EN MATHEMATIQUE
SPÉSIALITÉ : STATISTIQUES & PROBABILITÉS
PRÉSENTÉ PAR1:
Nassima ZABOOT
Thème
Estimation du Point de Saut de la Fonction de Hasard pour des
Données Censurées
Résumé :
Dans cette étude, on s’intéressera à l’estimation du point de saut de la fonction de hasard pour
des données censurées, en considérant un modèle de survie avec un risque instantané constant et
un seul point de rupture. Ce modèle est à trois paramètres , et qui représentent
respectivement : la valeur du taux de hasard avant le saut, la taille ou la mesure du saut, et le
point de saut.
D’une part on procédera à l’estimation paramétrique de , et par trois méthodes : le
maximum de vraisemblance en considérant la fonction log vraisemblance proposée par Gijbels et
Gurler (2003),la procédure d’estimation de Chang, Chen et Hsiung fondée sur l’estimateur de
Nelson-Aalen (1978) de la fonction de hasard cumulée, où le point de saut représente un
maximum local et par la suite, la méthode d’estimation par les moindres carrés en considérant
une partition d’un intervalle contenant .
D’autre part, on se penchera sur l’estimation non paramétrique du point de saut , en localisant
l’extrémum de l’estimateur à noyau de la dérivée de la fonction de hasard.
Nous illustrerons notre étude par des simulations afin de vérifier les propriétés des estimateurs
étudiés à taille finie.
Mots clés :
Consistance, données censurées, estimateur de Kaplan Meier, estimateur de Nelson Aalen,
estimation non paramétrique, fonction de hasard, fonction de hasard cumulée, fonction noyau,
maximum de vraisemblance, modèle de survie, moindres carrés, normalité, point de rupture .
Estimation du Point de Saut de la Fonction de Hasard pour des Données Censurées 2
Présenté par Nassima ZABOOT Sous la Direction de : Ourida SADKI
1. Introduction à l’analyse de survie
L’analyse de la survie est née au vingtième siècle et a connu un développement
important dans la seconde moitié du siècle. Les développements dans ce domaine ont eu un
impact profond sur les essais cliniques notamment, la méthode de Kaplan Meier (1958)
pour l’estimation de la fonction de survie qui sera abordée dans le premier chapitre du
mémoire.
1.1. Données de survie
Le terme de durée de vie est employé de manière générale pour désigner le temps
qui s’écoule jusqu’à l’arrivée d’un événement particulier, autrement dit les données de
survie représentent le temps écoulé entre le début d’une observation et l’arrivée d’un
événement qui n’est pas forcement la mort, mais peut être la guérison, l’apparition d’une
maladie ou de complications. Dans l’industrie, il peut s’agir d’un bris d’une machine ou en
économie, du temps écoulé pour qu’une personne trouve un travail.
La variable représentative est notée , sa caractéristique fondamentale est que
cette variable (durée de vie) est positive ou nulle.
1.1.1. Données censurées
Les données censurées sont des observations pour lesquelles la valeur exacte d’un
événement n’est pas toujours connue. Cependant, on dispose tout de même d’une
information partielle permettant de fixer une borne inférieure (censure à droite) ou une
borne supérieure (censure à gauche).
Les raisons de cette censure peuvent être le fait que le patient soit toujours vivant
ou non malade à la fin de l’étude ou qu’il se soit retiré de l’étude pour des raisons
personnelles (immigration, mutation professionnelle ;…etc.).
Type de données censurées
Il existe trois catégories de censures qu’on nomme censure à droite, censure à
gauche et censure par intervalle (lorsqu’on connait la borne supérieure et la borne inférieure
d’un événement)
Il existe différents types de censures à l’intérieur de ces trois catégories :
A- Censure de type I, censure fixe
Etant donné un nombre positif fixé et un n-échantillon X1,, Xn, on observe
Ti= XiC et i= IXi=C
Tel que : ab représente le minimum (a, b)
Le temps de censure est fixé par le chercheur comme étant la fin de l’étude
Estimation du Point de Saut de la Fonction de Hasard pour des Données Censurées 3
Présenté par Nassima ZABOOT Sous la Direction de : Ourida SADKI
B- Censure de type III : jusqu’au rième « décès »
Etant donné un entier positif r fixé, un n-échantillon 1,, d’une variable
aléatoire positive et les statistiques d’ordre (1),,(), on observe :
=()  ==
Autrement dit, ce genre de censure se caractérise par le fait que l’étude cesse
aussitôt qu’a eu lieu un nombre d’événements prédéterminés par l’expérimentateur.
C- Censure de type II, censure aléatoire
Soit tel qu’à chaque = 1, , est associé un couple de variables aléatoires non
nul Xi, Cioù seul le minimum est observé c'est-à-dire qu’on observe :
Ti= XiCi et i= IXiCi
i est un indicateur de censure tel que :
i=1 si XiCi
0 si Xi> Ci
Xi est l’instant de l’événement.
Ci est l’instant de censure.
Remarque
Le phénomène de troncature est très différent de celui de la censure, car, dans le
cas de la censure, on sait que la variable X, non observée, est supérieure ou inférieure à une
valeur C qui elle a été observée. La troncature élimine de l’étude une partie des X, ce qui a
pour conséquence que l’analyse pourra porter seulement sur la loi de X conditionnellement
à l’événement (c < <) en cas de troncature gauche et droite simultanées.
Notre étude portera sur des données censurées aléatoirement en considérant des
couples de variables , où: = min(,) et (= 1, ,) est la fonction
indicatrice de censure.
On définit :
La fonction distribution des
La fonction distribution des
Tel que les soient indépendantes des
2. Fonction de Hasard
On considère les variables aléatoires X et C absolument continues de fonction de
répartition F et G respectivement on suppose pour l’identification du modèle que ces
variables sont indépendantes.
Estimation du Point de Saut de la Fonction de Hasard pour des Données Censurées 4
Présenté par Nassima ZABOOT Sous la Direction de : Ourida SADKI
Une des fonctions caractérisant le comportement probabiliste des observations est
la fonction de hasard, définie pour tout de R+ par :
=0<+/

Ce conditionnement successif fait en sorte que la fonction de risque est un
concept très pertinent, car il décrit la probabilité qu’un décès (événement) ait lieu dans un
petit intervalle de temps, sachant que l’individu est vivant au temps t.
() est donc le taux instantané de sortie d’un état à la date t (même si () n’est
pas nécessairement inférieur à 1).
2.1. Fonction de hasard cumulée H
C’est l’intégrale du taux de hasard , notée Ht telle que :
Ht=hx dx
t
0=fx
Sx dx =
t
0dS x
Sx dx
t
0
L’estimation de la fonction de hasard cumulée présente les mêmes difficultés que
celle d’une densité de probabilité, cependant, on peut estimer sans lissage la fonction de
hasard cumulée Ht :
Comme St= exp hx dx
t
0= eHt
On peut prendre pour estimateur de la fonction de hasard cumulée :
H
t=log 1i
ni+1
Ti<
i est une fonction indicatrice définie précédemment
En faisant l’hypothèse d’absence d’ex-æquo.
2.1.1. Estimateur de Nelson Aalen :
Nelson (1972) et Aalen (1978) ont proposé un estimateur de la fonction de risque
cumulée Ht. Connu sous le nom d'estimateur de Nelson-Aalen, cet estimateur du taux
cumulé est de la forme suivante :
H
t=dN
(s)
Y
(s)
t
o
Qui peut aussi sécrire, puisquil ny a que des sauts :
H
t=N
(ti)
Y
(ti)
i,tit
N
ti représente le nombre de décès à linstant ti et Y
it le nombre des sujets à
risque juste avant cet instant.
Estimation du Point de Saut de la Fonction de Hasard pour des Données Censurées 5
Présenté par Nassima ZABOOT Sous la Direction de : Ourida SADKI
3. Notion de risque avec point de saut
Les problèmes de ruptures sont apparus dès 1938 sur des exemples de régressions
linéaires avec changement de ponte (Garnier et Hammond 1938) ; mais c’est E.S.Page
(1955) qui est considéré comme initiateur des modèles avec saut (rupture) en étudiant des
problèmes de contrôle de production ; de tels exemples existent dans d’autres domaines
notamment en économétrie il arrive que les caractéristiques de la situation financière
subissent un changement après un crash financier dans les traitements médicaux , plus
particulièrement le traitement de la leucémie, pour expérimenter les effets d’une nouvelle
thérapie, les chercheurs mesurent le temps de rechute du malade, après le début de
rémission.
Définition
Soient un ouvert non vide de R+ et P
une famille de lois de probabilités (par
exemple), avec .
On dira qu’il ya rupture dans le modèle s’il existe un instant sur l’intervalle
d’observation, et donc un indice k1 < , et deux paramètres (1 et 2)
avec 12 tel que les variables aléatoires X1,, Xn soient indépendantes et loi des
Xi est P
1 pour ik et P
2 pour i > .
Gijbels et Gurler (2003) ont proposé un modèle pour la distribution de X spécifié
par la fonction de risque suivante:
=+< (3.1 )
Ce modèle est à trois paramètres , et le point de saut tel que > 0
et +> 0, en d’autres termes on suppose que la fonction de hasard de la variable X est
constante en (la valeur de la fonction de hasard avant le saut) jusqu’à avec un point de
saut (la taille ou la dimension du saut) ces paramètres sont tous inconnus à estimer.
Sous le modèle (3.1 ) la fonction de hasard cumulative est donnée par :
= =+
0<
Matthews, Farewell et Pyke (1985) ont testé l'hypothèse nulle d’un taux de hasard
constant contre l’alternative d’un taux d’échec qui implique une discontinuité ou un point
de changement (point de saut). Dans ce qui suit des estimateurs de ces paramètres seront
étudiées en utilisant le modèle (2.1).
4. Estimation paramétrique
Dans cette partie, on se penchera sur l’estimation paramétrique du point de saut ,
on s’intéressera, aussi, à l’estimation de la valeur du taux de hasard avant le saut et à
l’estimation de la dimension ou de la mesure du saut en .
1 / 14 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !