Estimation du Point de Saut de la Fonction de Hasard sur

Téléchargement

Sous la direction de : Ourida SADKI, M.C.A à l’Université d’Oum El Bouagui

RÉPUBLIQUE ALGÉRIENNE DÉMOCRATIQUE ET POPULAIRE

MINISTÈRE DE L’ENSEIGNEMENT SUPÉRIEUR ET DE LA RECHERCHE SCIENTIFIQUE

UNIVERSITÉ DES SCIENCES ET TECHNOLOGIE DE HOUARI BOUMEDIENNE

FACULTÉ DES MATHÉMATIQUES

DÉPARTEMENT DES PROBABILITÉS STATISTIQUES

RÉSUMÉ DU MÉMOIRE DE MAGISTER EN MATHEMATIQUE

SPÉSIALITÉ : STATISTIQUES & PROBABILITÉS

PRÉSENTÉ PAR1:

Nassima ZABOOT

Thème

Estimation du Point de Saut de la Fonction de Hasard pour des

Données Censurées

Résumé :

Dans cette étude, on s’intéressera à l’estimation du point de saut de la fonction de hasard pour

des données censurées, en considérant un modèle de survie avec un risque instantané constant et

un seul point de rupture. Ce modèle est à trois paramètres , et  qui représentent

respectivement : la valeur du taux de hasard avant le saut, la taille ou la mesure du saut, et le

point de saut.

D’une part on procédera à l’estimation paramétrique de , et  par trois méthodes : le

maximum de vraisemblance en considérant la fonction log vraisemblance proposée par Gijbels et

Gurler (2003),la procédure d’estimation de Chang, Chen et Hsiung fondée sur l’estimateur de

Nelson-Aalen (1978) de la fonction de hasard cumulée, où le point de saut représente un

maximum local et par la suite, la méthode d’estimation par les moindres carrés en considérant

une partition d’un intervalle contenant .

D’autre part, on se penchera sur l’estimation non paramétrique du point de saut , en localisant

l’extrémum de l’estimateur à noyau de la dérivée de la fonction de hasard.

Nous illustrerons notre étude par des simulations afin de vérifier les propriétés des estimateurs

étudiés à taille finie.

Mots clés :

Consistance, données censurées, estimateur de Kaplan Meier, estimateur de Nelson Aalen,

estimation non paramétrique, fonction de hasard, fonction de hasard cumulée, fonction noyau,

maximum de vraisemblance, modèle de survie, moindres carrés, normalité, point de rupture .

Estimation du Point de Saut de la Fonction de Hasard pour des Données Censurées 2

Présenté par Nassima ZABOOT Sous la Direction de : Ourida SADKI

1. Introduction à l’analyse de survie

L’analyse de la survie est née au vingtième siècle et a connu un développement

important dans la seconde moitié du siècle. Les développements dans ce domaine ont eu un

impact profond sur les essais cliniques notamment, la méthode de Kaplan Meier (1958)

pour l’estimation de la fonction de survie qui sera abordée dans le premier chapitre du

mémoire.

1.1. Données de survie

Le terme de durée de vie est employé de manière générale pour désigner le temps

qui s’écoule jusqu’à l’arrivée d’un événement particulier, autrement dit les données de

survie représentent le temps écoulé entre le début d’une observation et l’arrivée d’un

événement qui n’est pas forcement la mort, mais peut être la guérison, l’apparition d’une

maladie ou de complications. Dans l’industrie, il peut s’agir d’un bris d’une machine ou en

économie, du temps écoulé pour qu’une personne trouve un travail.

La variable représentative est notée , sa caractéristique fondamentale est que

cette variable (durée de vie) est positive ou nulle.

1.1.1. Données censurées

Les données censurées sont des observations pour lesquelles la valeur exacte d’un

événement n’est pas toujours connue. Cependant, on dispose tout de même d’une

information partielle permettant de fixer une borne inférieure (censure à droite) ou une

borne supérieure (censure à gauche).

Les raisons de cette censure peuvent être le fait que le patient soit toujours vivant

ou non malade à la fin de l’étude ou qu’il se soit retiré de l’étude pour des raisons

personnelles (immigration, mutation professionnelle ;…etc.).

Type de données censurées

Il existe trois catégories de censures qu’on nomme censure à droite, censure à

gauche et censure par intervalle (lorsqu’on connait la borne supérieure et la borne inférieure

d’un événement)

Il existe différents types de censures à l’intérieur de ces trois catégories :

A- Censure de type I, censure fixe

Etant donné un nombre positif fixé  et un n-échantillon X1,, Xn, on observe

Ti= XiC et i= IXi=C

Tel que : ab représente le minimum (a, b)

Le temps de censure est fixé par le chercheur comme étant la fin de l’étude

Estimation du Point de Saut de la Fonction de Hasard pour des Données Censurées 3

Présenté par Nassima ZABOOT Sous la Direction de : Ourida SADKI

B- Censure de type III : jusqu’au rième « décès »

Etant donné un entier positif r fixé, un n-échantillon 1,, d’une variable

aléatoire positive  et les statistiques d’ordre (1),,(), on observe :

=()  ==

Autrement dit, ce genre de censure se caractérise par le fait que l’étude cesse

aussitôt qu’a eu lieu un nombre d’événements prédéterminés par l’expérimentateur.

C- Censure de type II, censure aléatoire

Soit  tel qu’à chaque = 1, , est associé un couple de variables aléatoires non

nul Xi, Cioù seul le minimum est observé c'est-à-dire qu’on observe :

Ti= XiCi et i= IXiCi

Où i est un indicateur de censure tel que :

i=1 si XiCi

0 si Xi> Ci

Où Xi est l’instant de l’événement.

Ci est l’instant de censure.

Remarque

Le phénomène de troncature est très différent de celui de la censure, car, dans le

cas de la censure, on sait que la variable X, non observée, est supérieure ou inférieure à une

valeur C qui elle a été observée. La troncature élimine de l’étude une partie des X, ce qui a

pour conséquence que l’analyse pourra porter seulement sur la loi de X conditionnellement

à l’événement (c < <) en cas de troncature gauche et droite simultanées.

Notre étude portera sur des données censurées aléatoirement en considérant des

couples de variables , où: = min(,) et (= 1, ,) est la fonction

indicatrice de censure.

On définit :

 La fonction distribution des 

 La fonction distribution des 

Tel que les soient indépendantes des 

2. Fonction de Hasard

On considère les variables aléatoires X et C absolument continues de fonction de

répartition F et G respectivement où on suppose pour l’identification du modèle que ces

variables sont indépendantes.

Estimation du Point de Saut de la Fonction de Hasard pour des Données Censurées 4

Présenté par Nassima ZABOOT Sous la Direction de : Ourida SADKI

Une des fonctions caractérisant le comportement probabiliste des observations est

la fonction de hasard, définie pour tout  de R+ par :

=0<+/



Ce conditionnement successif fait en sorte que la fonction de risque est un

concept très pertinent, car il décrit la probabilité qu’un décès (événement) ait lieu dans un

petit intervalle de temps, sachant que l’individu est vivant au temps t.

() est donc le taux instantané de sortie d’un état à la date t (même si () n’est

pas nécessairement inférieur à 1).

2.1. Fonction de hasard cumulée H

C’est l’intégrale du taux de hasard , notée Ht telle que :

Ht=hx dx

0=fx

Sx dx =

0dS x

Sx dx

L’estimation de la fonction de hasard cumulée présente les mêmes difficultés que

celle d’une densité de probabilité, cependant, on peut estimer sans lissage la fonction de

hasard cumulée Ht :

Comme St= exp hx dx

0= eHt

On peut prendre pour estimateur de la fonction de hasard cumulée :

t=log 1i

ni+1

Ti<

Où i est une fonction indicatrice définie précédemment

En faisant l’hypothèse d’absence d’ex-æquo.

2.1.1. Estimateur de Nelson Aalen :

Nelson (1972) et Aalen (1978) ont proposé un estimateur de la fonction de risque

cumulée Ht. Connu sous le nom d'estimateur de Nelson-Aalen, cet estimateur du taux

cumulé  est de la forme suivante :

t=dN



(s)

(s)

Qui peut aussi s’écrire, puisqu’il n’y a que des sauts :

t=N

(ti)

i,tit

Où N

ti représente le nombre de décès à l’instant ti et Y

it le nombre des sujets à

risque juste avant cet instant.

Estimation du Point de Saut de la Fonction de Hasard pour des Données Censurées 5

Présenté par Nassima ZABOOT Sous la Direction de : Ourida SADKI

3. Notion de risque avec point de saut

Les problèmes de ruptures sont apparus dès 1938 sur des exemples de régressions

linéaires avec changement de ponte (Garnier et Hammond 1938) ; mais c’est E.S.Page

(1955) qui est considéré comme initiateur des modèles avec saut (rupture) en étudiant des

problèmes de contrôle de production ; de tels exemples existent dans d’autres domaines

notamment en économétrie où il arrive que les caractéristiques de la situation financière

subissent un changement après un crash financier où dans les traitements médicaux , plus

particulièrement le traitement de la leucémie, pour expérimenter les effets d’une nouvelle

thérapie, les chercheurs mesurent le temps de rechute du malade, après le début de

rémission.

Définition

Soient  un ouvert non vide de R+ et P

 une famille de lois de probabilités (par

exemple), avec .

On dira qu’il ya rupture dans le modèle s’il existe un instant  sur l’intervalle

d’observation, et donc un indice k1 < , et deux paramètres (1 et 2) 

avec 12 tel que les variables aléatoires X1,, Xn soient indépendantes et loi des

Xi est P

1 pour ik et P

2 pour i > .

Gijbels et Gurler (2003) ont proposé un modèle pour la distribution de X spécifié

par la fonction de risque suivante:

=+< (3.1 )

Ce modèle est à trois paramètres , et le point de saut  tel que > 0

et +> 0, en d’autres termes on suppose que la fonction de hasard de la variable X est

constante en  (la valeur de la fonction de hasard avant le saut) jusqu’à  avec un point de

saut  (la taille ou la dimension du saut) ces paramètres sont tous inconnus à estimer.

Sous le modèle (3.1 ) la fonction de hasard cumulative est donnée par :

= =+



0<

Matthews, Farewell et Pyke (1985) ont testé l'hypothèse nulle d’un taux de hasard

constant contre l’alternative d’un taux d’échec qui implique une discontinuité ou un point

de changement (point de saut). Dans ce qui suit des estimateurs de ces paramètres seront

étudiées en utilisant le modèle (2.1).

4. Estimation paramétrique

Dans cette partie, on se penchera sur l’estimation paramétrique du point de saut ,

on s’intéressera, aussi, à l’estimation de la valeur du taux de hasard  avant le saut et à

l’estimation de la dimension ou de la mesure du saut  en .

1 / 14 100%

Documents connexes

Cartes de circuit

TP14 : Force et vitesse

Pour réussir son saut à ski, Marc doit atteindre au

Modélisation Multi-états et outils médico

TP 6 Circuits en régime transitoire

Rythme cardiaque

Télécharger - Grandeur Nature asbl

2. Quelle combinaison jouer au loto ?

Rythme cardiaque

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Estimation du Point de Saut de la Fonction de Hasard sur

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Estimation du Point de Saut de la Fonction de Hasard sur

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib