%0$503"5%&-6/*7&34*5²%&506-064& %N 0RÏSENTÏE

%NVUEDELOBTENTIONDU
%0$503"5%&-6/*7&34*5²%&506-064&
$ÏLIVRÏPAR
$ISCIPLINEOUSPÏCIALITÏ
0RÏSENTÏEETSOUTENUEPAR
4ITRE
%COLEDOCTORALE
5NITÏDERECHERCHE
$IRECTEURSDE4HÒSE
2APPORTEURS
LE
MEMBRESDUJURY:
Université ToulouseIII Paul Sabatier
(
UT3 Paul Sabatier
)
Mathématiques Informatique Télécommunications (MITT)
LA SANTE REPRODUCTIVE DE L'HOMME :
méthodologie et statistique
j
eudi 30
j
uin 2011
Marie WALSCHAERTS
Biostatistique - Epidémiologie
Pr. Pierre JOUANNET et Pr. Jean-Michel POGGI
Philippe BESSE et Patrick THONNEAU
Equipe de recherche en fertilite humaine, EA 3694
Jean-Michel LOUBES - Président
Roger MIEUSSET - Membre
Eve LECONTE - Membre invité
THÈSE
pour obtenir le grade de
DOCTEUR de l’Université de Toulouse
Spécialité : Epidémiologie - Biostatistique
préparée au laboratoire Equipe de recherche en fertilité humaine, EA 3694
dans le cadre de l’École Doctorale Mathématiques Informatique et
Télécommunications de Toulouse
présentée et soutenue publiquement par
Marie WALSCHAERTS
Titre:
La santé reproductive de l’homme :
méthodologie et statistique
Directeurs de thèse : Philippe BESSE et Patrick THONNEAU
Jury
M. Pierre JOUANNET Université René-Descartes Paris Rapporteur
M. Jean-Michel POGGI Université Paris-Sud Rapporteur
M. Jean-Michel LOUBES Université Toulouse III Président du jury
M. Roger MIEUSSET Université Toulouse III Membre du jury
Mme Eve LECONTE Université Toulouse I Membre invité
M. Philippe BESSE INSA Toulouse Directeur de thèse
M. Patrick THONNEAU IRD Tunisie Directeur de thèse
Résumé
La santé reproductive de l’homme est un indicateur de la santé générale de celui-ci. Elle est
également intimement liée aux expositions de l’environnement et du milieu de vie. Aujourd’hui,
on observe une baisse séculaire de la qualité du sperme et une augmentation des pathologies et
malformations de l’appareil reproducteur masculin.
L’objectif de ce travail est d’étudier la santé reproductive de l’homme d’un point de vue épi-
démiologique et par le biais de différents outils statistiques. Nous nous sommes intéressés à l’in-
cidence et aux facteurs de risque du cancer du testicule. Ensuite, nous avons étudié le parcours
thérapeutique d’une population d’hommes ayant consulté pour infécondité masculine en analy-
sant la relation entre leurs paramètres du sperme et leurs investigations andrologiques, ainsi que
l’issue de leur projet parental. Enfin, l’événement naissance a été analysé en tenant compte de son
délai de réalisation en utilisant des modèles de durées de vie incluant la censure à droite : modèles
de Cox et arbres de survie. En y associant des techniques de sélection stable de variables (stepwise,
pénalisation de type L1,bootstrap), les performances prédictives de ces méthodes ainsi que leur
capacité à fournir aux cliniciens un modèle facilement interprétable ont été comparées.
Dans le sud de la France, l’incidence du cancer du testicule a doublé au cours des 20 dernières
années. L’effet cohorte de naissance, c’est-à-dire l’effet générationnel, suggère un effet délétère
des expositions environnementales sur la santé reproductive de l’homme. Toutefois, aucune ex-
position du milieu de vie de l’homme durant sa vie adulte ne semble être un facteur de risque
potentiel de survenue du cancer du testicule, suggérant l’hypothèse d’une exposition à des pertur-
bateurs endocriniens in utero.
Actuellement, la responsabilité de l’homme dans des difficultés à concevoir représente 50%
des causes d’infertilité. La prise en charge de l’homme est donc essentielle. Dans notre cohorte de
couples consultant pour des problèmes d’infertilité, un examen andrologique anormal est observé
chez 85% des partenaires masculins. Une relation significative est observée entre l’examen de
sperme et l’examen andrologique, suggérant la nécessité de pratiquer des investigations cliniques
afin d’identifier les causes d’infertilité masculine. Finalement, un couple sur deux réussit à avoir
un enfant. Et l’âge des hommes de plus de 35 ans apparaît comme un facteur de risque majeur, ce
qui devrait encourager les couples à entamer leur projet parental le plus tôt possible.
En prenant en compte la composante temporelle dans l’issue reproductive de ces couples infé-
conds, les modèles de durée de vie obtenus sont très souvent instables du fait du grand nombre de
covariables. Nous avons intégré des techniques de rééchantillonnage (bootstrap) à des approches
de sélection de variables. Bien que l’approche Random Survival Forests soit la meilleure en qualité
de prévision, ses résultats ne sont pas facilement interprétables. Concernant les autres méthodes,
les résultats diffèrent selon la taille de l’échantillon. L’algorithme stepwise intégré au modèle de
Cox ne converge pas si le nombre d’événements est trop faible. L’approche qui consiste à choisir
la meilleure division en bootstrappant l’échantillon à chaque noeud lors de la construction d’un
arbre de survie ne paraît pas avoir une meilleure capacité prédictive qu’un simple arbre de survie
quand l’échantillon est suffisamment grand. Finalement, le modèle de Cox avec une sélection de
variables par pénalisation de type L1donne un bon compromis entre facilité d’interprétation et
prévision dans le cas de petits échantillons.
Mots clés : infertilité masculine, andrologie, taux cumulé, modèle de Cox, arbre de survie,
stepwise, Lasso, random survival forest, bootstrap
iii
Abstract
Male reproductive health is an indicator of his overall health. It is also closely linked to en-
vironmental exposures and living habits. Nowadays, surveillance of male fertility shows a secular
decline in sperm quality and increased disease and malformations of the male reproductive tract.
The objective of this work is to study the male reproductive health in an epidemiologic aspect
and through various statistical tools. Initially, we were interested in the pathology of testicular can-
cer, its incidence and its risk factors. Then, we studied the population of men consulting for male
infertility, their andrological examination, their therapeutic care and their parenthood project. Fi-
nally, the birth event was analyzed through survival models : the Cox model and the survival trees.
We compared different methods of stable selection variables (the stepwise bootstrapped and the
bootstrap penalisation L1method based on Cox model, and the bootstrap node-level stabilization
method and random survival forests) in order to obtain a final model easy to interpret and which
improve prediction.
In South of France, the incidence of testicular cancer doubled over the past 20 years. The birth
cohort effect, i.e. the generational effect,suggests a hypothesis of a deleterious effect of environ-
mental exposure on male reproductive health. However, the living environment of man during his
adult life does not seem to be a potential risk factor for testicular cancer, suggesting hypothesis of
exposure to endocrine disruptors in utero.
The responsibility of man for difficulties in conceiving represents 50% of cases of infertility,
making the management of male infertility essential. In our cohort, 85% of male partners presen-
ted an abnormal clinical examination (either a medical history or the presence of an anomaly in
andrological examination). Finally, one in two couples who consulted for male infertility success-
fully had a child. The age of men over 35 appears to be a major risk factor, which should encourage
couples to start their parenthood project earlier.
Taking into account the survival time in the reproductive outcome of these infertile couples,
the inclusion of large numbers of covariates gives models often unstable. We associated the boots-
trap method to variables selection approaches. Although the method of Random Survival Forests is
the best in the prediction performance, the results are not easily interpretable. Results are different
according to the size of the sample. Based on the Cox model, the stepwise algorithm is inappro-
priate when the number of events is too small. The bootstrap node-level stabilization method does
not seem better in prediction performance than a simple survival tree (difficulty to prune the tree).
Finally, the Cox model based on selection variables with the penalisation L1method seems a good
compromise between interpretation and prediction.
Keywords : male infertility, andrology, cumulative rate, Cox model, survival tree, stepwise,
Lasso, random survival forest, bootstrap
iv
1 / 263 100%

%0$503"5%&-6/*7&34*5²%&506-064& %N 0RÏSENTÏE

La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !