Thème : Aspects statistiques en génétique des - TIMC-IMAG

publicité
Thème :
Aspects statistiques en génétique des populations structurées en tissus
Application aux biopuces tissulaires
O. François (Responsable)
Le projet implique Mathieu Emily, Remy Drouilhet, Jean-Michel Billiot, Raphael Marcelpoil.
Mots-clés :
1. Statistique spatiale : processus ponctuels marqués
2. Puces à tissu TMA, cancer
3. Classification automatique, indicateurs statistiques
4. Génétique spatiale, migrations, parentés, segmentation de tumeurs
5. Cancérogénèse, instabilité génomique
6. Théorie de la coalescence
7. Simulations de Monte-Carlo
Les techniques récentes d'acquisition de données pour les tissus tumoraux génèrent un flot
gigantesque d'informations complexes dont il n'est pas toujours aisé de faire ressortir celles qui vont
être significatives pour le diagnostic et le pronostic du cancer.
C'est en particulier le cas des puces tissulaires, comportant sur une même lame de verre de
nombreuses coupes histologiques marquées. Un processus de fixation dans de la paraffine permet
de conserver la structure bi-dimensionnelle des tissus observés. Le marquage d'une coupe
histologique s'effectue grâce à une réaction immuno-histologique.
Les marqueurs sont
généralement des marqueurs protéiques nucléaires, membranaires ou cytoplasmiques. Des
marqueurs génétiques peuvent aussi être observés pour quelques cellules dans le tissu.
Une analyse statistique s'appuyant sur des modélisations simples mais pertinentes apparait comme
une nécessité pour un traitement convenable de telles données. Nous présentons deux axes
d'investigation :
une approche aveugle ou non-paramétrique,
une approche de type "génétique des populations spatialisée".
1) Présentation des TMAs
En génétique du cancer, les progrès technologiques effectués depuis l'année 1998 ont permis de
produire des bio-puces tissulaires : Tissue Micro Arrays (TMA). Un TMA fournit de 30 à 150
prélèvements de 0,6 mm à 2 mm chacun, comportant entre 1000 à 20000 cellules d'une coupe
histologique d'un tissu. Ces cellules sont marquées par des marqueurs génétiques révélant
l'expression d'un gène discriminant au niveau du cancer. Les TMAs dont nous disposons sont
représentatifs des différents grades histologiques des cancers du sein. L'analyse spatiale des
TMAs est une approche prometteuse afin d'aider les pathologistes dans le diagnostic précoce du
cancer du sein.
2) Approche "Model-Free"
Après l'analyse d'imagerie, les données TMA se présentent comme une liste de coordonnées
bi-dimensionnelles (points) représentant les noyaux des cellules associée à une liste de marques
représentant les quantités de protéines exprimées localement.
Après l'analyse d'imagerie, les données TMA se présentent comme une liste de coordonnées
bi-dimensionnelles (points) représentant les noyaux des cellules associée à une liste de marques
représentant les quantités de protéines exprimées localement.
Dans l'approche non-paramétrique, nous utilisons la théorie des processus spatiaux marqués. Le
processus de ce type le plus connu est le "modèle de Potts". La nouveauté dans ce contexte est
l'introduction d'une interaction entre les points respectant la structure du tissu cellulaire et
s'effectuant selon le graphe de Delaunay .
Dans ce contexte, la quantité de marqueur peut être statistiquement corrélée à certains paramètres
ponctuels (surface ou périmètre de la cellule par exemple). Nous étudions divers indicateurs
statistiques permettant a) de tester l'adéquation des modèles de Potts, b) d'étudier la corrélation
avec le grade de la tumeur observé localement lorsque cette observation est disponible.
Dans cette approche, nous développons un générateur aléatoire permettant de simuler différents
scénarios d'interactions entre points et marques s'appuyant sur les méthodes de Monte-Carlo par
chaînes de Markov.
Les objectifs affichés sont de a) obtenir une classification automatique des grades d'une tumeur au
vu de coupes sériées "TMA", b) fournir une diagnostic précoce et un pronostic du devenir de
patient(e)s atteint(e)s de cancer. Nous accompagnons ces objectifs d'une réflexion éthique sur la
diffusion d'un logiciel intégrant de tels outils.
3) Approche "Génétique des populations"
L'acquisition massive de marqueurs génétiques au niveau d'un tissu permet de développer de
nombreux outils statistiques inspirés de la génétique des populations. En particulier, les taux de
mutation, de migration cellulaires peuvent être estimés par les méthodes récentes développées
dans ce domaine.
Nous nous focalisons sur deux aspects particuliers
la détection de parentés,
la détection de mutateurs, ou de phénotypes de mutation.
La détection de parenté peut être une étape cruciale pour la segmentation d'un clone tumoral à
l'intérieur d'un tissu sain ou au milieu d'autres clones plus récents ou plus anciens. En effet, les
relations de voisinages entre cellules sont peut-être significatrices des parentés, mais il est difficile
d'identifier parmi les cellules voisines d'une cellule donnée laquelle possède la relation de plus
proche parenté. Il est nécessaire de dater cette parenté pour pouvoir l'affilier à un clone précis.
Nous proposons un test statistique fondé sur la théorie de la coalescence des généalogies.
L'hypothèse du phénotype de mutation est une hypothèse controversée, à la source de la génèse
du cancer. Dans cette hypothèse, le processus de cancérisation est accompagné d'une
augmentation phénoménale du nombre de mutations dans le clone tumoral. Cet accroissement peut
être expliqué par double mutation d'un gène suppresseur de tumeur et d'un gène réparateur de
l'ADN. Nous développons un test statistique pour la significativité de l'hypothèse du phénotype de
mutation fondé sur le modèle à infinité d'allèles et sur la théorie de la coalescence.
4) Compétences : Quelques publications
Statistique spatiale :
E. Bertin, J.-M. Billiot, R. Drouilhet. Phase Transition in the Delaunay Continuum Potts Models,
Accepté par Journal of Statistical Physics, 2003.
E. Bertin, J.-M. Billiot, R. Drouilhet. Existence of Delaunay Pairwise Gibbs Point Process with
Superstable Component, Journal of Statistical Physics, 95(3) :719-744, 1999.
Génétique spatiale / Evolution :
M. Blum, O. François. Brownian motions and coalescent structures, European Mathematical
Genetics Meeting 2003, Robinson College, Cambridge, 7-9 april 2003.
S. Manel, E. Bellemain, J. Swenson, O. François. Assumed and inferred spatial structures of
populations : The Scandinavian brown bears revisited, Accepté par Molecular Ecology, 2004.
A. Cercueil, O. François. Sharp Asymptotics for Fixation Times in Stochastic Population Genetics
Models at Low Mutation Probabilities, Journal of statistical physics, 110(1-2) :311-332, 2003.
Parentés :
A. Cercueil, E. Bellemain, S. Manel. PARENTE : Computer program for parentage analysis. The
Journal of Heredity, 93 :458-459, 2002.
M. Blum, O. François. Kinship under the coalescent, Soumis au Journal of Mathematical Biology,
2003.
TMA :
M. Emily. Classification automatique de coupes histologiques. Application au cancer du sein.
Mémoire de DEA, 2003.
Téléchargement