Thème : Aspects statistiques en génétique des populations structurées en tissus Application aux biopuces tissulaires O. François (Responsable) Le projet implique Mathieu Emily, Remy Drouilhet, Jean-Michel Billiot, Raphael Marcelpoil. Mots-clés : 1. Statistique spatiale : processus ponctuels marqués 2. Puces à tissu TMA, cancer 3. Classification automatique, indicateurs statistiques 4. Génétique spatiale, migrations, parentés, segmentation de tumeurs 5. Cancérogénèse, instabilité génomique 6. Théorie de la coalescence 7. Simulations de Monte-Carlo Les techniques récentes d'acquisition de données pour les tissus tumoraux génèrent un flot gigantesque d'informations complexes dont il n'est pas toujours aisé de faire ressortir celles qui vont être significatives pour le diagnostic et le pronostic du cancer. C'est en particulier le cas des puces tissulaires, comportant sur une même lame de verre de nombreuses coupes histologiques marquées. Un processus de fixation dans de la paraffine permet de conserver la structure bi-dimensionnelle des tissus observés. Le marquage d'une coupe histologique s'effectue grâce à une réaction immuno-histologique. Les marqueurs sont généralement des marqueurs protéiques nucléaires, membranaires ou cytoplasmiques. Des marqueurs génétiques peuvent aussi être observés pour quelques cellules dans le tissu. Une analyse statistique s'appuyant sur des modélisations simples mais pertinentes apparait comme une nécessité pour un traitement convenable de telles données. Nous présentons deux axes d'investigation : une approche aveugle ou non-paramétrique, une approche de type "génétique des populations spatialisée". 1) Présentation des TMAs En génétique du cancer, les progrès technologiques effectués depuis l'année 1998 ont permis de produire des bio-puces tissulaires : Tissue Micro Arrays (TMA). Un TMA fournit de 30 à 150 prélèvements de 0,6 mm à 2 mm chacun, comportant entre 1000 à 20000 cellules d'une coupe histologique d'un tissu. Ces cellules sont marquées par des marqueurs génétiques révélant l'expression d'un gène discriminant au niveau du cancer. Les TMAs dont nous disposons sont représentatifs des différents grades histologiques des cancers du sein. L'analyse spatiale des TMAs est une approche prometteuse afin d'aider les pathologistes dans le diagnostic précoce du cancer du sein. 2) Approche "Model-Free" Après l'analyse d'imagerie, les données TMA se présentent comme une liste de coordonnées bi-dimensionnelles (points) représentant les noyaux des cellules associée à une liste de marques représentant les quantités de protéines exprimées localement. Après l'analyse d'imagerie, les données TMA se présentent comme une liste de coordonnées bi-dimensionnelles (points) représentant les noyaux des cellules associée à une liste de marques représentant les quantités de protéines exprimées localement. Dans l'approche non-paramétrique, nous utilisons la théorie des processus spatiaux marqués. Le processus de ce type le plus connu est le "modèle de Potts". La nouveauté dans ce contexte est l'introduction d'une interaction entre les points respectant la structure du tissu cellulaire et s'effectuant selon le graphe de Delaunay . Dans ce contexte, la quantité de marqueur peut être statistiquement corrélée à certains paramètres ponctuels (surface ou périmètre de la cellule par exemple). Nous étudions divers indicateurs statistiques permettant a) de tester l'adéquation des modèles de Potts, b) d'étudier la corrélation avec le grade de la tumeur observé localement lorsque cette observation est disponible. Dans cette approche, nous développons un générateur aléatoire permettant de simuler différents scénarios d'interactions entre points et marques s'appuyant sur les méthodes de Monte-Carlo par chaînes de Markov. Les objectifs affichés sont de a) obtenir une classification automatique des grades d'une tumeur au vu de coupes sériées "TMA", b) fournir une diagnostic précoce et un pronostic du devenir de patient(e)s atteint(e)s de cancer. Nous accompagnons ces objectifs d'une réflexion éthique sur la diffusion d'un logiciel intégrant de tels outils. 3) Approche "Génétique des populations" L'acquisition massive de marqueurs génétiques au niveau d'un tissu permet de développer de nombreux outils statistiques inspirés de la génétique des populations. En particulier, les taux de mutation, de migration cellulaires peuvent être estimés par les méthodes récentes développées dans ce domaine. Nous nous focalisons sur deux aspects particuliers la détection de parentés, la détection de mutateurs, ou de phénotypes de mutation. La détection de parenté peut être une étape cruciale pour la segmentation d'un clone tumoral à l'intérieur d'un tissu sain ou au milieu d'autres clones plus récents ou plus anciens. En effet, les relations de voisinages entre cellules sont peut-être significatrices des parentés, mais il est difficile d'identifier parmi les cellules voisines d'une cellule donnée laquelle possède la relation de plus proche parenté. Il est nécessaire de dater cette parenté pour pouvoir l'affilier à un clone précis. Nous proposons un test statistique fondé sur la théorie de la coalescence des généalogies. L'hypothèse du phénotype de mutation est une hypothèse controversée, à la source de la génèse du cancer. Dans cette hypothèse, le processus de cancérisation est accompagné d'une augmentation phénoménale du nombre de mutations dans le clone tumoral. Cet accroissement peut être expliqué par double mutation d'un gène suppresseur de tumeur et d'un gène réparateur de l'ADN. Nous développons un test statistique pour la significativité de l'hypothèse du phénotype de mutation fondé sur le modèle à infinité d'allèles et sur la théorie de la coalescence. 4) Compétences : Quelques publications Statistique spatiale : E. Bertin, J.-M. Billiot, R. Drouilhet. Phase Transition in the Delaunay Continuum Potts Models, Accepté par Journal of Statistical Physics, 2003. E. Bertin, J.-M. Billiot, R. Drouilhet. Existence of Delaunay Pairwise Gibbs Point Process with Superstable Component, Journal of Statistical Physics, 95(3) :719-744, 1999. Génétique spatiale / Evolution : M. Blum, O. François. Brownian motions and coalescent structures, European Mathematical Genetics Meeting 2003, Robinson College, Cambridge, 7-9 april 2003. S. Manel, E. Bellemain, J. Swenson, O. François. Assumed and inferred spatial structures of populations : The Scandinavian brown bears revisited, Accepté par Molecular Ecology, 2004. A. Cercueil, O. François. Sharp Asymptotics for Fixation Times in Stochastic Population Genetics Models at Low Mutation Probabilities, Journal of statistical physics, 110(1-2) :311-332, 2003. Parentés : A. Cercueil, E. Bellemain, S. Manel. PARENTE : Computer program for parentage analysis. The Journal of Heredity, 93 :458-459, 2002. M. Blum, O. François. Kinship under the coalescent, Soumis au Journal of Mathematical Biology, 2003. TMA : M. Emily. Classification automatique de coupes histologiques. Application au cancer du sein. Mémoire de DEA, 2003.