Biodiversité trans-spécifique chez la souris domestique

publicité
Biodiversité trans-spécifique chez la souris
domestique : une approche génomique.
Déposé le : 26 fevrier 2007
Date de début : 1 octobre 2007
Sujet susceptible d'obtenir une : Allocation Recherche
ANR blanche 2005 (jusqu’en déc 2008), et ANR Biodiversité 2006 (jusqu’en déc 2009)
couvrent les expériences mais pas l’allocation de thèse.
Directeur : Pierre BOURSOT
04 67 14 46 86 - 04 67 14 45 54 - [email protected]
Encadrement : Encadrement théorique par le directeur de thèse. A la paillasse par un
technicien dédié au projet. Collaboration avec un ingénieur informaticien programmeur.
Thématique : Recherche des déterminants historiques et sélectifs de la distribution de la
diversité génomique lors d’un processus de différenciation et de spéciation.
Détail : La biodiversité se crée dans les populations, se distribue dans leurs populations filles,
qui peuvent ensuite se différencier, puis échanger secondairement de la diversité. Cette
dynamique qui peut mener à la spéciation est pour partie aléatoire et sous contingence
historique, pour partie déterminée par l’effet de la sélection naturelle. Les patrons de
coalescence des gènes dans et entre les populations (ou espèces proches) peuvent être inférés
par l’étude des variations de séquences d’ADN et nous renseignent sur la part de ces deux
types de déterminants. Nous pouvons ainsi appréhender l’implication de la sélection naturelle
dans le maintien, la ségrégation ou les mélanges de la diversité au cours d’évènements de
spéciation. Sur un organisme modèle tel que la souris, l’approche peut être génomique, et
faire le lien avec les caractéristiques du génome (organisation, recombinaison), et les aspects
fonctionnels (fonction et expression des gènes).
Profil recherché: Formation en génétique des populations et évolution moléculaire, et/ou en
bioinformatique.
Domaine : Biodiversité, génétique des populations, évolution moléculaire, génomique.
Objectif : La Biodiversité Trans-Spécifique (BTS) est la composante de la biodiversité neutre
et fonctionnelle commune entre les espèces, c’est à dire le polymorphisme nucléotidique
qu’elles partagent. La BTS neutre est générée par le maintien du polymorphisme ancestral,
des mutations récurrentes indépendantes ou encore par l’introgression génétique. La BTS
fonctionnelle est le résultat des mêmes processus, auxquels se surajoute l’effet de la sélection
naturelle qui peut soit accroître la BTS dans le cas de sélection balancée et d’introgression
adaptative, ou au contraire la diminuer dans le cas de sélection diversifiante et d’adaptation
locale. La comparaison des patrons de BTS neutre et fonctionnelle entre régions génomiques
est un moyen d’identifier ce qui appartient à la biodiversité fonctionnelle.
Les sous-espèces de la souris domestique (Mus musculus) seront notre modèle pour aborder
ces questions. Nous exploiterons les données de re-séquençage et de typage de SNPs (Single
Nucleotide Polymorphisms) des bases de données pour identifier des régions génomiques
candidates pour la BTS ou au contraire la différenciation entre sous-espèces. Une approche
expérimentale par séquençage permettra ensuite d’améliorer les données sur les régions
candidates, en augmentant l’échantillonnage de génomes sauvages, qui est encore très limité
dans les bases de données.
L’étude comparative des patrons de coalescence des différentes régions du génome permettra
de tester des hypothèses relatives à l’influence de la sélection sur la détermination des patrons
de différenciation et de BTS entre les sous-espèces, et donc de quantifier l’influence de la
sélection sur la distribution de la biodiversité lors d’un processus de différenciation et un
début de spéciation, en relation avec les caractéristiques génomiques telles que la
recombinaison, la localisation chromosomique (chromosomes sexuels et autosomes) et les
caractéristiques fonctionnelles des gènes étudiés (lieux d’expression, fonction biochimique,
processus biologique, réseaux métaboliques).
Mots clés : Evolution moléculaire
Génétique des populations
Sélection
Coalescence
Spéciation
Génomique
Souris
Contexte : La vision de l’histoire des spéciations, et donc de la génération de la biodiversité,
sous forme d’un pattern de dichotomies successives a longtemps prévalu. Elle permet de
rendre compte de l’évolution à long terme et des relations entre les grands groupes
d’organismes. Toutefois le processus de spéciation implique des populations de génomes
complexes, dont les différentes composantes peuvent avoir des histoires indépendantes, et
subir des contraintes contrastées. Il est donc peu probable que ce pattern dichotomique simple
puisse rendre compte d’un tel processus complexe et multidimensionnel. C’est pourtant bien
dans cette complexité que peut être décrit et compris le processus de spéciation, c'est-à-dire
que peuvent être identifiées les forces évolutives et les contingences historiques qui
conduisent à la diversification du vivant.
Nombreuses sont les controverses sur les reconstitutions phylogénétiques d’espèces, en
fonction du gène étudié ou de la méthode employée. Dans le cas de taxons proches, de telles
controverses s’avèrent vaines puisqu’il y a plus de raisons théoriques d’attendre des
discordances que des concordances entre régions du génome. L’ADN mitochondrial a
longtemps été le marqueur de choix pour les comparaisons entre espèces proches. Toutes les
études récentes comparatives avec d’autres composantes du génome ont révélé des
discordances (pour ne citer que quelques exemples, Bachtrog et al. 2006; Ballard 2000;
Boissinot and Boursot 1997; Chan and Levin 2005; Melo-Ferreira et al. 2005; Pidancier et al.
2006). De même, les comparaisons entre régions du génome nucléaire montrent parfois des
contrastes très saisissants (par exemple Machado and Hey 2003; Pollard et al. 2006). L’étude
de telles discordances est elle-même très instructive, beaucoup plus que de tenter à tout prix
de réconcilier phylogénie des gènes et des espèces. Dans un nombre grandissant de cas,
l’étude de ces discordances fait sens et permet par exemple de pointer des gènes ou régions du
génome candidats pour l’acquisition de l’isolement reproductif, comme par exemple chez la
drosophile (Ting et al. 2000) ou plus récemment entre l’homme et le chimpanzé (Patterson et
al. 2006). De telles études stimulent les développements théoriques associés permettant
l’analyse de ces données complexes dans un cadre statistique de plus en plus rigoureux (Hey
2006; Hey and Nielsen 2004), visant à déterminer l’influence de la démographie, de la
sélection et des échanges secondaires dans la détermination de la ségrégation de la diversité
entre taxons proches.
La souris domestique (Mus musculus) est un excellent modèle pour aborder ces questions. En
effet, plusieurs sous-espèces différenciées occupant des aires de distribution disjointes sont
reconnues. Elles sont issues d’une radiation géographique à partir d’une zone de
différenciation initiale située au Moyen-Orient et au nord du sous-continent Indien, et
présentent des incompatibilités génétiques partielles, traduisant un début d’acquisition
d’isolement reproductif (Boursot et al. 1993). Les données préliminaires montrent des patrons
contrastés suivant les régions du génome, depuis un large partage de polymorphisme jusqu’à
une différenciation complète. La très bonne connaissance du génome de cette espèce permet
d’envisager une approche de cette question à l’échelle du génome, et de faire le lien entre les
patrons de différenciation observés, les propriétés locales du génome, et la fonction des gènes
concernés.
Méthode : Analyse bioinformatique : Les nombreuses données de polymorphisme déjà
disponibles pour la souris, sous forme de reséquençages de génomes complets, et de typage de
SNPs (Single Nucleotide Polymorphisms) à haut débit, sur des génomes de lignées de
laboratoire, et certains génomes d’origine sauvage des différentes sous-espèces, serviront à
définir des régions candidates pour des patrons de coalescence contrastés entre sous-espèces.
Les lignées de laboratoire étant des hybrides entre les sous-espèces, l’étude des déséquilibres
de liaison entre fractions du génome d’origines taxonomiques différentes servira également à
détecter les régions fonctionnellement différenciées participant à des incompatibilités entre
génomes.
Les gènes contenus dans ces régions candidates seront ensuite analysés à la lumière des bases
de données d’ontologie des gènes, d’expression différentielle dans différents organes et au
cours du développement, et d’implication dans des réseaux métaboliques. Ceci permettra
d’affiner et de rationaliser le choix de régions et gènes candidats.
Séquençage : Les gènes candidats retenus par l’analyse bioinformatique seront séquencés
dans un panel représentatif des sous-espèces de la souris domestique. L’échantillonnage est
disponible au laboratoire.
Analyse des données de séquence : Les données de séquence seront analysées en utilisant la
batterie de logiciels de génétique des populations et de simulations existante, ainsi qu’avec les
nouveaux outils statistiques développés par les partenaires du projet ANR, qui viseront plus
spécifiquement à faire la part entre les différentes causes possibles de TSB (persistance de
polymorphisme ancestral neutre ou sous sélection diversifiante, introgression secondaire).
Résultat attendu : L’analyse bioinformatique des données de polymorphisme à l’échelle
génomique permettra de tester les corrélations entre les patrons de polymorphisme et de
divergence et divers paramètres d’intérêt : nature des chromosomes (sexuels ou autosomes),
intensité de la recombinaison, fonctions biologiques et patrons d’expression des gènes.
L’acquisition de nouvelles séquences de régions candidates permettra de vérifier sur un
meilleur échantillonnage de génomes les prédictions de l’analyse génomique. Ces données
permettront de tester les hypothèses sélectives émises, et de documenter des cas où la
sélection pourrait expliquer la différenciation, ou au contraire le maintien de polymorphisme
ancestral, ou encore l’introgression secondaire entre les sous-espèces.
Référence biblio : Bachtrog, D., K. Thornton, A. Clark, and P. Andolfatto. 2006. Extensive
introgression of mitochondrial DNA relative to nuclear genes in the Drosophila yakuba
species group. Evolution 60:292-302.
Ballard, J. W. O. 2000. When one is not enough: Introgression of mitochondrial DNA in
Drosophila. Molecular Biology and Evolution 17:1126-1130.
Boissinot, S., and P. Boursot. 1997. Discordant phylogeographic patterns between the Y
chromosome and mitochondrial DNA in the house mouse: selection on the Y chromosome?
Genetics 146:1019-1033.
Boursot, P., J.-C. Auffray, J. Britton-Davidian, and F. Bonhomme. 1993. The evolution of
house mice. Annual Review of Ecology and Systematics 24:119-152.
Chan, K. M. A., and S. A. Levin. 2005. LEAKY PREZYGOTIC ISOLATION AND
POROUS GENOMES: RAPID INTROGRESSION OF MATERNALLY INHERITED DNA.
Evolution 59:720-729.
Hey, J. 2006. Recent advances in assessing gene flow between diverging populations and
species. Current Opinion in Genetics & Development 16:592-596.
Hey, J., and R. Nielsen. 2004. Multilocus Methods for Estimating Population Sizes, Migration
Rates and Divergence Time, With Applications to the Divergence of Drosophila
pseudoobscura and D. persimilis. Genetics 167:747-760.
Machado, C. A., and J. Hey. 2003. The causes of phylogenetic conflict in a classic Drosophila
species group. Proc R Soc Lond B Biol Sci 270:1193-202.
Melo-Ferreira, J., P. Boursot, F. Suchentrunk, N. Ferrand, and P. C. Alves. 2005. Invasion
from the cold past: extensive introgression of mountain hare (Lepus timidus) mitochondrial
DNA into three other hare species in northern Iberia. Molecular Ecology 14:2459-2464.
Patterson, N., D. J. Richter, S. Gnerre, E. S. Lander, and D. Reich. 2006. Genetic evidence for
complex speciation of humans and chimpanzees. Nature 441:1103-1108.
Pidancier, N., S. Jordan, G. Luikart, and P. Taberlet. 2006. Evolutionary history of the genus
Capra (Mammalia, Artiodactyla): Discordance between mitochondrial DNA and Ychromosome phylogenies. Molecular Phylogenetics and Evolution 40:739-749.
Pollard, D. A., V. N. Iyer, A. M. Moses, and M. B. Eisen. 2006. Widespread Discordance of
Gene Trees with Species Tree in Drosophila: Evidence for Incomplete Lineage Sorting. PLoS
Genetics 2:e173.
Ting, C. T., S. C. Tsaur, and C. I. Wu. 2000. The phylogeny of closely related species as
revealed by the genealogy of a speciation gene, Odysseus. Proceedings of the National
Academy of Sciences of the United States of America 97:5313-5316.
Téléchargement