05-1 - David 13/04/06 9:31 Page 22 Dossier Génome et diversité ches les plantes cultivées Le regard de la génomique sur la diversité naturelle des plantes cultivées Les nouvelles technologies d’étude du génome explorent la diversité des plantes au niveau même de l’ADN. L’accumulation récente de données donne accès à de nouvelles connaissances sur l’histoire des plantes mises en culture par l’homme. L’étude de la diversité des plantes, notamment au niveau des gènes, permet de tester des théories évolutives sur le rôle de la sélection pour l’adaptation, avec des retombées qui permettront de repérer au sein même des gènes les nucléotides impliqués dans la variation des plantes entières et par-là même de décrypter les facteurs d’adaptation des plantes à leur environnement, naturel ou anthropique. * UMR Inra / Ensam / IRD Diversité et génome des plantes cultivées, Inra, Domaine de Melgueil, 34130 Mauguio [email protected] ** SGAP, Inra, Route de Saint Cyr, 78026 Versailles cedex [email protected] *** Cirad Montpellier, bât 3, BP 5035, 34032 Montpellier cedex 1 [email protected] Jacques David*, Olivier Loudet**, Jean-Christophe Glaszmann*** L a diversité des êtres vivants est spectaculaire. Nos repères naturels de perception de la diversité nous permettent d'apprécier l'étendue de l'adaptation des différentes formes, innombrables et entremêlées. La biodiversité s'exprime en particulier sous la forme d’espèces différentes, et d'individus différents au sein de la même espèce. Les observations directes, plus ou moins élaborées, de plantes nous révèlent des palettes de formes, de couleur, de taille, de vitesse de développement, de résistance aux maladies ou de réactions à d'autres facteurs environnementaux, qui sont autant de phénotypes. Pour les plantes sauvages, cette diversité est souvent interprétée comme le résultat d’une sélection pour l’adaptation à des conditions de vie ou de milieu contrastées. Par exemple, la production de graines d’une plante dépend de sa date de floraison. Ainsi, dans un milieu stressant, des plantes précoces pourront avoir 22 BIOFUTUR 266 • MAI 2006 plus de descendants que des plantes tardives (on parle d’une meilleure valeur sélective). Les plantes précoces y seront donc plus fréquemment rencontrées tandis que des plantes plus tardives s’épanouiront dans les environnements plus favorables. Pour autant, ce type d’adaptation est souvent difficile à mettre en évidence, et il est probable qu’une part importante de la diversité observée ne joue pas de rôle majeur dans l’adaptation des plantes. Celle-ci est alors considérée comme sélectivement neutre et évolue au gré du hasard. Pour les plantes cultivées, cette diversité prend le nom de ressources génétiques. Elle est utilisée par les améliorateurs des plantes depuis leur domestication, pour adapter ces dernières aux contraintes de l’agriculture et à ses évolutions successives. Pour les plantes sauvages, elle représente un réservoir d’innovation et d’adaptation. 05-1 - David 13/04/06 9:31 Page 23 La diversité trouve sa source dans l’ADN Nous disposons d'autres moyens d'appréhender cette diversité. Au niveau des plantes entières, les différences visibles se rapportent bien sûr à l’existence de variations génétiques codées dans l’ADN des individus, appelées polymorphismes. Ces variations sont créées par différents types de mutation, et certaines sont soumises à une sélection en rapport avec leur effet sur un comportement phénotypique. Toutefois, au niveau de l’ADN, la plupart des variations observées sont sélectivement neutres et ne confèrent a priori aucun avantage sélectif. La génomique fournit un grand nombre de marqueurs moléculaires, de différents types, permettant de révéler des polymorphismes sur l'ensemble du génome, de façon quasialéatoire aussi bien ciblée sur des gènes « candidats » ayant des fonctions présumées (encadré 1). Elle produit donc des outils très puissants pour étudier la diversité génétique des populations de nombreuses espèces sauvages et cultivées, en particulier pour en retracer l’histoire (phylogéographie) et en comprendre la dynamique (colonisation, isolement reproducteur, adaptation, déclin et disparition). Par exemple, les phylogénies entre espèces sont établies par comparaison de séquences de gènes. Elles permettent de vérifier si les taxonomies mises en place par les botanistes sur des critères floristiques se retrouvent au niveau du génome. Ce travail donne des indications sur les proximités génétiques entre espèces, permettant notamment d’identifier les ancêtres les plus probables des espèces cultivées, comme la téosinte (Zea diploperennis), espèce allogame*1 et ancêtre du maïs. Mieux comprendre l’histoire et le fonctionnement des populations En premier lieu, la diversité peut être comparée entre espèces. Ainsi, la téosinte possède une diversité bien supérieure à celle de l’orge sauvage (Hordeum spontaneum), elle-même supérieure à celle d’Arabidopsis thaliana (un polymorphisme toutes les 30 paires de bases) et celle du blé sauvage (Triticum dicoccoides), ces trois dernières espèces étant autogames. Allogamie et diversité génétique En général, les espèces allogames présentent une plus grande diversité génétique que les espèces autogames, résultat prédit par la théorie neutre de l’évolution sur la base du fait qu’un individu allogame (et diploïde) peut stocker à chaque locus deux allèles de deux parents différents, tandis qu’un individu issu d’une autofécondation hérite le plus souvent de deux copies du même allèle, du même parent. En d’autres termes, c’est la taille du réservoir utilisé pour stocker l’information allélique qui apparaît déterminante pour expliquer le niveau de diversité d’une espèce. On parle de taille génétique efficace. Les polymorphismes neutres sont donc de bons outils pour comprendre comment la diversité s’accumule dans une espèce ou dans ses populations et pour faire des prédictions sur le niveau global de diversité que l’on peut s’attendre à trouver à un locus quelconque. Les variants neutres issus des mutations (allèles) apparaissent constamment dans les populations. Leur fré- quence évolue selon des processus aléatoires au sein des populations sous l’effet de l’échantillonnage de gamètes pour passer d’une génération à l’autre (dérive génétique). Ils peuvent ainsi se fixer ou bien disparaître ; en raison de leur très faible fréquence, la plupart des mutants apparus à une génération n’ont que peu de chances d’être retrouvés dans la génération suivante. Plus le taux de mutation est élevé à un locus, plus le nombre d’allèles à ce locus va être important. Le rôle de la démographie La démographie est l’autre processus important qui module le niveau de diversité. Plus l’espèce compte d’individus, plus sa taille génétique efficace est grande et plus elle peut stocker d’allèles sans risquer de les perdre par la dérive génétique. Ainsi, les espèces distribuées sur une large aire depuis une longue période ont en général un niveau de diversité plus élevé que des espèces peu répandues. Encadré 1 - Les marqueurs moléculaires Pour révéler les variations, appelées polymorphismes, au niveau du génome, différents types de marqueurs moléculaires sont utilisés. Les premiers ont été les isozymes : certaines enzymes existent sous différentes formes alléliques distinguables par électrophorèse. Les marqueurs ADN ont pris le relais et de nombreuses techniques de révélation ont vu le jour. Les polymorphismes révélés sont de plus en plus nombreux dans le génome, de plus en plus faciles à utiliser. Aujourd'hui on utilise principalement les microsatellites, les SNP, les AFLP et les DArT. • Les microsatellites sont de courtes séquences (en général deux à quatre bases) répétées en tandem dans de nombreux sites au sein d'un génome. Leur spécificité d'emplacement est utilisée grâce à des amorces spécifiques. Leur polymorphisme repose sur le nombre de répétitions d’un motif répété. Selon les espèces, les microsatellites sont suffisamment nombreux pour permettre une bonne couverture du génome. Leur taux de mutation élevé les rend très polymorphes. Ils sont utilisés pour analyser la structure fine et la dynamique des populations (étude de parenté, évolution récente). • Les AFLP ( amplified fragment length polymorphisms), révélés par électrophorèse, ou les DArT (diversity array technology), révélés par hybridation sur puce à ADN, sont issus de la comparaison de représentations réduites du génome des individus analysés. Il s'agit de marqueurs anonymes (non ciblés) et généralement dominants, se prêtant moins facilement à la génétique des populations, mais ils ont l’avantage d’être nombreux, peu onéreux et de pouvoir s'appliquer à toute espèce sans investissement de séquençage préalable. Simples et rapides d'application, leur bonne couverture du génome les rend propices aux travaux de cartographie génétique. • Les SNP (single nucleotide polymorphisms) sont la forme la plus simple et la plus fréquente de polymorphisme. Ils correspondent à des variations de nucléotides au sein d’une séquence connue et localisée sur le génome, en général un gène d’intérêt. Pour l’instant, ils sont restreints à quelques espèces bénéficiant d’importants efforts de génomique : maïs, Arabidopsis, riz, blé, notamment. Chers à révéler, ils devraient cependant bénéficier rapidement de nouvelles technologies. Pour ces espèces, on disposera de SNP par dizaines de milliers pour des analyses nécessitant une couverture du génome très complète. Une application importante sera de déterminer la diversité allélique des gènes que l’on pense impliqués dans des caractères adaptatifs, et de repérer les formes les plus favorables. BIOFUTUR 266 • MAI 2006 23 *1 Dans une plante allogame, l'ovule d’une plante est fécondé par du pollen produit par une autre plante, par opposition à « autogame » (le pollen provient de la même plante que l’ovule). 05-1 - David 13/04/06 9:31 Page 24 Dossier Génome et diversité ches les plantes cultivées Toutefois, si l’espèce a connu une forte réduction de sa démographie dans un passé récent, sa diversité est réduite, et on parle alors de goulot d’étranglement. Ce phénomène de goulot est fréquent lors du passage des formes sauvages aux formes cultivées au cours de la domestication. Le goulot est également drastique lorsque l’espèce est issue d’un événement rare de polyploïdisation. Sa mise en évidence avec des marqueurs moléculaires a relancé l’intérêt de l’utilisation des populations sauvages, de nombreux allèles à des loci d’intérêt pouvant être disponibles dans les formes sauvages. À l’inverse, lorsque la population est en expansion, les allèles rares sont moins fréquemment perdus lors du passage d’une génération à l’autre, et la diversité augmente. Ainsi, l’observation d’un excès d’allèles rares fait penser qu’Arabidopsis thaliana est en expansion démographique et qu’elle a reconquis récemment l’Europe après la dernière glaciation à partir d’un foyer se situant en Asie. À partir de ces informations sur la structuration de la diversité, il est désormais possible d’améliorer les stratégies d’exploration de la diversité génétique pour des caractères difficiles ou coûteux à mesurer. L’idéal est de disposer du plus petit échantillon possible recelant la plus grande diversité génétique possible en moyenne sur l’ensemble du génome. Un tel échantillon reçoit le nom de core collection en anglais, de collection essentielle en français. Des simulations ont montré que des marqueurs neutres pouvaient être efficaces pour construire ces échantillons à condition que les populations échantillonnées de l’espèce soient relativement structurées génétiquement et isolées les unes des autres. Dans ce cas, l’information de diversité à un locus peut se révéler efficace pour prédire la diversité à d’autres loci même non physiquement proches. Appliquée à Arabidopsis thaliana, cette stratégie a permis de définir un lot de 48 lignées homozygotes fixées (accessions) qui est maintenant utilisé comme échantillon de référence pour étudier la diversité naturelle de l’espèce pour des caractères tels que la résistance au froid ou à la sécheresse (figure 1). L’objectif est de détecter les gènes et leurs allèles impliqués dans de nombreux caractères et ainsi de mieux comprendre comment une espèce comme A. thaliana s’adapte aux conditions très variables trouvées sur son aire de répartition, des contreforts de l’Himalaya aux îles du Cap vert. Ces lignées sont maintenues et régénérées avec le plus grand soin par l’Inra de Versailles, et distribuées à la communauté internationale. Une base de données et un site web permettent de centraliser et rendre accessible les informations acquises (1). Figure 1 Origine géographique de la core collection d’Arabidopsis Distribution mondiale des accessions d'Arabidopsis thaliana disponibles dans les centres de ressources (points rouges). Les 24 accessions identifiées en jaune correspondent à une core collection représentant l'essentiel de la diversité connue de l'espèce. © D.R. (1) http://dbsgap.versailles. inra.fr/vnat Les apports de l’informatique Les progrès des méthodes statistiques et l’accroissement vertigineux de la puissance de calcul des ordinateurs ont permis l’analyse massive de nouvelles données moléculaires. Par exemple, regrouper les individus partageant les mêmes combinaisons d’allèles à de nombreux loci a permis de retracer l’histoire et les voies de dispersion des plantes. Pour reprendre l’exemple d’A. thaliana, un gradient de dispersion depuis l’Asie jusqu’à la Méditerranée apparaît probable, ainsi que l'existence d’un refuge glaciaire en Espagne-Maroc. Ce refuge méditerranéen, comme celui se situant dans les Balkans, a également été clairement démontré pour de nombreuses autres espèces de plantes (comme le chêne par exemple) et de mammifères grâce à l’étude de la diversité moléculaire. Des outils pour rationaliser l’exploration de la diversité 24 BIOFUTUR 266 • MAI 2006 9:31 Page 25 D’énormes efforts de description de la diversité naturelle basés sur l’analyse des séquences de gènes ont été entrepris sur quelques espèces, la plupart d’importance agronomique, financés surtout par les États-Unis à travers les soutiens de la NSF (National Science Foundation). Sur Arabidopsis, 876 fragments de gènes ont été séquencés sur un échantillon de 96 individus. Sur le maïs, un effort similaire a été rendu public en 2005 et d’importants résultats sont attendus sur le riz et le blé. Le blé et la vigne ont également reçu une attention particulière de l’Inra, pour décrire leur diversité sur un nombre de marqueurs microsatellites important. Ainsi, l’ensemble des cépages conservés au Centre de ressources biologique de Montpellier a été génotypé, de même que 5 000 lignées de blés conservées au CRB de ClermontFerrand représentatives de la diversité mondiale. Programmes et consortiums Au-delà de ces efforts de recherche par séquençage haut-débit sur les gènes eux-mêmes, la communauté internationale a mis en place le challenge program « Generation » (2). C’est un programme du Groupe consultatif pour la recherche agronomique internationale qui focalise le développement et l'application de la génomique vers l'exploitation de la diversité génétique pour l’amélioration des plantes, en particulier celle présente dans les grandes collections internationales de plantes cultivées et leurs parents sauvages. Les organismes de recherche agronomique français sont membres du consortium fondateur sous la bannière d'Agropolis à Montpellier. Les principales cultures vivrières sont concernées (maïs, blés, riz, orge, sorgho, mil et millets divers, haricots, divers pois, arachide, niébé, manioc, pomme de terre, igname, bananier, cocotier) et le caractère cible prioritaire est la tolérance à la sécheresse. Il s'agit d'analyser en détail la diversité génétique, de déployer des analyses de génomique comparative, de gérer et exploiter les données produites dans un cadre bioinformatique performant et d'intégrer les résultats de recherche dans le développement de nouvelles variétés, le tout en partenariat étroit avec les utilisateurs dans les pays du Sud. Repérer la variation qui cause les différences phénotypiques, un défi Émerge ainsi une des questions les plus excitantes de la génétique en ce début du XXIe siècle. Dans l’ensemble de la diversité observée au niveau de l’ADN, quelle part de la variation tient un rôle adaptatif ? Peut-on identifier les bases nucléotidiques qui sont directement responsables de la variation phénotypique ? L’analyse de la diversité naturelle peut-elle nous aider à comprendre comment se construit un phénotype à partir de variations moléculaires à différents loci ? Cette question mobilise aujourd’hui une grande partie de la communauté des généticiens, quel que soit l’organisme sur lequel ces derniers travaillent, de l’humain jusqu’aux plantes. Cela consiste à chercher l’aiguille du polymorphisme causal dans la botte de foin du polymorphisme neutre. L’approche QTL Une des approches expérimentales employées pour ces études consiste à rechercher les QTL*2. Les cartes génétiques permettent de suivre la ségrégation des gènes dans Encadré 2 - Des polymorphismes « candidats » dans le gène opaque-2 chez le sorgho © LUCIO ALENCAR 13/04/06 Opaque-2 est un gène identifié d'abord chez le maïs, à partir d'une mutation qui produit un grain opaque. Il agit par activation de la transcription de certains gènes et régule en particulier l'expression d'un gène qui produit une zéine (une classe de protéines de réserve du maïs, Zea mays) de 22 kDa. Il fait partie d'une liste de gènes candidats pris en compte dans un projet associant GABI et Génoplante, les programmes nationaux de génomique végétale allemands et français, pour expliquer les variations de la teneur en protéines du grain chez les céréales. Chez le sorgho, les travaux sont conduits par Lucio Alencar, chercheur de l'université catholique de Brasilia, et Monique Deu du Cirad. Opaque-2 a été amplifié (sur une base de huit fragments, a à h) et séquencé pour un ensemble de variétés représentatives de la diversité du sorgho, révélant au total plus de 50 SNP et plusieurs indels (insertions/délétions) le long des 4,3 kb analysés, qui recouvrent une région amont de 1,5 kb et la partie codante de 2,8 kb, faite de six exons (régions codantes du gène) et cinq introns (non codants). En utilisant 188 variétés pour lesquelles on dispose de plus de 80 % de la séquence (les données sont incomplètes pour le segment f), on relève un déséquilibre de liaison fort, avec seulement 22 haplotypes différents (sur un total de 256 possibles) qui se répartissent en six groupes d'effectif important, appartenant à deux grands types très différents (groupes 1 à 5 et groupe 6). Certains haplotypes sont spécifiques d'une race (comme les Guinea margaritiferum) ou d'une provenance (comme l'Afrique australe) et donc révèlent essentiellement des éléments de structure. D'autres se répartissent sur un grand ensemble de types variétaux et l'effet de leur présence/absence sur le phénotype des variétés peut être testé efficacement. Les mêmes variétés sont évaluées pour de nombreuses caractéristiques du grain. © D.R. 05-1 - David les descendances en couvrant l'ensemble du génome. Tout comme le polymorphisme moléculaire des gènes, ou un caractère phénotypique simple (la couleur, par exemple), les caractères quantitatifs (taille de la plante, nombre de graines, etc.) peuvent être mesurés dans la descendance d’un croisement entre deux plantes. On peut ainsi déterminer si le ou les caractères quantitatifs étudiés sont associés de manière statistiquement significative à une zone chromosomique particulière repérée par les marqueurs moléculaires qui s’y trouvent, et dont la ségrégation a aussi été suivie dans cette même descendance. Cela donne un pouvoir de résolution supérieur à celui de l'analyse des ségrégations génétiques dans les descendances, qui permet de repérer les différentes zones du génome impliquées dans l'élaboration de caractères quantitatifs complexes et de les classer selon leur effet sur le caractère. BIOFUTUR 266 • MAI 2006 25 *2 Quantitative trait loci, zone chromosomique qui contrôle la valeur d'un caractère. (2) CPG, www.generationcp.org 05-1 - David 13/04/06 9:31 Page 26 Dossier Génome et diversité ches les plantes cultivées Tsukuba au Japon est parvenue à cloner plusieurs QTL dans le cadre d'une analyse systématique de la diversité naturelle de contrôle de la floraison (4). Elle a ainsi révélé des gènes orthologues de gènes connus chez Arabidopsis thaliana (Hd1, RFT1), mais aussi des gènes sans équivalent connu aujourd’hui (Ehd1, Hd5, Hd6, Lhd4). Encadré 3 - La diversité génétique du riz © J.-C. G. Cigalon – Camargue Basmati 370 – Inde, Pakistan (parfumé) Inca (Ciat-Cirad) Ram tulasi, Inde Khao Youak, Laos (waxy) Irat 216 – Cirad Khao Dawk Mali 105 Thaïlande, jasmin (parfumé) Le riz, culture vivrière de premier rang mais aussi modèle pour l'analyse génétique des céréales, est la deuxième plante à avoir eu son génome séquencé. Le Génoscope a assuré le séquençage de l’un de ses 12 chromosomes. L'espèce asiatique assure plus de 95 % de la production. Toutes les générations de marqueurs moléculaires s'accordent pour lui attribuer une origine multiple, avec des domestications en Chine (type japonica) comme en Inde (type indica), qui expliquerait son extraordinaire diversité adaptative et agromorphologique. Grâce à la disponibilité des séquences de plusieurs variétés, on dispose de centaines de milliers de SNP couvrant l'ensemble du génome. Les estimations de DL montrent des associations s'étendant jusqu'à 100 kb, sans compter le DL d'introgression qui caractérise les interfaces issues de recombinaison entre groupes variétaux. La variation de séquence au niveau de gènes impliqués dans des caractères importants comme la qualité du grain (gène waxy, dont un allèle rend le riz glutineux) permet de jumeler analyses biochimiques, génétiques, évolutives et ethnologiques. Ainsi, la mutation responsable du grain glutineux induit l'absence d'amylose (une composante particulière de l'amidon) par défaut d'épissage de l'ARN messager correspondant. Elle est apparue et a été sélectionnée dans le type japonica avant de se répandre dans le type indica sous l'action des flux polliniques et de la sélection opérée par les riziculteurs d'Asie du Sud-Est. De la même façon, l'arôme de certains riz est essentiellement contrôlé par une délétion de huit paires de bases dans un gène de bétaïne aldéhyde déshydrogénase. Il semble qu'elle ne soit apparue qu'une fois et se soit répandue au sein de différents types variétaux pour donner les différents riz basmati de l'Inde et du Pakistan et les riz parfumés de Thaïlande (indica) ou des Philippines (japonica). *3 Distance génétique, 1 cM équivaut à 1 % de recombinaison pendant la méiose. (3) Frany A et al. (2003) Genome 46,235-43 (4) Li Z et al. (2003) Plant Phys Biochem 42, 1-6 Il existe aujourd'hui d'importants répertoires de QTL sur de nombreuses espèces. Les réussites les plus spectaculaires sont probablement le repérage d'allèles favorables (quantitative trait alleles) dans les espèces sauvages pour des caractères pourtant supérieurs chez l'espèce cultivée, ainsi que l'identification de gènes nouveaux grâce au clonage de QTL. Après une quinzaine d'années de travaux sur l'exploitation des espèces sauvages pour l'amélioration de la tomate, Steve Tanksley de l'université de Cornell aux États-Unis constate qu'un cinquième des loci identifiés à partir d'une analyse QTL présente une forme allélique plus favorable dans le parent sauvage que dans le parent cultivé et que la source est loin de se tarir, chaque nouvelle espèce sauvage utilisée, même éloignée, apportant son lot de nouveaux allèles (3). Sur le riz, la disponibilité de la séquence du génome facilite le clonage de QTL. L'équipe de Masahiro Yano au National Institute of Agrobiological Sciences de 26 BIOFUTUR 266 • MAI 2006 La génétique d’association Se développent également différentes approches regroupées sous le terme de génétique d'association. La première consiste à cibler l'analyse de la diversité moléculaire au niveau de gènes candidats, de façon à inventorier toutes les formes alléliques présentes dans un échantillon donné (encadré 2), et à rechercher les associations apparentes entre profil moléculaire et expression phénotypique. On espère ainsi valider le fait qu'un gène candidat donné est important sur le plan fonctionnel et repérer les formes alléliques les plus « favorables » (encadré 3). L'approche complémentaire procède au contraire à un balisage complet et sans a priori du génome, et tire avantage de ce qu'on appelle le déséquilibre de liaison (DL). Celui-ci vient du fait que les gènes sont liés entre eux par l’organisation physique des chromosomes. Se créent alors des propriétés d’association particulières entre les polymorphismes à des loci différents, avec une dépendance statistique globalement plus forte entre loci liés sur le même chromosome (figure 2). Par exemple, entre deux loci présentant chacun un polymorphisme à deux allèles (A/a et B/b), l'allèle A au premier locus sera plus fréquemment associé à l’allèle B qu’à l’allèle b au second locus (avec l'association complémentaire entre l'allèle a et l'allèle b). Si les allèles B et b sont in fine responsables d’une part de la variation d’un caractère, par exemple si les individus BB sont plus précoces que les individus bb, alors les individus AA seront aussi plus précoces que les aa puisque A est associé statistiquement à B. La probabilité d’avoir un marqueur (locus A) lié au polymorphisme causal (locus B) augmente avec la densité de marquage et l’étendue du DL autour du locus B. Le déséquilibre de liaison se crée par la mutation, la dérive génétique, la sélection et la différenciation entre populations, et il est cassé par la recombinaison lors de la méiose chez les individus hétérozygotes. Il en résulte une possibilité de cartographier le génome en utilisant des échantillons de plantes dont on connaît l’histoire évolutive. Les recombinaisons s’accumulent au cours des générations et l’étendue du DL finit par décroître pour arriver à son point d’équilibre. L’étendue cartographique du DL varie considérablement d’une espèce à l’autre. Le DL s'étend couramment au-delà de la centaine de kilobases (kb) chez les variétés traditionnelles de céréales, de 50 à 250 kb chez A. thaliana, et quelques kilobases chez le maïs. Il peut parfois atteindre plusieurs dizaines de centimorgans*3 (un quart de chromosome) chez les cultivars modernes issus d'amélioration génétique récente. Quelques résultats Ainsi, les premiers résultats sur le maïs ou le riz sont encourageants sur des régions ciblées. Chez le maïs, un polymorphisme a été trouvé au sein du gène Dwarf8 comme potentiellement responsable de la durée de développement. De même, Susan McCouch (université Cornell) conclue de ses études sur la 05-1 - David 13/04/06 9:31 Page 27 diversité dans les variétés traditionnelles de riz que le génotypage d’une centaine de lignées de type Aus lui avait permis de resserrer très efficacement la zone d’étude autour d’un gène de résistance à une bactérie (xa5) alors qu’il lui aurait fallu beaucoup plus d’individus et de marqueurs pour arriver à ce résultat avec un croisement classique (5). Lorsque des données sont disponibles sur l’ensemble du génome pour un échantillon de plantes d’une centaine d’individus, une approche plus systématique peut être entreprise comme cela vient d’être fait sur Arabidopsis thaliana dans l’équipe de Magnus Nordborg en Californie (6) . Si le nombre de faux positifs reste élevé, des gènes majeurs déjà connus pour être impliqués dans la floraison (FRI) et la résistance aux pathogènes (Rpm1, Rps5 et Rps2) ont été retrouvés. Cela montre qu’en caractérisant ces lignées pour de nombreux caractères, la génétique d’association pourra se révéler un outil précieux pour découvrir de nouveaux gènes candidats impliqués dans divers processus et interpréter les différences fonctionnelles entre les allèles. Pour réduire le nombre de faux positifs, l’utilisation de l’information des polymorphismes neutres est essentielle, elle permet de repérer les structures de populations dues à l’histoire (réduction et expansion démographique) et au fonctionnement des populations (régime de reproduction, dispersion et flux géniques). Par exemple, si un gradient climatique se confond avec une voie de colonisation suivie par l’espèce, de nombreux marqueurs neutres, même non liés physiquement au polymorphisme adaptatif, seront liés par hasard à la variation adap- tative au gradient climatique. La connaissance de l’histoire évolutive permet de corriger les modèles de génétique d’association. Créer artificiellement de la diversité ? (5) Blair MW et al. (2003) Les généticiens tentent même aujourd’hui de rivaliser avec la nature pour générer artificiellement de nouveaux allèles de gènes d’intérêt et les trier en fonction de leur impact sur le phénotype. En soumettant un génotype de référence à un agent chimique (EMS) qui a la propriété de créer de nombreuses mutations ponctuelles, ils créent des populations de mutants porteurs de nombreux allèles nouveaux qu’il est possible de trier selon des critères phénotypiques, après leur identification à un locus donné par tilling (7). L’avenir nous dira si cette néo-diversité (encore très coûteuse) pourra se comparer avec celle issue de l’accumulation millénaire de mutations spontanées, recombinées et triées par la sélection naturelle. Ainsi, l’étude de la diversité naturelle des plantes, sauvages ou cultivées, permet de comprendre comment les facteurs évolutifs agissent sur le vivant pour le façonner et l’adapter à des conditions de milieux variables et changeantes. L'accès au fondement moléculaire de la variation adaptative et les succès de la génomique comparative dans une perspective évolutive permettront d'entreprendre une synthèse des différentes voies d'adaptation explorées par les différentes espèces. La diversité génétique est à la fois une ressource indispensable à l’amélioration des plantes et une source fertile d’interrogation sur le vivant. G © D.R. Figure 2 La génétique d’association : associer la diversité génétique avec la variation phénotypique BIOFUTUR 266 • MAI 2006 27 Theor Appl Genet 107, 62-73 (6) Aranzana MJ et al. (2005) PloS 1 (5), e60 (7) Bouchez D et al. (2006) Biofutur 265, 38-44