05-1 - David - INRA Versailles

publicité
05-1 - David
13/04/06
9:31
Page 22
Dossier Génome et diversité ches les plantes cultivées
Le regard de la génomique
sur la diversité naturelle
des plantes cultivées
Les nouvelles technologies d’étude du génome explorent la diversité des
plantes au niveau même de l’ADN. L’accumulation récente de données
donne accès à de nouvelles connaissances sur l’histoire des plantes mises
en culture par l’homme. L’étude de la diversité des plantes, notamment
au niveau des gènes, permet de tester des théories évolutives sur le rôle
de la sélection pour l’adaptation, avec des retombées qui permettront
de repérer au sein même des gènes les nucléotides impliqués dans la
variation des plantes entières et par-là même de décrypter les facteurs
d’adaptation des plantes à leur environnement, naturel ou anthropique.
* UMR Inra / Ensam /
IRD Diversité et génome
des plantes cultivées, Inra,
Domaine de Melgueil,
34130 Mauguio
[email protected]
** SGAP, Inra,
Route de Saint Cyr,
78026 Versailles cedex
[email protected]
*** Cirad Montpellier,
bât 3, BP 5035,
34032 Montpellier cedex 1
[email protected]
Jacques David*, Olivier Loudet**, Jean-Christophe Glaszmann***
L
a diversité des êtres vivants est spectaculaire. Nos
repères naturels de perception de la diversité nous
permettent d'apprécier l'étendue de l'adaptation
des différentes formes, innombrables et entremêlées.
La biodiversité s'exprime en particulier sous la forme
d’espèces différentes, et d'individus différents au sein de
la même espèce. Les observations directes, plus ou moins
élaborées, de plantes nous révèlent des palettes de formes,
de couleur, de taille, de vitesse de développement, de résistance aux maladies ou de réactions à d'autres facteurs
environnementaux, qui sont autant de phénotypes.
Pour les plantes sauvages, cette diversité est souvent
interprétée comme le résultat d’une sélection pour
l’adaptation à des conditions de vie ou de milieu
contrastées. Par exemple, la production de graines
d’une plante dépend de sa date de floraison. Ainsi, dans
un milieu stressant, des plantes précoces pourront avoir
22 BIOFUTUR 266 • MAI 2006
plus de descendants que des plantes tardives (on parle
d’une meilleure valeur sélective). Les plantes précoces
y seront donc plus fréquemment rencontrées tandis
que des plantes plus tardives s’épanouiront dans les
environnements plus favorables.
Pour autant, ce type d’adaptation est souvent difficile
à mettre en évidence, et il est probable qu’une part
importante de la diversité observée ne joue pas de rôle
majeur dans l’adaptation des plantes. Celle-ci est alors
considérée comme sélectivement neutre et évolue au
gré du hasard. Pour les plantes cultivées, cette diversité prend le nom de ressources génétiques. Elle est utilisée par les améliorateurs des plantes depuis leur
domestication, pour adapter ces dernières aux
contraintes de l’agriculture et à ses évolutions successives. Pour les plantes sauvages, elle représente un
réservoir d’innovation et d’adaptation.
05-1 - David
13/04/06
9:31
Page 23
La diversité trouve sa source dans l’ADN
Nous disposons d'autres moyens d'appréhender cette
diversité. Au niveau des plantes entières, les différences
visibles se rapportent bien sûr à l’existence de variations génétiques codées dans l’ADN des individus,
appelées polymorphismes. Ces variations sont créées
par différents types de mutation, et certaines sont soumises à une sélection en rapport avec leur effet sur un
comportement phénotypique.
Toutefois, au niveau de l’ADN, la plupart des variations observées sont sélectivement neutres et ne confèrent a priori aucun avantage sélectif. La génomique
fournit un grand nombre de marqueurs moléculaires,
de différents types, permettant de révéler des polymorphismes sur l'ensemble du génome, de façon quasialéatoire aussi bien ciblée sur des gènes « candidats »
ayant des fonctions présumées (encadré 1). Elle produit
donc des outils très puissants pour étudier la diversité
génétique des populations de nombreuses espèces
sauvages et cultivées, en particulier pour en retracer
l’histoire (phylogéographie) et en comprendre la dynamique (colonisation, isolement reproducteur, adaptation, déclin et disparition).
Par exemple, les phylogénies entre espèces sont établies par comparaison de séquences de gènes. Elles permettent de vérifier si les taxonomies mises en place par
les botanistes sur des critères floristiques se retrouvent
au niveau du génome. Ce travail donne des indications
sur les proximités génétiques entre espèces, permettant
notamment d’identifier les ancêtres les plus probables
des espèces cultivées, comme la téosinte (Zea diploperennis), espèce allogame*1 et ancêtre du maïs.
Mieux comprendre l’histoire
et le fonctionnement des populations
En premier lieu, la diversité peut être comparée entre
espèces. Ainsi, la téosinte possède une diversité bien
supérieure à celle de l’orge sauvage (Hordeum spontaneum), elle-même supérieure à celle d’Arabidopsis
thaliana (un polymorphisme toutes les 30 paires de
bases) et celle du blé sauvage (Triticum dicoccoides),
ces trois dernières espèces étant autogames.
Allogamie et diversité génétique
En général, les espèces allogames présentent une plus
grande diversité génétique que les espèces autogames,
résultat prédit par la théorie neutre de l’évolution sur
la base du fait qu’un individu allogame (et diploïde)
peut stocker à chaque locus deux allèles de deux parents
différents, tandis qu’un individu issu d’une autofécondation hérite le plus souvent de deux copies du
même allèle, du même parent. En d’autres termes, c’est
la taille du réservoir utilisé pour stocker l’information
allélique qui apparaît déterminante pour expliquer
le niveau de diversité d’une espèce. On parle de taille
génétique efficace.
Les polymorphismes neutres sont donc de bons outils
pour comprendre comment la diversité s’accumule dans
une espèce ou dans ses populations et pour faire des
prédictions sur le niveau global de diversité que l’on
peut s’attendre à trouver à un locus quelconque. Les
variants neutres issus des mutations (allèles) apparaissent constamment dans les populations. Leur fré-
quence évolue selon des processus aléatoires au sein
des populations sous l’effet de l’échantillonnage de
gamètes pour passer d’une génération à l’autre (dérive
génétique). Ils peuvent ainsi se fixer ou bien disparaître ;
en raison de leur très faible fréquence, la plupart des
mutants apparus à une génération n’ont que peu de
chances d’être retrouvés dans la génération suivante.
Plus le taux de mutation est élevé à un locus, plus le
nombre d’allèles à ce locus va être important.
Le rôle de la démographie
La démographie est l’autre processus important qui
module le niveau de diversité. Plus l’espèce compte
d’individus, plus sa taille génétique efficace est grande
et plus elle peut stocker d’allèles sans risquer de les
perdre par la dérive génétique. Ainsi, les espèces distribuées sur une large aire depuis une longue période
ont en général un niveau de diversité plus élevé que des
espèces peu répandues.
Encadré 1 - Les marqueurs moléculaires
Pour révéler les variations, appelées polymorphismes, au
niveau du génome, différents types de marqueurs moléculaires sont utilisés. Les premiers ont été les isozymes : certaines enzymes existent sous différentes formes alléliques
distinguables par électrophorèse. Les marqueurs ADN ont
pris le relais et de nombreuses techniques de révélation ont
vu le jour. Les polymorphismes révélés sont de plus en plus
nombreux dans le génome, de plus en plus faciles à utiliser.
Aujourd'hui on utilise principalement les microsatellites, les
SNP, les AFLP et les DArT.
• Les microsatellites sont de courtes séquences (en général deux à quatre bases) répétées en tandem dans de nombreux sites au sein d'un génome. Leur spécificité d'emplacement est utilisée grâce à des amorces spécifiques. Leur
polymorphisme repose sur le nombre de répétitions d’un
motif répété. Selon les espèces, les microsatellites sont
suffisamment nombreux pour permettre une bonne couverture du génome. Leur taux de mutation élevé les rend très
polymorphes. Ils sont utilisés pour analyser la structure
fine et la dynamique des populations (étude de parenté,
évolution récente).
• Les AFLP ( amplified fragment length polymorphisms),
révélés par électrophorèse, ou les DArT (diversity array technology), révélés par hybridation sur puce à ADN, sont issus
de la comparaison de représentations réduites du génome
des individus analysés. Il s'agit de marqueurs anonymes
(non ciblés) et généralement dominants, se prêtant moins
facilement à la génétique des populations, mais ils ont
l’avantage d’être nombreux, peu onéreux et de pouvoir s'appliquer à toute espèce sans investissement de séquençage
préalable. Simples et rapides d'application, leur bonne couverture du génome les rend propices aux travaux de cartographie génétique.
• Les SNP (single nucleotide polymorphisms) sont la forme
la plus simple et la plus fréquente de polymorphisme. Ils
correspondent à des variations de nucléotides au sein d’une
séquence connue et localisée sur le génome, en général un
gène d’intérêt. Pour l’instant, ils sont restreints à quelques
espèces bénéficiant d’importants efforts de génomique :
maïs, Arabidopsis, riz, blé, notamment. Chers à révéler, ils
devraient cependant bénéficier rapidement de nouvelles
technologies. Pour ces espèces, on disposera de SNP par
dizaines de milliers pour des analyses nécessitant une couverture du génome très complète. Une application importante sera de déterminer la diversité allélique des gènes que
l’on pense impliqués dans des caractères adaptatifs, et de
repérer les formes les plus favorables.
BIOFUTUR 266 • MAI 2006 23
*1 Dans une plante allogame,
l'ovule d’une plante est
fécondé par du pollen produit
par une autre plante,
par opposition à « autogame »
(le pollen provient de la même
plante que l’ovule).
05-1 - David
13/04/06
9:31
Page 24
Dossier Génome et diversité ches les plantes cultivées
Toutefois, si l’espèce a connu une forte réduction de sa
démographie dans un passé récent, sa diversité est
réduite, et on parle alors de goulot d’étranglement. Ce
phénomène de goulot est fréquent lors du passage des
formes sauvages aux formes cultivées au cours de la
domestication. Le goulot est également drastique
lorsque l’espèce est issue d’un événement rare de polyploïdisation. Sa mise en évidence avec des marqueurs
moléculaires a relancé l’intérêt de l’utilisation des populations sauvages, de nombreux allèles à des loci d’intérêt pouvant être disponibles dans les formes sauvages.
À l’inverse, lorsque la population est en expansion, les
allèles rares sont moins fréquemment perdus lors du
passage d’une génération à l’autre, et la diversité augmente. Ainsi, l’observation d’un excès d’allèles rares
fait penser qu’Arabidopsis thaliana est en expansion
démographique et qu’elle a reconquis récemment
l’Europe après la dernière glaciation à partir d’un foyer
se situant en Asie.
À partir de ces informations sur la structuration de
la diversité, il est désormais possible d’améliorer les
stratégies d’exploration de la diversité génétique pour
des caractères difficiles ou coûteux à mesurer. L’idéal
est de disposer du plus petit échantillon possible recelant la plus grande diversité génétique possible en
moyenne sur l’ensemble du génome. Un tel échantillon
reçoit le nom de core collection en anglais, de collection essentielle en français.
Des simulations ont montré que des marqueurs neutres
pouvaient être efficaces pour construire ces échantillons
à condition que les populations échantillonnées de l’espèce soient relativement structurées génétiquement
et isolées les unes des autres. Dans ce cas, l’information de diversité à un locus peut se révéler efficace pour
prédire la diversité à d’autres loci même non physiquement proches.
Appliquée à Arabidopsis thaliana, cette stratégie a permis de définir un lot de 48 lignées homozygotes fixées
(accessions) qui est maintenant utilisé comme échantillon de référence pour étudier la diversité naturelle
de l’espèce pour des caractères tels que la résistance au
froid ou à la sécheresse (figure 1). L’objectif est de détecter les gènes et leurs allèles impliqués dans de nombreux
caractères et ainsi de mieux comprendre comment une
espèce comme A. thaliana s’adapte aux conditions très
variables trouvées sur son aire de répartition, des contreforts de l’Himalaya aux îles du Cap vert.
Ces lignées sont maintenues et régénérées avec le plus
grand soin par l’Inra de Versailles, et distribuées à la
communauté internationale. Une base de données et
un site web permettent de centraliser et rendre accessible les informations acquises (1).
Figure 1 Origine géographique de la core collection d’Arabidopsis
Distribution mondiale des accessions d'Arabidopsis thaliana disponibles dans les centres de ressources (points rouges).
Les 24 accessions identifiées en jaune correspondent à une core collection représentant l'essentiel de la diversité connue
de l'espèce.
© D.R.
(1) http://dbsgap.versailles.
inra.fr/vnat
Les apports de l’informatique
Les progrès des méthodes statistiques et l’accroissement vertigineux de la puissance de calcul des ordinateurs ont permis l’analyse massive de nouvelles
données moléculaires. Par exemple, regrouper les individus partageant les mêmes combinaisons d’allèles à
de nombreux loci a permis de retracer l’histoire et
les voies de dispersion des plantes. Pour reprendre
l’exemple d’A. thaliana, un gradient de dispersion
depuis l’Asie jusqu’à la Méditerranée apparaît probable, ainsi que l'existence d’un refuge glaciaire en
Espagne-Maroc. Ce refuge méditerranéen, comme celui
se situant dans les Balkans, a également été clairement
démontré pour de nombreuses autres espèces de plantes
(comme le chêne par exemple) et de mammifères grâce
à l’étude de la diversité moléculaire.
Des outils pour rationaliser
l’exploration de la diversité
24 BIOFUTUR 266 • MAI 2006
9:31
Page 25
D’énormes efforts de description de la diversité naturelle
basés sur l’analyse des séquences de gènes ont été entrepris sur quelques espèces, la plupart d’importance agronomique, financés surtout par les États-Unis à travers
les soutiens de la NSF (National Science Foundation).
Sur Arabidopsis, 876 fragments de gènes ont été séquencés sur un échantillon de 96 individus. Sur le maïs, un
effort similaire a été rendu public en 2005 et d’importants résultats sont attendus sur le riz et le blé.
Le blé et la vigne ont également reçu une attention particulière de l’Inra, pour décrire leur diversité sur un
nombre de marqueurs microsatellites important. Ainsi,
l’ensemble des cépages conservés au Centre de ressources
biologique de Montpellier a été génotypé, de même que
5 000 lignées de blés conservées au CRB de ClermontFerrand représentatives de la diversité mondiale.
Programmes et consortiums
Au-delà de ces efforts de recherche par séquençage
haut-débit sur les gènes eux-mêmes, la communauté
internationale a mis en place le challenge program
« Generation » (2). C’est un programme du Groupe
consultatif pour la recherche agronomique internationale qui focalise le développement et l'application
de la génomique vers l'exploitation de la diversité génétique pour l’amélioration des plantes, en particulier
celle présente dans les grandes collections internationales de plantes cultivées et leurs parents sauvages.
Les organismes de recherche agronomique français sont
membres du consortium fondateur sous la bannière
d'Agropolis à Montpellier. Les principales cultures
vivrières sont concernées (maïs, blés, riz, orge, sorgho,
mil et millets divers, haricots, divers pois, arachide,
niébé, manioc, pomme de terre, igname, bananier, cocotier) et le caractère cible prioritaire est la tolérance à la
sécheresse. Il s'agit d'analyser en détail la diversité génétique, de déployer des analyses de génomique comparative, de gérer et exploiter les données produites dans
un cadre bioinformatique performant et d'intégrer les
résultats de recherche dans le développement de nouvelles variétés, le tout en partenariat étroit avec les utilisateurs dans les pays du Sud.
Repérer la variation qui cause
les différences phénotypiques, un défi
Émerge ainsi une des questions les plus excitantes de la
génétique en ce début du XXIe siècle. Dans l’ensemble de
la diversité observée au niveau de l’ADN, quelle part
de la variation tient un rôle adaptatif ? Peut-on identifier
les bases nucléotidiques qui sont directement responsables
de la variation phénotypique ? L’analyse de la diversité
naturelle peut-elle nous aider à comprendre comment se
construit un phénotype à partir de variations moléculaires
à différents loci ?
Cette question mobilise aujourd’hui une grande partie de
la communauté des généticiens, quel que soit l’organisme
sur lequel ces derniers travaillent, de l’humain jusqu’aux
plantes. Cela consiste à chercher l’aiguille du polymorphisme
causal dans la botte de foin du polymorphisme neutre.
L’approche QTL
Une des approches expérimentales employées pour ces
études consiste à rechercher les QTL*2. Les cartes génétiques permettent de suivre la ségrégation des gènes dans
Encadré 2 - Des polymorphismes « candidats »
dans le gène opaque-2 chez le sorgho
© LUCIO ALENCAR
13/04/06
Opaque-2 est un gène identifié
d'abord chez le maïs, à partir d'une
mutation qui produit un grain opaque.
Il agit par activation de la transcription de certains gènes et régule en
particulier l'expression d'un gène qui
produit une zéine (une classe de protéines de réserve du maïs, Zea mays)
de 22 kDa. Il fait partie d'une liste de
gènes candidats pris en compte dans
un projet associant GABI et Génoplante, les programmes nationaux de
génomique végétale allemands et
français, pour expliquer les variations
de la teneur en protéines du grain
chez les céréales.
Chez le sorgho, les travaux sont
conduits par Lucio Alencar, chercheur de l'université catholique de Brasilia, et Monique Deu du Cirad. Opaque-2 a été amplifié
(sur une base de huit fragments, a à h) et séquencé pour un ensemble de variétés représentatives de la diversité du sorgho, révélant au total plus de 50 SNP et plusieurs indels (insertions/délétions) le long des 4,3 kb analysés, qui recouvrent une région amont de 1,5 kb et la
partie codante de 2,8 kb, faite de six exons (régions codantes du gène) et cinq introns (non
codants).
En utilisant 188 variétés pour lesquelles on dispose de plus de 80 % de la séquence (les données sont incomplètes pour le segment f), on relève un déséquilibre de liaison fort, avec seulement 22 haplotypes différents (sur un total de 256 possibles) qui se répartissent en six
groupes d'effectif important, appartenant à deux grands types très différents (groupes 1 à 5
et groupe 6). Certains haplotypes sont spécifiques d'une race (comme les Guinea margaritiferum) ou d'une provenance (comme l'Afrique australe) et donc révèlent essentiellement des
éléments de structure. D'autres se répartissent sur un grand ensemble de types variétaux et
l'effet de leur présence/absence sur le phénotype des variétés peut être testé efficacement.
Les mêmes variétés sont évaluées pour de nombreuses caractéristiques du grain.
© D.R.
05-1 - David
les descendances en couvrant l'ensemble du génome.
Tout comme le polymorphisme moléculaire des gènes,
ou un caractère phénotypique simple (la couleur, par
exemple), les caractères quantitatifs (taille de la plante,
nombre de graines, etc.) peuvent être mesurés dans
la descendance d’un croisement entre deux plantes. On
peut ainsi déterminer si le ou les caractères quantitatifs
étudiés sont associés de manière statistiquement significative à une zone chromosomique particulière repérée par les marqueurs moléculaires qui s’y trouvent, et
dont la ségrégation a aussi été suivie dans cette même
descendance.
Cela donne un pouvoir de résolution supérieur à celui
de l'analyse des ségrégations génétiques dans les descendances, qui permet de repérer les différentes zones
du génome impliquées dans l'élaboration de caractères
quantitatifs complexes et de les classer selon leur effet
sur le caractère.
BIOFUTUR 266 • MAI 2006 25
*2 Quantitative trait loci, zone
chromosomique qui contrôle
la valeur d'un caractère.
(2) CPG, www.generationcp.org
05-1 - David
13/04/06
9:31
Page 26
Dossier Génome et diversité ches les plantes cultivées
Tsukuba au Japon est parvenue à cloner plusieurs QTL
dans le cadre d'une analyse systématique de la diversité
naturelle de contrôle de la floraison (4). Elle a ainsi révélé
des gènes orthologues de gènes connus chez Arabidopsis
thaliana (Hd1, RFT1), mais aussi des gènes sans équivalent connu aujourd’hui (Ehd1, Hd5, Hd6, Lhd4).
Encadré 3 - La diversité génétique du riz
© J.-C. G.
œ
Cigalon – Camargue
Basmati 370 – Inde, Pakistan (parfumé)
Inca (Ciat-Cirad)
œ
Ram tulasi, Inde
Khao Youak, Laos (waxy)
Irat 216 – Cirad
Khao Dawk Mali 105
Thaïlande, jasmin (parfumé)
Le riz, culture vivrière de premier rang mais aussi modèle pour l'analyse génétique des céréales,
est la deuxième plante à avoir eu son génome séquencé. Le Génoscope a assuré le séquençage de l’un de ses 12 chromosomes. L'espèce asiatique assure plus de 95 % de la production. Toutes les générations de marqueurs moléculaires s'accordent pour lui attribuer une
origine multiple, avec des domestications en Chine (type japonica) comme en Inde (type
indica), qui expliquerait son extraordinaire diversité adaptative et agromorphologique.
Grâce à la disponibilité des séquences de plusieurs variétés, on dispose de centaines de milliers de SNP couvrant l'ensemble du génome. Les estimations de DL montrent des associations s'étendant jusqu'à 100 kb, sans compter le DL d'introgression qui caractérise les
interfaces issues de recombinaison entre groupes variétaux.
La variation de séquence au niveau de gènes impliqués dans des caractères importants comme
la qualité du grain (gène waxy, dont un allèle rend le riz glutineux) permet de jumeler analyses biochimiques, génétiques, évolutives et ethnologiques. Ainsi, la mutation responsable du grain glutineux induit l'absence d'amylose (une composante particulière de l'amidon)
par défaut d'épissage de l'ARN messager correspondant. Elle est apparue et a été sélectionnée dans le type japonica avant de se répandre dans le type indica sous l'action des
flux polliniques et de la sélection opérée par les riziculteurs d'Asie du Sud-Est.
De la même façon, l'arôme de certains riz est essentiellement contrôlé par une délétion de
huit paires de bases dans un gène de bétaïne aldéhyde déshydrogénase. Il semble qu'elle ne
soit apparue qu'une fois et se soit répandue au sein de différents types variétaux pour donner les différents riz basmati de l'Inde et du Pakistan et les riz parfumés de Thaïlande (indica)
ou des Philippines (japonica).
*3 Distance génétique,
1 cM équivaut à 1 %
de recombinaison pendant
la méiose.
(3) Frany A et al. (2003)
Genome 46,235-43
(4) Li Z et al. (2003)
Plant Phys Biochem 42, 1-6
Il existe aujourd'hui d'importants répertoires de QTL
sur de nombreuses espèces. Les réussites les plus spectaculaires sont probablement le repérage d'allèles favorables (quantitative trait alleles) dans les espèces
sauvages pour des caractères pourtant supérieurs chez
l'espèce cultivée, ainsi que l'identification de gènes nouveaux grâce au clonage de QTL. Après une quinzaine
d'années de travaux sur l'exploitation des espèces sauvages pour l'amélioration de la tomate, Steve Tanksley
de l'université de Cornell aux États-Unis constate qu'un
cinquième des loci identifiés à partir d'une analyse QTL
présente une forme allélique plus favorable dans le
parent sauvage que dans le parent cultivé et que la
source est loin de se tarir, chaque nouvelle espèce sauvage utilisée, même éloignée, apportant son lot de nouveaux allèles (3).
Sur le riz, la disponibilité de la séquence du génome
facilite le clonage de QTL. L'équipe de Masahiro Yano
au National Institute of Agrobiological Sciences de
26 BIOFUTUR 266 • MAI 2006
La génétique d’association
Se développent également différentes approches regroupées sous le terme de génétique d'association. La première consiste à cibler l'analyse de la diversité
moléculaire au niveau de gènes candidats, de façon à
inventorier toutes les formes alléliques présentes dans
un échantillon donné (encadré 2), et à rechercher les
associations apparentes entre profil moléculaire et
expression phénotypique. On espère ainsi valider le
fait qu'un gène candidat donné est important sur le
plan fonctionnel et repérer les formes alléliques les plus
« favorables » (encadré 3).
L'approche complémentaire procède au contraire à un
balisage complet et sans a priori du génome, et tire
avantage de ce qu'on appelle le déséquilibre de liaison
(DL). Celui-ci vient du fait que les gènes sont liés entre
eux par l’organisation physique des chromosomes. Se
créent alors des propriétés d’association particulières
entre les polymorphismes à des loci différents, avec
une dépendance statistique globalement plus forte entre
loci liés sur le même chromosome (figure 2).
Par exemple, entre deux loci présentant chacun un
polymorphisme à deux allèles (A/a et B/b), l'allèle A
au premier locus sera plus fréquemment associé à l’allèle B qu’à l’allèle b au second locus (avec l'association complémentaire entre l'allèle a et l'allèle b). Si les
allèles B et b sont in fine responsables d’une part de la
variation d’un caractère, par exemple si les individus
BB sont plus précoces que les individus bb, alors les
individus AA seront aussi plus précoces que les aa
puisque A est associé statistiquement à B.
La probabilité d’avoir un marqueur (locus A) lié au
polymorphisme causal (locus B) augmente avec la densité de marquage et l’étendue du DL autour du locus B.
Le déséquilibre de liaison se crée par la mutation, la
dérive génétique, la sélection et la différenciation entre
populations, et il est cassé par la recombinaison lors
de la méiose chez les individus hétérozygotes. Il en
résulte une possibilité de cartographier le génome en
utilisant des échantillons de plantes dont on connaît
l’histoire évolutive.
Les recombinaisons s’accumulent au cours des générations et l’étendue du DL finit par décroître pour arriver à son point d’équilibre. L’étendue cartographique du
DL varie considérablement d’une espèce à l’autre. Le DL
s'étend couramment au-delà de la centaine de kilobases
(kb) chez les variétés traditionnelles de céréales, de 50 à
250 kb chez A. thaliana, et quelques kilobases chez le
maïs. Il peut parfois atteindre plusieurs dizaines de centimorgans*3 (un quart de chromosome) chez les cultivars
modernes issus d'amélioration génétique récente.
Quelques résultats
Ainsi, les premiers résultats sur le maïs ou le riz sont
encourageants sur des régions ciblées. Chez le maïs,
un polymorphisme a été trouvé au sein du gène
Dwarf8 comme potentiellement responsable de la
durée de développement. De même, Susan McCouch
(université Cornell) conclue de ses études sur la
05-1 - David
13/04/06
9:31
Page 27
diversité dans les variétés traditionnelles de riz que
le génotypage d’une centaine de lignées de type Aus lui
avait permis de resserrer très efficacement la zone d’étude
autour d’un gène de résistance à une bactérie (xa5) alors
qu’il lui aurait fallu beaucoup plus d’individus et de
marqueurs pour arriver à ce résultat avec un croisement
classique (5).
Lorsque des données sont disponibles sur l’ensemble
du génome pour un échantillon de plantes d’une centaine d’individus, une approche plus systématique
peut être entreprise comme cela vient d’être fait sur
Arabidopsis thaliana dans l’équipe de Magnus
Nordborg en Californie (6) . Si le nombre de faux
positifs reste élevé, des gènes majeurs déjà connus
pour être impliqués dans la floraison (FRI) et la
résistance aux pathogènes (Rpm1, Rps5 et Rps2)
ont été retrouvés. Cela montre qu’en caractérisant
ces lignées pour de nombreux caractères, la génétique d’association pourra se révéler un outil précieux pour découvrir de nouveaux gènes candidats
impliqués dans divers processus et interpréter les
différences fonctionnelles entre les allèles.
Pour réduire le nombre de faux positifs, l’utilisation
de l’information des polymorphismes neutres est
essentielle, elle permet de repérer les structures de
populations dues à l’histoire (réduction et expansion démographique) et au fonctionnement des
populations (régime de reproduction, dispersion
et flux géniques). Par exemple, si un gradient climatique se confond avec une voie de colonisation
suivie par l’espèce, de nombreux marqueurs neutres,
même non liés physiquement au polymorphisme
adaptatif, seront liés par hasard à la variation adap-
tative au gradient climatique. La connaissance de
l’histoire évolutive permet de corriger les modèles
de génétique d’association.
Créer artificiellement de la diversité ?
(5) Blair MW et al. (2003)
Les généticiens tentent même aujourd’hui de rivaliser
avec la nature pour générer artificiellement de nouveaux allèles de gènes d’intérêt et les trier en fonction de leur impact sur le phénotype. En soumettant
un génotype de référence à un agent chimique (EMS)
qui a la propriété de créer de nombreuses mutations
ponctuelles, ils créent des populations de mutants porteurs de nombreux allèles nouveaux qu’il est possible
de trier selon des critères phénotypiques, après leur
identification à un locus donné par tilling (7). L’avenir
nous dira si cette néo-diversité (encore très coûteuse)
pourra se comparer avec celle issue de l’accumulation
millénaire de mutations spontanées, recombinées et
triées par la sélection naturelle.
Ainsi, l’étude de la diversité naturelle des plantes, sauvages ou cultivées, permet de comprendre comment les
facteurs évolutifs agissent sur le vivant pour le façonner et l’adapter à des conditions de milieux variables
et changeantes. L'accès au fondement moléculaire de
la variation adaptative et les succès de la génomique
comparative dans une perspective évolutive permettront d'entreprendre une synthèse des différentes voies
d'adaptation explorées par les différentes espèces. La
diversité génétique est à la fois une ressource indispensable à l’amélioration des plantes et une source fertile d’interrogation sur le vivant. G
© D.R.
Figure 2 La génétique d’association : associer la diversité génétique avec la variation phénotypique
BIOFUTUR 266 • MAI 2006 27
Theor Appl Genet 107, 62-73
(6) Aranzana MJ et al. (2005)
PloS 1 (5), e60
(7) Bouchez D et al. (2006)
Biofutur 265, 38-44
Téléchargement