ROZENN TREPOS bureau R135
TD Génomique et phylogénie moléculaire
Intro :
Depuis la découverte de son rôle comme support de l''hérédité, l'ADN est sans doute devenue
la molécule la plus étudiée au monde. L'information qu'elle renferme est scrutée lettre à lettre
pour emplir de gigantesques banques de données. Mais la recherche fondamentale n'est pas la
seule à s'y intéresser. De nombreuses applications technologiques se servent de cette
"molécule de la vie", complétant l'attirail des biotechnologies. Après la génétique est donc
venu le temps de la génomique. L’avènement de la génomique en tant que nouvelle discipline
biologique repose essentiellement sur des progrès techniques importants réalisés au cours des
années 90. Ces techniques comblent, en effet, en grande partie un fossé qui séparait ce qu’on
pouvait identifier au niveau génétique, de ce qu’on pouvait analyser au niveau moléculaire.
Classiquement, on savait d’un côté identifier et localiser des caractères génétiques sur les
cartes chromosomiques, et de l’autre étudier et modifier des gènes in vitro. Au cours des dix
ou quinze dernières années, sont apparues des méthodologies qui permettent de relier ces
deux niveaux d’analyse : on peut par exemple plus facilement isoler les gènes à la base des
caractères localisés sur les cartes génétiques.
Un aspect important des approches de génomique est l’objectif d’exhaustivité qu’elles
affichent. Si l’ambition de la génomique structurale est de décrire l’organisation des
chromosomes et dresser l’inventaire des gènes qu’ils contiennent, celle de la génomique
fonctionnelle est d’attribuer un rôle biologique à ces gènes, de déterminer la façon dont ils
sont régulés et leurs interactions. La génomique n’est donc qu’une façon différente d’aborder
la génétique, avec des ambitions nouvelles quant aux questions que l’on pose et aux outils
qu’on met en place pour y répondre.
Définition :
La génomique est l’étude de l’ensemble des gènes d’une espèce (génome), de leur disposition
sur les chromosomes , de la description fine de leur structure et de leurs fonctions. Pour le
moment, les entreprises de génomique s’attachent essentiellement au séquençage du génome
et dans une moindre mesure à la recherche de la fonction des gènes séquencés.
Le séquençage est maintenant automatisé et industrialisé, l’innovation semble résider dans la
génomique fonctionnelle, c‘est a dire dans la recherche sur les fonctions des gènes. En
particulier la protéomique s’attache à identifier les protéines réellement exprimées à partir de
séquences de gènes.
1 Génomique
1.1. Génomique structurale
La cartographie génétique
L’apparition d’un nouveau type de marqueurs génétiques au milieu des années 1980, les marqueurs
moléculaires, a permis de dresser des cartes génétiques avec une précision et une rapidité jusqu’alors
inégalées. Ces marqueurs, dont on étudie la ségrégation au passage d’une génération à l’autre au même
titre que celle de n’importe quel caractère génétique simple, permettent d’identifier et de suivre dans
les populations des différences – ou polymorphismes – au niveau de la molécule d’ADN elle-même,
d’où leur nom de marqueur "moléculaire". Faciles à obtenir en grand nombre, simples d’emploi, ils
sont à la base de cartes génétiques extrêmement détaillées qui permettent ensuite aux généticiens de
localiser les régions chromosomiques importantes entrant en jeu dans un caractère, et ce même pour
des caractères très complexes.
La cartographie physique
Les génomes entiers sont trop complexes pour pouvoir être étudiés facilement au laboratoire. Il est
donc nécessaire de les fragmenter et de les multiplier sous forme de banque de fragments.
D’importants progrès techniques ont permis d’augmenter notablement la taille des fragments
1
qu’on peut analyser et de les propager chez les bactéries ou les levures sous forme de
chromosomes artificiels portant plusieurs centaines de milliers de nucléotides.
Malheureusement, dans ces banques, ces fragments ne sont plus ordonnés, et il faut donc
rétablir leur origine chromosomique de façon à obtenir un ensemble de fragments
indépendants et identifiés individuellement, qui recouvre la totalité du génome : c’est ce
qu’on appelle la carte physique du génome.On recherche pour ce faire les zones de
chevauchement entre les différents fragments de la banque, ce qui permet de les ordonner les
uns par rapport aux autres. Les marqueurs moléculaires utilisés pour la carte génétique
peuvent être localisés sur la carte physique et permettent d’identifier les fragments
chevauchants correspondant aux différents chromosomes. On peut en procédant de cette
manière établir une correspondance entre la carte physique et la carte génétique, ce qui permet
de passer d’une localisation sur la carte génétique à une région d’ADN et vice versa.
Il faut noter que les deux cartes – génétique et physique – sont loin de donner la même
représentation du génome : si la carte génétique s’appuie sur le mécanisme biologique de la
recombinaison, la carte physique correspond à la molécule d’ADN. Deux gènes très proches
sur la molécule d’ADN (carte physique) peuvent apparaître éloignés sur la carte génétique s’il
y a beaucoup d’événements de recombinaison entre eux. L’intégration des deux types de
cartes permet d’isoler les gènes responsables des caractères étudiés, étape nécessaire pour
avancer dans la compréhension de leur fonction.
Le séquençage
Les techniques de séquençage enzymatique sont apparues dès les années 1970. Elles sont de
nos jours réalisées de façon automatique par des robots de séquençage. Ces machines
permettent d’atteindre un débit compatible avec le séquençage de génomes entiers.
1.2. Bioinformatique
Un des problèmes soulevés par les programmes de génomique est l’augmentation sans
précédent des volumes de données biologiques à traiter. Il s’agit de stocker ces données dans
de larges bases de données informatiques, de permettre à tous les biologistes d’y accéder de
façon simple et rapide, de les analyser et les comparer entre elles, souvent en développant des
outils mathématiques et informatiques appropriés. C’est le domaine de la bioinformatique,
nécessaire aux programmes de génomique qu'elle soit structurale ou fonctionnelle.
A partir des données de séquençage, il est généralement difficile de reconnaître les gènes,
souvent morcelés dans le génome. L’informatique peut apporter une aide précieuse pour
identifier et reconstituer les gènes codant pour des protéines. Des programmes informatiques
élaborés à partir des connaissances obtenues sur des milliers de gènes permettent de prédire la
localisation des parties codantes des gènes et donc d’apporter une aide précieuse pour
l’identification des gènes codant pour telle ou telle protéine. La comparaison automatique de
séquence, permet également de rechercher dans l’énorme masse de données existante les
gènes qui présentent des ressemblances avec une séquence étudiée, que ce soit dans le même
organisme ou dans toute autre espèce. De 50 à 60% des gènes d’Arabidopsis impliqués dans
la synthèse des protéines sont retrouvés dans d’autres organismes comme la levure de
boulanger, la mouche du vinaigre ou l’homme, reflétant des fonctions très conservées dans
tous les être vivants. Si on connaît déjà la fonction biologique de ces gènes similaires, on peut
souvent proposer un rôle pour les gènes étudiés, rôle que l’on pourra essayer de confirmer de
façon expérimentale. Le traitement informatique peut également faire connaître dans la
séquence des modules de structure ou de fonction connue, qui peuvent renseigner le biologiste
par exemple sur la régulation de l’expression du gène ou sur la localisation de la protéine dans
la cellule.
1.3. Génomique fonctionnelle
La génomique structurale et le séquençage permettent de dresser un inventaire de la totalité
des gènes de l’organisme. L’analyse bioinformatique permet d’établir des classifications et
2
souvent de proposer des hypothèses sur la fonction que pourraient remplir ces gènes.
L’objectif de la génomique fonctionnelle est de fournir des outils d’analyse efficaces
permettant d’attribuer des fonctions aux nombreux gènes inconnus. Cette discipline s’articule
autour de deux axes majeurs : l’expression du génome et la modification de l’expression des
gènes.
Applications
Séquençage et criblage tous azimut
-Séquencer l'ADN de tous les êtres vivants, de la plus petite bactérie aux mammifères.
-Etablir des banques de données d'ADN, de protéines, de substances actives.
Des gènes pour la pharmacie
La génomique fonctionnelle a de l'avenir dans le secteur du médicament. Connaître la
fonction d'un gène peut en effet être la première étape vers la mise au point d'une molécule
thérapeutique. La recherche en génomique fonctionnelle s'appuie notamment sur la bio-
informatique qui prédit les fonctions des séquences d'ADN par analogies et comparaisons.
Les recherches en génomique fonctionnelle commencent donc à trouver une manne financière
auprès des industries pharmaceutiques. Par ailleurs, une nouvelle discipline est née : la
pharmacogénomique. Elle consiste à adapter le traitement au génome du patient en se fondant
sur les interactions entre les médicaments et les spécificités génétiques du patient (analyse des
polymorphismes). Cette discipline, à terme, devrait aboutir à une forme de médecine
individuelle et prédictive. Mais plusieurs dizaines d'années peuvent s'écouler avant la
généralisation de ces pratiques. La connaissance du génome, de ses variabilités et des
interactions entre les protéines n'en est qu'à ses débuts.
Thérapie génique
Cette méthode médicale utilise les gènes comme agents thérapeutiques. Le principe est de
découvrir un gène thérapeutique (rôle de la génomique) et de le transférer dans le noyau des
cellules cibles via un vecteur. Une fois dans le noyau, le gène s'exprime et la cellule produit la
protéine thérapeutique. Le problème se situe sur l'efficacité des vecteurs, que l'on domine
encore peu. La voie la plus étudiée est celle des virus, mais les recherches se tournent à
présent vers des vecteurs synthétiques ou cellulaires.
Marqueurs de l'identité
L'ADN est un très puissant outil d'identification et de suivi aussi bien dans le domaine agro-
alimentaire que dans le domaine médico-légal. Grâce à des méthodes de PCR, de séquençage
automatique, d'extraction d'ADN et d'amplification, on peut avec, un fragment d'ADN, même
dégradé, retrouver son origine ou évaluer la pureté d'un produit. Ces méthodes d'identification
des empreintes génétiques sont aussi utilisées pour les recherches en paternité ou pour
détecter des maladies (C'est le principe des puces à ADN-voir ci-dessous).
Les puces savantes
Puces à ADN, biopuces, sondes, trois expressions qui recouvrent un même concept et un
même projet : dépister, détecter, identifier des séquences d'ADN ou d'ARN grâce aux
propriétés de ces acides nucléiques.
Savant mélange entre l'électronique et la biologie, les puces à ADN sont donc des petits carrés
de silicium comprenant des milliers de micro-électrodes. A chacune d'elle est reliée un brin
d'ADN dont la séquence est connue. Les deux brins de l'ADN à analyser sont séparés.
L'un deux est plongé dans la solution où a été déposée la puce. Il va alors s'apparier à la
séquence d'ADN qui lui est complémentaire et activer une des micro-électrodes.
Elles consistent en un support solide (petite lame de verre comme celles utilisées en
microscopie traditionnelle ou membrane de nylon) sur lequel des milliers de fragment d’ADN
sont déposés de façon géométrique à l’aide d’une multipipette robotisée. Grâce à cette
technique chacun des fragments est représenté par un point sur le support (ou puce). Ils
servent de sondes pour fixer de façon très spécifique les fragments de gènes complémentaires
3
(cibles) présents dans les échantillons biologiques à tester : leur mise en contact permet de
reconstituer la double hélice d’ADN et ce phénomène (hybridation) peut être mis en évidence
par des techniques optiques sous éclairage fluorescent ou par détection de radioactivité ;un
système de marquage de l’échantillon au moyen de traceurs radioactifs ou fluorescent ayant
été réalisé préalablement.
Cet ingénieux système peut servir à dépister des mutations responsables de maladies
génétiques, à identifier plus rapidement la nature d'un microbe responsable d'une infection ou
à contrôler la qualité d'une eau potable (identification précise de tout micro-organisme
recherché dans l’eau en le reconnaissant au travers de son empreinte génétique).
2 Phylogénie
Intro :
La phylogénie moléculaire est une branche de la systématique : elle consiste à déterminer
l'arbre phylogénétique d'un ensemble de séquences homologues données, c'est à dire la
configuration la plus probable pour rendre compte du degré de parenté existant entre ces
séquences. Cela correspond à de la phylogénie par comparaison de gènes.
Les gènes utilisés doivent être choisis avec soin : il faut que cela soit des gènes subissant de
fortes contraintes fonctionnelles donc ayant un taux de mutation faible.
Un bon exemple est le cytochrome B intervenant dans les chaines d'oxydation cellulaire de
tous les êtres vivants (les êtres vivants actuels l'ont sans doute hérité d'un ancêtre commun il y
a trois milliards d'années).
Il y a cependant une accumulation des mutations au cours du temps et pour rendre compte de
ce phénomène, Zuckerland et Pauling (1962) ont développé la théorie de l'horloge
moléculaire.
2 .1 .Description de L'horloge moléculaire /Définition :
On constate que le taux d'accumulation des mutations dans le génome d'organismes différents
est du même ordre de grandeur dans des régions homologues (régions soumises à la même
pression de sélection).L'accumulation sera maximale pour des régions qui ne sont pas
soumises à la pression de sélection naturelle (ne codant pas pour des gènes) et minimale dans
les parties du génome soumises à une forte pression (c'est à dire les régions codant pour des
fonctions essentielles à la survie de l'organisme). Chaque séquence accumule les mutations à
un rythme qui lui est propre et qui est dicté par l'intensité de la pression de sélection à laquelle
elle est soumise. Pour reconstituer des phylogénies (dater la divergence entre deux espèces),
on peut utiliser différentes molécules comme on utilise les aiguilles d'une montre pour
calibrer l'horloge :
- la trotteuse des secondes (taux de mutation important, par exemple un pseudogène) pour des
évènements récents (études des sous populations au sein d'une espèce).
- l'aiguille des minutes (taux de mutation moyen, par exemple le cytochrome C) pour l'analyse
d'un passé proche.
- l'aiguille des heures (taux de mutations faible : les histones) pour l'étude d'un passé lointain.
La vitesse d'évolution de la séquence est du même ordre de grandeur au sein d'une même
classe fonctionnelle de protéines et elle est différente pour des protéines qui ont des fonctions
différentes : la vitesse d'évolution de la sérum albumine est toujours plus importante que celle
du cytochrome C. Ces différences de vitesse dépendent à la fois de la probabilité qu'une
substitution apparaisse et de sa compatibilité avec la survie de l'organisme.
Si l'on admet cette théorie, et que l'on connaît le taux d'accumulation des mutations, il est
possible d'estimer le temps de divergences d'espèces en comparant leur diversité moléculaire
Arguments contre l'horloge moléculaire
La théorie de l'horloge moléculaire est remise en cause et plusieurs arguments ont été
développés :
4
- L'horloge moléculaire ne serait pas constante (Goodman): les mutations avantageuses se
fixeraient plus rapidement lors de la formation de nouvelles espèces.
- L'horloge moléculaire serait épisodique (Gillepsie) et les mutations ne se produiraient pas
de façon indépendante au cours de l'évolution: il y aurait des épisodes d'accumulation suivis
d'arrêts évolutifs.
Conclusion
Bien que le débat persiste, il semble que l'horloge moléculaire fonctionne assez bien sur de
longues périodes évolutives, pour des gènes ayant un taux de mutation relativement faible où
même si l'horloge ne bat pas très régulièrement, les ralentissements et les accélérations se
compensent.
Il faut également se méfier des estimations de temps de divergence basées sur un petit nombre
de gènes.
2.2Objectifs des études phylogénétiques
Mieux comprendre les mécanismes de l' évolution et les mécanismes moléculaires associés.
Connaître l'arbre de la vie ( taxonomie ).
Etudier la biodiversité .
Déterminer l'origine géographique des espèces .
L'homologie : point de départ de la phylogénie moléculaire
Deux séquences sont dites homologues si elles ont un ancêtre commun. Au cours de
l'évolution des gènes protéiques , il peut se produire deux types d'événement :
des changements mineurs : substitutions , insertions ou délétions de courte taille.
Ce mode d'évolution est conservateur : généralement, il ne modifie pas de manière importante
la structure des protéines.
Des gènes apparentés qui ont subi uniquement des changements mineurs sont dits
homéomorphes et sont homologues sur toute leur longueur. Parmi ces derniers, on distingue :
les gènes orthologues : gènes homologues qui ont divergé à la suite d'un évènement de
spéciation.
les gènes paralogues : gènes homologues qui sont issus d'un évènement de duplication .
des remaniements complexes : fusion de gènes, perte ou gain d'exons, etc.
Ce mode d'évolution permet de créer des gènes entièrement nouveaux par combinaison de
fragments d'autres gènes. Les relations d'homologie ne concernent alors plus que des
segments du gène. Ainsi, certaines protéines sont constituées de domaines (ou modules) qui
ont des origines évolutives différentes. On parle dans ce cas de domaines protéiques
homologues, et non de protéines homologues.
Pour la phylogénie moléculaire, on utilise uniquement des séquences (gènes ou protéines)
homéomorphes (changement mineur) et plus précisément des gènes orthologues(divergence à
la suite d’un évènement de spéciation) pour reconstituer l'histoire des espèces.
Conditions préalables requises pour la construction de bons arbres :
-Disposer du plus grand nombre de gènes homologues possibles.
-Avoir des jeux de données indépendants pour valider les résultats
-Procéder à un alignement multiple fiable ,c'est à dire un jeu de séquences homologues à
partir duquel il sera possible de considérer la manière dont a évolué chacun des sites (chacune
des positions) de la séquence ancestrale.
-Eliminer les régions ambigües, les positions non informatives, les régions hypervariables, les
gaps des alignements.
-Faire appel à un groupe extérieur
-Pour "enraciner" un arbre, il est nécessaire de faire appel à un groupe extérieur
(="outgroup"). Notoirement plus éloigné que les autres, il sert de point d'ancrage pour
positionner les trois premiers groupes les uns par rapport aux autres.
5
1 / 7 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !