Suite à ce projet, de plus en plus d’équipes se sont mises à utiliser le séquençage pour leurs travaux,
cependant la première génération coûte cher et le séquençage entier d’un génome est lent à cause d’un faible
débit.
Pour permettre à la discipline de prendre son essor, la création de
technique de séquençage seconde génération (ou NGS Next generation
sequencing) à plus haut débit a été nécessaire.
Les NGS n’utilisent pas le même principe de terminaison de chaîne,
mais permettent de faire des séquençages de plusieurs milliers de fragments en
parallèle et à haut débit. Ces techniques fonctionnent en capturant le signal émis par le clivage d’une sonde
lumineuse ou l’émission de protons lors de la synthèse du brin d’ADN. Les NGS ont permis de réduire
fortement le coût du séquençage d’une séquence, démocratisant ainsi l’utilisation du séquençage des
génomes. Plusieurs techniques différentes avec chacunes leurs avantages et inconvénients ont été
développées : Pyroséquençage 454, Illumina, Solid, Ion torrent… Le faible coût par base des NGS couplé au
développement de séquenceur de paillasse (Ion PGM et Myseq) permit l’utilisation massive du séquençage
de l’ADN.
La première génération a permis le séquençage rapide de longs fragments d’ADN mais avait un coût
élevé et un faible débit. La seconde génération a permis de gagner en débit tout en diminuant fortement les
coûts par base, mais perdu en contrepartie au niveau de la taille des fragments séquençables et en vitesse de
lecture. La troisième génération offre un compromis en proposant un haut débit à faible coût, permettant le
séquençage d’une molécule entière d’ADN avec une vitesse de lecture rapide. Les techniques de séquençage
de troisièmes générations possèdent deux caractéristiques propres qui les différencient des techniques
précédentes. Elles s’affranchissent de l’étape d’amplification de l’ADN ce qui réduit le temps et le coût de
préparation de l’ADN. Cela a aussi pour conséquence de réduire les biais introduits auparavant par cette
amplification. Pour finir ces techniques permettent l’observation en temps réel du signal via la capture du
signal électrique (nanopore) ou par fluorescence (pacbio). L’intensité du signal est aussi mesurable ce qui
permet de donner des informations sur l’état de méthylation de l’ADN.
Cependant les NGS et 3ème générations génèrent énormément de données et il est aujourd’hui plus
cher de stocker les données produites que de reséquencer entièrement ces données. L’analyse des
informations est donc un facteur limitant aujourd’hui liés au progrès de la bioinformatique. L'amélioration
des systèmes informatiques et l'optimisation des logiciels de bioinformatique est donc un objectif majeur des
prochaines années pour continué l'essor de la discipline.
Remerciement :
Nous souhaitons particulièrement remercier Francois Sabot, bio-informaticien de l'Institut de Recherche
pour le Développement à Montpellier d'avoir bien voulu nous consacrer un peu de son temps pour nous
parler de son métier.
Références :
http://bioinfo-fr.net/le-sequencage - http://hmg.oxfordjournals.org/content/19/R2/R227.full
- http://biologie.univ-mrs.fr/upload/p201/Thieffry_ULB_271006.pdf -
- Master 2 Biologie des plantes - Gaëtan Maillot - Jean-Baptiste Lopez - Thomas Gayraud -
La bioinformatique va
devenir un outil classique en
laboratoires. D'ici dix ans
l'utilisation de script sera
aussi commune qu'une PCR.
F. Sabot