ANAGENE (Analyse de séquences nucléiques et protéiques) Anagène est un logiciel d’analyse de séquences nucléiques et protéiques. Il comporte une banque de données et différents outils d’analyse et de traitement de ces données. Anagène est constitué d’une fenêtre-mère présentant sous la barre de titre une barre de menus et une barre d’outils. Le mode de déplacement et de sélection pilotés à l’aide de la souris ou du clavier obéissent aux règles adoptées pour Windows. Ainsi un clic pointé sur un libellé de la barre des menus offre le choix entre les commandes disponibles. Lorsque le pointeur de la souris est maintenu quelques instants en place sur l’un des objets de l’écran, tels par exemple un bouton de la barre d’outils, une bulle d’aide apparaît et rappelle la fonction qui lui est associée. Ainsi les fonctions d’Anagène sont accessibles soit au travers les différentes options de la barre de menu, soit directement pour la plupart par l’intermédiaire des boutons de la barre d’outils. Plan : I - EXPRESSION DE L'INFORMATION GENETIQUE 1 - Approche de la transcription 2. Approche de la traduction 3 - Approche du code génétique II- LES RELATIONS GENOTYPE - PHENOTYPE 1. Les phénotypes relatifs aux hémoglobinopathies 1.1 - Le phénotype drépanocytaire 1.2 - Les phénotypes thalassémiques 1.3 - Le phénotype " groupe sanguin ABO " III - POLYMORPHISME DES GENES 1. Structure des gènes et des protéines HLA de classe I 2. Les allèles des gènes HLA de classe I 3. Recherche des différences entre les allèles d’un gène HLA CONCLUSIONS I - EXPRESSION DE L'INFORMATION GENETIQUE 1 - Approche de la transcription 1.1 - Visualisation de l’ADN double brin et de l’ARNm Cliquer sur le bouton Thèmes d’étude de la barre d’outils (ou sélectionner la commande Thèmes d’étude dans le menu Fichier). Ouvrir successivement le menu Expression de l’information génétique et le sous-menu Globine alpha. Sélectionner Gène et ARNm codant et valider le choix en cliquant sur OK. Les séquences nucléiques de l’ADN (Alpha brin 1 et Alpha brin 2) et de l’ARNm sont affichées dans la fenêtre Affichage des séquences et peuvent être parcourues de la 1ère à la 429 ème base en utilisant la barre de défilement horizontal. 1.2 - Comparaison de chaque brin d’ADN avec l’ARNm Sélectionner Alpha ARNm cod et Alpha brin 1 en cliquant sur les boutons de sélection correspondant à chaque séquence. Cliquer sur le bouton Comparer les séquences de la barre d’outils (ou sélectionner l’option Comparer les séquences dans le menu Traiter). Valider l’option Comparaison simple et confirmer en cliquant sur OK. La nature du traitement effectué et les deux séquences comparées s’affichent dans la fenêtre Comparaison simple. Elles peuvent être parcourues en utilisant la barre de défilement horizontal. Le tiret indique l’identité des bases par rapport à celles de la première séquence qui sert de référence. En procédant de la même façon, comparer Alpha brin 2 et Alpha ARNm cod. RESULTATS Les différences entre le brin 1 de l’ADN et l’ARNm sont limitées aux bases Uracile qui remplacent les bases Thymine de l’ADN. Le brin 2 de l’ADN et l’ARNm présentent 100% de différences. CONCLUSIONS Le brin 2 de l’ADN apparaît comme le brin transcrit et le brin 1 comme le brin non transcrit. La séquence de l’ARNm se déduit de celle du brin non transcrit en remplaçant la thymine par l’uracile. Fermer la fenêtre Comparaison simple. 2. Approche de la traduction 2.1 - Traduction de la séquence d’ARNm en polypeptide Sélectionner la séquence Alpha ARNm cod en cliquant sur son bouton de sélection. Cliquer sur la commande Convertir les séquences de la barre d’outils. Valider successivement l’option Peptidique pour la séquence à afficher, l’option Traduction simple et l’option Résultat dans la fenêtre Affichage/édition, puis confirmer ce choix en cliquant sur OK. La séquence Pro-Alpha ARNm s’affiche dans la fenêtre Affichage des séquences et peut être parcourue en utilisant la barre de défilement horizontal. 2.2 - Comparaison du polypeptide obtenu avec le polypeptide de la banque de données Cliquer sur le bouton Thèmes d’étude de la barre d’outils. Ouvrir successivement le menu Expression de l’information génétique et le sous-menu Globine alpha. Sélectionner Séquence peptidique et valider ce choix en cliquant sur OK. La chaîne polypeptidique Polypeptide alph s’affiche dans la fenêtre Affichage des séquences et peut être parcourue en utilisant la barre de défilement horizontal. Sélectionner successivement Pro-Alpha ARNm et Polypeptide alph en cliquant sur les boutons correspondant à ces séquence peptidiques Cliquer sur le bouton Comparer les séquences de la barre d’outils. Valider l’option Comparaison simple et confirmer en cliquant sur OK. Cliquer sur l’échelle pour obtenir celle correspondant aux acides aminés. La nature du traitement effectué et les deux séquences peptidiques s’affichent dans la fenêtre Comparaison simple. Elles peuvent être parcourues en utilisant la barre de défilement horizontal. Le tiret indique l’identité des acides aminés par rapport à ceux de la première séquence qui sert de référence. RESULTAT Il y a identité des deux chaînes polypeptidiques, elles comportent chacune 141 acides aminés identiques. 2.3 - Inversion et traduction de la séquence d’ARNm 2.3.1 - Inversion de la séquence d’ARNm Sélectionner la séquence Alpha ARNm cod en cliquant sur son bouton de sélection. Dans le menu Edition valider la commande Dupliquer la séquence. Une nouvelle séquence Alpha ARNm cod s’affiche dans la fenêtre Affichage des séquences. Après avoir, dans le menu Options, désélectionné la commande Protéger les données, sélectionner la nouvelle séquence Alpha ARNm cod. Sélectionner, dans le menu Edition, la commande Inverser la séquence. Une séquence inverse d’ARNm, i-Alpha ARNm co s’affiche dans la fenêtre Edition des séquences. Revenir au menu Options et sélectionner à nouveau la commande Protéger les données. 2.3.2 - Traduction de l’ARNm inversé Sélectionner la séquence i-Alpha ARNm co en cliquant sur son bouton de sélection. Cliquer sur le bouton Convertir les séquences de la barre d’outils. Valider successivement l’option Peptidique, l’option Traduction simple et l’option Résultat dans la fenêtre Affichage/édition. Confirmer ces choix en cliquant sur OK. La séquence polypeptidique Pro-i-Alpha ARN s’affiche dans la fenêtre Affichage des séquences et peut être parcourue en utilisant la barre de défilement horizontal. 2.3.3 - Comparaison du polypeptide obtenu avec celui de la banque de données Sélectionner successivement les séquences Pro-i-Alpha ARN et Polypeptide alph en cliquant sur les boutons de sélection correspondants. Cliquer sur le bouton Comparer les séquences de la barre d’outils. Valider l’option Comparaison simple et confirmer en cliquant sur OK. La nature du traitement et les deux séquences polypeptidiques comparées s’affichent dans la fenêtre Comparaison simple. Elles peuvent être parcourues en utilisant la barre de défilement horizontal. Les tirets indiquent l’identité des acides aminés par rapport à ceux de la première séquence qui sert de référence. RESULTAT La chaîne polypeptidique obtenue est différente de celle de la banque de données CONCLUSION Il y a unidirectionnalité de la traduction de l’ARNm en polypeptide Fermer la fenêtre Comparaison simple en cliquant sur le bouton de fermeture de la barre d’outils 2.4 - Cadre de lecture 2.4.1 - Traduction de L’ARNm à partir des positions 4,7,10 Sélectionner la séquence Alpha ARNm cod en cliquant sur son bouton de sélection. Dans le menu Edition valider la commande Dupliquer la séquence. Une nouvelle séquence Alpha ARNm cod s’affiche dans la fenêtre Affichage des séquences. Sélectionner la séquence Alpha Polypeptide Alph en cliquant sur son bouton de sélection. Dans le menu Edition valider la commande Dupliquer la séquence. Une nouvelle séquence Polypeptide Alph s’affiche dans la fenêtre Affichage des séquences. Dans le menu Options, désélectionner la commande Protéger les données. Sélectionner la nouvelle séquence Alpha ARNm cod, puis après avoir placé le curseur après la troisième base, supprimer successivement les bases G, U et A en utilisant le clavier Sélectionner la nouvelle séquence Polypeptide Alph puis après avoir placé le curseur après le premier acide aminé, supprimer le en utilisant le clavier Sélectionner la nouvelle séquence Alpha ARNm cod créée (elle est affichée en bleu dans la fenêtre Affichage des séquences) en cliquant sur son bouton de sélection. Cliquer sur le bouton Convertir les séquences de la barre d’outils. Valider successivement l’option Peptidique pour la séquence à afficher, l’option Traduction simple et l’option Résultat dans la fenêtre Affichage/édition, puis confirmer ce choix en cliquant sur OK. Une nouvelle séquence Pro-Alpha ARNm s’affiche dans la fenêtre Affichage des séquences et peut être parcourue en utilisant la barre de défilement horizontal. Sélectionner la nouvelle séquence Pro-Alpha ARNm et la séquence Polypeptide Alph puis cliquer sur le bouton Comparer les séquences de la barre d’outils Valider l’option Comparaison simple et confirmer en cliquant sur OK. La nature du traitement et les deux séquences polypeptidiques comparées s’affichent dans la fenêtre Comparaison simple. Les tirets indiquent l’identité des acides aminés par rapport à ceux de la première séquence qui sert de référence. Procéder de la même façon à partir des positions 7 et 10. RESULTAT La traduction de l’ARNm à partir des positions 4, 7 et 10 conduit à la même séquence polypeptidique que celle de la banque de données, diminuée chaque fois d’un acide aminé 2.4.2 - Traduction de L’ARNm à partir des positions 2, 3, 5, 6 Sélectionner la séquence Alpha ARNm cod en cliquant sur son bouton de sélection. Dans le menu Edition valider la commande Dupliquer la séquence. Une nouvelle séquence Alpha ARNm cod s’affiche dans la fenêtre Affichage des séquences. Dans le menu Options, désélectionner la commande Protéger les données. Sélectionner la nouvelle séquence Alpha ARNm cod, puis après avoir placé le curseur après la première base, supprimer la en utilisant le clavier Sélectionner la nouvelle séquence Alpha ARNm cod créée (elle est affichée en bleu dans la fenêtre Affichage des séquences) en cliquant sur son bouton de sélection. Cliquer sur le bouton Convertir les séquences de la barre d’outils. Valider successivement l’option Peptidique pour la séquence à afficher, l’option Traduction simple et l’option Résultat dans la fenêtre Affichage/édition, puis confirmer ce choix en cliquant sur OK. Une nouvelle séquence Pro-Alpha ARNm s’affiche dans la fenêtre Affichage des séquences Sélectionner la séquence Pro-Alpha ARNm et la séquence Polypeptide Alph puis cliquer sur le bouton Comparer les séquences de la barre d’outils Valider l’option Comparaison simple et confirmer en cliquant sur OK. La nature du traitement et les deux séquences polypeptidiques comparées s’affichent dans la fenêtre Comparaison simple. Elles peuvent être parcourues en utilisant la barre de défilement horizontal. Les tirets indiquent l’identité des acides aminés par rapport à ceux de la première séquence qui sert de référence. Procéder de la même façon à partir des positions 3, 5 et 6. RESULTAT La traduction de l’ARNm à partir des positions 2, 3, 5, et 6 conduit à des séquences polypeptidiques différentes de celle de la banque de données. CONCLUSION La traduction de l’ARNm se fait triplet par triplet, sans chevauchement 3 - Approche du code génétique 3 .1 - Création et traduction d’une séquence Poly-U 3.1.1 - Création d’une séquence Poly-U Dans le menu Fichier, sélectionner la commande Créer. Sélectionner ARN pour choisir le type de séquence à créer et donner le nom de Poly-U à cette séquence, puis confirmer ces choix en cliquant sur OK. Dans la fenêtre Edition des séquences, créer une séquence de 18 bases Uracile en cliquant sur la lettre U du pavé des bases azotées. 3.1.2 - Traduction de la séquence Poly-U Sélectionner la séquence Poly-U à l’aide de son bouton de sélection. Cliquer sur le bouton Convertir les séquences de la barre d’outils. Valider successivement l’option peptidique pour la séquence à afficher, l’option Traduction simple et l’option Résultat dans la fenêtre Affichage/édition, puis confirmer ces choix en cliquant sur OK. La séquence Pro-Poly-U s’affiche dans la fenêtre Edition des séquences. RESULTAT La séquence polypeptidique obtenue ne comporte qu’un seul type d’acide aminé, la phénylalanine. CONCLUSION Le codon UUU code pour la phénylalanine 3.2 - Création et traduction d’une séquence Poly-UUC 3.2.1- Création d’une séquence Poly-UUC Dans le menu Fichier, sélectionner la commande Créer. Sélectionner ARN pour choisir le type de séquence à créer et donner le nom de Poly-UUC à cette séquence, puis confirmer ces choix en cliquant sur OK. Dans la fenêtre Edition des séquences, créer une séquence de 6 UUC en cliquant sur les lettres U et C du pavé des bases azotées. 3.2.2- Traduction de la séquence Poly-UUC Sélectionner la séquence Poly-UUC à l’aide de son bouton de sélection. Cliquer sur le bouton Convertir les séquences de la barre d’outils. Valider successivement l’option peptidique pour la séquence à afficher, l’option Traduction simple et l’option Résultat dans la fenêtre Affichage/édition, puis confirmer ces choix en cliquant sur OK. La séquence Pro-Poly-UUC s’affiche dans la fenêtre Edition des séquences. RESULTAT La séquence polypeptidique obtenue ne comporte qu’un seul type d’acide aminé, la phénylalanine. CONCLUSIONS Le codon UUC code pour la phénylalanine Les codons UUU et UUC codent pour le même acide aminé, la phénylalanine, le code génétique est redondant (ou dégénéré) 3.3- Création et traduction d’une séquence Poly-UC 3.3.1- Création d’une séquence Poly-UC Dans le menu Fichier, sélectionner la commande Créer. Sélectionner ARN pour choisir le type de séquence à créer et donner le nom de Poly-UC à cette séquence, puis confirmer ces choix en cliquant sur OK. Dans la fenêtre Edition des séquences, créer une séquence de 9 UC en cliquant sur les lettres U et C du pavé des bases azotées. 3.3.2- Traduction de la séquence Poly-UC Sélectionner la séquence Poly-UC à l’aide de son bouton de sélection. Cliquer sur le bouton Convertir les séquences de la barre d’outils. Valider successivement l’option peptidique pour la séquence à afficher, l’option Traduction simple et l’option Résultat dans la fenêtre Affichage/édition, puis confirmer ces choix en cliquant sur OK. La séquence Pro-Poly-UC s’affiche dans la fenêtre Edition des séquences. RESULTAT La séquence polypeptidique obtenue est formée de l’alternance de deux acides aminés, la sérine et la leucine. CONCLUSION Le codon UCU code pour la sérine et le codon CUC code pour la leucine II- LES RELATIONS GENOTYPE - PHENOTYPE 1. Les phénotypes relatifs aux hémoglobinopathies Dans ces exemples, le polypeptide résultant de l’expression du gène est le phénotype moléculaire dont dépendent le phénotype cellulaire et le phénotype clinique de l’organisme. 1.1 - Le phénotype drépanocytaire Il s’agit d’un cas simple dans lequel le phénotype macroscopique correspond à un seul allèle. Cliquer sur le bouton Thèmes d’étude de la barre d’outils (ou sélectionner la commande Thèmes d’étude dans le menu Fichier). Ouvrir le menu Relations Génotype-Phénotype, sélectionner Phénotype drépanocytaire et valider le choix en cliquant sur OK. Les séquences nucléiques et protéiques de HbA et de HbS sont affichées dans la fenêtre Affichage des séquences et peuvent être parcourues en utilisant la barre de défilement horizontal. 1.1.1 - Comparaison des séquences protéiques Sélectionner successivement HbS protéique et HbA protéique en cliquant sur les boutons de sélection correspondants. Cliquer sur le bouton Comparer les séquences de la barre d’outils. Valider l’option Comparaison simple et confirmer en cliquant sur OK. La nature du traitement effectué et les séquences comparées s’affichent dans la fenêtre Comparaison simple. Elles peuvent être parcourues en utilisant la barre de défilement horizontal. Les tirets indiquent l’identité des acides aminés par rapport à ceux de la première séquence qui sert de référence. Cliquer sur l’échelle pour obtenir celle correspondant aux séquences peptidiques. RESULTAT HbS diffère de HbA par la substitution d’un acide glutamique par une valine en position 7 1.1.2 - Comparaison des séquences nucléiques Sélectionner successivement HbS nucléique et HbA nucléique en cliquant sur les boutons de sélection correspondants. Cliquer sur le bouton Comparer les séquences de la barre d’outils. Valider l’option Comparaison simple et confirmer en cliquant sur OK. La nature du traitement effectué et les séquences comparées s’affichent dans la fenêtre Comparaison simple. Elles peuvent être parcourues en utilisant la barre de défilement horizontal. Les tirets indiquent l’identité des bases par rapport à celles de la première séquence qui sert de référence. Cliquer sur l’échelle pour obtenir celle correspondant aux séquences nucléiques. RESULTAT La séquence d’ADN codant pour HbS diffère de celle codant pour HbA par la substitution d’une Adénine (A) par une Thymine (T) en position 20. Fermer les fenêtres en cliquant sur le bouton Fermer toutes les fenêtres de la barre d’outils. 1.2 - Les phénotypes thalassémiques Les phénotypes thalassémiques de la banque de données sont en relation avec l’absence de synthèse d’une chaîne bêta fonctionnelle de l’hémoglobine. Il s’agit de thalassémies bêta majeures marquées par une anémie hémolytique grave, une morphologie des hématies très irrégulière, un retard staturo-pondéral et des modifications du squelette en rapport avec l’hémolyse chronique. Les malades arrivent à survivre quelques années car en l’absence de l’hémoglobine A1 fonctionnelle (Hb formée de 2 chaînes alpha et de 2 chaînes bêta) est partiellement compensée par une synthèse accrue d’hémoglobine A2 (2 chaînes alpha et 2 chaînes delta) et la persistance de synthèse d’hémoglobine foetale (2 chaînes alpha et 2 chaînes gamma). Cliquer sur le bouton Thèmes d’étude de la barre d’outils (ou sélectionner l’option Thèmes d’étude dans le menu Fichier). Ouvrir successivement le menu Relations Génotype-Phénotype et le sous-menu Phénotypes thalassémiques. Sélectionner Séquences nucléiques et valider le choix en cliquant sur OK. Les séquences nucléiques de HbA et des différentes thalassémies sont affichées dans la fenêtre Affichage des séquences et peuvent être parcourues en utilisant la barre de défilement horizontal. Procéder de la même façon pour sélectionner Séquences protéiques. Les séquences protéiques de HbA et des différentes thalassémies sont affichées dans la fenêtre Affichage des séquences et peuvent être parcourues en utilisant la barre de défilement horizontal. 1.2.1- Comparaison des séquences protéiques Sélectionner successivement Tha5 protéique, Tha4 protéique, Tha1 protéique et HbA protéique en cliquant sur les boutons de sélection correspondants. Cliquer sur le bouton Comparer les séquences de la barre d’outils. Valider l’option Comparaison simple et confirmer en cliquant sur OK. La nature du traitement effectué et les séquences comparées s’affichent dans la fenêtre Comparaison simple. Elles peuvent être parcourues en utilisant la barre de défilement horizontal. Les tirets indiquent l’identité des acides aminés par rapport à ceux de la première séquence qui sert de référence. Cliquer sur l’échelle pour obtenir celle correspondant aux séquences peptidiques. Utiliser la barre de défilement horizontal pour rechercher les différences entre les quatre séquences et le grand curseur pour préciser leur position Noter les résultats dans un tableau. Fermer la fenêtre Comparaison simple. 1.2.2- Comparaison des séquences nucléiques Sélectionner successivement Tha5 nucléique, Tha4 nucléique, Tha1 nucléique et HbA nucléique en cliquant sur les boutons de sélection correspondants. Cliquer sur le bouton Comparer les séquences de la barre d’outils. Valider l’option Alignement avec discontinuité et confirmer en cliquant sur OK. La nature du traitement effectué et les séquences comparées s’affichent dans la fenêtre Comparaison avec alignement. Elles peuvent être parcourues en utilisant la barre de défilement horizontal. Les tirets indiquent l’identité des bases par rapport à celles de la première séquence qui sert de référence. Le tiret bas ( _ )indique la délétion d’une base. Utiliser la barre de défilement horizontal pour rechercher les différences entre les quatre séquences et le grand curseur pour préciser leur position Noter les résultats dans un tableau. Cliquer sur l’icône Fermer toutes les fenêtres de la barre d’outils. RESULTATS POLYPEPTIDE ADN Position dans la séquence Changement global Position dans la séquence Nature du changement Tha1 18 chaîne de 17 a.a. 52 AT Tha4 7 chaîne de 18 a.a, différences à partir du 7 20 délétion de A Tha5 73 chaîne de 73 a.a., le dernier différent 218 addition de A Tha2 40 chaîne de 39 a.a. 118 CT Tha6 18 chaîne de 18 a.a., le dernier différent 52 délétion de C Tha7 10 chaîne de 22 a.a., différences à partir du 10 28 addition de C CONCLUSION L’arrêt anticipé de la traduction de l’ARNm, par suite de l’apparition d’un codon Stop plus ou moins précoce dans la séquence, est un dénominateur commun à l’origine du phénotype thalassémique. Mais ce codon Stop est dû à des mécanismes différents selon les allèles : - substitution transformant un triplet codant pour un acide aminé en un codon Stop (Thalassémies 1 et 2) ; - délétion entraînant un décalage du cadre de lecture et provoquant l’apparition d’un codon Stop plus ou moins distant de la position de la délétion (Thalassémies 4 et 6) ; - addition d’un nucléotide entraînant un décalage du cadre de lecture et provoquant l’apparition d’un codon stop plus ou moins distant dans la séquence (Thalassémies 5 et 7). 1.3 - Le phénotype " groupe sanguin ABO " Dans cet exemple, le polypeptide produit de l’expression du gène est une enzyme qui intervient dans la dernière étape de la synthèse des marqueurs membranaires de ce système de groupe sanguin. Le phénotype moléculaire, c’est à dire le marqueur membranaire, résulte de l’activité catalytique du polypeptide expression du gène. Cliquer sur le bouton Thèmes d’étude de la barre d’outils (ou sélectionner la commande Thèmes d’étude dans le menu Fichier). Ouvrir le menu Relations Génotype-Phénotype, sélectionner Phénotype groupes sanguins A, B, et O et valider le choix en cliquant sur OK. Les séquences nucléiques des allèles A, B et O sont affichées dans la fenêtre Affichage des séquences et peuvent être parcourues en utilisant la barre de défilement horizontal. 1.3.1- Comparaison des séquences nucléiques Sélectionner successivement Allèle O, Allèle B, et Allèle A en cliquant sur les boutons de sélection correspondants. Cliquer sur le bouton Comparer les séquences de la barre d’outils. Valider l’option Alignement avec discontinuité et confirmer en cliquant sur OK. La nature du traitement effectué et les séquences comparées s’affichent dans la fenêtre Comparaison avec alignement. Elles peuvent être parcourues en utilisant la barre de défilement horizontal. Les tirets indiquent l’identité des bases par rapport à celles de l’Allèle A qui sert de référence. Utiliser la barre de défilement horizontal pour rechercher les différences entre les trois séquences et le grand curseur pour préciser leur position Noter les résultats dans un tableau. Fermer la fenêtre Comparaison avec alignement. 1.3.2- Traduction des séquences nucléiques Sélectionner successivement Allèle O, Allèle B, et Allèle A en cliquant sur les boutons de sélection correspondants. Cliquer sur le bouton Convertir les séquences de la barre d’outils. Valider l’option Peptidique, l’option Traduction simple, l’option Résultat dans la fenêtre Affichage/édition et confirmer en cliquant sur OK. La nature du traitement effectué et les séquences protéiques Pro-Allèle O, Pro-Allèle B et Pro-Allèle A s’affichent dans la fenêtre Affichage des séquences. Elles peuvent être parcourues en utilisant la barre de défilement horizontal. 1.3.3- Comparaison des séquences protéiques Sélectionner successivement Pro-Allèle O, Pro-Allèle B et Pro-Allèle A en cliquant sur les boutons de sélection correspondants. Cliquer sur l’icône Comparer les séquences de la barre d’outils. Valider l’option Comparaison simple et confirmer en cliquant sur OK. La nature du traitement effectué et les séquences comparées s’affichent dans la fenêtre Comparaison simple. Les tirets indiquent l’identité des acides aminés par rapport à ceux de la première séquence qui sert de référence. Utiliser la barre de défilement horizontal pour rechercher les différences entre les trois séquences et le grand curseur pour préciser leur position Noter les résultats dans un tableau. RESULTATS POLYPEPTIDE Position dans la séquence ADN Changement global Position dans la séquence chaîne de 353 acides aminés chaîne de 1062 bases azotées 175 ARG GLY 523 CG 234 GLY SER 700 GA 265 LEU MET 793 CA 267 GLY ALA 800 GC chaîne de 115 a.a., différences à partir de 87 258 Allèle A Nature du changement Allèle B Allèle O délétion de G stop en 117 Fermer les fenêtres en cliquant sur l’icône Fermer toutes les fenêtres de la barre d’outils. CONCLUSION La comparaison des allèles A et B montre qu’ils diffèrent par 4 nucléotides situés aux positions 523, 700, 793 et 800. Il en résulte 4 différences au niveau de la séquence d’acides aminés du polypeptide enzymatique. Les acides aminés Leucine 265 et Glycine 267 rendent l’enzyme A capable de reconnaître la N-acétylgalactosamine, alors que les deux autres acides aminés, la Méthionine 265 et l’Alanine 267 rendent l’enzyme B capable de reconnaître le galactose (Cf. Hakomori S. Les rôles cachés des groupes sanguins . La Recherche, mai 1993, p. 548-554). L’allèle O diffère des allèles A et B par une délétion en position 258, qui entraîne un décalage du cadre de lecture et l’apparition d’un codon Stop en position 117. Il en résulte que toute ou partie du polypeptide contenant les acides aminés précédents n’est pas synthétisée, ce qui peut être relié à l’inactivité de l’enzyme. III - POLYMORPHISME DES GENES Gènes codant pour les glycoprotéines membranaires HLAA, HLAB et HLAC Chez l’homme, les gènes du CMH sont situés, très près les uns des autres, sur le bras court du chromosome 6. Ils codent pour des glycoprotéines membranaires appelées antigènes majeurs d’histocompatibilité. On distingue les antigènes HLA de classe I exprimés à la surface des membranes de toutes les cellules nucléées de l’organisme et les antigènes HLA de classe II présents uniquement sur les membranes des cellules du système immunitaire. La banque de données ne renferme que les séquences relatives aux antigènes de classe I. 1. Structure des gènes et des protéines HLA de classe I Les antigènes majeurs d’histocompatibilité de classe I sont codés par 3 gènes : HLAA, HLAB et HLAC. Chaque gène comprend 8 exons et 7 introns. Un antigène de classe I est constitué de deux molécules : la chaîne polypeptidique dite alpha codée par un gène HLA et la bêta microglobuline, dont le rôle est de maintenir la structure de la chaîne alpha par des liaisons chimiques faibles. La chaîne alpha présente : - une partie extracellulaire constituée par 3 domaines de 90 acides aminés chacun : les domaines alpha 1, alpha 2 et alpha 3, codés respectivement par les exons 2, 3 et 4 ; - une partie intramembranaire, riche en acides aminés hydrophobes, permettant l’ancrage solide de la molécule dans la membrane, elle est codée par l’exon 5 ; - une partie intracytoplasmique constituant l’extrémité carboxyterminale de la molécule et codée par les exons 6 et 7 et le tout début de l’exon 8, sauf pour HLAB pour lequel l’exon 8 se trouve entièrement dans la partie non traduite du gène. Les séquences strictement codantes des gènes de la banque de données commencent au codon d’initiation de la traduction ATG et se terminent au codon Stop. Elles comportent donc la partie de l’exon 1 correspondant au peptide signal, la exons 2 à 7 et le tout début de l’exon 8 (sauf pour HLAB). 2. Les allèles des gènes HLA de classe I Ce sont des gènes très polymorphes, on reconnaît plus de 40 allèles HLAA, plus de 60 allèles HLAB et une quinzaine d’allèles HLAC. Dans la majorité des populations étudiées, la fréquence des divers allèles répertoriés dépasse 1%, mais varie d’une population à l’autre Chaque allèle est défini par 4 chiffres : les deux premiers correspondent à la spécificité repérée sérologiquement, les deux derniers à une séquence nucléotidique précise : - HLAB 27, gène associé à la spondylarthrite ankylosante, correspond à 6 allèles numérotés de HLAB 2701 à HLAB 2706 ; - HLAA 2, gène le plus fréquent, correspond à 12 allèles numérotés de HLAA 0201 à HLAA 0212. Allèles Français Japonais N 355 939 HLAA 1 14,6 0,7 HLAA 2 20,9 24,1 HLAA 3 13,6 0,6 HLAA 11 5,7 10,4 HLAA 23 2,8 - HLAA 24 9,5 35,6 HLAA 25 2,5 0 HLAA 26 4,2 10,9 5,5 0 HLAA 28 Fréquence en % de quelques allèles du locus HLAA dans deux échantillons de populations 3. Recherche des différences entre les allèles d’un gène HLA 3.1- Différences entre allèles de même spécificité sérologique 3.1.1- Comparaison des séquences nucléiques Cliquer sur le bouton Thèmes d’étude de la barre d’outils (ou sélectionner l’option Thèmes d’étude dans le menu Fichier). Ouvrir successivement le menu Polymorphisme des gènes et le sous-menu Polymorphisme HLAA. Les séquences nucléiques des différents allèles du gène HLAA sont affichées dans la fenêtre Affichage des séquences et peuvent être parcourues en utilisant la barre de défilement horizontal. Sélectionner successivement hlaa 0212, hlaa 0211, hlaa 0210 et hlaa 0201 en cliquant sur les boutons de sélection correspondants. Cliquer sur le bouton Comparer les séquences de la barre d’outils. Valider l’option Comparaison simple et confirmer en cliquant sur OK. La nature du traitement effectué et les séquences comparées s’affichent dans la fenêtre Comparaison simple. Elles peuvent être parcourues en utilisant la barre de défilement horizontal. Les tirets indiquent l’identité des bases par rapport à celles de la première séquence qui sert de référence. Utiliser la barre de défilement horizontal pour rechercher les différences entre les quatre séquences et le grand curseur pour préciser leur position Noter les résultats dans un tableau. RESULTATS Position 1 98 102 290 292 368 391 538 539 1098 Hlaa 0201 - T A C C A T T T - Hlaa 0210 - A C C C T G T T - Hlaa 0211 - T A T G A T T T - Hlaa 0212 - T A C C A T C A - Hlaa 0201 0 Hlaa 0210 4 0 Hlaa 0211 2 6 0 Hlaa 0212 2 6 4 O Hlaa 0201 Hlaa 0210 Hlaa 0211 Hlaa 0212 Matrice des différences entre quelques allèles de HLAA 02 Fermer la fenêtre Comparaison simple. 3.1.2- Traduction des séquences nucléiques Sélectionner successivement hlaa 0212, hlaa 0211, hlaa 0210 et hlaa 0201 en cliquant sur les boutons de sélection correspondants. Cliquer sur le bouton Convertir les séquences de la barre d’outils. Valider l’option Peptidique, l’option Traduction simple, l’option Résultat dans la fenêtre Affichage/édition et confirmer en cliquant sur OK. La nature du traitement effectué et les séquences protéiques s’affichent dans la fenêtre Affichage des séquences. Elles peuvent être parcourues en utilisant la barre de défilement horizontal. 3.1.3- Comparaison des séquences protéiques Sélectionner successivement Pro-hlaa 0212, Pro-hlaa 0211, Pro-hlaa 0210 et Pro-hlaa 0201 en cliquant sur les boutons de sélection correspondants. Cliquer sur l’icône Comparer les séquences de la barre d’outils. Valider l’option Comparaison simple et confirmer en cliquant sur OK. La nature du traitement effectué et les séquences comparées s’affichent dans la fenêtre Comparaison simple. Les tirets indiquent l’identité des acides aminés par rapport à ceux de la première séquence qui sert de référence. Utiliser la barre de défilement horizontal pour rechercher les différences entre les quatre séquences et le grand curseur pour préciser leur position Noter les résultats dans un tableau. RESULTATS Position 1 33 97 98 123 131 180 365 Pro-hlaa 0201 - Phe Thr His Tyr Trp Leu - Pro-hlaa 0210 - Tyr - - Phe Gly - - Pro-hlaa 0211 - - Ile Asp - - - - Pro-hlaa 0212 - - - - - - Gln - Pro-hlaa 0201 0 Pro-hlaa 0210 3 0 Pro-hlaa 0211 2 5 0 Pro-hlaa 0212 1 4 3 O Pro-hlaa 0201 Pro-hlaa 0210 Pro-hlaa 0211 Pro-hlaa 0212 Fermer la fenêtre Comparaison simple. 3.2 - Différences entre allèles de spécificités sérologiques différentes 3.2.1- Comparaison des séquences nucléiques Sélectionner successivement hlaa 2401, hlaa 1101, hlaa 0201 et hlaa 0101 en cliquant sur les boutons de sélection correspondants. Cliquer sur le bouton Comparer les séquences de la barre d’outils. Valider l’option Comparaison simple et confirmer en cliquant sur OK. La nature du traitement effectué et les séquences comparées s’affichent dans la fenêtre Comparaison simple. Elles peuvent être parcourues en utilisant la barre de défilement horizontal. Les tirets indiquent l’identité des bases par rapport à celles de la première séquence qui sert de référence. Utiliser la barre de défilement horizontal pour rechercher les différences entre les quatre séquences et le grand curseur pour préciser leur position Noter les résultats dans un tableau. RESULTATS Hlaa 0101 0 Hlaa 0201 50 0 Hlaa 1101 12 50 0 Hlaa 2401 47 49 48 O Hlaa 0101 Hlaa 0201 Hlaa 1101 Hlaa 2401 Matrice des différences entre quelques allèles de spécificités sérologiques différentes Position 1 23 48 72 78 98 102 144 203 240 Hlaa 0101 - C C G C T A C A G Hlaa 0201 - G T - T - - A G T Hlaa 1101 - - - - - A C - G - Hlaa 2401 - G - A - C - - G - Position 256 257 265 270 271 282 292 299 301 307 Hlaa 0101 C A C T A C G C A G Hlaa 0201 G G - A G - C T G - Hlaa 1101 - - - - G G - T G - Hlaa 2401 G - G A G - - A - C Position 311 313 314 317 319 341 355 362 363 368 Hlaa 0101 C C T G G A A T A5 A Hlaa 0201 - - - - - C G G G - Hlaa 1101 - - - - - - - - - - Hlaa 2401 T G C T C C C - G T Position 385 391 413 414 418 453 489 497 502 506 Hlaa 0101 C G G G G C A T A G Hlaa 0201 T T A C T A - C - A Hlaa 1101 - - - - - - - - - - Hlaa 2401 T - A C T A G - C - Position 521 524 527 533 534 545 559 560 570 571 Hlaa 0101 T A C C G T C G C G Hlaa 0201 C - T T T C A C G T Hlaa 1101 C - - - A C - - G T Hlaa 2401 C G T T T C A C - - Position 622 630 633 642 649 651 652 666 672 678 Hlaa 0101 C G A C C C A G C G Hlaa 0201 G A G T G T G A - - Hlaa 1101 - - - - - - - - - - Hlaa 2401 - - - - - - - - T A Position 691 702 807 819 829 868 899 900 916 920 Hlaa 0101 G C G G G C T G A C Hlaa 0201 A - - - C T C - - - Hlaa 1101 - - - - - - - - - - Hlaa 2401 - T A A - - C A G A Position 952 987 1005 1029 1033 1098 Hlaa 0101 C C G T A - Hlaa 0201 T T - C T - Hlaa 1101 - - - - - - Hlaa 2401 - T C C T - Fermer la fenêtre Comparaison simple. 3.2.2- Traduction des séquences nucléiques Sélectionner successivement hlaa 2401, hlaa 1101, hlaa 0201 et hlaa 0101 en cliquant sur les boutons de sélection correspondants. Cliquer sur le bouton Convertir les séquences de la barre d’outils. Valider l’option Peptidique, l’option Traduction simple, l’option Résultat dans la fenêtre Affichage/édition et confirmer en cliquant sur OK. La nature du traitement effectué et les séquences protéiques s’affichent dans la fenêtre Affichage des séquences. Elles peuvent être parcourues en utilisant la barre de défilement horizontal. 3.2.3- Comparaison des séquences protéiques Sélectionner successivement Pro-hlaa 2401, Pro-hlaa 1101, Pro-hlaa 0201 et Pro-hlaa 0101 en cliquant sur les boutons de sélection correspondants. Cliquer sur l’icône Comparer les séquences de la barre d’outils. Valider l’option Comparaison simple et confirmer en cliquant sur OK. La nature du traitement effectué et les séquences comparées s’affichent dans la fenêtre Comparaison simple. Les tirets indiquent l’identité des acides aminés par rapport à ceux de la première séquence qui sert de référence. Utiliser la barre de défilement horizontal pour rechercher les différences entre les quatre séquences et le grand curseur pour préciser leur position Noter les résultats dans un tableau. RÉSULTATS Pro_hlaa 0101 0 Pro-hlaa 0201 33 0 Pro-hlaa 1101 11 27 0 Pro-hlaa 2401 33 30 33 O Pro-hlaa 0101 Pro-hlaa 0201 Pro-hlaa 1101 Pro-hlaa 2401 Matrice des différences entre polypeptides codés par divers allèles de HLAA CONCLUSIONS 1- Les différences entre les allèles se limitent uniquement à des substitutions de nucléotides. Les sites de variabilité sont dispersés sur toute la chaîne, mais sont surtout situés dans les régions qui codent pour les domaines alpha 1 et alpha 2 de la protéine. 2- Les allèles de même spécificité sérologique présentent un nombre réduit de différences, alors que ceux appartenant à des spécificités sérologiques différentes en présentent un grand nombre, de 40 à 50 en moyenne. 3- Les chaînes polypeptidiques codées par les différents allèles d’un locus ont toutes la même longueur (365 acides aminés avec le peptide signal pour HLAA), ce qui signifie qu’aucune substitution n’entraîne l’apparition anticipée d’un codon Stop. Les polypeptides correspondant à un même spécificité sérologique ne diffèrent que par un à quelques acides aminés. Les polypeptides correspondant à des spécificités sérologiques différentes ont en moyenne 20 à 25 acides aminés différents. 4- La comparaison du nombre de différences au niveau nucléique et au niveau protéique montre qu’il existe des mutations silencieuses en rapport avec la redondance du code génétique.