caractère ancestral à partir de la méthode de
Vraisemblance, une méthode d’estimation
paramétrique permettant de donner un estimateur
d’un paramètre d’une loi de probabilité inconnue
dont on observe des réalisations indépendantes, en
utilisant le modèle Mk1 avec 3 états du caractère
« acide C24 », soit présence, absence ou inconnu.
Par rapport à la topologie d’arbre, nous
avons fait 24 arbres modèles des tous les 225
mammifères deux fois, d’abord par la méthode de
parcimonie et après, par la méthode de
vraisemblance, parce qu’il y avait plusieurs
topologies différents d’arbres phylogénétiques des
mammifères (annexe 3 – partie 1) dans la littérature.
De plus, vu qu’il y avait des espèces dont leurs
phénotypes étaient inconnu, il était difficile à
interpréter les arbres, nous avons donc fait aussi les
mêmes 24 arbres avec seulement les espèces dont le
phénotype était connu, un total de 162 individus
(annexe 3 – partie 2).
Reconstruction du caractère ancestral des vertébrés
Hofmann et al 2010 ont montré que chez les
vertébrés et aussi chez les agnates le phénotype 1 est
le caractère ancestral, mais chez les mammifères, le
phénotype 6 est prédominant. Afin de savoir quand
le phénotype 6 a apparu chez les vertébrés et mieux
comprendre son histoire évolutive, nous avons
reconstruit le caractère ancestral « acides C24 » avec
Mesquite, comme décrit avant, en utilisant la
méthode de Vraisemblance. Cette fois, nous avons
dû faire seulement 4 topologies différentes des 61
espèces de vertébrés séquencés (annexe 3 – partie 3)
qui faisaient partie du tableau de 225 espèces. En
autre, nous avons refaire les 4 arbres avec les espèces
dont le phénotype était connu – soit un total de 28
espèces – afin de faciliter l’analyse des arbres
(annexe 3 – partie 4).
Recherche des orthologues et construction de la
phylogénétique de BAAT chez vertébrés
Une fois le gène candidat choisi, nous avons
cherché des orthologues entre les espèces de
vertébrés séquencées sur la base de données
Ensembl. Nous avons fait un BLAST de la séquence
de la protéine humaine et comme résultat, la
recherche a trouvé 61 vertébrés qui ont été utilisées
pour faire la reconstruction du caractère ancestral
« acides C24 » par Mesquite selon le gène BAAT.
Entre eux, 28 espèces avaient le phénotype connu
(elles faisaient partie des jeux de donnés de
Hofmann et al 2010) et afin d’obtenir des résultats
plus significatifs, la reconstruction a été faite aussi
uniquement avec elles. Afin de comparer le résultat
de la recherche sur Ensembl, une recherche des
orthologues de BAAT et un BLAST de la protéine
humaine ont été faits aussi sur la base de données
NCBI et les mêmes 61 espèces ont été trouvées. La
séquence au format FASTA des 28 espèces dont le
phénotype était connu a été prise ainsi que celle de
deux urochordés, Ciona intestinalis et C. savignyi,
afin les utiliser comme groupe externe pour la
construction de la phylogénie (annexe 4 – partie 1).
Afin d’identifier les espèces après l’alignement, la
première lettre qui identifie le genre et les deux
premières lettres de l’espèce de leurs noms
scientifiques ont été utilisés pour faire une
identification avant chaque séquence, par exemple :
l’identifiant de l’espèce Homo sapiens est « Hsa ».
Les séquences ont été alignées par le logiciel
Seaview 4.5.0 et les régions conservées ont été
sélectionnées pour la construction de la phylogénie
de BAAT (annexe 4 – partie 2). Les séquences de
Petromyzon marinus, Tarsius syrichta et
Microcebus murinus, n’ont pas été alignées parce
qu’elles étaient trop petites (ne sont pas présentes
dans l’annexe 4), ce qui a donné un total de 27
séquences alignées. La construction de l’arbre
phylogénétique du gène BAAT a été faite aussi par