242 STV, vol. 24, no5, mai 2012
et un groupe de témoins. Les variants génétiques
les plus fréquemment utilisés sont les polymorphismes
mononucléotidiques (single nucleotide polymorphism,
SNP), représentant une variation individuelle dans la
séquence nucléotidique. Pour un SNP A/G par exemple,
un individu donné peut être porteur d’aucun, un ou deux
allèle(s) G et présenter un des trois génotypes suivants :
AA, AG ou GG. Un allèle donné d’un variant génétique
est considéré comme étant associé à une maladie si sa fré-
quence diffère plus entre cas et témoins que ne le voudrait le
simple hasard. Cela n’implique pas nécessairement un lien
de causalité, dans la mesure où les variants étudiés ne sont
souvent pas directement fonctionnels, mais uniquement en
déséquilibre de liaison avec le variant causal qui n’est pas
observé (figure 1). Les études d’association génétique sont
beaucoup plus puissantes que les analyses de liaison pour
les maladies complexes [3]. Durant plusieurs années les
études d’association génétique étaient effectuées avec un
nombre limité de variants génétiques (souvent un seul), qui
étaient sélectionnés dans des gènes dits « candidats », c’est-
à-dire dont on pensait a priori qu’ils pouvaient intervenir
dans la physiopathologie de la maladie étudiée. Des cen-
taines d’études de ce type ont été publiées, dont très peu
ont abouti à des résultats robustes ayant pu être confirmés
dans des populations indépendantes [4]. Une grande par-
tie de ces études présentaient des limites méthodologiques,
notamment l’utilisation d’effectifs trop faibles donnant une
puissance statistique insuffisante, une analyse limitée de
la variation génétique sur un gène donné, et l’absence de
réplication de résultats significatifs dans une population
indépendante [5, 6]. Par ailleurs, elles sont fondées sur des
Association indirecte
(observée)
Déséquilibre de liaison
A
Phénotype
Association directe
(non observée)
Variant génotypé Variant causal non observé
Chromosome
B
Figure 1. Distinction entre association génétique et relation cau-
sale dans les études d’association génétique. Le variant génotypé
est à considérer comme un «marqueur ». À noter toutefois que
les variants génotypés peuvent parfois être aussi le variant cau-
sal. Le caractère fonctionnel d’un variant doit idéalement être testé
de fac¸on expérimentale (par exemple en testant l’association de
ce variant avec le taux d’expression du gène dans lequel ou près
duquel il se trouve). En l’absence de données expérimentales, cer-
taines localisations des variants génétiques peuvent être en faveur
d’un rôle fonctionnel : dans une séquence régulatrice, dans une
séquence codante – exon – «non-synonyme »ou «missense »
(i.e. modifiant l’acide aminé) ou «non-sense »(i.e. induisant la
survenue prématurée d’un codon stop), dans un site d’épissage
intronique.
hypothèses préalables, possiblement fausses, sur la physio-
pathologie sous-jacente de la maladie.
Depuis quelques années, les études d’association géné-
tiques ont été littéralement révolutionnées par l’avènement
des technologies de génotypage à haut débit. En effet
l’utilisation de micropuces, contenant des séquences oligo-
nucléotidiques définies sur lesquelles l’ADN est hybridisé,
permettent de mesurer de fac¸on automatisée en quelques
jours seulement des centaines de milliers voire plusieurs
millions de variants génétiques répartis sur l’ensemble du
génome, et ce sur plusieurs milliers d’individus à la fois
[7]. Auparavant, le génotypage d’un seul variant effectué
manuellement sur quelques centaines d’individus pouvait
prendre plusieurs semaines. Parallèlement à ces innova-
tions technologiques, le projet international HapMap1a
décrit et mis à disposition des chercheurs les polymor-
phismes les plus fréquents sur l’ensemble du génome,
dans différents groupes ethniques. Ceci a conduit à
l’avènement d’un nouveau type d’étude d’association géné-
tique, dite pangénomique ou « genome-wide association
study » (GWAS) [8]. Ces études consistent à génotyper
un très grand nombre (500 000-5 000 000) de variants
génétiques distribués sur l’ensemble des chromosomes,
sans hypothèse a priori sur les loci (régions génétiques)
d’intérêt.
Méthodes
Description des méthodes
Sur le plan statistique les études d’association génétique
sont basées sur des méthodes classiques. Pour un phénotype
dit binaire (présence ou absence d’une maladie donnée),
une régression logistique est effectuée pour chacun des
centaines des milliers de variants disponibles sur la puce
utilisée [9, 10]. Lorsque des traits quantitatifs sont étudiés,
par exemple la pression artérielle pulsée [11], ou l’index de
masse corporelle [12], une régression linéaire est employée,
et lorsque l’étude GWAS est effectuée dans des études lon-
gitudinales avec des événements incidents, un modèle de
Cox peut être appliqué [13]. Le modèle génétique utilisé est
généralement un modèle additif, avec un degré de liberté,
qui est le modèle le plus puissant dans ce type d’étude.
Un certain nombre de contraintes statistiques et logistiques
doivent toutefois être prises en compte, telles que détaillées
ci-après.
Le nombre très important de tests statistiques effectués
nécessite généralement l’accès à un supercalculateur du
1www.hapmap.org
Copyright © 2017 John Libbey Eurotext. Téléchargé par un robot venant de 88.99.165.207 le 24/05/2017.