Profils d`expression génique et Puces à ADN dans le cancer du sein

publicité
Profils d’expression génique et Puces à
ADN dans le cancer du sein : choix du
patient, choix du protocole
F. Bertucci
Malgré les progrès accomplis ces dernières années, la survie des patientes atteintes
d’un cancer du sein stagne autour de 70 % à cinq ans. Les indications thérapeutiques sont basées sur des facteurs pronostiques (« choix du patient ») et prédictifs
de la réponse thérapeutique (« choix du protocole ») qui, globalement, ont peu
évolué depuis une quinzaine d’années. Ces facteurs, histologiques, cliniques et
moléculaires, sont insuffisants pour rendre compte de l’hétérogénéité évolutive de
la maladie, conduisant un certain nombre de patientes vers des traitements
inadaptés, toxiques, inutiles ou inefficaces, et traduisant l’existence de sous-classes
pronostiques non identifiées par ces approches classiques. Etant donné la disponibilité croissante de nouvelles molécules anti-tumorales, il est crucial d’améliorer la
classification pronostique du cancer du sein pour affiner les indications thérapeutiques et améliorer la survie des patientes.
Face aux limites des approches conventionnelles, il est apparu que de nouvelles
percées thérapeutiques ne seraient possibles qu’à travers une caractérisation moléculaire plus globale, détaillée et objective de la maladie. Le cancer du sein est une
maladie génétique complexe, caractérisée par l’accumulation et la combinaison de
multiples altérations moléculaires qui confèrent à chaque tumeur un phénotype et
un potentiel évolutif propres. La nécessité d’une compréhension approfondie de la
maladie au niveau moléculaire se heurtait donc jusqu’à présent à des contraintes
techniques, donnant peu d’informations par rapport à la complexité du processus.
Depuis quelques années, la recherche biomédicale connaît une véritable révolution
avec l’apport de la génomique, fruit de deux facteurs : les avancées et les ressources
sans cesse croissantes produites par le projet Génome humain (clones d’ADN,
séquences de gènes, de protéines…) et l’essor de nouvelles technologies (bio-informatique, robotique…) capables de les exploiter. Les techniques d’analyse moléculaire à grande échelle qui ont ainsi été récemment développées permettent d’analyser l’activité de plusieurs milliers de gènes ou protéines simultanément, dans un
échantillon en une expérience, rendant plus abordable la complexité moléculaire
des tumeurs. L’hypothèse, confirmée par les travaux publiés, est que l'étude d'une
268 Cancer du sein
combinaison de molécules impliquées dans un phénotype complexe est plus informative que chaque molécule prise isolément. Pour des raisons techniques, ce typage
à grande échelle s’est d’abord focalisé sur l’étude du transcriptome (ensemble des
ARN d’un échantillon) au moyen de la technique des puces à ADN qui mesurent de
manière quantitative le niveau d’expression au niveau de l’ARN (1, 2). Les applications attendues sont multiples aux niveaux fondamental, clinique et thérapeutique
(3). Au niveau clinique, plusieurs publications ont notamment suggéré l’impact de
cette approche dans l’évaluation pronostique des tumeurs, le cancer du sein en particulier.
Puces à ADN ou DNA micro-arrays
Le principe repose sur l'hybridation d'un jeu ordonné de gènes cibles (représentés
par des clones d’ADN complémentaire ADNc ou des oligo-nucléotides) immobilisés sur un support solide (puce ou array) avec une sonde complexe produite par
rétro-transcription et marquage à partir d'un ARN d'intérêt (figure 1). Elle est dite
complexe car elle contient, en solution, de nombreuses séquences d'ADNc en quantités variables, correspondant aux abondances des espèces d'ARNm dans l'ARN de
départ. L’hybridation sur la puce aboutit à la fixation sur chaque gène cible d’une
quantité de l’espèce correspondante d’ARNm de la sonde, proportionnelle à son
abondance dans l’ARN de départ. Après lavage et acquisition de l’image d’hybridation, le signal fixé sur chaque cible est détecté, quantifié et enregistré de façon automatique grâce à des logiciels d’analyse. Ce signal reflète la concentration de la
séquence correspondante dans la sonde, donc le niveau d'expression du gène
concerné. Les intensités obtenues sont ensuite normalisées, permettant de dresser
pour chaque échantillon (une tumeur, par exemple) un véritable portrait moléculaire qui pourra alors être comparé à celui d’autres échantillons. L’objectif de cette
analyse comparative est l’identification d’une signature moléculaire (combinaison
de plusieurs gènes) permettant de définir de nouvelles classes de tumeurs sur la
seule base de leur profil d’expression (approches non supervisées) et/ou de caractériser des classes de tumeurs associées à un phénotype d’intérêt (la survie par
exemple, approches supervisées) (4). Elle fait appel à des outils bio-informatiques
sophistiqués traitant l’énorme quantité des données produites.
Profils d’expression génique et Puces à ADN dans le cancer du sein… 269
Figure 1 - Principe de la mesure d’expression génique sur puces à ADN.
270 Cancer du sein
Profils d’expression et pronostic
Plusieurs études rétrospectives ont suggéré le potentiel pronostique des puces à
ADN en cancérologie mammaire à travers l’identification de nouvelles classes pronostiques non identifiables par les moyens conventionnels, dans des groupes de
tumeurs d'apparence histo-clinique homogène, mais hétérogènes sur le plan évolutif. Ces études ont porté sur la recherche de profils d’expression associés à la survie
sans ou avec traitement systémique (chimiothérapie CT et/ou hormonothérapie
HT) en situation adjuvante (analyse de la tumeur réséquée) ou néo-adjuvante (analyse de la biopsie tumorale avant CT), dans des formes localisées ou localement
avancées.
Lors d’une étude pilote analysant l’expression d’environ 200 gènes candidats
dans une série de 34 cancers du sein localisés, nous avons identifié, parmi des
tumeurs de mauvais pronostic traitées par CT adjuvante, deux classes d’évolution
différente en terme de survie. Cette discrimination résultait de l’expression différentielle de 23 gènes (5). Nous avons ensuite analysé l’expression d’environ 1 000 gènes,
incluant les 200 précédents, dans une population théoriquement homogène de 55
tumeurs localisées, de mauvais pronostic (6). Toutes les patientes avaient reçu une
CT adjuvante à base d’anthracyclines. Nous avons dans un premier temps validé
l’intérêt pronostique de notre jeu de 23 gènes dans cette série indépendante de
tumeurs. Une analyse plus approfondie a ensuite identifié une signature de
40 gènes, directement dérivée de la précédente, qui affinait la classification en distinguant trois classes de patientes équilibrées sur les facteurs pronostiques classiques, mais présentant une survie globale et sans métastase significativement différente sur un suivi médian de cinq ans (figure 2). Une étude de validation rétrospective est en cours aujourd’hui au niveau uni- et multicentrique.
Figure 2
– Représentation en 2D des résultats de classification hiérarchique des 55 tumeurs en fonction de l’expression respective des gènes du cluster I (25 gènes corrélés à ESR1 qui code
pour RE) et des gènes du cluster II (15 gènes). Pour chaque classification (attention, celle
concernant les gènes du cluster II a été pivotée de 90° pour des raisons de représentation
graphique), chaque ligne représente un gène et chaque colonne représente une tumeur. Les
gènes sont référencés par leur symbole LocusLink et les tumeurs par un numéro. Les
numéros des tumeurs avec une évolution fatale sont notés en rouge. Pour chaque gène, les
niveaux d’expression sont rapportés au niveau d’expression médian à travers toutes les
tumeurs et sont représentés par une échelle de couleur allant du vert pour les gènes sousexprimés au rouge pour les gènes sur-exprimés. La classification hiérarchique a été appliquée aux échantillons et aux gènes sur la base d’une similarité des niveaux d’expression
génique : les échantillons les plus similaires entre eux sont regroupés sur l’axe horizontal,
de même que les gènes sur l’axe vertical. La longueur des branches du dendrogramme
reliant les éléments reflète leur degré de similarité. La représentation croisée en 2D définit
quatre groupes de tumeurs (A, B, C et D). Les carrés noirs indiquent les patientes en vie au
dernier suivi et les carrés rouges les patientes décédées de leur maladie. Trois classes de
patientes (A, B+C, D) sont définies avec une survie significativement différente.
– Courbe de survie sans métastase pour les trois classes.
– Courbe de survie globale pour les trois classes.
Profils d’expression génique et Puces à ADN dans le cancer du sein… 271
Figure 2 - Classification pronostique de 55 cancers du sein localisés en fonction de l’expression de 40 gènes discriminants.
272 Cancer du sein
Une équipe hollandaise a abordé le problème du sur-traitement par CT adjuvante
des tumeurs localisées sans envahissement ganglionnaire N- (7). Les auteurs ont
mesuré l’expression d’environ 25 000 gènes dans une série de 97 cancers du sein non
traités par CT adjuvante. Les patientes étaient sélectionnées de telle sorte qu’une
moitié avait développé des métastases dans les cinq ans et l’autre moitié en était
indemne au-delà de cinq ans. Une analyse supervisée réalisée sur 78 échantillons a
identifié un jeu discriminant de 70 gènes qui prédisait correctement le devenir clinique dans 83 % des cas. Ce jeu a ensuite été validé sur les 19 échantillons indépendants restants. Les auteurs ont ensuite comparé le nombre de patientes qui auraient
été candidates à une CT adjuvante selon les critères consensuels de Saint-Gallen et
du NIH, ou selon ce prédicteur à 70 gènes. Les critères classiques auraient conduit
à traiter environ 95 % des patientes qui ont rechuté et 70 à 91 % de celles qui n’ont
pas rechuté, alors que le critère moléculaire aurait permis de traiter un nombre
identique de patientes qui ont rechuté (91 %), mais un nombre bien inférieur parmi
celles qui n’ont pas rechuté (27 %). Cette signature moléculaire a été analysée secondairement sur une série de 295 tumeurs avec et sans atteinte ganglionnaire (8) et son
impact pronostique a été confirmé sur l’ensemble de la série, mais également chez
les patientes N- et les patientes N+.
Une troisième étude s’est intéressée au cancer du sein localement avancé (9).
L’équipe de Stanford a mesuré l’expression d’environ 8 000 gènes dans un jeu de
78 tumeurs du sein comprenant une majorité de formes localement évoluées chez
des patientes traitées par doxorubicine en néo-adjuvant. Les auteurs ont défini un
jeu de 496 gènes dont l’expression définissait cinq classes de tumeurs différentes du
point de vue de leur signature transcriptionnelle et de la survie à long terme. Ces
classes étaient reliées au type cellulaire à l’origine de la tumeur et à certaines données d’immuno-histochimie. Les tumeurs négatives pour le récepteur aux estrogènes (RE-) étaient subdivisées en une classe présentant un profil d’expression
proche de celui des cellules épithéliales basales, une classe qui sur-exprimait un
groupe de gènes contenant ERBB2 et une classe présentant un profil proche du tissu
mammaire normal. Les tumeurs RE+ présentaient un profil d’expression proche
des cellules épithéliales luminales et étaient subdivisées en deux classes (luminal A
et luminal B) de survie différente. Ces résultats ont été confirmés par la même
équipe sur un jeu plus étendu de 115 tumeurs (incluant les 78 tumeurs précédentes)
et sur deux séries de données publiées par deux autres équipes et disponibles sur
Internet (10). Ces sous-types moléculaires cliniquement et biologiquement relevants ont été aussi validés par C. Sotiriou et al. sur 99 tumeurs localisées analysées
sur des puces contenant 7 650 gènes (11), renforçant encore la validité de cette classification.
Une autre étude à visée pronostique a été rapportée en 2002 par une équipe allemande (12) et concernait, en fait, toutes les formes cliniques du cancer du sein, des
stades localisés aux stades métastatiques. Il s’agissait de l’actualisation avec les données de survie d’une étude publiée l’année précédente (13). Les auteurs ont classé
55 tumeurs en fonction de l’expression de 41 gènes, et ont identifié une classe de
patientes présentant une survie sans métastase significativement inférieure aux
autres classes. Cependant, certains aspects méthodologiques cliniques de cette étude
apparaissent peu rigoureux : l’analyse de survie n’a pas pris en compte les tumeurs
Profils d’expression génique et Puces à ADN dans le cancer du sein… 273
T4, et des paramètres pertinents pour le pronostic tels que le traitement, l’âge des
patientes, le statut RE, le grade et le type histologique des tumeurs n’ont pas été
mentionnés. Aucune étude n’a été publiée ensuite par ce groupe sur le sujet.
Plus récemment, E. Huang et al. (14) ont analysé l’expression de plus de 12 000
gènes (puces Affymetrix) dans une série de 89 cancers du sein localisés. L’étude pronostique a porté sur 52 tumeurs ayant 1 à 3 ganglions axillaires envahis (18 rechutes
à trois ans contre 34 sans rechute). La méthode d’analyse était originale et utilisait,
non pas les gènes individuellement, mais 496 métagènes préalablement définis par
k-means clustering afin de réduire la multidimensionnalité du jeu de données. Par
une méthode de « partitionnement successif » des échantillons, les auteurs ont identifié un prédicteur moléculaire multigénique permettant de classer correctement
90 % des cas (estimation par la méthode leave-one-out cross-validation).
Enfin, l’étude la plus récente a été publiée en juin 2004 (15). Elle concernait le
pronostic des formes localisées traitées par HT adjuvante. Les auteurs ont analysé
l’expression de plus 22 000 gènes (puces Agilent) dans une série de 60 cancers du
sein localisés RE+ traités en adjuvant par tamoxifène. L’analyse parallèle des échantillons tumoraux « entiers » et micro-disséqués a permis de réduire la liste des gènes
associés à la rechute métastatique à deux gènes HOXB13 et IL17BR. Le ratio de l’expression des deux gènes représentait un facteur pronostique fort et indépendant en
analyse uni- puis multivariée, qui a été ensuite validé sur les mesures d’expression
définies par RQ-PCR sur les mêmes échantillons congelés, mais aussi sur 20 échantillons indépendants inclus en paraffine. Il s’agit de la première étude par puces à
ADN s’intéressant à l’évolution sous HT.
Profils d’expression et réponse à la chimiothérapie
Trois études rétrospectives récentes se sont intéressées plus directement à la réponse
à la CT dans le cancer du sein localisé et localement avancé, traité par CT première.
Toutes suggèrent le potentiel des profils d’expression définis sur puces à ADN
dans la prédiction de cette réponse.
La première a été rapportée dans le Lancet par l’équipe du Baylor College de
Houston (16). L’analyse, réalisée sur puces à 12 000 gènes (Affymetrix), a concerné
24 tumeurs localement avancées traitées par 4 cures de taxotère en néo-adjuvant.
L’analyse supervisée a identifié un jeu de 92 gènes dont l’expression était corrélée à
la réponse clinique (12 répondeurs et 12 non-répondeurs). En expérience de crossvalidation, le taux de classifications correctes était de 88 %.
La seconde étude a été rapportée par l’équipe du MD Anderson (17). Les auteurs
ont analysé l’expression de 30 721 clones (puces personnelles) dans 42 cancers du
sein T2-T4 traités par un schéma séquentiel de CT délivrant 12 cures hebdomadaires de Taxol®, suivies de 4 cures de FAC en néo-adjuvant. L’analyse supervisée
portant sur la réponse histologique après CT dans un learning set de 24 tumeurs
(13 RCH ou réponse complète histologique et 11 non-RCH) a identifié une signature de 74 clones dont l’expression classait correctement 78 % des tumeurs du validation set (18 tumeurs).
274 Cancer du sein
La dernière étude concerne le cancer du sein inflammatoire (18). Nous avons
analysé l’expression de 8 000 clones (puces personnelles) dans 37 cancers du sein
inflammatoires. Pour 26 patientes, la réponse histologique à une CT première à base
d’anthracycline était documentée, incluant 9 RCH+ et 17 RCH-. Par analyse supervisée, nous avons identifié un jeu de 85 gènes discriminants dont l’expression combinée permettait de séparer cette population en deux groupes présentant respectivement 70 % de RCH pour l’un et 0 % pour l’autre (figure 3).
Figure 3 - Classification pronostique de 26 cancers du sein inflammatoires en fonction de
l’expression de 85 gènes discriminants. Les gènes sont ordonnés de haut en bas en fonction
de leur score discriminant mesuré en analyse supervisée. Les tumeurs sont ordonnées de
gauche à droite en fonction du coefficient de corrélation de leur profil d’expression avec le
profil médian des tumeurs en réponse complète histologique (RCH). La ligne orange définit
deux classes de tumeurs ayant des taux de RCH significativement différents (rectangle noir,
RCH ; rectangle blanc, absence de RCH).
Profils d’expression génique et Puces à ADN dans le cancer du sein… 275
Conclusion
Dans toutes ces études, les signatures multigéniques pronostiques et/ou prédictives
paraissaient plus performantes que les classifications conventionnelles basées sur
des facteurs histo-cliniques et moléculaires. Des études de validation sont, bien
entendu, nécessaires avant toute application clinique sur de plus grandes séries
rétrospectives de patientes. Certaines sont en cours de manière uni- ou multicentrique, et précèderont l’éventuelle incorporation de ces signatures dans des essais
cliniques prospectifs, premier niveau d’application clinique de cette approche.
Le succès de ces études dépendra de collaborations étroites entre chercheurs de différentes disciplines (cliniciens, anatomo-pathologistes, biologistes, bio-informaticiens, mathématiciens…), de la qualité et de la quantité des échantillons tumoraux
disponibles (avec leurs annotations informatisées cliniques, histologiques et moléculaires), de l’amélioration de la technologie et des outils d’analyse, et, bien sûr, du
bon design des essais.
Références
1. The Chipping Forecast (1999) Nature Genet 21 Supplement: 1-60
2. Granjeaud S, Bertucci F, Jordan BR (1999) Expression profiling: DNA arrays
in many guises. Bioessays 21: 781-90
3. Bertucci F, Houlgatte R, Nguyen C et al. (2001) Gene expression profiling of
cancer by use of DNA arrays : how far from the clinic? Lancet Oncol
2: 674-82
4. Brazma AVilo J (2000) Gene expression data analysis. FEBS Lett 480: 17-24
5. Bertucci F, Houlgatte R, Benziane A et al. (2000) Gene expression profiling of
primary breast carcinomas using arrays of candidate genes. Hum Mol Genet
9: 2981-91
6. Bertucci F, Nasser V, Granjeaud S et al. (2002) Gene expression profiles of
poor-prognosis primary breast cancer correlate with survival. Hum Mol
Genet 11: 863-72
7. van 't Veer LJ, Dai H, van De Vijver MJ et al. (2002) Gene expression profiling predicts clinical outcome of breast cancer. Nature 415: 530-6
8. van de Vijver MJ, He YD, van't Veer LJ et al. (2002) A gene-expression signature as a predictor of survival in breast cancer. N Engl J Med 347: 1999-2009
9. Sorlie T, Perou CM, Tibshirani R et al. (2001) Gene expression patterns of
breast carcinomas distinguish tumor subclasses with clinical implications.
Proc Natl Acad Sci U S A 98: 10869-74
10. Sorlie T, Tibshirani R, Parker J et al. (2003) Repeated observation of breast
tumor subtypes in independent gene expression data sets. Proc Natl Acad Sci
USA 100: 8418-23
11. Sotiriou C, Neo SY, McShane LM et al. (2003) Breast cancer classification and
prognosis based on gene expression profiles from a population-based study.
Proc Natl Acad Sci USA 100: 10393-8
276 Cancer du sein
12. Ahr A, Karn T, Solbach C et al. (2002) Identification of high risk breastcancer patients by gene expression profiling. Lancet 359: 131-2
13. Ahr A, Holtrich U, Solbach C et al. (2001) Molecular classification of breast
cancer patients by gene expression profiling. J Pathol 195: 312-20
14. Huang E, Cheng SH, Dressman H et al. (2003) Gene expression predictors of
breast cancer outcomes. Lancet 361: 1590-6
15. Ma XJ, Wang Z, Ryan PD et al. (2004) A two-gene expression ratio predicts
clinical outcome in breast cancer patients treated with tamoxifen. Cancer Cell
5: 607-16
16. Chang JC, Wooten EC, Tsimelzon A et al. (2003) Gene expression profiling
for the prediction of therapeutic response to docetaxel in patients with breast
cancer. Lancet 362: 362-9
17. Ayers M, Symmans WF, Stec J et al. (2004) Gene expression profiles predict
complete pathologic response to neoadjuvant paclitaxel and fluorouracil,
doxorubicin, and cyclophosphamide chemotherapy in breast cancer. J Clin
Oncol 22: 2284-93
18. Bertucci F, Finetti P, Rougemont J et al. (2004) Gene expression profiling for
molecular characterization of inflammatory breast cancer and prediction of
response to chemotherapy. Cancer Res 64: 8558-65
Téléchargement