Lorsque le placebo est plus efficace que le comprimé seul

CURRICULUM Forum Med Suisse 2007;7:318–324 318
Lorsque le placebo est plus efficace
que le comprimé seul
Quelques idées sur la méthodologie des essais cliniques,
inspirées par deux études sur le sommeil
Markus Gnädinger, Franz Marty
Affiliation: les auteurs sont des «Research Fellows» de l’Unite de médecine de premier recours (EHAM) de l’université de Zurich.
Vous trouverez les questions à choix multiple concernant cet article à la page 313 ou sur internet sous www.smf-cme.ch.
Avant-propos
Si, en lisant cet essai, vous avez parfois l’im-
pression que les auteurs vous transportent dans
une foire médiévale et vous demandent de faire
la roue (intellectuellement) avec les bateleurs et
les faiseurs de farces à succès, vous distrayant
avec leurs poèmes ridicules et leurs cabrioles,
c’est que nous avons réussi, exactement comme
nous le souhaitions, à vous faire sourire d’une
manière ou d’une autre. Mais nous n’aurons
atteint notre but que si, lors de la lecture com-
plète, tel un poème de troubadour, vous sentez
également notre amour de l’analyse critique des
résultats de recherche.
C’est comme en paléontologie: les déjections,
c’est-à-dire les excréments ossifiés des animaux
préhistoriques donnent souvent plus d’informa-
tions que leurs os eux-mêmes. Il en va de même
pour le groupe qui s’est formé autour de James
K. Walsh, Rochester, NY. Ce dernier a publié en
2000 une étude contrôlée contre placebo sur la
prise intermittente de zolpidem (Stilnox®ou un
générique) dans l’insomnie primaire (n = 163)
[1]. En 2004, les données d’une deuxième étude
ont été publiées. Elle était un peu plus importante
(n = 199) et un peu plus longue (12 semaines au
lieu de 8), mais avait un protocole identique [2].
Un travail du même groupe de recherche, publié
en 2005, a étudié le groupe placebo de la der-
nière étude [3] au cours d’une analyse post hoc
et suscité avec ces «données déchets» plus d’in-
térêt qu’avec l’étude zolpidem.
Le mot latin «Placebo» signifie «je plairai». Il
vient du psaume 114, verset 9. Lors de la tra-
duction de l’hébreu en latin, la phrase: «Pour
que je marche devant le Seigneur, au pays des
vivants» (Psaume 116,9, traduction TOB)» a
été traduite de façon erronée par «Placebo
domino in regione vivorum», soit: «Je plairai
à l’Eternel au pays des vivants». On utilisa ce
texte au Moyen Age en guise de refrain lors de
vêpres funèbres et il était généralement connu
pour cette raison. Comme déjà à l’époque,
l’adage était «De mortuis nil [dices] nisi bene»
(«Il ne faut pas critiquer les défunts»), les
prières funèbres devenaient bien souvent
des flatteries au sujet de son prochain. Les
«chants placebo» étaient souvent synonymes
d’hommage (élogieux) des défunts. Ce concept
tendit plutôt ultérieurement à désigner des
flatteries destinées aux personnalités haut
placées. Les courtisans complaisants copiant
le discours des princes existaient déjà au
Moyen Age et ne sont donc pas une invention
des congrès modernes de médecins! C’est
uniquement à la fin du XVIIIesiècle que le
concept de placebo a été introduit dans la
terminologie médicale avec son actuelle signi-
fication de médicament factice.
Première idée
Que produisent les mécanismes indépendants
du placebo comme «l’effet de régression à la
moyenne» ou «l’effet Hawthorne»?
Comme c’est le cas dans toutes les études, la
question qui se pose est la suivante: quels sont
les effets pouvant être expliqués par l’interven-
Quintessence
Différents aspects de l’effet du placebo sont discutés sur la base de deux
études sur l’insomnie.
Dans les enquêtes scientifiques, ce dernier est provoqué principalement
par l’effet de «Hawthorne» (qui représente des facteurs psychologiques de
l’inclusion dans une étude scientifique) ou de la «régression à la moyenne» (qui
est un phénomène statistique des critères de l’inclusion).
Le fait de prendre un placebo en soi devrait avoir seulement un effet faible.
Summary
In the placebo effect more than just the “pill” is at work
Thoughts on scientific trial methods on the basis of two sleep studies
Various aspects of the placebo effect are discussed on the basis of two
sleep studies. In scientific trials this effect may often be due to the “Hawthorne
effect” (psychological factors relating to study participation) or “regression
toward the mean” (a mere statistical side effect of the trial inclusion criteria).
To take, or not to take, a placebo per se should make little difference.
une autre cause que celle du médicament testé
(s’agit-il alors de l’effet placebo?).
Régression à la moyenne
Un phénomène statistique intitulé «régression à
la moyenne» est en partie responsable de cette
amélioration du paramètre de l’étude, non liée
au médicament. Ainsi, toute personne incluse
dans l’étude d’intervention doit dépasser, ou ne
pas atteindre, un certain paramètre, un seuil dé-
fini. Pour l’étude zolpidem, ces critères d’inclu-
sion était les suivants: 1) conformité aux critères
de l’insomnie primaire selon le DSM IV, 2) temps
de latence de l’endormissement supérieur à 44
minutes ou temps de sommeil total de moins de
6,5 heures et présence de troubles pendant la
journée en raison d’une insuffisance de sommeil
et des symptômes associés, ainsi que 3) le temps
passé «au lit» de 6,5 à 9,0 heures.
La moyenne de toutes les valeurs mesurées pour
les paramètres de l’étude était plus faible lors de
mesures ultérieures que lors de l’inclusion dans
l’étude étant donné que, par erreur, des sujets
«sains» inclus dans l’étude ont évolué au cours du
suivi vers la valeur normale (µ03 µ1) (fig. 2 x).
Cela signifie en fin de compte que «l’effet de ré-
gression à la moyenne» nous a donné un tableau
erroné de l’état de la maladie de la population
étudiée en raison de la procédure d’inclusion
dans l’étude. Au cours du suivi de l’étude, le ta-
bleau s’est modifié en direction de la valeur
habituelle des paramètres de la maladie étant
donné qu’aucune nouvelle sélection n’a eu lieu.
Cette modification n’a aucun rapport avec une
modification de l’état de santé du patient dans
l’étude, mais il s’agit au contraire d’un phéno-
mène purement statistique. P. Kleist a récem-
ment décrit cet effet très concrètement dans cette
revue [4].
Effet Hawthorne
Le terme «d’effet Hawthorne» concerne le phé-
nomène (psychologique) selon lequel les person-
nes participant à l’étude peuvent modifier leur
comportement et présenter de ce fait des amé-
liorations individuelles de leur état initial. Par
exemple, certaines modifications de comporte-
ment ont été entreprises et influencent pour leur
part les paramètres mesurés (le mot-clé est ici
l’hygiène du sommeil). Il existe aussi par exem-
ple une tendance à inclure des personnes dans
l’étude qui, au moment de leur recrutement,
étaient particulièrement mécontentes de leurs
problèmes ou du traitement pris jusqu’à présent,
ce qui les rend ouvertes aux interventions. Pour
finir, les sujets assimilent des stratégies de ges-
tion: ils apprennent à vivre avec le problème (en
anglais «coping», qui signifie appliquer une stra-
CURRICULUM Forum Med Suisse 2007;7:318–324 319
tion testée et quel est l’effet présenté par l’inclu-
sion en soi dans l’étude scientifique.
La figure ci-dessous (fig. 1 x), tirée de la pre-
mière publication, montre la comparaison de la
durée subjective du temps de sommeil entre le
groupe placebo et le groupe qui a reçu le prin-
cipe actif pour les jours «avec» ou «sans» prise
de médicament. On a pu documenter dans les
deux groupes un allongement de la durée du
sommeil, bien que seuls les sujets présents sur
la courbe supérieure aient reçu le principe actif.
Le zolpidem a augmenté le temps de sommeil
de 320 minutes (valeur initiale) à 420 minutes –
et sans principe actif, le temps de sommeil a aug-
menté de 320 minutes à environ 360 minutes.
Cette amélioration doit donc être rapportée à
Figure 1
Evolution de la durée totale subjective du temps de sommeil [1]. Légende: zol = groupe
zolpidem, pla = groupe placebo, + = jours «avec» et – = jours «sans» prise de comprimé.
Suivi de l’étude
Durée totale du sommeil
Semaines d’étude
Figure 2
Régression à la moyenne, évolution sous placebo.
«Inclusion» 1re Mesure de suivi 2eMesure de suivi
Critères d’inclusion
µ0
µ1
Echantillon total (tous les sujets): Population étudiée (sujets malades):
– ampleur – ampleur
– moyenne – moyenne
– y compris les sujets «sains»
Paramètres de maladie
Deuxième idée
Est-ce que seul ce qui est statistiquement signi-
ficatif est présenté?
Ce qu’il y avait de particulier dans l’étude zolpi-
dem était que les sujets pouvaient librement dé-
cider de prendre ou non tel soir le médicament
à l’étude. Cependant, ils avaient obligation de
prendre au moins trois et au maximum cinq com-
primés par semaine, si bien que les jours «avec»
et les jours «sans» pouvaient être exploités sta-
tistiquement.
Le graphique suivant (provenant de la seconde
étude zolpidem) (fig. 3 x) montre le nombre
moyen de comprimés pris sur deux semaines.
C’est avec ce graphique que Walsh a fondé son
opinion selon laquelle le zolpidem ne provo-
querait pas de dépendance. Cette affirmation
mériterait quelques points d’interrogation. La
méthodologie de l’étude n’était probablement
pas appropriée pour découvrir les signes d’une
dépendance, étant donné que les participants à
l’étude qui présentaient un risque de dépen-
dance étaient déjà à cinq comprimés dès la pre-
mière semaine, qu’ils figuraient déjà sur «l’esti-
mation haute» et que la dose ne pouvait pas être
augmentée. Des phases placebo en simple aveu-
gle pour les deux groupes étudiés, au début et à
la fin de l’étude auraient été pour cette raison
bien mieux appropriées pour distinguer si les
personnes qui prenaient le traitement actif
étaient plus simplement de «bons avaleurs de
comprimés» ou bien si le traitement actif qui
«fonctionnait» mieux entraînait une prise plus
importante (feed-back positif). Malheureuse-
ment, le plan de l’étude ne l’avait pas prévu.
Comme analyse statistique, on a mentionné une
analyse de variance (ANOVA) en 6 x 2 points et
un test de t de Duncan (ne vous découragez pas
si vous ne comprenez pas ces deux modèles, il en
va de même pour nous!). Ce test admet un «effet
de groupe» pour une valeur de p <0,0005 et un
«effet de suivi» pour une valeur de p = 0,0319,
ainsi qu’une «interaction» négative entre les
groupes. Ces valeurs ont été interprétées par les
auteurs comme suit: «l’effet de groupe» signifie
que le groupe sous traitement actif a pris plus de
médicaments que le groupe placebo, «l’effet de
suivi» signifie que les deux groupes ont eu une
tendance vers une escalade des doses (tolérance)
et «l’interaction» négative que cette tendance
n’était pas différente entre les deux groupes, à
savoir le groupe traitement actif et le groupe pla-
cebo. Dans le résumé de l’étude les auteurs ajou-
tent: «il n’y avait aucun indice en faveur d’une
insomnie par dépendance dans les jours sans
zolpidem ou en faveur d’une augmentation de la
prise des médicaments pendant l’étude».
En se basant sur ces informations, on ne peut pas
réellement affirmer que le zolpidem rend géné-
ralement dépendant, mais on ne peut non plus
démentir avec certitude le fait que quelques-uns
CURRICULUM Forum Med Suisse 2007;7:318–324 320
tégie de défense) et à s’en accommoder. L’effet
Hawthorne représente ainsi une menace de la
validité externe (généralisation des résultats à
partir d’une étude sur l’utilisation en cabinet).
De même, l’effet Hawthorne a été récemment
discuté par P. Kleist dans le Swiss Medical
Forum [4].
Il est vraisemblable qu’un effet de sélection sta-
tistique et des facteurs psychologiques jouent
aussi un certain rôle au cours du travail quoti-
dien en cabinet. Lorsque chez un patient qui pré-
sente des valeurs tensionnelles à 150/95 mm Hg
survient une variation statistiquement significa-
tive vers le haut, il est plus vraisemblable que
vous allez ajouter un troisième médicament an-
tihypertenseur que si la modification avait pointé
en direction de la valeur cible. Et si chez un autre
patient, vous initiez un médicament pour le trai-
tement de sa dysfonction érectile, vous modifiez
bien des paramètres sur le plan psychologique.
Malgré tout, ces facteurs considérés dans la si-
tuation bien spéciale d’une étude clinique sont
nettement plus prononcés qu’en pratique quoti-
dienne. L’effet global d’une intervention est com-
posé d’un effet propre ainsi que de facteurs pla-
cebo. Ces derniers sont généralement moins
prononcés au cabinet, ce qui fait que l’effet d’une
mesure thérapeutique particulière sera norma-
lement plus important dans une étude qu’en ca-
binet. On devrait donc le plus souvent surestimer
l’efficacité des interventions mesurées dans des
études comparativement aux résultats attendus
en cabinet.
Conclusion
L’effet de la sélection statistique, à savoir la ré-
gression à la moyenne, et les facteurs psycholo-
giques (l’effet Hawthorne) nous font générale-
ment surestimer l’efficacité des interventions
dans les études cliniques.
Figure 3
Prise des comprimés pendant l’étude [2].
Prise des médicaments
Comprimés pour 2 semaines
Semaines d’études
L’autre cas, le fait que le plan de l’étude n’au-
rait pas été approprié méthodologiquement
pour répondre à une question, n’est pas consi-
déré dans l’analyse de puissance ou avec
l’erreur bêta, c’est-à-dire que l’erreur bêta ex-
prime simplement que la probabilité d’omet-
tre une relation en dépit d’une méthodologie
optimale. On accepte normalement une erreur
bêta de 10 à 20 %. Inversement, on calcule la
puissance de l’étude avec la formule: 1 – b.
Une blague à ce sujet: Pipo cherche fébrile-
ment quelque chose sur la place de la gare de
Berne une nuit, à quatre pattes.Un policier
s’approche: «Pipo, qu’est-ce que tu fais à qua-
tre pattes?». «Je cherche la pièce de 5 francs
que j’ai perdue!». «Sais-tu exactement où tu
l’as perdue?». «Oui, bien sûr, près du pont de
Nydegg! «Alors, pourquoi ne la cherches-tu
pas là-bas?». «Mais … parce qu’il y fait trop
sombre!». Au fond, l’histoire raconte que
l’on ne peut trouver la «vraie» connaissance
que là où elle se trouve, et uniquement si la
méthode de recherche est approfondie. Et
d’autre part, que même s’il y a des découver-
tes nouvelles et scientifiquement intéressan-
tes à faire, on ne trouvera rien si la méthode
n’est pas compatible. Et pour finir: ne fais
confiance à aucune méthode statistique que tu
ne comprends pas!
Conclusion
«Absence of evidence of a difference is not evi-
dence of absence of a difference» [5], une ab-
sence de preuve de différence n’est pas la preuve
de l’absence d’une différence.
Une absence de significativité entre deux inter-
ventions ne dit pas si leurs conséquences, sur-
tout dans un cas individuel, ne pourraient pas
toutefois se différencier de façon significative.
Troisième idée
Quelle est la probabilité qu’un résultat statisti-
quement significatif soit vrai?
Pour conclure à propos des publications sur le
placebo de Walsh [3]: dans la figure 4 x, les
jours comportant la prise du comprimé placebo
ont été comparés aux jours où le médicament fac-
tice n’était pas pris (le temps de sommeil total est
présenté).
On a observé à nouveau, comme cela a déjà été
mentionné plus haut, une amélioration approxi-
mative d’environ 320 minutes à 360 minutes par
nuit au cours de l’étude. La valeur a été analysée
à l’aide de ANOVA. Pour la différence «jours
avec» et «jours sans», le logiciel a calculé au total
une valeur de p = 0,014. Pour l’évolution au fil
du temps, une différence significative de p =
0,001. L’interaction de la prise de comprimés et
du temps a été calculée comme étant significa-
CURRICULUM Forum Med Suisse 2007;7:318–324 321
Figure 4
Durée du sommeil (8écart type) avec prise de placebo (bleu) ou sans (rouge) prise
de placebo [3].
Temps de sommeil total
des participants aient pu avoir des problèmes de
dépendance. Malheureusement, Walsh ne nous
donne aucune écart type et nous ignorons donc
si, par exemple vers la fin de l’étude, l’écart a pu
augmenter dans le groupe traitement actif, ce qui
voudrait dire que l’augmentation de la prise des
comprimés n’aurait été le fait que de quelques-
uns des participants à l’étude qui avaient un ris-
que de dépendance. De même, l’observation
dans la figure 1 (voir plus haut) montrant que le
groupe traitement actif par le zolpidem fait plus
mauvaise figure les jours «sans» comprimé, ne
concourt pas à notre soulagement. Notre expé-
rience quotidienne montre que le zolpidem peut
justement entraîner bien des problèmes. C’est un
fait que nous observons de plus en plus en pra-
tique de cabinet: certains patients exigent sous
la forme d’un ultimatum la remise de ce produit
et ils commencent à se replier sur eux-mêmes
jusqu’à la prochaine boîte. Autrement dit, même
lorsque l’effet indésirable décrit (développement
de symptômes de dépendance) n’est pas signi-
ficativement différent, il peut malgré tout sur-
venir sous traitement par principe actif plus fré-
quemment que sous placebo. Cette allégation
affirmant que les deux interventions n’étaient
pas différentes (études d’équivalence) doit être
étayée par une analyse statistique plus fine [5],
qui a certainement manqué dans les études de
Walsh.
Dans le cas où le zolpidem devrait rendre dé-
pendant et que Walsh aurait omis de le voir,
cela aurait été décrit statistiquement comme
une erreur de type II ou «erreur bêta». Cela
signifie qu’un effet effectivement présent n’a
pas été constaté, par exemple en raison d’une
puissance d’étude insuffisante (trop courte,
trop faible, trop peu de participants, etc.).
ministrés pour prévenir l’athérosclérose et la
maladie d’Alzheimer? Nombreux étaient ceux
qui considéraient comme n’étant pas éthiques les
études de ce type s’appuyant sur l’esprit d’alors.
On n’aurait pas dû priver les femmes des hormo-
nes bienfaisantes! Et aujourd’hui, «le méchant»
est celui qui donne de façon hâtive des œstro-
gènes combinés aux femmes présentant des
symptômes gênants.
Conclusion:
La probabilité a posteriori (post hoc) qu’un effet
publié soit effectivement vrai est de 85% dans le
meilleur des cas, et ceci même si la valeur de p
présente beaucoup de zéros après la virgule.
Quatrième idée
Qu’est-ce qu’un nocebo?
Les effets indésirables présents dans les deux
études zolpidem n’ont été décrits que de façon
fragmentaire. Dans la première étude, on a sim-
plement décrit qu’un patient sous zolpidem avait
arrêté l’étude, mais la cause de cet arrêt n’est pas
connue selon les auteurs. Dans la seconde étude
plus longue, les effets indésirables qui ont en-
traîné les arrêts d’études ont été notés chez 7 pa-
tients du groupe zolpidem (1. Somnolence im-
portante; 2. Céphalées et vertiges; 3. Troubles de
l’humeur et anxiété; 4. Fatigue; 5. Hallucina-
tions, 6. Céphalées, 7. Hallucinations) et trois pa-
tients du groupe placebo (1. Rhume, 2. Cauche-
mar, 3. Eruptions cutanées). A propos des effets
indésirables qui n’ont pas entraîné l’arrêt du
traitement, rien n’est mentionné malheureuse-
ment et peu de choses sont dites, même si les
effets indésirables ont été recherchés systéma-
tiquement.
Vous souvenez-vous encore des paramètres de
mesure de la médecine par la preuve (Evidence
based medicine ou EBM)? Le nombre de patients
qu’il est nécessaire de traiter (Number Needed to
Treat ou NNT), qui est le nombre inverse de la
réduction absolue du risque (RAR) décrit le nom-
bre de patients que l’on doit traiter selon un
ordre défini par l’étude (même dose, même
durée, etc.) pour empêcher la survenue d’un cer-
tain événement. Ceci est également valable pour
les effets indésirables des médicaments. On parle
du nombre d’individus à traiter pour qu’un effet
indésirable survienne (en anglais: «Number
needed to harm» ou mieux «Number Needed to
treat to cause Harm» ou NNH). Cet effet existe
naturellement lors d’un traitement par placebo
et l’on utilise alors le terme de «nocebo»2[7].
CURRICULUM Forum Med Suisse 2007;7:318–324 322
tive pour les semaines 3/4 et 9/10 (valeur de p
inconnue). Etant donné que l’efficacité a été éva-
luée sur quatre paramètres différents (outre le
temps de sommeil ont été évalués également: la
latence de l’endormissement, le nombre d’épiso-
des de réveil, la durée de la période d’éveil après
le premier endormissement), une correction au-
rait été réellement indiquée lors du calcul de la
significativité1, étant donné que l’effet notifié
peut par ailleurs représenter un résultat pure-
ment dû au hasard.
Notre très chère valeur de p exprime la pro-
babilité qu’un résultat d’étude soit réellement
dû au hasard du point de vue statistique. Pour
cette erreur de type I ou «erreur alpha»,
on accepte dans les études cliniques généra-
lement une probabilité de 5% ou moins. Par
conséquent, c’est la raison pour laquelle en
moyenne un résultat d’analyse statistique
significatif sur 20 devrait être uniquement dû
au hasard.
Dans un essai [6], John P. A. Ioannidis est arrivé
au résultat que la plupart des effets publiés ne
pouvaient pas être véridiques pour des motifs
statistiques et méthodiques. En fonction de la
probabilité de l’étude préalable de l’effet testé, la
méthodologie et la puissance de l’étude, on peut
au mieux attendre une probabilité de 85% que la
relation soit aussi exacte, bien que le niveau de
significativité montré n’atteigne que 5%. Une
étape importante de la méthodologie est cer-
tainement la réalisation d’études cliniques en
double aveugle, pour neutraliser la partialité des
participants à l’étude et des investigateurs. Le ta-
bleau 1 pfait la liste des circonstances habituel-
lement importantes qui amenuisent la validité
des affirmations, jusqu’à une valeur extrême de
1/10000. Vous remarquerez rapidement que,
outre l’évaluation de la probabilité préliminaire
à l’étude, le point le plus difficile de l’opinion pré-
conçue est la connaissance (de soi). Que se pas-
sait-il auparavant avec les études de grande taille
réalisées chez les femmes post-ménopausées
avec des traitements hormonaux substitutifs ad-
Tableau 1. Facteurs qui ont influencé négativement
la validité des allégations dans les études [6].
1. Faible probabilité préliminaire à l’étude
2. Petite taille de l’échantillon représentatif
3. Petite taille de l’effet attendu (<33%)
4. Nombreux paramètres testés, points de mesure
et/ou sous-groupes
5. Méthodologie définie de façon imprécise
6. Conflit d’intérêts et opinions préconçues
7. Thème particulièrement «chaud» (évaluation de
nombreux groupes qui traitent d’une thématique
semblable)
1 Correction ou ajustement de Bonferroni (la significa-
tivité démontrée est abaissée selon les paramètres
recherchés en même temps):
pBonferoni = p xnombre de paramètres testés
xnombre de points de mesure testés.
1 / 7 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !