ministrés pour prévenir l’athérosclérose et la
maladie d’Alzheimer? Nombreux étaient ceux
qui considéraient comme n’étant pas éthiques les
études de ce type s’appuyant sur l’esprit d’alors.
On n’aurait pas dû priver les femmes des hormo-
nes bienfaisantes! Et aujourd’hui, «le méchant»
est celui qui donne de façon hâtive des œstro-
gènes combinés aux femmes présentant des
symptômes gênants.
Conclusion:
La probabilité a posteriori (post hoc) qu’un effet
publié soit effectivement vrai est de 85% dans le
meilleur des cas, et ceci même si la valeur de p
présente beaucoup de zéros après la virgule.
Quatrième idée
Qu’est-ce qu’un nocebo?
Les effets indésirables présents dans les deux
études zolpidem n’ont été décrits que de façon
fragmentaire. Dans la première étude, on a sim-
plement décrit qu’un patient sous zolpidem avait
arrêté l’étude, mais la cause de cet arrêt n’est pas
connue selon les auteurs. Dans la seconde étude
plus longue, les effets indésirables qui ont en-
traîné les arrêts d’études ont été notés chez 7 pa-
tients du groupe zolpidem (1. Somnolence im-
portante; 2. Céphalées et vertiges; 3. Troubles de
l’humeur et anxiété; 4. Fatigue; 5. Hallucina-
tions, 6. Céphalées, 7. Hallucinations) et trois pa-
tients du groupe placebo (1. Rhume, 2. Cauche-
mar, 3. Eruptions cutanées). A propos des effets
indésirables qui n’ont pas entraîné l’arrêt du
traitement, rien n’est mentionné malheureuse-
ment et peu de choses sont dites, même si les
effets indésirables ont été recherchés systéma-
tiquement.
Vous souvenez-vous encore des paramètres de
mesure de la médecine par la preuve (Evidence
based medicine ou EBM)? Le nombre de patients
qu’il est nécessaire de traiter (Number Needed to
Treat ou NNT), qui est le nombre inverse de la
réduction absolue du risque (RAR) décrit le nom-
bre de patients que l’on doit traiter selon un
ordre défini par l’étude (même dose, même
durée, etc.) pour empêcher la survenue d’un cer-
tain événement. Ceci est également valable pour
les effets indésirables des médicaments. On parle
du nombre d’individus à traiter pour qu’un effet
indésirable survienne (en anglais: «Number
needed to harm» ou mieux «Number Needed to
treat to cause Harm» ou NNH). Cet effet existe
naturellement lors d’un traitement par placebo
et l’on utilise alors le terme de «nocebo»2[7].
CURRICULUM Forum Med Suisse 2007;7:318–324 322
tive pour les semaines 3/4 et 9/10 (valeur de p
inconnue). Etant donné que l’efficacité a été éva-
luée sur quatre paramètres différents (outre le
temps de sommeil ont été évalués également: la
latence de l’endormissement, le nombre d’épiso-
des de réveil, la durée de la période d’éveil après
le premier endormissement), une correction au-
rait été réellement indiquée lors du calcul de la
significativité1, étant donné que l’effet notifié
peut par ailleurs représenter un résultat pure-
ment dû au hasard.
Notre très chère valeur de p exprime la pro-
babilité qu’un résultat d’étude soit réellement
dû au hasard du point de vue statistique. Pour
cette erreur de type I ou «erreur alpha»,
on accepte dans les études cliniques généra-
lement une probabilité de 5% ou moins. Par
conséquent, c’est la raison pour laquelle en
moyenne un résultat d’analyse statistique
significatif sur 20 devrait être uniquement dû
au hasard.
Dans un essai [6], John P. A. Ioannidis est arrivé
au résultat que la plupart des effets publiés ne
pouvaient pas être véridiques pour des motifs
statistiques et méthodiques. En fonction de la
probabilité de l’étude préalable de l’effet testé, la
méthodologie et la puissance de l’étude, on peut
au mieux attendre une probabilité de 85% que la
relation soit aussi exacte, bien que le niveau de
significativité montré n’atteigne que 5%. Une
étape importante de la méthodologie est cer-
tainement la réalisation d’études cliniques en
double aveugle, pour neutraliser la partialité des
participants à l’étude et des investigateurs. Le ta-
bleau 1 pfait la liste des circonstances habituel-
lement importantes qui amenuisent la validité
des affirmations, jusqu’à une valeur extrême de
1/10000. Vous remarquerez rapidement que,
outre l’évaluation de la probabilité préliminaire
à l’étude, le point le plus difficile de l’opinion pré-
conçue est la connaissance (de soi). Que se pas-
sait-il auparavant avec les études de grande taille
réalisées chez les femmes post-ménopausées
avec des traitements hormonaux substitutifs ad-
Tableau 1. Facteurs qui ont influencé négativement
la validité des allégations dans les études [6].
1. Faible probabilité préliminaire à l’étude
2. Petite taille de l’échantillon représentatif
3. Petite taille de l’effet attendu (<33%)
4. Nombreux paramètres testés, points de mesure
et/ou sous-groupes
5. Méthodologie définie de façon imprécise
6. Conflit d’intérêts et opinions préconçues
7. Thème particulièrement «chaud» (évaluation de
nombreux groupes qui traitent d’une thématique
semblable)
1 Correction ou ajustement de Bonferroni (la significa-
tivité démontrée est abaissée selon les paramètres
recherchés en même temps):
pBonferoni = p xnombre de paramètres testés
xnombre de points de mesure testés.