
120
ce de traitement et le résultat observé est altéré et le
risque d'observer une différence significative par
hasard est majoré. Et ceci quelles que soient les justifi-
cations qui ont conduit à la formation de ces sous-
groupes par la sélection de certains patients. Il peut
s'agir des patients qui sont allés jusqu'au bout de l'étu-
de, de ceux qui ont bien pris le traitement, des moins
atteints, des plus jeunes etc. De plus, l'utilisation d'une
covariable quantitative, comme l'âge, ou d'une variable
qualitative à plusieurs classes, comme le stade clinique,
permet toutes les manipulations possibles en faisant
varier la limite de séparation et donc les regroupe-
ments, jusqu'à observer une différence entre deux sous-
groupes
- La majoration du risque augmente le risque de
conclure à tort à une différence. La procédure normale
consiste à formuler une hypothèse a priori, puis à
recueillir des données et à tester cette hypothèse avec
un risque en général de 5%. Il s'agit du risque
consenti d'accepter la différence observée comme
significative alors qu'elle peut être le fruit du hasard
des fluctuations d'échantillonnage. Si d'autres tests sont
effectués selon un découpage différent, déterminant
des sous-groupes, le modèle servant de base au raison-
nement statistique n'est plus applicable. Les tests ne
sont plus indépendants puisqu'ils portent sur les mêmes
données ou une partie d'entre elles, et sur la même
expérience. Chacune de ces procédures, chaque nou-
veau test, majore le risque de sorte qu'il n'est plus
possible de connaître le risque d'erreur si une différen-
ce significative fini par être observée.
- La diminution de la puissance de l'étude provoquée
par l'augmentation du risque , majore le risque de
conclure à tort à l'absence de différence significative.
Le risque est en quelque sorte l'inverse du risque .
C'est le risque consenti de ne pas observer de différen-
ce significative alors qu'il y en a une en réalité. La puis-
sance de l'étude, 1- , est sa capacité à mettre en évi-
dence de façon significative une différence qui existe
réellement. Un de ses principaux composants, et celui
que l'on peut maîtriser, est le nombre des sujets inclus.
En diminuant le nombre de sujets sur lesquels porte
l'étude, puisque les tests portent sur des sous-groupes,
la puissance diminue, ce qui se traduit par une majora-
tion du risque de ne pas mettre en évidence une diffé-
rence qui existerait réellement. De façon paradoxale
pour un clinicien, ce n'est pas parce qu'on ne met pas en
évidence de différence significative sur une analyse en
sous-groupes, qu'il n'y en a pas en réalité.
- Le risque de raisonnement circulaire, de type tautolo-
gique, provient du fait que ce sont les données de la
même étude qui servent à tester, a posteriori, l'hypothè-
se à laquelle elles ont donné naissance.
D'une façon générale, la pratique se discute selon que l'on
est dans le cadre d'une étude prospective ou rétrospective.
- Dans une étude prospective, il existe plusieurs cas de
figures selon qu'il y a ou non une hypothèse faite a
priori sur l'intervention de covariables, et selon le
résultat de l'analyse base sur le critère principal.
Si l'intervention d'une covariable est suspectée a priori,
il est possible d'effectuer une randomisation des
patients avec une stratification sur cette covariable
(stade anatomo-pathologique par exemple) afin d'équi-
librer les effectifs par traitements. Mais la situation
devient ingérable s'il y a plus d'une ou deux cova-
riables.
Si l'analyse de base, sur le critère principal, montre une
d i fférence significative, la caractérisation de sous-
groupes est possible, de même que l'utilisation de
méthodes d'ajustement. Mais elle ne saurait conduire
qu'à des hypothèses à tester par une étude ultérieure.
Dans notre exemple, le bénéfice d'un traitement com-
biné fut de nouveau testé, de façon un peu différente
(castration chirurgicale plus Placebo ou Flutamide) par
la même équipe. Mais aucune différence significative
ne fut mise en évidence, ni dans le groupe principal, ni
dans le sous-groupe des patients "minimal disease" [3].
Si l'analyse de base ne montre pas de différence signi-
ficative, la recherche de sous-groupes, dans le but de
faire apparaître des différences, doit être rejetée, même
s'il est toujours possible de trouver des justifications
cliniques.
- Dans une étude rétrospective comment faire si nous
n'avons droit qu'à un seul groupe, ou à deux groupes
constitués dès le début, et à un seul test? Dans l'idéal, il
faudrait se poser une question avant d'isoler la série,
puis recueillir les données et les analyser avec un test
unique pour répondre à la question, c'est-à-dire tester
l'hypothèse initiale. Toutes modifications ultérieures de
la série en différents sous-groupes, "pour voir si ...",
n'est que "dragage" de données ou "bidouillage" statis-
tique a posteriori (statistiques post hoc). Plus on essaye
de covariables, de nouveaux sous-groupes, d'autres
tests, plus on majore le risque . Certes il existe des
méthodes qui tiennent compte de cette inflation du
risque , telle la correction de BONFERRONI [1]. Mais,
si trop de tests sont prévus, leur application conduit à
une telle inflation du risque que seules des évidences
deviennent significatives. La pratique de tests succes-
sifs peut se justifier dans certaines procédures statis-
tiques validées. Ainsi les analyses intermédiaires, par-
fois nécessaires, imposent une diminution du risque
consenti pour chacun des tests afin que sur l'ensemble
de l'étude le risque total soit celui recherché, le plus
souvent de = 0,05. Une procédure proche est aussi
prévue dans le cadre des analyses séquentielles.
Il existe aussi des méthodes d'analyses multivariées.
Mais leur logique est plus mathématique que statis-
tique. Le lien entre le résultat d'une analyse et le phé-
Pascal Glémain, Progrès en Urologie (2001), 11, 119-121