25. Méthodes non quantitatives de méta-analyse

publicité
25.
Méthodes non quantitatives de méta-analyse
Par méthodes non quantitatives nous désignerons des techniques de synthèse qui ne
s’intéressent pas à la taille de l’effet, mais seulement à son existence. Ces techniques
sont cependant d’une utilité tout à fait marginale en médecine dans la mesure où
l’estimation de la taille de l’effet est au moins aussi importante que le test de sa
signification statistique.
25.1. Techniques pour la méthode des votes
A) Codification
Deux classifications peuvent être utilisées pour coder les résultats d’un essai. Dans la
première, trois modalités décrivent l’existence d’une relation positive significative,
négative significative et l’absence de relation significative. Les résultats peuvent
aussi être codés en résultats positifs et résultats négatifs, sans tenir compte de la
signification statistique du résultat. Cette dernière classification ne se base donc que
sur la tendance du résultat, sans tenir compte du test statistique.
B) Test des signes
Le test des signes permet de tester de façon simple l’hypothèse nulle : les effets
traitement mesurés dans k essais indépendants sont tous nuls. Si le traitement n’a
réellement aucun effet (vrai effet traitement nul), la probabilité d’obtenir un résultat
positif est de 0,5. Si le vrai effet traitement est supérieur à zéro, la probabilité d’obtenir un essai positif est supérieure à 0,5. Le test des signes est donc une application
du test non paramétrique binomial aux deux hypothèses :
Ho : ¼ = 0,5
H1 : ¼ > 0,5
où ¼ est la proportion d’essais positifs estimée à partir du nombre d’essais positifs
u par ^¼ = u=k.
268
Méthodes non quantitatives de méta-analyse
Ce test consiste à calculer, sous l’hypothèse nulle, la probabilité d’obtenir un
nombre d’essais positifs au moins égal à celui qui a été observé. Cette probabilité
est égale à la probabilité que la variable aléatoire « nombre d’essais positifs » U soit
supérieure à la valeur observée u, cette variable aléatoire suivant sous l’hypothèse
nulle une loi binomiale de paramètre 0,5 et k :
U » B (0,5; k)
p = Pr (U ¸ u)
Exemple 25.1 Si dans un groupe de 15 essais, 10 sont positifs, il convient de calculer la somme p des probabilités d’observer 10,11,12,13,14,15 résultats positifs
sur 15 essais quand ¼ = 0,5. La table suivante donne la distribution de probabilité
d’une loi binomiale B (0; 5; 15) :
u Pr (U = u)
0
0,0000
1
0,0005
2
0,0032
3
0,0139
4
0,0417
5
0,0916
6
0,1527
7
0,1964
u Pr (U = u)
8
0,1964
9
0,1527
10
0,0916
11
0,0417
12
0,0139
13
0,0032
14
0,0005
15
0,0000
ce qui donne : p = 0,0916+0,0417+0,0139+0,0032+0,0005+0,0 = 0,1509. Cette
probabilité est supérieure à 5%, il n’est donc pas possible de rejeter l’hypothèse
nulle. Le nombre de résultats positifs obtenu est compatible avec une probabilité
d’un demi d’obtenir par hasard un essai positif. On ne peut pas démontrer l’effet du
traitement.
Par contre, si 12 résultats positifs avaient été obtenus, la probabilité d’obtenir
cette proportion sous l’hypothèse nulle est p = 0,0139 + 0,0032 + 0,0005 + 0,0 =
0,0176 qui, étant inférieure au seuil de 5%, permet de rejeter l’hypothèse nulle et de
conclure à l’existence d’un effet.
C) Estimation d’un effet standardisé avec la méthode des votes
Le développement qui suit, suppose que les k essais regroupés dans la méta-analyse
possèdent tous le même effectif et que les tailles des deux groupes sont identiques
T
dans tous les essais, c’est-à-dire que : 8i; nC
i = n i = n. Cette hypothèse est extrêmement restrictive. Cependant, si les effectifs ne sont pas trop différents, il est possible de les considérer comme étant tous égaux à une « valeur moyenne » [188].
Plusieurs types de « valeur moyenne » sont possibles. Hegdes et Olkin proposent
269
Techniques pour la méthode des votes
l’effectif maximum, minimum ou la moyenne arithmétique. Gibbons, Olkin et Sobel recommandent l’utilisation du carré de la moyenne des racines (« square mean
root ») [189] :
µp
p ¶
n1 + : : : + n k 2
¹n =
k
Ce carré de la moyenne des racines est moins inf luencé par les valeurs extrêmes
que la moyenne arithmétique. Si les effectifs diffèrent de façon importante d’un essai à l’autre, il n’est cependant pas raisonnable d’utiliser une valeur moyenne et il
devient nécessaire de faire appel à des techniques spéciales développées pour cette
situation. Le lecteur intéressé se reportera à l’ouvrage de Cooper et Hedges [190].
Le but est d’obtenir une estimation de l’effet traitement uniquement à partir d’un
codage dichotomique du résultat des études. Soit Ti l’estimation, inconnue, de l’effet traitement du i-ème essai. Si cette valeur Ti dépasse la valeur critique C® (par
exemple C0;05 pour un seuil de signification classique à 5%), le résultat de cet essai
sera codé comme significativement positif et comme négatif dans le cas contraire.
Ce codage peut être représenté par une variable binaire Xi tel que :
Xi = 1
Xi = 0
si Ti > C®
si Ti · C®
Dénotons par ¼ la probabilité avec laquelle cette variable Xi prend la valeur 1 :
¼ = Pr (Xi = 1) = Pr (T i > C® )
1 ¡ ¼ = Pr (Xi = 0) = Pr (T i · C ®)
P
A partir d’un échantillon de k essais, ¼ peut être estimé par p =
xi =k. Le
numérateur est simplement le nombre d’essais à résultat significativement positif et
le dénominateur le nombre total d’essais. Un intervalle de confiance de p s’obtient en
utilisant l’approximation normale de la loi binomiale. La variance de p, est estimée
par var(p) = p (1 ¡ p) /k et les bornes supérieures et inférieures d’un intervalle de
confiance à 100(1-®) s’obtiennent par :
r
p (1 ¡ p)
p; p = p § z®=2
(25.1)
k
où z®=2 représente la valeur de seuil critique de la loi normale. Pour un intervalle de
confiance à 95%, z0;025 = 1,96.
La valeur de ¼ dépend de la valeur du vrai effet traitement µ. Si T est normalement distribué avec comme moyenne µ et comme variance var (µ), la probabilité ¼
est une fonction de µ :
¼ = Pr (T > C® )
270
Méthodes non quantitatives de méta-analyse
µ
T ¡µ
C® ¡ µ
= Pr
>
var (µ)
var (µ)
µ
¶
C® ¡ µ
¼ = 1¡©
var (µ)
¶
(25.2)
où © désigne la fonction de distribution cumulative de la loi normale. En résolvant
l’équation (25.2), on obtient :
µ = C® ¡ var (µ) ©¡1 (1 ¡ ¼)
(25.3)
Cette équation permet de transformer une proportion d’essais significatifs positifs en valeur d’effet standardisé (« effect size »), donc en estimation quantitative
d’effet traitement. Un intervalle de confiance de cet estimateur s’obtient en calculant
avec (25.3) les valeurs µ et µ qui correspondent aux bornes p et p obtenues d’après
(25.1).
25.2. Combinaison des degrés de signification
Le terme, valeur de p (« p-value »), est synonyme de degré de signification. Les
degrés de signification pi des essais sont tous le ref let du test d’une même hypothèse
nulle, très générale et envisagée dans chaque essai : le traitement étudié n’a aucun
effet. Le but du test est de rejeter cette hypothèse nulle pour accepter l’hypothèse
alternative de l’existence de l’effet du traitement. Dans la réalisation d’un essai,
l’hypothèse nulle est formulée de façon bien plus circonstanciée (par exemple la
différence des pressions artérielles mesurées dans les deux groupes est nulle), mais
elle réfère toujours au concept général de l’existence d’un effet du traitement.
Dans la combinaison des degrés de signification, l’hypothèse nulle est que l’effet
traitement recherché n’existe dans aucun des essais :
H0 : µ 1 = : : : = µk = 0
(25.4)
où la notation µi = 0 représente, d’une façon conceptuelle, l’inexistence de l’effet
du traitement. Il est possible de tester cette hypothèse nulle, appelée aussi hypothèse
« omnibus » et d’obtenir une valeur de p rattachée à cette hypothèse (« test omnibus »). Cependant, ce degré de signification pose un problème d’interprétation.
Pour aborder cela, il est nécessaire de faire un rappel sur l’interprétation des degrés
de signification.
A) Rappel sur le degré de signification
Les interprétations erronées du degré de signification sont courantes. Il est inexact
de dire que le degré de signification mesure la probabilité que l’hypothèse de travail
Combinaison des degrés de signification
271
soit exacte, ou que la valeur de p représente la probabilité que les résultats de l’essai
soient dus à la chance.
En fait, la valeur de p est la probabilité d’obtenir un échantillon particulier de valeurs sous l’hypothèse que seule la chance (les f luctuations d’échantillonnage aléatoires) cause ce résultat. Il ne s’agit pas de la probabilité que la chance donne ce
résultat, la chance donnant ce résultat avec une probabilité de 1.
Un degré de signification cumulé significatif autorise à rejeter l’hypothèse nulle
(25.4) et à conclure que dans au moins un essai, l’effet du traitement n’était pas nul.
En fait, il s’agit plutôt d’un test d’homogénéité de l’absence de l’effet traitement dans
tous les essais qu’un test d’existence de l’effet traitement en tant que tel. Néanmoins,
en cas de test significatif, il est possible de conclure qu’au moins dans un cas, le
traitement a eu un effet non nul.
La portée limitée des conclusions possibles restreint l’intérêt de cette procédure.
Son principal avantage reste la possibilité de regrouper des études ayant envisagé
des types de critères divers et variés.
B) Méthodes de combinaison
Deux types de méthodes de combinaison des p existent, celles basées directement
sur la distribution uniforme des p, et celles qui utilisent des transformations des p
[41, 191]. La première catégorie exploite le fait que pour toutes statistiques de test
continues, les valeurs des degrés de signification sont distribuées uniformément. Ces
techniques se rattachent à la méthode des votes (voir la section 25.1).
Exemple 25.2 Les calculs nécessaires aux différentes méthodes présentées ci dessous sont illustrés à partir des données fictives suivantes :
Etudes Valeur de p
1
0,980
2
0,560
3
0,034
4
0,670
5
0,100
6
0,580
7
0,060
8
0,055
Méthodes basées sur la distribution uniforme
La distribution des degrés de signification p sous l’hypothèse nulle est uniforme sur
l’intervalle [0; 1] [44].
272
Méthodes non quantitatives de méta-analyse
Méthode du p minimum. Si p[1] est la valeur minimale d’une série de valeurs
de p, un test de l’hypothèse nulle « omnibus » est obtenu en comparant p[1] avec
1 ¡(1¡®)1=k [41]. Ainsi l’hypothèse nulle (25.4) est rejetée si p[1] < 1¡(1¡®)1=k
Exemple 25.3 La valeur minimale des p est de 0,034. Le seuil critique pour ® =
0,05 vaut 1 ¡ (1 ¡ 0,05)1=8 =0,0064, qui n’est pas inférieur à la valeur minimale
des p. Le rejet de l’hypothèse nulle n’est donc pas possible.
Moyenne des p: Dans cette méthode le test de l’hypothèse « omnibus » se base sur
la statistique :
p
³
´
X
12k 1=2 ¡
pi /k
qui est distribuée suivant une loi normale [41].
Exemple
25.4 La moyenne des p est de 0,380. La valeur de la statistique
p
12 £ 8 (0; 5 ¡ 0; 38) = 1,176, conduisant à une valeur de p cumulé pC = 0,120.
Méthodes de transformation
Dans cette méthode, les valeurs de p sont transformées en valeurs de variables aléatoires en utilisant la fonction inverse de distribution cumulative d’une loi particulière
(loi normale, de t, de F, etc.). Les nouvelles variables sont X = F ¡1(p), avec F qui
représente la fonction de distribution cumulative de la loi considérée.
Méthode de la somme des log. Cette méthode est basée sur le fait que ¡2 log(u)
est distribué suivant une loi du chi-deux à 2 degrés de liberté si u est uniformément
distribué sur l’intervalle [0; 1]. La somme de k de ces variables a une distribution du
chi-deux à 2k degrés de liberté, ce qui est donc le cas de :
X
¡2 log(pi) » Â22k dll
La valeur observée permet de réaliser un test de l’hypothèse nulle « omnibus ».
Combinaison des degrés de signification
273
Exemple 25.5 L’application de cette méthode à l’exemple conduit aux calculs suivants :
Etudes Valeur de p ¡2 log (p)
1
0,980
0,040
2
0,560
1,160
3
0,034
6,763
4
0,670
0,801
5
0,100
4,605
6
0,580
1,089
7
0,060
5,627
8
0,055
5,801
Total
25,886
P
¡2 log(pi ) = 25,886 pour 2£8 = 16 degrés de liberté, la valeur de p combiné
obtenue est pC = 0,056.
Méthode de la transformation normale. Cette méthode transforme les valeurs
de p en valeur de variable normale (z-score) en utilisant la fonction inverse de la
distribution normale ©¡1. Quand H0 est vrai, la statistique :
¢
1 ¡
Z = p © ¡1 (p1) + : : : + © ¡1 (pk )
k
a une distribution normale standard (centrée réduite). L’hypothèse nulle omnibus
peut donc être rejetée quand Z excède la valeur critique appropriée de la distribution
normale standard.
Exemple 25.6 L’application de cette méthode aux données de l’exemple donne :
Etudes Valeur de p ©¡1 (p)
1
0,980
2,054
2
0,560
0,151
3
0,034
-1,825
4
0,670
0,440
5
0,100
-1,282
6
0,580
-0,202
7
0,060
-1,555
8
0,055
-1,598
Total -3,413
p
Z = 1= 8 £ ¡3,413 = ¡1,207, ce qui donne une valeur de p combiné de pC =
0,114, non significative comme avec les méthodes précédentes.
274
Méta-analyse dans d’autres situations
Interprétation des résultats obtenus avec l’exemple
Toutes les méthodes employées s’accordent pour rejeter l’hypothèse nulle « omnibus » bien qu’individuellement un seul essai ait atteint le seuil à 5% de la signification statistique (essai n± 3) et deux autres en aient été proches (essais n± 8 et 7).
Ainsi, en fonction de la totalité de l’information apportée par ces 8 valeurs de p, il
n’est pas possible de rejeter l’hypothèse nulle que dans aucun essai n’existe un effet
traitement.
C) Autres approches
D’autres approches indirectes ont été proposées. Ces méthodes permettent de convertir des statistiques de tests diverses et variées en une grandeur identique et de les
combiner. La description détaillée de ces techniques spéciales figure dans de nombreux ouvrages [4, 192].
Téléchargement