25. Méthodes non quantitatives de méta-analyse Par méthodes non quantitatives nous désignerons des techniques de synthèse qui ne s’intéressent pas à la taille de l’effet, mais seulement à son existence. Ces techniques sont cependant d’une utilité tout à fait marginale en médecine dans la mesure où l’estimation de la taille de l’effet est au moins aussi importante que le test de sa signification statistique. 25.1. Techniques pour la méthode des votes A) Codification Deux classifications peuvent être utilisées pour coder les résultats d’un essai. Dans la première, trois modalités décrivent l’existence d’une relation positive significative, négative significative et l’absence de relation significative. Les résultats peuvent aussi être codés en résultats positifs et résultats négatifs, sans tenir compte de la signification statistique du résultat. Cette dernière classification ne se base donc que sur la tendance du résultat, sans tenir compte du test statistique. B) Test des signes Le test des signes permet de tester de façon simple l’hypothèse nulle : les effets traitement mesurés dans k essais indépendants sont tous nuls. Si le traitement n’a réellement aucun effet (vrai effet traitement nul), la probabilité d’obtenir un résultat positif est de 0,5. Si le vrai effet traitement est supérieur à zéro, la probabilité d’obtenir un essai positif est supérieure à 0,5. Le test des signes est donc une application du test non paramétrique binomial aux deux hypothèses : Ho : ¼ = 0,5 H1 : ¼ > 0,5 où ¼ est la proportion d’essais positifs estimée à partir du nombre d’essais positifs u par ^¼ = u=k. 268 Méthodes non quantitatives de méta-analyse Ce test consiste à calculer, sous l’hypothèse nulle, la probabilité d’obtenir un nombre d’essais positifs au moins égal à celui qui a été observé. Cette probabilité est égale à la probabilité que la variable aléatoire « nombre d’essais positifs » U soit supérieure à la valeur observée u, cette variable aléatoire suivant sous l’hypothèse nulle une loi binomiale de paramètre 0,5 et k : U » B (0,5; k) p = Pr (U ¸ u) Exemple 25.1 Si dans un groupe de 15 essais, 10 sont positifs, il convient de calculer la somme p des probabilités d’observer 10,11,12,13,14,15 résultats positifs sur 15 essais quand ¼ = 0,5. La table suivante donne la distribution de probabilité d’une loi binomiale B (0; 5; 15) : u Pr (U = u) 0 0,0000 1 0,0005 2 0,0032 3 0,0139 4 0,0417 5 0,0916 6 0,1527 7 0,1964 u Pr (U = u) 8 0,1964 9 0,1527 10 0,0916 11 0,0417 12 0,0139 13 0,0032 14 0,0005 15 0,0000 ce qui donne : p = 0,0916+0,0417+0,0139+0,0032+0,0005+0,0 = 0,1509. Cette probabilité est supérieure à 5%, il n’est donc pas possible de rejeter l’hypothèse nulle. Le nombre de résultats positifs obtenu est compatible avec une probabilité d’un demi d’obtenir par hasard un essai positif. On ne peut pas démontrer l’effet du traitement. Par contre, si 12 résultats positifs avaient été obtenus, la probabilité d’obtenir cette proportion sous l’hypothèse nulle est p = 0,0139 + 0,0032 + 0,0005 + 0,0 = 0,0176 qui, étant inférieure au seuil de 5%, permet de rejeter l’hypothèse nulle et de conclure à l’existence d’un effet. C) Estimation d’un effet standardisé avec la méthode des votes Le développement qui suit, suppose que les k essais regroupés dans la méta-analyse possèdent tous le même effectif et que les tailles des deux groupes sont identiques T dans tous les essais, c’est-à-dire que : 8i; nC i = n i = n. Cette hypothèse est extrêmement restrictive. Cependant, si les effectifs ne sont pas trop différents, il est possible de les considérer comme étant tous égaux à une « valeur moyenne » [188]. Plusieurs types de « valeur moyenne » sont possibles. Hegdes et Olkin proposent 269 Techniques pour la méthode des votes l’effectif maximum, minimum ou la moyenne arithmétique. Gibbons, Olkin et Sobel recommandent l’utilisation du carré de la moyenne des racines (« square mean root ») [189] : µp p ¶ n1 + : : : + n k 2 ¹n = k Ce carré de la moyenne des racines est moins inf luencé par les valeurs extrêmes que la moyenne arithmétique. Si les effectifs diffèrent de façon importante d’un essai à l’autre, il n’est cependant pas raisonnable d’utiliser une valeur moyenne et il devient nécessaire de faire appel à des techniques spéciales développées pour cette situation. Le lecteur intéressé se reportera à l’ouvrage de Cooper et Hedges [190]. Le but est d’obtenir une estimation de l’effet traitement uniquement à partir d’un codage dichotomique du résultat des études. Soit Ti l’estimation, inconnue, de l’effet traitement du i-ème essai. Si cette valeur Ti dépasse la valeur critique C® (par exemple C0;05 pour un seuil de signification classique à 5%), le résultat de cet essai sera codé comme significativement positif et comme négatif dans le cas contraire. Ce codage peut être représenté par une variable binaire Xi tel que : Xi = 1 Xi = 0 si Ti > C® si Ti · C® Dénotons par ¼ la probabilité avec laquelle cette variable Xi prend la valeur 1 : ¼ = Pr (Xi = 1) = Pr (T i > C® ) 1 ¡ ¼ = Pr (Xi = 0) = Pr (T i · C ®) P A partir d’un échantillon de k essais, ¼ peut être estimé par p = xi =k. Le numérateur est simplement le nombre d’essais à résultat significativement positif et le dénominateur le nombre total d’essais. Un intervalle de confiance de p s’obtient en utilisant l’approximation normale de la loi binomiale. La variance de p, est estimée par var(p) = p (1 ¡ p) /k et les bornes supérieures et inférieures d’un intervalle de confiance à 100(1-®) s’obtiennent par : r p (1 ¡ p) p; p = p § z®=2 (25.1) k où z®=2 représente la valeur de seuil critique de la loi normale. Pour un intervalle de confiance à 95%, z0;025 = 1,96. La valeur de ¼ dépend de la valeur du vrai effet traitement µ. Si T est normalement distribué avec comme moyenne µ et comme variance var (µ), la probabilité ¼ est une fonction de µ : ¼ = Pr (T > C® ) 270 Méthodes non quantitatives de méta-analyse µ T ¡µ C® ¡ µ = Pr > var (µ) var (µ) µ ¶ C® ¡ µ ¼ = 1¡© var (µ) ¶ (25.2) où © désigne la fonction de distribution cumulative de la loi normale. En résolvant l’équation (25.2), on obtient : µ = C® ¡ var (µ) ©¡1 (1 ¡ ¼) (25.3) Cette équation permet de transformer une proportion d’essais significatifs positifs en valeur d’effet standardisé (« effect size »), donc en estimation quantitative d’effet traitement. Un intervalle de confiance de cet estimateur s’obtient en calculant avec (25.3) les valeurs µ et µ qui correspondent aux bornes p et p obtenues d’après (25.1). 25.2. Combinaison des degrés de signification Le terme, valeur de p (« p-value »), est synonyme de degré de signification. Les degrés de signification pi des essais sont tous le ref let du test d’une même hypothèse nulle, très générale et envisagée dans chaque essai : le traitement étudié n’a aucun effet. Le but du test est de rejeter cette hypothèse nulle pour accepter l’hypothèse alternative de l’existence de l’effet du traitement. Dans la réalisation d’un essai, l’hypothèse nulle est formulée de façon bien plus circonstanciée (par exemple la différence des pressions artérielles mesurées dans les deux groupes est nulle), mais elle réfère toujours au concept général de l’existence d’un effet du traitement. Dans la combinaison des degrés de signification, l’hypothèse nulle est que l’effet traitement recherché n’existe dans aucun des essais : H0 : µ 1 = : : : = µk = 0 (25.4) où la notation µi = 0 représente, d’une façon conceptuelle, l’inexistence de l’effet du traitement. Il est possible de tester cette hypothèse nulle, appelée aussi hypothèse « omnibus » et d’obtenir une valeur de p rattachée à cette hypothèse (« test omnibus »). Cependant, ce degré de signification pose un problème d’interprétation. Pour aborder cela, il est nécessaire de faire un rappel sur l’interprétation des degrés de signification. A) Rappel sur le degré de signification Les interprétations erronées du degré de signification sont courantes. Il est inexact de dire que le degré de signification mesure la probabilité que l’hypothèse de travail Combinaison des degrés de signification 271 soit exacte, ou que la valeur de p représente la probabilité que les résultats de l’essai soient dus à la chance. En fait, la valeur de p est la probabilité d’obtenir un échantillon particulier de valeurs sous l’hypothèse que seule la chance (les f luctuations d’échantillonnage aléatoires) cause ce résultat. Il ne s’agit pas de la probabilité que la chance donne ce résultat, la chance donnant ce résultat avec une probabilité de 1. Un degré de signification cumulé significatif autorise à rejeter l’hypothèse nulle (25.4) et à conclure que dans au moins un essai, l’effet du traitement n’était pas nul. En fait, il s’agit plutôt d’un test d’homogénéité de l’absence de l’effet traitement dans tous les essais qu’un test d’existence de l’effet traitement en tant que tel. Néanmoins, en cas de test significatif, il est possible de conclure qu’au moins dans un cas, le traitement a eu un effet non nul. La portée limitée des conclusions possibles restreint l’intérêt de cette procédure. Son principal avantage reste la possibilité de regrouper des études ayant envisagé des types de critères divers et variés. B) Méthodes de combinaison Deux types de méthodes de combinaison des p existent, celles basées directement sur la distribution uniforme des p, et celles qui utilisent des transformations des p [41, 191]. La première catégorie exploite le fait que pour toutes statistiques de test continues, les valeurs des degrés de signification sont distribuées uniformément. Ces techniques se rattachent à la méthode des votes (voir la section 25.1). Exemple 25.2 Les calculs nécessaires aux différentes méthodes présentées ci dessous sont illustrés à partir des données fictives suivantes : Etudes Valeur de p 1 0,980 2 0,560 3 0,034 4 0,670 5 0,100 6 0,580 7 0,060 8 0,055 Méthodes basées sur la distribution uniforme La distribution des degrés de signification p sous l’hypothèse nulle est uniforme sur l’intervalle [0; 1] [44]. 272 Méthodes non quantitatives de méta-analyse Méthode du p minimum. Si p[1] est la valeur minimale d’une série de valeurs de p, un test de l’hypothèse nulle « omnibus » est obtenu en comparant p[1] avec 1 ¡(1¡®)1=k [41]. Ainsi l’hypothèse nulle (25.4) est rejetée si p[1] < 1¡(1¡®)1=k Exemple 25.3 La valeur minimale des p est de 0,034. Le seuil critique pour ® = 0,05 vaut 1 ¡ (1 ¡ 0,05)1=8 =0,0064, qui n’est pas inférieur à la valeur minimale des p. Le rejet de l’hypothèse nulle n’est donc pas possible. Moyenne des p: Dans cette méthode le test de l’hypothèse « omnibus » se base sur la statistique : p ³ ´ X 12k 1=2 ¡ pi /k qui est distribuée suivant une loi normale [41]. Exemple 25.4 La moyenne des p est de 0,380. La valeur de la statistique p 12 £ 8 (0; 5 ¡ 0; 38) = 1,176, conduisant à une valeur de p cumulé pC = 0,120. Méthodes de transformation Dans cette méthode, les valeurs de p sont transformées en valeurs de variables aléatoires en utilisant la fonction inverse de distribution cumulative d’une loi particulière (loi normale, de t, de F, etc.). Les nouvelles variables sont X = F ¡1(p), avec F qui représente la fonction de distribution cumulative de la loi considérée. Méthode de la somme des log. Cette méthode est basée sur le fait que ¡2 log(u) est distribué suivant une loi du chi-deux à 2 degrés de liberté si u est uniformément distribué sur l’intervalle [0; 1]. La somme de k de ces variables a une distribution du chi-deux à 2k degrés de liberté, ce qui est donc le cas de : X ¡2 log(pi) » Â22k dll La valeur observée permet de réaliser un test de l’hypothèse nulle « omnibus ». Combinaison des degrés de signification 273 Exemple 25.5 L’application de cette méthode à l’exemple conduit aux calculs suivants : Etudes Valeur de p ¡2 log (p) 1 0,980 0,040 2 0,560 1,160 3 0,034 6,763 4 0,670 0,801 5 0,100 4,605 6 0,580 1,089 7 0,060 5,627 8 0,055 5,801 Total 25,886 P ¡2 log(pi ) = 25,886 pour 2£8 = 16 degrés de liberté, la valeur de p combiné obtenue est pC = 0,056. Méthode de la transformation normale. Cette méthode transforme les valeurs de p en valeur de variable normale (z-score) en utilisant la fonction inverse de la distribution normale ©¡1. Quand H0 est vrai, la statistique : ¢ 1 ¡ Z = p © ¡1 (p1) + : : : + © ¡1 (pk ) k a une distribution normale standard (centrée réduite). L’hypothèse nulle omnibus peut donc être rejetée quand Z excède la valeur critique appropriée de la distribution normale standard. Exemple 25.6 L’application de cette méthode aux données de l’exemple donne : Etudes Valeur de p ©¡1 (p) 1 0,980 2,054 2 0,560 0,151 3 0,034 -1,825 4 0,670 0,440 5 0,100 -1,282 6 0,580 -0,202 7 0,060 -1,555 8 0,055 -1,598 Total -3,413 p Z = 1= 8 £ ¡3,413 = ¡1,207, ce qui donne une valeur de p combiné de pC = 0,114, non significative comme avec les méthodes précédentes. 274 Méta-analyse dans d’autres situations Interprétation des résultats obtenus avec l’exemple Toutes les méthodes employées s’accordent pour rejeter l’hypothèse nulle « omnibus » bien qu’individuellement un seul essai ait atteint le seuil à 5% de la signification statistique (essai n± 3) et deux autres en aient été proches (essais n± 8 et 7). Ainsi, en fonction de la totalité de l’information apportée par ces 8 valeurs de p, il n’est pas possible de rejeter l’hypothèse nulle que dans aucun essai n’existe un effet traitement. C) Autres approches D’autres approches indirectes ont été proposées. Ces méthodes permettent de convertir des statistiques de tests diverses et variées en une grandeur identique et de les combiner. La description détaillée de ces techniques spéciales figure dans de nombreux ouvrages [4, 192].