Plan de mesures de l’ANQ: analyse de l’intégralité et de la pertinence Rapport de recherche de l’ISGF, mai 2012 Version succincte Janvier 2013 / Version 1.1 Sommaire 1 Introduction 1 2 Objectifs 1 3 Méthode 1 3.1 3.2 3.3 1 2 3 4 5 Gestion de la qualité du point de vue de la santé publique 3 4.1 4.2 4.3 4.3.1 Rapport entre mesure et gestion de la qualité Choix des thèmes de la qualité et synthèse Evaluation dans les interviews d’experts Classement des 33 événements qualité 3 4 4 4 4.3.2 Priorisation des indicateurs de qualité selon les expert(e)s 5 Point sur la littérature pour contenus et indicateurs dans la gestion de la qualité 5.1 5.2 5.3 6 7 Analyse de la littérature Evaluation des indicateurs de l’ANQ Entretiens avec des experts Aspects médicaux des mesures de la qualité Aspects techniques des mesures de la qualité Thématiques des indicateurs de la qualité 6 6 8 10 Harmonisation de l’état des recherches avec la pratique de la gestion de la qualité 12 6.1 6.2 12 13 Aspects médicaux vus sous l’angle pratique Aspects techniques des relevés vus sous l’angle pratique Réflexions finales 14 7.1 7.2 14 15 Réponses aux questions liées à l’évaluation Conclusion et autres recommandations 1 Introduction L’Association nationale pour le développement de la qualité dans les hôpitaux et les cliniques (ANQ) a chargé le Schweizer Institut für Sucht- und Gesundheitsforschung (ISGF, Zurich) d’analyser l’intégralité et la pertinence de son plan de mesure. L’expertise devait tenir compte d’une part des divers champs thématiques, des indicateurs et des instruments (ou méthodes) de mesure déjà définis par l’ANQ (notamment les coopérations avec les registres de maladies et de traitements existants) et, d’autre part, des prescriptions édictées par l’ANQ liées à la planification, la réalisation d’évaluations des indicateurs de qualité sur le plan conceptuel et au feedback aux hôpitaux (pour une éventuelle accessibilité générale des résultats). 2 Objectifs L’expertise devait répondre aux sept questions suivantes : 1. Quels champs thématiques de l’assurance qualité sont pertinents pour la médecine somatique aiguë sur les plans national et international, et comment sont-ils définis ? 2. Parmi ces champs thématiques, lesquels ne sont pas ou pas assez couverts par le plan de mesure actuel de l’ANQ ? 3. Quels indicateurs de la qualité des résultats ces champs thématiques englobent-ils? 4. Compte tenu de la stratégie et des objectifs de l’ANQ, quels indicateurs de la qualité des résultats devraient éventuellement être intégrés au plan de mesure ? 5. Quelles sont les méthodes de relevé existantes pour les indicateurs de la qualité identifiés (à la question 4) ? 6. Comment ces indicateurs sont-ils évalués au regard du rapport coût-utilité ? 7. Conviennent-ils à des fins de comparaison et de publication ? 3 Méthode Pour la médecine somatique aiguë, le plan de mesure ANQ définit contractuellement les six indicateurs pour le relevé par les hôpitaux de soins aigus. Grâce à la collaboration avec un registre de données central (SIRIS), un indicateur supplémentaire a été élaboré de sorte à être empiriquement mesurable. Pour choisir les méthodes de mesure, l’ANQ s’est concentrée en priorité sur les concepts de mesure existants et a décidé la démarche suivante : • • • • • utilisation du système d’analyse SQLape pour le calcul des taux de réhospitalisations et de réopérations; collaboration avec SwissNOSO pour le relevé des infections post-opératoires; emploi du questionnaire bref de l’ANQ pour le relevé de la satisfaction des patients; mesure de la prévalence des chutes et escarres d’après le concept de mesure LPZ collaboration avec le registre des implants SIRIS pour évaluer le temps nécessaire à la révision des endoprothèses de hanche et de genou. 3.1 Analyse de la littérature La littérature scientifique spécialisée consacrée au thème «Mesures de la qualité dans le domaine des soins er aigus en milieu résidentiel» a été analysée pour la période du 1 janvier 2002 au 20 février 2012. Les bases de données littéraires retenues sont medline (accès via PUBMED), EMBASE, PSYCINFO et PSYNDEX qui recueillent des journaux avec «peer review» (avec une vaste palette de thèmes). Plan de mesures de l’ANQ, rapport de recherche 2012 1 Le nombre d’articles spécialisés publiés chaque année reflète l’importance accordée par la littérature médicale aux mesures de la qualité. Ce dernier a clairement augmenté au cours de la dernière décennie et a plus que doublé : le nombre d’articles est passé de moins de 20 à plus de 40 par an. Bien que le nombre de publications médicales spécialisées a augmenté d’un facteur 1,76 entre 2002 (medline : 560 687 articles) et 2011 (medline : 987 385 articles), l’importance des mesures de la qualité dans la littérature médicale a encore davantage évolué (d’un facteur 1,96). A noter que seuls 0,03 ‰ en 2002 et 0,05 ‰ en 2011 des nouvelles littératures médicales traitent des mesures de la qualité; la recherche sur le système de soins reste donc marginale par rapport à la recherche clinique. 3.2 Evaluation des indicateurs de l’ANQ Les instruments de mesure prescrits à ce jour par l’ANQ ne relèvent pas uniquement des aspects qualitatifs très différents sur le plan du contenu ; ils peuvent aussi être considérés comme extrêmement hétérogènes en ce qui concerne le processus générant les données : • chutes et escarres de décubitus : évaluation d’experts qui doit être complétée par le personnel infirmier à un jour fixe. • satisfaction des patients : questionnaire bref de l’ANQ remis aux patients ; • réhospitalisations : à partir d’un set de données annuel national de toutes les sorties résidentielles, obtenu via une « interconnexion des dossiers », la réadmission du même patient est considérée comme problème de qualité potentiel selon le classement effectué par un système de scoring préalablement développé. Les données proviennent uniquement de la Statistique médicale des hôpitaux de l’Office fédéral de la statistique (OFS) ; • réopérations : taux de réopérations potentiellement évitables, calculé à partir des données de routine systématiques de la Statistique médicale des hôpitaux de l’OFS grâce à un système de scoring préalablement développé ; • charge engendrée par la révision des endoprothèses : évaluation à partir du registre national, qui n’a pas été conçu à l’origine pour la gestion de la qualité, mais qui doit également profiter à la recherche clinique ; • relevé des infections nosocomiales après des interventions fixées: évaluation d’experts réalisée par le personnel infirmier (sous le contrôle d’un médecin), qui comporte, selon le type d’intervention, une enquête téléphonique auprès des patients 30 jours ou 12 mois après leur sortie. En raison de cette hétérogénéité méthodologique, l’objectif de l’évaluation a été fixé selon différents aspects : • pour les relevés de la prévalence chutes et escarres de décubitus, la fiabilité du schéma d’évaluation utilisé pour la mesure par le personnel infirmier est d’une part discutée. D’autre part, le processus de l’’échantillon retenu (échantillon transversal sur un jour fixe) est également discuté afin d’étudier dans quelle mesure cette méthode profite à la comparaison entre les cliniques et s’avère capable d’illustrer la situation générale en Suisse au niveau de la qualité des soins dispensés ; • l’évaluation de l’indicateur de satisfaction des patients avait pour objectif de favoriser les réflexions psychométriques; • pour les indicateurs de qualité (infections nosocomiales et traitements endoprothétiques), les exigences posées à l’égard de la qualité des données ont été discutées sur la base du développement de structures de relevé et d’évaluation actuellement en cours d’élaboration. Au-delà des hôpitaux, l’intégralité du relevé ou le processus de sélection de l’échantillon retenu pour les évaluations partielles constitue également un critère d’évaluation important ; Plan de mesures de l’ANQ, rapport de recherche 2012 2 • pour les indicateurs de qualité réopérations et réhospitalisations, les réflexions méthodologiques et statistiques ont été au cœur des discussions. Le thème de la qualité des données n’a pas été particulièrement traité dans ce rapport car il relève avant tout de l’Office fédéral de la statistique, en sa qualité de centrale des données de la Statistique médicale des hôpitaux. 3.3 Entretiens avec des experts Au total, 16 personnes ont été identifiées en leur qualité d’experts de l’assurance qualité dans le domaine des soins aigus en milieu résidentiel. Treize d’entre elles se sont prêtées à un entretien. Les critères de sélection ont tenu compte du fait que les médecins, infirmiers, représentants des autorités de surveillance et des assurances-maladie, ainsi que les chercheurs scientifiques reconnus dans le domaine de la gestion de la qualité (GQ) feraient des partenaires d’interviews idéaux. Cinq entretiens ont été réalisés avec des personnes travaillant à l’étranger (Allemagne et Autriche). Les entretiens étaient divisés en trois parties : 1. classement des indicateurs actuels de l’ANQ, 2. identification des priorités parmi les indicateurs de la gestion de la qualité 3. évaluation et réflexion sur les données issues de la littérature. 4 Gestion de la qualité sur le plan de la santé publique Si l’on considère la GQ comme un processus d’apprentissage du système de soins (et non pas comme une fonction de contrôle souveraine), il est non seulement nécessaire de mesurer les indicateurs de la qualité des soins, mais il convient également de veiller à ce que les prestataires (corps médical, personnel infirmier, domaine diagnostique et autres services d’hospitalisation) bénéficient de retours compréhensibles, efficaces et rapides sur les prestations délivrées par leurs soins. 4.1 Rapport entre mesure et gestion de la qualité La mesure du résultat dans les soins résidentiels ne s’effectue pas à des fins purement documentaires. Elle doit aussi permettre un feedback aux experts cliniques dans le cadre de la gestion de la qualité et ainsi contribuer à un développement continu de la qualité des résultats. En posant un regard critique sur la pratique confirmée du développement des indicateurs, la littérature précise que les retours ne doivent pas être considérés en soi comme un outil améliorant automatiquement la qualité de la GQ. Des caractéristiques de tâches différentes peuvent découler de la problématique clinique à résoudre à l’aide d’un traitement résidentiel. Dans le doute, ces dernières peuvent même engendrer un effet aggravant du retour lié au résultat du traitement. Selon la littérature, il est primordial d’identifier dans quelle mesure la tâche comprend en soi un degré d’incertitude faible ou élevé. Pour les thérapies qui n’offrent que peu de chances d’amélioration, le seul retour sur la qualité du résultat peut même avoir un effet nuisible, selon la théorie psychologique du Feedback-Intervention, parce qu’il oriente l’objectif des prestataires dans la mauvaise direction. Un retour sur les paramètres de processus (couplés à l’Outcome) serait plus judicieux pour les traitements présentant une incertitude statistique élevée, ceci afin de permettre le développement ultérieur des méthodes cliniques et Plan de mesures de l’ANQ, rapport de recherche 2012 3 de palier aux éventuels doutes supplémentaires chez les prestataires qui, nécessairement, agissent de manière risquée. 4.2 Choix des thèmes qualitatifs et synthèse Dans la littérature scientifique, une méthode très appréciée pour sélectionner au sein des hôpitaux ou sur l’ensemble d’un système de soins différents thèmes de qualité parmi le grand nombre de thèmes de mesure potentiels consiste dans la création plus ou moins structurée d’un consensus par des expert(e)s. Les résultats de telles démarches sont fortement liés aux personnes participant à la création du consensus, à leur expérience et à leurs connaissances théoriques générales. L’application de telles procédures Delphi (ou de techniques de groupes similaires) comprend également des risques significatifs quant à l’obtention de résultats incomplets ou faussés. L’idée a donc été émise d’identifier au préalable les possibles mécanismes de sélection avant d’initier un tel processus de création de consensus, ainsi que de relever des données empiriques sur l’importance relative accordée par les experts compétents aux « méta-critères » de la qualité. Les problèmes de qualité se laissent quantifier d’après les catégories «envergure du dommage» et «probabilité d’occurrence». Exemples de potentiels critères de priorisation: • • • • • Priorisation en fonction de la gravité de la maladie (les soi-disant disability adjusted life years (DALYs)) Priorisation en fonction de la fréquence d’erreur Priorisation en fonction des potentiels d’amélioration Priorisation en fonction des coûts Masse récapitulative pour la qualité dans les hôpitaux 4.3 Evaluation dans le cadre des interviews d’experts 4.3.1 Classement des 33 événements qualité A l’unanimité, les personnes interrogées ont classé les événements qualité selon un principe «expertocratique»: ils ont attribué une importance nettement plus élevée aux événements qui, du point de vue des experts du domaine de la santé, pourraient être interprétés comme des « erreurs » qui relèvent de leur responsabilité par rapport aux événements qui, du point de vue des patient(e)s, illustreraient « simplement » une qualité des soins hospitaliers insuffisante ». «Les erreurs artisanales» faites dans le cadre d’une procédure clairement décrite (p. ex. les réopérations évitables) ont été jugées «plus graves» que les infections post-opératoires, les escarres de décubitus ou une infection nosocomiale générale. Ces trois déficiences qualitatives jugées moins «graves» partagent le fait de provenir d’une multitude de sources d’erreurs différentes, ne contrecarrant ainsi pas obligatoirement le droit professionnel individuel à la liberté d’erreurs. Les décisions erronées lors de la pose de l’indication pour la sectio ou l‘appendicectomie sont, selon l’avis des experts, encore moins importantes. Un retard de traitement suite à une attaque à l’hôpital jouit en revanche d’un classement très élevé au même titre que les fautes « artisanales ». L’importance des événements concernés ne faisait pas l’unanimité. Les événements « plus graves » se voyaient en général attribuer un classement plus homogène que les « moins graves ». Les experts(e)s s’accordaient cependant, à quelques détails près, sur le fait que les jugements des patients étaient estimés moins dramatiques que les erreurs de diagnostic ou artisanales. Plan de mesures de l’ANQ, rapport de recherche 2012 4 Il ne faut cependant en aucun cas considérer comme un mépris des intérêts des patients le fait que les problèmes de qualité définis par les patients soient classés, d’un point de vue professionnel, après les problèmes de qualité définis par les experts. Une confrontation exclusive et mutuelle des points de vue des patients et des experts quant aux procédures hospitalières ne reflète pas la réalité du processus de traitement et n‘est que le résultat « forcé » de la méthode d’interrogation. Les points de vue se complètent souvent dans la pratique. Les professionnels de la santé et les patient(e)s évaluent les faits de manière relativement similaire, surtout pour ce qui a trait au pôle négatif. Une excellente application professionnelle de la sécurité des patient(e)s répond au souhait du patient(e) et pose les bases d’une confiance de principe face au traitement. Les personnes interrogées ont contredit l’image instaurée par les Etats-Unis il y a dix ans, selon laquelle les erreurs de traitement sont jugées comme un problème relativement minime par les patient(e)s et les médecins. 4.3.2 Priorisation des indicateurs de qualité selon les expert(e)s La priorisation d’indicateurs à relever peut être considérée sous différents angles (point de vue individuel du patient, santé publique, institutions de financement comme les caisses d’assurance-maladie, collaborateur infirmier individuel, hôpital etc.). L’angle de la santé publique (angle SP) revêt une importance capitale pour l’ANQ en sa qualité d’institution de portée nationale, Sous l’angle SP, il conviendrait donc d’obtenir le plus grand effet possible sur la santé publique lors de l’établissement d’un programme de mesure lié à l’assurance de la qualité. Afin que cet angle PH ne soit guère influencé par d’autres critères d’évaluation, les expert(e)s ont été priés en cours d’entretien de réaliser une estimation comparative des critères de priorisation sous l’angle SP versus celui du personnel soignant. Grâce à cette technique des contrastes, les personnes interrogées sont amenées à garder à l’esprit la différence des deux approches lors de l’évaluation de chaque critère. Pour les personnes interrogées, le principal critère de sélection des indicateurs GQ réside dans les potentiels d’amélioration atteignables par les mesures de la qualité, suivis par la prévalence du traitement. Cela s’applique au personnel soignant et à l’angle SP. La moitié des mécanismes de sélection consultés a été jugée plus ou moins pertinente sous l’angle donné : l’homogénéisation des prestations (réduction de la variance) a été jugée plus importante sous l’angle SP que celui du personnel soignant. Pour le personnel soignant, le choix d’indicateurs GQ sur la base du nombre absolu d’erreurs, de la vérifiabilité de l’événement, ainsi que des trois facteurs de coûts (recours, coûts des mesures, suppression des erreurs) a été jugé plus important que sous l’angle SP. Les expert(e)s n’ont fait aucune différence entre une sélection d’indicateurs GQ liée à la prévalence du traitement, aux DALYs attribués à des erreurs, aux DALYs de la maladie d’origine et aux «Dread Risk». Une sélection d’indicateurs GQ d’après la somme des écarts constatés par rapport à l’hôpital « Best Practice » a été évaluée de manière plus ou moins uniforme sous les deux angles précités. Plan de mesures de l’ANQ, rapport de recherche 2012 5 Evaluation des critères de sélection des indicateurs GQ par les expert(e)s Dans l’ensemble, les expert(e)s sont arrivés à la conclusion que les indicateurs GQ d’un système de mesure national doivent avant tout provenir des champs pour lesquels aucune homogénéisation des résultats de traitement n’a été entreprise, que les traitements de routine très fréquents doivent être intégrés en priorité dans l’assurance de la qualité, et que – très important -, les indicateurs (générés par l’information de tiers) permettant d’obtenir un haut potentiel d’amélioration à l’échelle du système de soins général pour l’ensemble de la population,, devraient être prescrits. 5 Point sur la littérature pour les contenus et indicateurs de la gestion de la qualité Les articles scientifiques proviennent pour plus de 70% des Etats-Unis, de l‘Allemagne, de Grande-Bretagne, de France, d’Italie et des Pays-Bas. Au cours des dix dernières années, tous les autres pays ont publié moins de 9 articles consacrés au thème «Mesure de la qualité des soins». La Suisse a publié six articles. Au total, 47 pays ont été identifiés. 5.1 Aspects médicaux des mesures de la qualité Comme le montre l‘illustration suivante, les indicateurs les plus souvent discutés (n=102) sont ceux liés à l‘hôpital dans sa globalité (p. ex. la mortalité). Dans l’ensemble, il ressort qu’il n’y a pas de spécialité dominante faisant à elle seule l’objet d’une analyse scientifique exclusive des mesures de la qualité. A noter Plan de mesures de l’ANQ, rapport de recherche 2012 6 cependant que des disciplines importantes telles que la gynécologie, l’obstétrique, l’orthopédie et la neurologie totalisent étonnamment peu d’articles spécifiques. Spécialisations thématisées et unités organisationnelles Dans la littérature, on trouve plutôt des diagnostics ou groupes de maladie non spécifiques pour lesquels des mesures de qualité sont développées : les maladies vasculaires n’ont été spécifiquement traitées que dans moins d’un quart des articles (59 fois) en leur qualité de plus grand groupe de maladies. Il s’agissait en outre principalement de mesures de la qualité liées aux maladies cardiaques ischémiques. Seuls 27 articles se penchaient sur les diagnostics des maladies du système respiratoire, en l’occurrence surtout sur les pneumonies. Les maladies cancérigènes étaient spécifiquement mentionnées dans moins de 20 articles. Nous pouvons en conclure que la mesure de la qualité ne se rapporte que rarement à des diagnostics spécifiques, mais de manière générale plutôt au résultat obtenu ou aux critères de processus définis. Quant aux (groupes de) diagnostics traités, il n’y a pas eu de changement sur la période observée: de manière relativement constante, ce sont en moyenne entre 0,5 et 0,8 diagnostics par article qui sont analysés Plan de mesures de l’ANQ, rapport de recherche 2012 7 sur le plan de la mesure de leur qualité. La «distance diagnostique» de la mesure de la qualité semble être stable dans le temps. Introduite dans le débat médical sur la qualité par Donabedian en 1966, la classification en fonction de la qualité des structures, des processus et des résultats peut également être relevée dans les points de vue émis dans les articles sur les mesures de la qualité. Aucun article consacré à la qualité structurelle n’a été identifié (ce qui correspond tout à fait à la mission de cette expertise). Par ailleurs, la mesure des critères de processus domine clairement (plus de deux tiers des articles ont été consacrés à tels indicateurs). Moins d’un quart des articles traitent du véritable résultat de traitement. Des articles professionnels sur les critères de mesure de la qualité (qualité de la documentation) et la transmission d’informations s’avèrent être encore plus rares. L’impression se dégage que le développement d’instruments de mesure occupe une place prépondérante dans la cadre de la recherche clinique, bien qu’il joue un rôle plutôt secondaire dans la GQ. Si l’on s’interroge sur la source d’erreurs susceptibles d’engendrer un éventuel problème de qualité, un axe prioritaire se dégage clairement des articles sélectionnés : la réalisation erronée d’une procédure de traitement (pour la plupart du temps standardisée) représente avec plus de deux tiers de tous les articles le thème central nettement dominant dans la GQ. La question de savoir si l’indication d’un traitement est vraiment erronée est abordée dans à peine un tiers des articles. Suivent ensuite les erreurs d’hygiène (24%) en tant que sources d’erreurs découlant du processus de traitement respectif, les erreurs de diagnostic (21%) et les erreurs de mesure (18%). Les problèmes de qualité, qui peuvent survenir en raison d’une observance (compliance) thérapeutique insuffisante de la part des patients, jouaient le rôle le plus insignifiant (8%). Bien qu’au cours de ces mêmes dix années d’observation, le thème «Patient & compliance & measurement» a été traité dans medline à travers plus de 1’200 articles et le thème «Patient & adherence & measurement» repris plus de 1500 fois, le lien entre la recherche consacrée à l’observance et le domaine de la GQ n’est qu’infime, voire inexistant. De toute évidence, la recherche clinique accorde bien plus d’importance au thème de l’observance des patients en raison de son impact sur le résultat de traitement qu’à la GQ. Cela peut également provenir du fait que des indicateurs Outcome s’appliquant à long terme à tous les secteurs n’ont pour l’instant guère fait l’objet de discussions sur le thème de l’assurance qualité en milieu hospitalier. L’amélioration de l’observance des patients en tant que variable cible indépendante de la GQ n’a été que peu étudiée à titre de «compétence communicative » de la profession médicale et/ou infirmière et n’est vraisemblablement que peu reconnue en tant que telle comme compétence professionnelle. Cela s’illustre comme un déficit significatif de l’état actuel de la recherche, en particulier en ce qui concerne le large spectre des maladies chroniques nécessitant des séjours résidentiels répétitifs. 5.2 Aspects techniques des mesures de la qualité Pour 60% des articles, les données de routine font office de source de données qui ne sont pas relevées spécialement pour la documentation de la qualité ou la GQ mais qui font partie intégrante de la documentation habituelle des traitements dispensés. A peine 44 % des articles s’intéressent aux mesures relevées à des fins de documentation supplémentaire qui, au-delà de l’investissement quotidien, sont relevées exclusivement à des fins d’amélioration de la qualité de traitement d’un hôpital et non pas pour le contrôle individuel du déroulement du traitement dispensé à un patient spécifique. En d’autres termes, cette démarche représente en général un effort de documentation supplémentaire pour les médecins et le personnel infirmier. Les questionnaires complétés en priorité par les patients ou les relevés techniques supplémentaires n’ont fait l’objet que d’environ 20% d’articles au cours des dix dernières années. Durant ces années, l’utilisation des données de routine dans la GQ a connu un intérêt croissant, alors que les mesures supplémentaires axées sur les expertises enregistraient un recul. Plan de mesures de l’ANQ, rapport de recherche 2012 8 Lors de l’analyse du rapport entre les types d’erreurs constatés et les sources de données utilisées à cet effet, l’importance statistique des points suivants s’est dégagée : • Une utilisation plus fréquente des évaluations d’experts, lorsque les diagnostics erronés ont été traités comme des problèmes de qualité, • Une utilisation disproportionnée de documentation de routine en tant que source de données, lorsque la question d’une indication erronée est abordée, • une tendance à rarement recourir à des mesures techniques supplémentaires en présence de la réalisation d’une procédure erronée, mais à privilégier une • utilisation disproportionnée d’appréciations d’experts, également en relation avec la réalisation erronée, • et une utilisation plus fréquente de données relevées techniquement comme source de données pour palier aux « mesures erronées » à la base des problèmes de qualité. • Lorsqu’une observance déficiente des patients liée à un problème de qualité a fait l’objet de discussions, alors le problème de qualité a été relevé de manière disproportionnée comme source de données à l’aide d’une documentation de routine. En général, les liens documentés semblent d’une part plausibles, d’autre part ils indiquent que pour un seul et même type d’erreurs, il existe encore des possibilités de choix quant à savoir comment le problème concerné peut être opérationnalisé et mesuré. La majorité des publications recourt uniquement à un simple comptage des fréquences d’événements pour quantifier les éventuels problèmes de qualité: le problème survient ou non; dans 68% des articles étudiés une telle manière de compter (oui/non) s’applique aux indicateurs en question. Des classifications quantitatives plus précises, grâce auxquelles le problème de qualité est d’ordinaire au moins attribuable à divers degrés de gravité n’ont été discutées que dans 50 % des articles. Les indicateurs avec mesure du problème à l’aide d’échelles plus élevées sont à même de développer une sensibilité plus élevée en présence d’écarts standards. Les indicateurs qui mesuraient un écart entre un processus de traitement et une norme prédéfinie, à savoir une «observance protocolaire» déficiente ont été comptés séparés contrairement à ceux qui ne relèvent pas directement un problème de qualité généré par le patient. Si l’indicateur concerné est soigneusement sélectionné sur la base de son contenu, alors la probabilité d’un événement indésirable chez un patient augmente. Les écarts protocolaires ne sont néanmoins pas liés de manière définitive à des événements défavorables pour le patient. Un bon tiers des articles s’est penché sur les indicateurs de la qualité qui pourraient être considérés comme indicateurs indirects d’un éventuel problème de qualité. La littérature scientifique ne donne que très peu d’indications quant à la question de savoir comment passer d’indicateurs distincts liés à des champs de problèmes qualitatifs divergents à un système global de mesures de la qualité,. Tout article traitant d’un indicateur spécifique ou de l’identification d’un „paquet“ a été recensé. Les indicateurs multiples consignés sous le terme «Basket» sont ceux qui ne visent aucune interconnexion entre les différents indicateurs en vue de l’établissement d’une norme globale et qui sont donc simplement présentés en parallèle. La quasi moitié des articles étudiés s’est intéressée à ces „paquets“ non interconnectés. Environ un tiers se concentrait exclusivement sur un seul indicateur. Une mesure récapitulative pour la qualité d’un hôpital, au-delà de différentes questions ayant trait à la qualité, est en général présentée en rapport avec des questionnaires de satisfaction des patients. Tous les thèmes d’un questionnaire sont par exemple calculés sous la forme d’un score additionné afin de mesurer la satisfaction globale d’un patient. Quant à savoir si un tel calcul s’avère judicieux et fiable requiert un contrôle psychométrique préalable du questionnaire. Pour la comparaison entre les cliniques, les satisfactions moyennes de tous les patients ou de patients spécifiques peuvent dans l’idéal être comparées. Plan de mesures de l’ANQ, rapport de recherche 2012 9 Une règle de scoring alternative consisterait par exemple aussi à définir ce qui suit: «Un hôpital dont minimum 2 sur 6 indicateurs de la qualité sont jugés négativement ne doit pas obtenir le label ‚Superquali.» Dans le dernier cas, la règle d’interconnexion valable pour les mesures qualitatives donnera à nouveau une taille de mesure en deux parties: Label oui/non. Seuls 55 articles présentent sous des forme diverses des règles de scoring pour l’interconnexion d’indicateurs spécifiques différents (19 %). La littérature spécialisée semble donc encore loin du développement d’un «système» de mesures de la qualité. L’idée a rarement été poursuivie (dans uniquement 1 % des articles) de mesurer les faits liés à la qualité sous des angles différents: lorsque p.ex. l’hôpital évalue sa propre gestion des départs, que le patient donne également son avis au moyen d’un questionnaire et qu’éventuellement le collaborateur chargé du suivi est encore interrogé sur les modalités des départs. Et que ces données soient ensuite interconnectables à l’échelle individuelle. Cette démarche permettrait en effet une création d’indicateurs sous des angles multiples. A des fins de GQ d’une clinique spécifique, cela permettrait d’utiliser un plus grand «filet de pêche» pour le relevé des éventuels problèmes de qualité. Cela ne signifie pas pour autant que l’hôpital en question bénéficiera d’une avance décisive en matière d’information par rapport à d’éventuels concurrents grâce à l’utilisation d’indicateurs de la qualité multiaxiaux. Vu sous l’angle de la santé publique d’un système de soins, une démarche multiaxiale pourrait réellement apporter une utilité supplémentaire importante puisque l’interaction des divers domaines de soins avec l’avis des patients représente un facteur qualitatif décisif, en particulier pour les chaînes de soins suprasectorielles. 5.3 Thématiques des indicateurs de la qualité A ce jour, il n’existe pas de schéma de classification des problèmes de qualité uniforme dans les soins médicaux. Il semble également qu’une telle systématique ne verra vraisemblablement pas le jour: • Les événements indésirables vécus en partie par les patients (critères Outcome) ont été visés en tant que thématique des indicateurs de la qualité. • Parfois des évaluations erronées des médecins traitants ont été identifiées, • Critères de processus du traitement au sens d’écarts procéduraux artisanaux, • Critères de processus au sens de processus organisationnels insuffisants, • Maladies post-opératoires (p.ex. infections), • Les complications intervenant spontanément sans erreurs de traitement identifiables au préalable, • Eventuelles omissions dans les prestations de soins et • Caractéristiques structurelles thématisées chez les fournisseurs de prestations. Les divers thèmes peuvent s’appliquer simultanément à plusieurs aspects précités. L’énumération des thèmes a pour objectif de synchroniser l’ « intégralité » pragmatique du programme de mesure ANQ avec les thématiques discutées dans la littérature spécialisée. Plan de mesures de l’ANQ, rapport de recherche 2012 10 Thématiques/ Evénement cible des indicateurs de la qualité Le groupe «Autres» - en général un recueil de thématiques très spécifiques abordées dans de rares articles – ne peut pas être attribué aux autres catégories (71 articles). Si l’on compare les indicateurs de la qualité ANQ actuels avec ceux de la liste thématique, alors les chutes (1,3 %), escarres de décubitus (2,0 %) et réoperations (2,4 %) sont des thèmes qui n’ont été que rarement identifiés par la littérature scientifique comme problèmes pour le développement de la qualité dans le contexte de la gestion de la qualité au cours des dix dernières années. Cela ne signifie pas pour autant que les escarres de décubitus ont constitué un problème insignifiant: au cours de la dernière décennie ; on trouve dans medline plus de 1000 articles avec les mots clé «Pressure & ulcer & prevalence», plus de 1900 articles avec les mots clé «Falls & incidence & hospital» et plus de 6200 articles sur «Reoperation & prevalence»! La fréquence relativement faible dans le set de données analysé signifie donc plutôt que la mesure ne représentait, en tant que telle, guère un thème pour le développement ultérieur méthodique. Quant au nombre de thèmes de mesure traités par article,, aucune tendance chronologique ne se dégage au cours des dix dernières années. Il s’avère notamment que l’intégration de divers thèmes à un indicateur de la qualité global n’a pas un impact considérable sur le développement méthodologique. Il reste à souligner que Plan de mesures de l’ANQ, rapport de recherche 2012 11 le thème de la sécurité de médication n’a pas été relevé à ce jour dans les mesures ANQ. A l’échelle internationale, il s’agit néanmoins du thème qui a fait l’objet des plus grandes discussions dans le cadre des différentes thématiques abordées. 6 Harmonisation de l’état des recherches avec la pratique de la gestion de la qualité 6.1 Aspects médicaux vus sous l’angle pratique Pondération des spécialités Près d’un quart des expert(e)s considère la pondération existante dans le débat sur les indicateurs comme globalement appropriée et pertinente pour la GQ. La proportion élevée d‘articles consacrés aux indicateurs se rapportant globalement au milieu hospitalier a été jugée positive d’une part. D’autre part, le souhait a été émis de pouvoir bénéficier d’indicateurs plus spécifiques et proches des procédures. Des déficits ont été identifiés pour les indicateurs liés à l’oncologie, l’orthopédie, l’obstétrique, la gynécologie, la pédiatrie, la médecine d’urgence et l’urologie. Les personnes interrogées se sont montrées partagées sur l’évaluation de la proportion élevée d’indicateurs chirurgicaux : pour les uns, cela se justifie par le fait que la plupart des erreurs surviennent dans ces spécialités. D’autres estiment que les erreurs peuvent être mesurées de manière relativement facile et «objective». Les décisions erronées prises en médecine interne seraient plus fréquentes, mais beaucoup plus difficiles à identifier. Pondération par groupe de maladies La faible part des indicateurs de qualité liés aux diagnostics a été jugée appropriée par près de la moitié des personnes interrogées. A ce titre, le développement des indicateurs est considéré comme lié à l’évolution des chemins cliniques : plus il y a de chemins cliniques pour le traitement de maladies spécifiques (identifiées quant à elles par des chemin diagnostiques), plus un principe de «procédures accomplies» s’impose dans la mesure de la qualité, principe pouvant p. ex. intervenir dans le traitement de différentes maladies recourant à des procédures similaires et non spécifiques au diagnostic. Certains ont vu dans la faible spécialisation liée aux indicateurs propres aux diagnostics la conséquence d’une orientation Outcome encore trop faible dans le domaine de la GQ : le succès clinique d’une mesure comme critère central permettrait de compléter automatiquement les indicateurs «génériques» (et souvent pertinents) à l’aide d’un catalogue d’indicateurs liés aux diagnostics. En outre, la faible orientation diagnostique de la recherche sur les indicateurs de qualité de ces dix dernières années a également été rapportée à un contexte politico-systémique: la faible proportion d’indicateurs liés au diagnostic témoignerait d’un manque d’intégration des clinicien(ne)s dans le travail de développement effectué à ce jour. Une réalité due notamment au fait que ces derniers ne s’accordent souvent pas sur les objectifs du traitement et la mesure du résultat. L’axe principal actuel pour les indicateurs orientés de manière « systémique » représente souvent un « compromis formel » pour lequel un consensus a momentanément été trouvé. Sont exigés à cet effet l’intégration d’un plus grand nombre de clinicien(ne)s dans le travail de développement et la résolution du problème des mesures de la qualité du résultat fastidieuses pour les maladies spécifiques. L’intérêt du public pour la qualité des hôpitaux serait pour l’instant trop souvent et trop étroitement réduit à des «cas spectaculaires» (inversion des côtés, erreur d’anesthésie, etc.) et à des maladies qui, au sens des perceptions sociales, sont estimées comme étant particulièrement « dangereuses ». Plan de mesures de l’ANQ, rapport de recherche 2012 12 6.2 Aspects techniques des relevés vus sous l’angle pratique Pondération relative à la mesure de la qualité Certain(e)s expert(e)s jugent la pondération actuelle dans la recherche sur la mesure de la qualité comme judicieuse. Les sources d’erreurs examinées dans le chapitre 5 ont cependant été clairement perçues comme insuffisantes au regard de l’étude de l’observance déficiente des patients. Par ailleurs, une prise en compte plus importante des éventuelles erreurs d’hygiène dans la création des indicateurs a été proposée, bien que l’investissement lié à la mesure se révèle être souvent fastidieux. La pondération des erreurs de diagnostic a également été jugée trop faible. La raison résiderait dans la difficile « mesurabilité » de telles erreurs de diagnostic. Certains estiment l’examen fréquent de problèmes de mesure (p. ex. dans le cadre d’essais interlaboratoires) exagéré: «Les fautes sont rarement commises par les appareils, mais par les personnes qui les utilisent.» Le sujet pourrait être transmis à la recherche sur l’agrémentation de la production médicale. Pondération relative aux sources de données Près d’un quart des personnes interrogées était satisfait de la répartition adoptée par la recherche sur la qualité pour l’introduction de différentes sources de données. Les ajouts suivants ont été proposés par les autres personnes : • Utilisation plus fréquente de méthodes de recherche qualitatives, comme par exemple de groupes cible pour la détermination de la satisfaction des patients • Plus d’analyse prospective des potentielles sources d’erreurs à travers des interviews d’expert(e)s et des groupes de discussion réunissant des expert(e)s cliniques • Etablissement d’un système national d’annonces spontanées pour les principaux «cas isolés» d’erreurs médicales (CIRS comme modèle) • Réalisation d’audits sur l’organisation des processus comme source de données supplémentaire • Discussion «d’infractions» dues à l’infrastructure de services critiques avec des commissions d’experts externes se concentrant sur l’ergonomie du lieu de travail, la sécurité et les questions d‘hygiène • Synthèse systématique des données de la gestion des plaintes instaurée dans la majorité des hôpitaux et des développements de stratégies d’évaluation s’appliquant à tous les hôpitaux • Réalisation régulière de «Medical Reviews» rétrospectives et randomisées pour les diagnostics critiques sélectionnés par des «Peer-Reviews» externes • Combinaison intelligente plus fréquente et méthodique des données de routine issues de sources différentes afin d’obtenir un angle de vue plus «multiaxial» d’un événement. Près de la moitié des personnes interrogées a émis, d’une manière ou d’une autre, des réserves face à une interprétation trop «naïve» des données de routine – à l’exception des aspects problématiques que sont la validité et la fiabilité de ces sets de données souvent instaurés pour des raisons de facturation et non pas de qualité. Conversion de variables cibles Près d’un quart des personnes interrogées exige une plus grande prise en compte des variables Outcome dans le cadre de la GQ médicale. D’autres ont jugé la pondération actuelle comme fonctionnelle sans plus de commentaires. Un groupe a estimé que la concentration du débat scientifique sur la qualité des résultats en tant qu’exigence centrale des mesures de qualité serait une erreur de conception. Les personnes interrogées ont précisé que rien n’était encore acquis pour la GQ avec une mesure purement Outcome et qu’il était important, d’un point de vue conceptuel, de déplacer l’attention de critères liés aux événements - souvent trop restrictifs - vers des aspects plus vastes du système de soins. Pour le développement futur d’un système de mesure national, des revendications aussi hétérogènes ne permettent pas d’obtenir des indications directement utilisables. Il est en outre possible que les personnes Plan de mesures de l’ANQ, rapport de recherche 2012 13 interrogées se référaient à des domaines thématiques différents lorsqu’elles ont formulé leurs prises de position clairement divergentes. Pour une uniformisation des résultats, des discussions interactives (p.ex. dans le cadre d’une procédure Delphi structurée) auraient sans doute été plus utiles que la voie initialement retenue des interviews individuelles. Perspectives au regard des indicateurs isolés, des paquets d’indicateurs, des systèmes de scoring et des relevés multiaxiaux Une majorité des expert(e)s souhaitait un ancrage plus fort des indicateurs multiaxiaux, bien que les coûts de mesure d’un tel système soient en même temps estimés très élevés, formant par là-même un obstacle important à sa réalisation. Par ailleurs, une vaste majorité s’accordait sur le fait que les «paquets d‘indicateurs» et les mesures multiaxiales, en particulier dans les interfaces de la chaîne de soins, pouvaient contribuer à la réalisation d’un important progrès dans la GQ, à défaut d’une base de données appropriée pour une GQ suprasectorielle. L’idée de vouloir pratiquer la GQ en la subdivisant en petits thèmes et efforts organisationnels simplement à l’aide d’un indicateur spécifique a été unanimement rejetée, en particulier dans le cadre de la mise en place d’un programme de mesure national. Le lien étroit entre les paquets d’indicateurs et les variables de processus parle également en faveur de l’introduction desdits paquets dont les variables thématiquement proches sont présentées en parallèle : dans l’esprit d’une présentation chronologique du processus de soins, cela permettrait également de mieux identifier les éventuels problèmes de déroulement. Pour la moitié des personnes interrogées, le regroupement de multiples indicateurs dans un même score présente un tel avantage qu’elles accueilleraient vivement de nouvelles évolutions méthodiques à cet égard: des pondérations justifiées visant à réduire la complexité pourraient ainsi contribuer à la fixation des priorités dans la GQ. Dans la plupart des cas, les avis exprimés semblent en même temps correspondre aux revendications personnelles émises à l’égard du système de santé. 7 Réflexions finales 7.1 Réponses aux questions liées à l’évaluation Quels domaines thématiques de l’assurance de la qualité en médecine somatique aiguë revêtent une importance nationale/internationale et comment sont-ils définis? La littérature spécialisée relative au développement des indicateurs dans l’assurance de la qualité en médecine somatique aiguë est fragmentée et décousue. Parmi les spécialités médicales, la chirurgie et la médecine interne sont les plus actives, les départements dépourvus de lits font également l’objet de multiples interrogations. La plupart des questions se rapporte toutefois à l’hôpital dans sa globalité. Les diagnostics médicaux représentent à ce titre moins des thématiques de l’assurance de la qualité que les critères de processus des traitements. Les motifs pondérés parlent à la fois en faveur d’indicateurs «génériques» (càd. groupes de maladies communs) et d’indicateurs «spécifiques» (pour des interventions ou diagnostics précis). Les experts n’ont pas été à même de s’accorder quant à la direction la plus favorable à prendre en vue du développement futur de l’assurance de la qualité. Quelles principales thématiques ne sont pas ou insuffisamment couvertes par le plan de mesure ANQ actuel? Le thème des erreurs de médication. Ce dernier englobe la qualité de l’indication, l’observance des patients lors de la prise de médicaments (dosage et timing), le risque de confusion lors de la préparation, et l’observation d’éventuelles réactions croisées provoquées par des médicaments différents lors de la pose de l’indication. Il s’agit du thème majoritairement discuté dans la littérature quant au développement futur des Plan de mesures de l’ANQ, rapport de recherche 2012 14 mesures de la qualité. Son importance clinique est élevée. Pour le domaine de la sécurité de médication, il n’existe à ce jour aucune procédure finale standardisée au niveau de la forme de réalisation d’une telle mesure de la qualité. Quels indicateurs de la qualité des résultats sont compris dans les thématiques importantes? Globalement, l’analyse de la littérature n’a relevé aucun concept d’opérationnalisation réellement divergent des thématiques ANQ actuelles. Un constat que l’on pouvait sans autre tirer au vu de la stratégie adoptée (pas de développement propre mais reprise de concepts de mesure existants). Quels indicateurs de la qualité des résultats sont à vérifier tenant compte de la stratégie et des objectifs de l’ANQ pour l’intégration au plan de mesure? A notre avis, il n’est pas possible de répondre à cette question de manière brève et concise, puisque le champ des erreurs de médication semble beaucoup trop complexe. Il existe toutefois une littérature méthodique exhaustive qui traite des erreurs de médication, de leurs mesures et stratégies d’évitement. Quelles sont les méthodes de relevé existantes pour les indicateurs de la qualité identifiés? A l’instar de la question précédente, les mêmes arguments s’appliquent: une méthode de relevé simple pour les erreurs de médication n’est pas envisageable en raison de la complexité des thématiques. Il existe de nombreuses propositions pour les méthodes de mesure et critères d’évaluation qui requièrent néanmoins une étude préalable conceptuelle et technique (d’un point de vue des relevés) pour l’intégration dans le plan de mesure ANQ. En accord avec les propositions des experts interviewés, la proposition est faite de commander une étude Delphi pointue et spécifique, réalisée par des experts reconnus des secteurs cliniques et pharmacologiques, mais aussi actifs dans l’informatique médicale. Une telle étude devrait néanmoins être conduite par des spécialistes compétents jouissant d’un excellent know-how en matière de jugements de groupe et de domaines de jugement cognitifs. Comment ces indicateurs de la qualité sont-ils jugés au niveau du rapport coût-utilité? La littérature scientifique ne tire aucun constat au sujet du rapport coût-utilité des indicateurs de la qualité spécifiques retenus par l’ANQ. Du point de vue de l’économie de la santé, des questions méthodiques (surtout la question de l’intégration des coûts indirects) doivent encore être résolues avant de pouvoir s’attaquer, sous l’angle empirique, au bénéfice économique généré par les mesures de la qualité. Les indicateurs de la qualité se prêtent-ils à une comparabilité et à la publication? La littérature ne voit en principe aucun problème à publier des résultats qualitatifs, pour autant qu’ils soient transparents et corrects sur le plan méthodologique. Le problème d’une publication à l’attention d’un public intéressé mais amateur résident dans les malentendus générés par l’utilisation d’une terminologie complexe mais aussi de graphiques inadéquats sur le plan de la perception psychologique. 7.2 Conclusion et autres recommandations Le mandat d’expertise assigné par l’ANQ se limitait expressément au secteur de soins aigus résidentiels et aux mesures de la qualité nécessaires ou judicieuses à l’échelle nationale. De nombreux experts ont précisé qu’une philosophie suprasectorielle relative à l’assurance de la qualité constituera à l’avenir un aspect de plus en plus décisif pour le succès de la thérapie et la sécurité des patients. La gestion des interfaces avec des institutions de suivi revêtira un rôle de plus en plus important pour la qualité de toute la chaîne de soins. La littérature exige à ce titre une étroite interaction avec les principaux groupes d’entraide pour les maladies chroniques, une étape de développement capitale pour les soins hospitaliers. Plan de mesures de l’ANQ, rapport de recherche 2012 15 Pour conclure, il convient de retenir que les indicateurs choisis par l’ANQ couvrent des thèmes importants de la médecine somatique aiguë. Indépendamment du haut degré de complexité, le thème de la sécurité de médication forme une thématique vivement discutée à l’international, revêtant une importance clinique élevée. Il est recommandé de vérifier son intégration dans le plan de mesure ANQ. En 2ème partie de rapport, les méthodes utilisées pour les divers thèmes de mesure ont été analysées et discutées de manière approfondies quant à leurs forces et faiblesses. Les résultats des analyses qui en découlent ont été adressés aux instituts de mesure respectifs pour prise de position. Les conclusions du processus d’évaluation sont transmises aux commissions de l’ANQ. Les éventuelles adaptations à apporter aux concepts de mesure seront également discutées. Plan de mesures de l’ANQ, rapport de recherche 2012 16