Version courte 1ère partie rapport évaluation ISGF

publicité
Plan de mesures de l’ANQ:
analyse de l’intégralité et de la
pertinence
Rapport de recherche de l’ISGF, mai 2012
Version succincte
Janvier 2013 / Version 1.1
Sommaire
1
Introduction
1
2
Objectifs
1
3
Méthode
1
3.1
3.2
3.3
1
2
3
4
5
Gestion de la qualité du point de vue de la santé publique
3
4.1
4.2
4.3
4.3.1
Rapport entre mesure et gestion de la qualité
Choix des thèmes de la qualité et synthèse
Evaluation dans les interviews d’experts
Classement des 33 événements qualité
3
4
4
4
4.3.2
Priorisation des indicateurs de qualité selon les expert(e)s
5
Point sur la littérature pour contenus et indicateurs dans la gestion de la qualité
5.1
5.2
5.3
6
7
Analyse de la littérature
Evaluation des indicateurs de l’ANQ
Entretiens avec des experts
Aspects médicaux des mesures de la qualité
Aspects techniques des mesures de la qualité
Thématiques des indicateurs de la qualité
6
6
8
10
Harmonisation de l’état des recherches avec la pratique de la gestion de la qualité
12
6.1
6.2
12
13
Aspects médicaux vus sous l’angle pratique
Aspects techniques des relevés vus sous l’angle pratique
Réflexions finales
14
7.1
7.2
14
15
Réponses aux questions liées à l’évaluation
Conclusion et autres recommandations
1
Introduction
L’Association nationale pour le développement de la qualité dans les hôpitaux et les cliniques (ANQ) a
chargé le Schweizer Institut für Sucht- und Gesundheitsforschung (ISGF, Zurich) d’analyser l’intégralité et la
pertinence de son plan de mesure. L’expertise devait tenir compte d’une part des divers champs
thématiques, des indicateurs et des instruments (ou méthodes) de mesure déjà définis par l’ANQ
(notamment les coopérations avec les registres de maladies et de traitements existants) et, d’autre part, des
prescriptions édictées par l’ANQ liées à la planification, la réalisation d’évaluations des indicateurs de qualité
sur le plan conceptuel et au feedback aux hôpitaux (pour une éventuelle accessibilité générale des résultats).
2
Objectifs
L’expertise devait répondre aux sept questions suivantes :
1. Quels champs thématiques de l’assurance qualité sont pertinents pour la médecine somatique aiguë sur
les plans national et international, et comment sont-ils définis ?
2. Parmi ces champs thématiques, lesquels ne sont pas ou pas assez couverts par le plan de mesure actuel
de l’ANQ ?
3. Quels indicateurs de la qualité des résultats ces champs thématiques englobent-ils?
4. Compte tenu de la stratégie et des objectifs de l’ANQ, quels indicateurs de la qualité des résultats
devraient éventuellement être intégrés au plan de mesure ?
5. Quelles sont les méthodes de relevé existantes pour les indicateurs de la qualité identifiés (à la question
4) ?
6. Comment ces indicateurs sont-ils évalués au regard du rapport coût-utilité ?
7. Conviennent-ils à des fins de comparaison et de publication ?
3
Méthode
Pour la médecine somatique aiguë, le plan de mesure ANQ définit contractuellement les six indicateurs pour
le relevé par les hôpitaux de soins aigus. Grâce à la collaboration avec un registre de données central (SIRIS),
un indicateur supplémentaire a été élaboré de sorte à être empiriquement mesurable. Pour choisir les
méthodes de mesure, l’ANQ s’est concentrée en priorité sur les concepts de mesure existants et a décidé la
démarche suivante :
•
•
•
•
•
utilisation du système d’analyse SQLape pour le calcul des taux de réhospitalisations et de réopérations;
collaboration avec SwissNOSO pour le relevé des infections post-opératoires;
emploi du questionnaire bref de l’ANQ pour le relevé de la satisfaction des patients;
mesure de la prévalence des chutes et escarres d’après le concept de mesure LPZ
collaboration avec le registre des implants SIRIS pour évaluer le temps nécessaire à la révision des
endoprothèses de hanche et de genou.
3.1
Analyse de la littérature
La littérature scientifique spécialisée consacrée au thème «Mesures de la qualité dans le domaine des soins
er
aigus en milieu résidentiel» a été analysée pour la période du 1 janvier 2002 au 20 février 2012. Les bases
de données littéraires retenues sont medline (accès via PUBMED), EMBASE, PSYCINFO et PSYNDEX qui
recueillent des journaux avec «peer review» (avec une vaste palette de thèmes).
Plan de mesures de l’ANQ, rapport de recherche 2012
1
Le nombre d’articles spécialisés publiés chaque année reflète l’importance accordée par la littérature
médicale aux mesures de la qualité. Ce dernier a clairement augmenté au cours de la dernière décennie et a
plus que doublé : le nombre d’articles est passé de moins de 20 à plus de 40 par an. Bien que le nombre de
publications médicales spécialisées a augmenté d’un facteur 1,76 entre 2002 (medline : 560 687 articles) et
2011 (medline : 987 385 articles), l’importance des mesures de la qualité dans la littérature médicale a encore
davantage évolué (d’un facteur 1,96). A noter que seuls 0,03 ‰ en 2002 et 0,05 ‰ en 2011 des nouvelles
littératures médicales traitent des mesures de la qualité; la recherche sur le système de soins reste donc
marginale par rapport à la recherche clinique.
3.2
Evaluation des indicateurs de l’ANQ
Les instruments de mesure prescrits à ce jour par l’ANQ ne relèvent pas uniquement des aspects qualitatifs
très différents sur le plan du contenu ; ils peuvent aussi être considérés comme extrêmement hétérogènes en
ce qui concerne le processus générant les données :
• chutes et escarres de décubitus : évaluation d’experts qui doit être complétée par le personnel infirmier
à un jour fixe.
• satisfaction des patients : questionnaire bref de l’ANQ remis aux patients ;
• réhospitalisations : à partir d’un set de données annuel national de toutes les sorties résidentielles,
obtenu via une « interconnexion des dossiers », la réadmission du même patient est considérée comme
problème de qualité potentiel selon le classement effectué par un système de scoring préalablement
développé. Les données proviennent uniquement de la Statistique médicale des hôpitaux de l’Office
fédéral de la statistique (OFS) ;
• réopérations : taux de réopérations potentiellement évitables, calculé à partir des données de routine
systématiques de la Statistique médicale des hôpitaux de l’OFS grâce à un système de scoring
préalablement développé ;
• charge engendrée par la révision des endoprothèses : évaluation à partir du registre national, qui n’a pas
été conçu à l’origine pour la gestion de la qualité, mais qui doit également profiter à la recherche
clinique ;
• relevé des infections nosocomiales après des interventions fixées: évaluation d’experts réalisée par le
personnel infirmier (sous le contrôle d’un médecin), qui comporte, selon le type d’intervention, une
enquête téléphonique auprès des patients 30 jours ou 12 mois après leur sortie.
En raison de cette hétérogénéité méthodologique, l’objectif de l’évaluation a été fixé selon différents
aspects :
• pour les relevés de la prévalence chutes et escarres de décubitus, la fiabilité du schéma d’évaluation
utilisé pour la mesure par le personnel infirmier est d’une part discutée. D’autre part, le processus de
l’’échantillon retenu (échantillon transversal sur un jour fixe) est également discuté afin d’étudier dans
quelle mesure cette méthode profite à la comparaison entre les cliniques et s’avère capable d’illustrer la
situation générale en Suisse au niveau de la qualité des soins dispensés ;
• l’évaluation de l’indicateur de satisfaction des patients avait pour objectif de favoriser les réflexions
psychométriques;
• pour les indicateurs de qualité (infections nosocomiales et traitements endoprothétiques), les exigences
posées à l’égard de la qualité des données ont été discutées sur la base du développement de structures
de relevé et d’évaluation actuellement en cours d’élaboration. Au-delà des hôpitaux, l’intégralité du relevé
ou le processus de sélection de l’échantillon retenu pour les évaluations partielles constitue également un
critère d’évaluation important ;
Plan de mesures de l’ANQ, rapport de recherche 2012
2
• pour les indicateurs de qualité réopérations et réhospitalisations, les réflexions méthodologiques et
statistiques ont été au cœur des discussions. Le thème de la qualité des données n’a pas été
particulièrement traité dans ce rapport car il relève avant tout de l’Office fédéral de la statistique, en sa
qualité de centrale des données de la Statistique médicale des hôpitaux.
3.3
Entretiens avec des experts
Au total, 16 personnes ont été identifiées en leur qualité d’experts de l’assurance qualité dans le domaine
des soins aigus en milieu résidentiel. Treize d’entre elles se sont prêtées à un entretien. Les critères de
sélection ont tenu compte du fait que les médecins, infirmiers, représentants des autorités de surveillance et
des assurances-maladie, ainsi que les chercheurs scientifiques reconnus dans le domaine de la gestion de la
qualité (GQ) feraient des partenaires d’interviews idéaux. Cinq entretiens ont été réalisés avec des personnes
travaillant à l’étranger (Allemagne et Autriche). Les entretiens étaient divisés en trois parties :
1. classement des indicateurs actuels de l’ANQ,
2. identification des priorités parmi les indicateurs de la gestion de la qualité
3. évaluation et réflexion sur les données issues de la littérature.
4
Gestion de la qualité sur le plan de la santé publique
Si l’on considère la GQ comme un processus d’apprentissage du système de soins (et non pas comme une
fonction de contrôle souveraine), il est non seulement nécessaire de mesurer les indicateurs de la qualité des
soins, mais il convient également de veiller à ce que les prestataires (corps médical, personnel infirmier,
domaine diagnostique et autres services d’hospitalisation) bénéficient de retours compréhensibles, efficaces
et rapides sur les prestations délivrées par leurs soins.
4.1
Rapport entre mesure et gestion de la qualité
La mesure du résultat dans les soins résidentiels ne s’effectue pas à des fins purement documentaires. Elle
doit aussi permettre un feedback aux experts cliniques dans le cadre de la gestion de la qualité et ainsi
contribuer à un développement continu de la qualité des résultats. En posant un regard critique sur la
pratique confirmée du développement des indicateurs, la littérature précise que les retours ne doivent pas
être considérés en soi comme un outil améliorant automatiquement la qualité de la GQ. Des caractéristiques
de tâches différentes peuvent découler de la problématique clinique à résoudre à l’aide d’un traitement
résidentiel. Dans le doute, ces dernières peuvent même engendrer un effet aggravant du retour lié au
résultat du traitement.
Selon la littérature, il est primordial d’identifier dans quelle mesure la tâche comprend en soi un degré
d’incertitude faible ou élevé. Pour les thérapies qui n’offrent que peu de chances d’amélioration, le seul
retour sur la qualité du résultat peut même avoir un effet nuisible, selon la théorie psychologique du
Feedback-Intervention, parce qu’il oriente l’objectif des prestataires dans la mauvaise direction. Un retour sur
les paramètres de processus (couplés à l’Outcome) serait plus judicieux pour les traitements présentant une
incertitude statistique élevée, ceci afin de permettre le développement ultérieur des méthodes cliniques et
Plan de mesures de l’ANQ, rapport de recherche 2012
3
de palier aux éventuels doutes supplémentaires chez les prestataires qui, nécessairement, agissent de
manière risquée.
4.2
Choix des thèmes qualitatifs et synthèse
Dans la littérature scientifique, une méthode très appréciée pour sélectionner au sein des hôpitaux ou sur
l’ensemble d’un système de soins différents thèmes de qualité parmi le grand nombre de thèmes de mesure
potentiels consiste dans la création plus ou moins structurée d’un consensus par des expert(e)s. Les résultats
de telles démarches sont fortement liés aux personnes participant à la création du consensus, à leur
expérience et à leurs connaissances théoriques générales. L’application de telles procédures Delphi (ou de
techniques de groupes similaires) comprend également des risques significatifs quant à l’obtention de
résultats incomplets ou faussés.
L’idée a donc été émise d’identifier au préalable les possibles mécanismes de sélection avant d’initier un tel
processus de création de consensus, ainsi que de relever des données empiriques sur l’importance relative
accordée par les experts compétents aux « méta-critères » de la qualité. Les problèmes de qualité se laissent
quantifier d’après les catégories «envergure du dommage» et «probabilité d’occurrence». Exemples de
potentiels critères de priorisation:
•
•
•
•
•
Priorisation en fonction de la gravité de la maladie (les soi-disant disability adjusted life years (DALYs))
Priorisation en fonction de la fréquence d’erreur
Priorisation en fonction des potentiels d’amélioration
Priorisation en fonction des coûts
Masse récapitulative pour la qualité dans les hôpitaux
4.3
Evaluation dans le cadre des interviews d’experts
4.3.1
Classement des 33 événements qualité
A l’unanimité, les personnes interrogées ont classé les événements qualité selon un principe
«expertocratique»: ils ont attribué une importance nettement plus élevée aux événements qui, du point de
vue des experts du domaine de la santé, pourraient être interprétés comme des « erreurs » qui relèvent de
leur responsabilité par rapport aux événements qui, du point de vue des patient(e)s, illustreraient
« simplement » une qualité des soins hospitaliers insuffisante ».
«Les erreurs artisanales» faites dans le cadre d’une procédure clairement décrite (p. ex. les réopérations
évitables) ont été jugées «plus graves» que les infections post-opératoires, les escarres de décubitus ou une
infection nosocomiale générale. Ces trois déficiences qualitatives jugées moins «graves» partagent le fait de
provenir d’une multitude de sources d’erreurs différentes, ne contrecarrant ainsi pas obligatoirement le droit
professionnel individuel à la liberté d’erreurs. Les décisions erronées lors de la pose de l’indication pour la
sectio ou l‘appendicectomie sont, selon l’avis des experts, encore moins importantes. Un retard de traitement
suite à une attaque à l’hôpital jouit en revanche d’un classement très élevé au même titre que les fautes
« artisanales ».
L’importance des événements concernés ne faisait pas l’unanimité. Les événements « plus graves » se
voyaient en général attribuer un classement plus homogène que les « moins graves ». Les experts(e)s
s’accordaient cependant, à quelques détails près, sur le fait que les jugements des patients étaient estimés
moins dramatiques que les erreurs de diagnostic ou artisanales.
Plan de mesures de l’ANQ, rapport de recherche 2012
4
Il ne faut cependant en aucun cas considérer comme un mépris des intérêts des patients le fait que les
problèmes de qualité définis par les patients soient classés, d’un point de vue professionnel, après les
problèmes de qualité définis par les experts. Une confrontation exclusive et mutuelle des points de vue des
patients et des experts quant aux procédures hospitalières ne reflète pas la réalité du processus de
traitement et n‘est que le résultat « forcé » de la méthode d’interrogation. Les points de vue se complètent
souvent dans la pratique. Les professionnels de la santé et les patient(e)s évaluent les faits de manière
relativement similaire, surtout pour ce qui a trait au pôle négatif. Une excellente application professionnelle
de la sécurité des patient(e)s répond au souhait du patient(e) et pose les bases d’une confiance de principe
face au traitement.
Les personnes interrogées ont contredit l’image instaurée par les Etats-Unis il y a dix ans, selon laquelle les
erreurs de traitement sont jugées comme un problème relativement minime par les patient(e)s et les
médecins.
4.3.2
Priorisation des indicateurs de qualité selon les expert(e)s
La priorisation d’indicateurs à relever peut être considérée sous différents angles (point de vue individuel du
patient, santé publique, institutions de financement comme les caisses d’assurance-maladie, collaborateur
infirmier individuel, hôpital etc.). L’angle de la santé publique (angle SP) revêt une importance capitale pour
l’ANQ en sa qualité d’institution de portée nationale, Sous l’angle SP, il conviendrait donc d’obtenir le plus
grand effet possible sur la santé publique lors de l’établissement d’un programme de mesure lié à
l’assurance de la qualité. Afin que cet angle PH ne soit guère influencé par d’autres critères d’évaluation, les
expert(e)s ont été priés en cours d’entretien de réaliser une estimation comparative des critères de
priorisation sous l’angle SP versus celui du personnel soignant. Grâce à cette technique des contrastes, les
personnes interrogées sont amenées à garder à l’esprit la différence des deux approches lors de l’évaluation
de chaque critère.
Pour les personnes interrogées, le principal critère de sélection des indicateurs GQ réside dans les potentiels
d’amélioration atteignables par les mesures de la qualité, suivis par la prévalence du traitement. Cela
s’applique au personnel soignant et à l’angle SP. La moitié des mécanismes de sélection consultés a été
jugée plus ou moins pertinente sous l’angle donné : l’homogénéisation des prestations (réduction de la
variance) a été jugée plus importante sous l’angle SP que celui du personnel soignant.
Pour le personnel soignant, le choix d’indicateurs GQ sur la base du nombre absolu d’erreurs, de la
vérifiabilité de l’événement, ainsi que des trois facteurs de coûts (recours, coûts des mesures, suppression
des erreurs) a été jugé plus important que sous l’angle SP.
Les expert(e)s n’ont fait aucune différence entre une sélection d’indicateurs GQ liée à la prévalence du
traitement, aux DALYs attribués à des erreurs, aux DALYs de la maladie d’origine et aux «Dread Risk». Une
sélection d’indicateurs GQ d’après la somme des écarts constatés par rapport à l’hôpital « Best Practice » a
été évaluée de manière plus ou moins uniforme sous les deux angles précités.
Plan de mesures de l’ANQ, rapport de recherche 2012
5
Evaluation des critères de sélection des indicateurs GQ par les expert(e)s
Dans l’ensemble, les expert(e)s sont arrivés à la conclusion que les indicateurs GQ d’un système de mesure
national doivent avant tout provenir des champs pour lesquels aucune homogénéisation des résultats de
traitement n’a été entreprise, que les traitements de routine très fréquents doivent être intégrés en priorité
dans l’assurance de la qualité, et que – très important -, les indicateurs (générés par l’information de tiers)
permettant d’obtenir un haut potentiel d’amélioration à l’échelle du système de soins général pour
l’ensemble de la population,, devraient être prescrits.
5
Point sur la littérature pour les contenus et indicateurs de la gestion de
la qualité
Les articles scientifiques proviennent pour plus de 70% des Etats-Unis, de l‘Allemagne, de Grande-Bretagne,
de France, d’Italie et des Pays-Bas. Au cours des dix dernières années, tous les autres pays ont publié moins
de 9 articles consacrés au thème «Mesure de la qualité des soins». La Suisse a publié six articles. Au total, 47
pays ont été identifiés.
5.1
Aspects médicaux des mesures de la qualité
Comme le montre l‘illustration suivante, les indicateurs les plus souvent discutés (n=102) sont ceux liés à
l‘hôpital dans sa globalité (p. ex. la mortalité). Dans l’ensemble, il ressort qu’il n’y a pas de spécialité
dominante faisant à elle seule l’objet d’une analyse scientifique exclusive des mesures de la qualité. A noter
Plan de mesures de l’ANQ, rapport de recherche 2012
6
cependant que des disciplines importantes telles que la gynécologie, l’obstétrique, l’orthopédie et la
neurologie totalisent étonnamment peu d’articles spécifiques.
Spécialisations thématisées et unités organisationnelles
Dans la littérature, on trouve plutôt des diagnostics ou groupes de maladie non spécifiques pour lesquels
des mesures de qualité sont développées : les maladies vasculaires n’ont été spécifiquement traitées que
dans moins d’un quart des articles (59 fois) en leur qualité de plus grand groupe de maladies. Il s’agissait en
outre principalement de mesures de la qualité liées aux maladies cardiaques ischémiques. Seuls 27 articles se
penchaient sur les diagnostics des maladies du système respiratoire, en l’occurrence surtout sur les
pneumonies. Les maladies cancérigènes étaient spécifiquement mentionnées dans moins de 20 articles.
Nous pouvons en conclure que la mesure de la qualité ne se rapporte que rarement à des diagnostics
spécifiques, mais de manière générale plutôt au résultat obtenu ou aux critères de processus définis.
Quant aux (groupes de) diagnostics traités, il n’y a pas eu de changement sur la période observée: de
manière relativement constante, ce sont en moyenne entre 0,5 et 0,8 diagnostics par article qui sont analysés
Plan de mesures de l’ANQ, rapport de recherche 2012
7
sur le plan de la mesure de leur qualité. La «distance diagnostique» de la mesure de la qualité semble être
stable dans le temps.
Introduite dans le débat médical sur la qualité par Donabedian en 1966, la classification en fonction de la
qualité des structures, des processus et des résultats peut également être relevée dans les points de vue émis
dans les articles sur les mesures de la qualité. Aucun article consacré à la qualité structurelle n’a été identifié
(ce qui correspond tout à fait à la mission de cette expertise). Par ailleurs, la mesure des critères de processus
domine clairement (plus de deux tiers des articles ont été consacrés à tels indicateurs). Moins d’un quart des
articles traitent du véritable résultat de traitement. Des articles professionnels sur les critères de mesure de la
qualité (qualité de la documentation) et la transmission d’informations s’avèrent être encore plus rares.
L’impression se dégage que le développement d’instruments de mesure occupe une place prépondérante
dans la cadre de la recherche clinique, bien qu’il joue un rôle plutôt secondaire dans la GQ.
Si l’on s’interroge sur la source d’erreurs susceptibles d’engendrer un éventuel problème de qualité, un axe
prioritaire se dégage clairement des articles sélectionnés : la réalisation erronée d’une procédure de
traitement (pour la plupart du temps standardisée) représente avec plus de deux tiers de tous les articles le
thème central nettement dominant dans la GQ. La question de savoir si l’indication d’un traitement est
vraiment erronée est abordée dans à peine un tiers des articles. Suivent ensuite les erreurs d’hygiène (24%)
en tant que sources d’erreurs découlant du processus de traitement respectif, les erreurs de diagnostic (21%)
et les erreurs de mesure (18%). Les problèmes de qualité, qui peuvent survenir en raison d’une observance
(compliance) thérapeutique insuffisante de la part des patients, jouaient le rôle le plus insignifiant (8%). Bien
qu’au cours de ces mêmes dix années d’observation, le thème «Patient & compliance & measurement» a été
traité dans medline à travers plus de 1’200 articles et le thème «Patient & adherence & measurement» repris
plus de 1500 fois, le lien entre la recherche consacrée à l’observance et le domaine de la GQ n’est qu’infime,
voire inexistant. De toute évidence, la recherche clinique accorde bien plus d’importance au thème de
l’observance des patients en raison de son impact sur le résultat de traitement qu’à la GQ. Cela peut
également provenir du fait que des indicateurs Outcome s’appliquant à long terme à tous les secteurs n’ont
pour l’instant guère fait l’objet de discussions sur le thème de l’assurance qualité en milieu hospitalier.
L’amélioration de l’observance des patients en tant que variable cible indépendante de la GQ n’a été que peu
étudiée à titre de «compétence communicative » de la profession médicale et/ou infirmière et n’est
vraisemblablement que peu reconnue en tant que telle comme compétence professionnelle. Cela s’illustre
comme un déficit significatif de l’état actuel de la recherche, en particulier en ce qui concerne le large
spectre des maladies chroniques nécessitant des séjours résidentiels répétitifs.
5.2
Aspects techniques des mesures de la qualité
Pour 60% des articles, les données de routine font office de source de données qui ne sont pas relevées
spécialement pour la documentation de la qualité ou la GQ mais qui font partie intégrante de la
documentation habituelle des traitements dispensés. A peine 44 % des articles s’intéressent aux mesures
relevées à des fins de documentation supplémentaire qui, au-delà de l’investissement quotidien, sont
relevées exclusivement à des fins d’amélioration de la qualité de traitement d’un hôpital et non pas pour le
contrôle individuel du déroulement du traitement dispensé à un patient spécifique. En d’autres termes, cette
démarche représente en général un effort de documentation supplémentaire pour les médecins et le
personnel infirmier.
Les questionnaires complétés en priorité par les patients ou les relevés techniques supplémentaires n’ont fait
l’objet que d’environ 20% d’articles au cours des dix dernières années. Durant ces années, l’utilisation des
données de routine dans la GQ a connu un intérêt croissant, alors que les mesures supplémentaires axées sur
les expertises enregistraient un recul.
Plan de mesures de l’ANQ, rapport de recherche 2012
8
Lors de l’analyse du rapport entre les types d’erreurs constatés et les sources de données utilisées à cet effet,
l’importance statistique des points suivants s’est dégagée :
• Une utilisation plus fréquente des évaluations d’experts, lorsque les diagnostics erronés ont été traités
comme des problèmes de qualité,
• Une utilisation disproportionnée de documentation de routine en tant que source de données, lorsque la
question d’une indication erronée est abordée,
• une tendance à rarement recourir à des mesures techniques supplémentaires en présence de la
réalisation d’une procédure erronée, mais à privilégier une
• utilisation disproportionnée d’appréciations d’experts, également en relation avec la réalisation erronée,
• et une utilisation plus fréquente de données relevées techniquement comme source de données pour
palier aux « mesures erronées » à la base des problèmes de qualité.
• Lorsqu’une observance déficiente des patients liée à un problème de qualité a fait l’objet de discussions,
alors le problème de qualité a été relevé de manière disproportionnée comme source de données à l’aide
d’une documentation de routine.
En général, les liens documentés semblent d’une part plausibles, d’autre part ils indiquent que pour un seul
et même type d’erreurs, il existe encore des possibilités de choix quant à savoir comment le problème
concerné peut être opérationnalisé et mesuré.
La majorité des publications recourt uniquement à un simple comptage des fréquences d’événements pour
quantifier les éventuels problèmes de qualité: le problème survient ou non; dans 68% des articles étudiés
une telle manière de compter (oui/non) s’applique aux indicateurs en question. Des classifications
quantitatives plus précises, grâce auxquelles le problème de qualité est d’ordinaire au moins attribuable à
divers degrés de gravité n’ont été discutées que dans 50 % des articles. Les indicateurs avec mesure du
problème à l’aide d’échelles plus élevées sont à même de développer une sensibilité plus élevée en présence
d’écarts standards. Les indicateurs qui mesuraient un écart entre un processus de traitement et une norme
prédéfinie, à savoir une «observance protocolaire» déficiente ont été comptés séparés contrairement à ceux
qui ne relèvent pas directement un problème de qualité généré par le patient. Si l’indicateur concerné est
soigneusement sélectionné sur la base de son contenu, alors la probabilité d’un événement indésirable chez
un patient augmente. Les écarts protocolaires ne sont néanmoins pas liés de manière définitive à des
événements défavorables pour le patient. Un bon tiers des articles s’est penché sur les indicateurs de la
qualité qui pourraient être considérés comme indicateurs indirects d’un éventuel problème de qualité.
La littérature scientifique ne donne que très peu d’indications quant à la question de savoir comment passer
d’indicateurs distincts liés à des champs de problèmes qualitatifs divergents à un système global de mesures
de la qualité,. Tout article traitant d’un indicateur spécifique ou de l’identification d’un „paquet“ a été
recensé. Les indicateurs multiples consignés sous le terme «Basket» sont ceux qui ne visent aucune
interconnexion entre les différents indicateurs en vue de l’établissement d’une norme globale et qui sont
donc simplement présentés en parallèle. La quasi moitié des articles étudiés s’est intéressée à ces „paquets“
non interconnectés. Environ un tiers se concentrait exclusivement sur un seul indicateur.
Une mesure récapitulative pour la qualité d’un hôpital, au-delà de différentes questions ayant trait à la
qualité, est en général présentée en rapport avec des questionnaires de satisfaction des patients. Tous les
thèmes d’un questionnaire sont par exemple calculés sous la forme d’un score additionné afin de mesurer la
satisfaction globale d’un patient. Quant à savoir si un tel calcul s’avère judicieux et fiable requiert un contrôle
psychométrique préalable du questionnaire. Pour la comparaison entre les cliniques, les satisfactions
moyennes de tous les patients ou de patients spécifiques peuvent dans l’idéal être comparées.
Plan de mesures de l’ANQ, rapport de recherche 2012
9
Une règle de scoring alternative consisterait par exemple aussi à définir ce qui suit: «Un hôpital dont
minimum 2 sur 6 indicateurs de la qualité sont jugés négativement ne doit pas obtenir le label ‚Superquali.»
Dans le dernier cas, la règle d’interconnexion valable pour les mesures qualitatives donnera à nouveau une
taille de mesure en deux parties: Label oui/non. Seuls 55 articles présentent sous des forme diverses des
règles de scoring pour l’interconnexion d’indicateurs spécifiques différents (19 %). La littérature spécialisée
semble donc encore loin du développement d’un «système» de mesures de la qualité.
L’idée a rarement été poursuivie (dans uniquement 1 % des articles) de mesurer les faits liés à la qualité sous
des angles différents: lorsque p.ex. l’hôpital évalue sa propre gestion des départs, que le patient donne
également son avis au moyen d’un questionnaire et qu’éventuellement le collaborateur chargé du suivi est
encore interrogé sur les modalités des départs. Et que ces données soient ensuite interconnectables à
l’échelle individuelle. Cette démarche permettrait en effet une création d’indicateurs sous des angles
multiples.
A des fins de GQ d’une clinique spécifique, cela permettrait d’utiliser un plus grand «filet de pêche» pour le
relevé des éventuels problèmes de qualité. Cela ne signifie pas pour autant que l’hôpital en question
bénéficiera d’une avance décisive en matière d’information par rapport à d’éventuels concurrents grâce à
l’utilisation d’indicateurs de la qualité multiaxiaux. Vu sous l’angle de la santé publique d’un système de
soins, une démarche multiaxiale pourrait réellement apporter une utilité supplémentaire importante puisque
l’interaction des divers domaines de soins avec l’avis des patients représente un facteur qualitatif décisif, en
particulier pour les chaînes de soins suprasectorielles.
5.3
Thématiques des indicateurs de la qualité
A ce jour, il n’existe pas de schéma de classification des problèmes de qualité uniforme dans les soins
médicaux. Il semble également qu’une telle systématique ne verra vraisemblablement pas le jour:
• Les événements indésirables vécus en partie par les patients (critères Outcome) ont été visés en tant que
thématique des indicateurs de la qualité.
• Parfois des évaluations erronées des médecins traitants ont été identifiées,
• Critères de processus du traitement au sens d’écarts procéduraux artisanaux,
• Critères de processus au sens de processus organisationnels insuffisants,
• Maladies post-opératoires (p.ex. infections),
• Les complications intervenant spontanément sans erreurs de traitement identifiables au préalable,
• Eventuelles omissions dans les prestations de soins et
• Caractéristiques structurelles thématisées chez les fournisseurs de prestations.
Les divers thèmes peuvent s’appliquer simultanément à plusieurs aspects précités. L’énumération des thèmes
a pour objectif de synchroniser l’ « intégralité » pragmatique du programme de mesure ANQ avec les
thématiques discutées dans la littérature spécialisée.
Plan de mesures de l’ANQ, rapport de recherche 2012
10
Thématiques/ Evénement cible des indicateurs de la qualité
Le groupe «Autres» - en général un recueil de thématiques très spécifiques abordées dans de rares articles –
ne peut pas être attribué aux autres catégories (71 articles).
Si l’on compare les indicateurs de la qualité ANQ actuels avec ceux de la liste thématique, alors les chutes
(1,3 %), escarres de décubitus (2,0 %) et réoperations (2,4 %) sont des thèmes qui n’ont été que rarement
identifiés par la littérature scientifique comme problèmes pour le développement de la qualité dans le
contexte de la gestion de la qualité au cours des dix dernières années. Cela ne signifie pas pour autant que
les escarres de décubitus ont constitué un problème insignifiant: au cours de la dernière décennie ; on trouve
dans medline plus de 1000 articles avec les mots clé «Pressure & ulcer & prevalence», plus de 1900 articles
avec les mots clé «Falls & incidence & hospital» et plus de 6200 articles sur «Reoperation & prevalence»! La
fréquence relativement faible dans le set de données analysé signifie donc plutôt que la mesure ne
représentait, en tant que telle, guère un thème pour le développement ultérieur méthodique.
Quant au nombre de thèmes de mesure traités par article,, aucune tendance chronologique ne se dégage au
cours des dix dernières années. Il s’avère notamment que l’intégration de divers thèmes à un indicateur de la
qualité global n’a pas un impact considérable sur le développement méthodologique. Il reste à souligner que
Plan de mesures de l’ANQ, rapport de recherche 2012
11
le thème de la sécurité de médication n’a pas été relevé à ce jour dans les mesures ANQ. A l’échelle
internationale, il s’agit néanmoins du thème qui a fait l’objet des plus grandes discussions dans le cadre des
différentes thématiques abordées.
6
Harmonisation de l’état des recherches avec la pratique de la gestion de
la qualité
6.1
Aspects médicaux vus sous l’angle pratique
Pondération des spécialités
Près d’un quart des expert(e)s considère la pondération existante dans le débat sur les indicateurs comme
globalement appropriée et pertinente pour la GQ. La proportion élevée d‘articles consacrés aux indicateurs
se rapportant globalement au milieu hospitalier a été jugée positive d’une part. D’autre part, le souhait a été
émis de pouvoir bénéficier d’indicateurs plus spécifiques et proches des procédures. Des déficits ont été
identifiés pour les indicateurs liés à l’oncologie, l’orthopédie, l’obstétrique, la gynécologie, la pédiatrie, la
médecine d’urgence et l’urologie. Les personnes interrogées se sont montrées partagées sur l’évaluation de
la proportion élevée d’indicateurs chirurgicaux : pour les uns, cela se justifie par le fait que la plupart des
erreurs surviennent dans ces spécialités. D’autres estiment que les erreurs peuvent être mesurées de manière
relativement facile et «objective». Les décisions erronées prises en médecine interne seraient plus fréquentes,
mais beaucoup plus difficiles à identifier.
Pondération par groupe de maladies
La faible part des indicateurs de qualité liés aux diagnostics a été jugée appropriée par près de la moitié des
personnes interrogées. A ce titre, le développement des indicateurs est considéré comme lié à l’évolution
des chemins cliniques : plus il y a de chemins cliniques pour le traitement de maladies spécifiques
(identifiées quant à elles par des chemin diagnostiques), plus un principe de «procédures accomplies»
s’impose dans la mesure de la qualité, principe pouvant p. ex. intervenir dans le traitement de différentes
maladies recourant à des procédures similaires et non spécifiques au diagnostic. Certains ont vu dans la
faible spécialisation liée aux indicateurs propres aux diagnostics la conséquence d’une orientation Outcome
encore trop faible dans le domaine de la GQ : le succès clinique d’une mesure comme critère central
permettrait de compléter automatiquement les indicateurs «génériques» (et souvent pertinents) à l’aide d’un
catalogue d’indicateurs liés aux diagnostics.
En outre, la faible orientation diagnostique de la recherche sur les indicateurs de qualité de ces dix dernières
années a également été rapportée à un contexte politico-systémique: la faible proportion d’indicateurs liés
au diagnostic témoignerait d’un manque d’intégration des clinicien(ne)s dans le travail de développement
effectué à ce jour. Une réalité due notamment au fait que ces derniers ne s’accordent souvent pas sur les
objectifs du traitement et la mesure du résultat. L’axe principal actuel pour les indicateurs orientés de
manière « systémique » représente souvent un « compromis formel » pour lequel un consensus a
momentanément été trouvé. Sont exigés à cet effet l’intégration d’un plus grand nombre de clinicien(ne)s
dans le travail de développement et la résolution du problème des mesures de la qualité du résultat
fastidieuses pour les maladies spécifiques. L’intérêt du public pour la qualité des hôpitaux serait pour
l’instant trop souvent et trop étroitement réduit à des «cas spectaculaires» (inversion des côtés, erreur
d’anesthésie, etc.) et à des maladies qui, au sens des perceptions sociales, sont estimées comme étant
particulièrement « dangereuses ».
Plan de mesures de l’ANQ, rapport de recherche 2012
12
6.2
Aspects techniques des relevés vus sous l’angle pratique
Pondération relative à la mesure de la qualité
Certain(e)s expert(e)s jugent la pondération actuelle dans la recherche sur la mesure de la qualité comme
judicieuse. Les sources d’erreurs examinées dans le chapitre 5 ont cependant été clairement perçues comme
insuffisantes au regard de l’étude de l’observance déficiente des patients. Par ailleurs, une prise en compte
plus importante des éventuelles erreurs d’hygiène dans la création des indicateurs a été proposée, bien que
l’investissement lié à la mesure se révèle être souvent fastidieux. La pondération des erreurs de diagnostic a
également été jugée trop faible. La raison résiderait dans la difficile « mesurabilité » de telles erreurs de
diagnostic. Certains estiment l’examen fréquent de problèmes de mesure (p. ex. dans le cadre d’essais
interlaboratoires) exagéré: «Les fautes sont rarement commises par les appareils, mais par les personnes qui
les utilisent.» Le sujet pourrait être transmis à la recherche sur l’agrémentation de la production médicale.
Pondération relative aux sources de données
Près d’un quart des personnes interrogées était satisfait de la répartition adoptée par la recherche sur la
qualité pour l’introduction de différentes sources de données. Les ajouts suivants ont été proposés par les
autres personnes :
• Utilisation plus fréquente de méthodes de recherche qualitatives, comme par exemple de groupes cible
pour la détermination de la satisfaction des patients
• Plus d’analyse prospective des potentielles sources d’erreurs à travers des interviews d’expert(e)s et des
groupes de discussion réunissant des expert(e)s cliniques
• Etablissement d’un système national d’annonces spontanées pour les principaux «cas isolés» d’erreurs
médicales (CIRS comme modèle)
• Réalisation d’audits sur l’organisation des processus comme source de données supplémentaire
• Discussion «d’infractions» dues à l’infrastructure de services critiques avec des commissions d’experts
externes se concentrant sur l’ergonomie du lieu de travail, la sécurité et les questions d‘hygiène
• Synthèse systématique des données de la gestion des plaintes instaurée dans la majorité des hôpitaux et
des développements de stratégies d’évaluation s’appliquant à tous les hôpitaux
• Réalisation régulière de «Medical Reviews» rétrospectives et randomisées pour les diagnostics critiques
sélectionnés par des «Peer-Reviews» externes
• Combinaison intelligente plus fréquente et méthodique des données de routine issues de sources
différentes afin d’obtenir un angle de vue plus «multiaxial» d’un événement.
Près de la moitié des personnes interrogées a émis, d’une manière ou d’une autre, des réserves face à une
interprétation trop «naïve» des données de routine – à l’exception des aspects problématiques que sont la
validité et la fiabilité de ces sets de données souvent instaurés pour des raisons de facturation et non pas de
qualité.
Conversion de variables cibles
Près d’un quart des personnes interrogées exige une plus grande prise en compte des variables Outcome
dans le cadre de la GQ médicale. D’autres ont jugé la pondération actuelle comme fonctionnelle sans plus de
commentaires. Un groupe a estimé que la concentration du débat scientifique sur la qualité des résultats en
tant qu’exigence centrale des mesures de qualité serait une erreur de conception. Les personnes interrogées
ont précisé que rien n’était encore acquis pour la GQ avec une mesure purement Outcome et qu’il était
important, d’un point de vue conceptuel, de déplacer l’attention de critères liés aux événements - souvent
trop restrictifs - vers des aspects plus vastes du système de soins.
Pour le développement futur d’un système de mesure national, des revendications aussi hétérogènes ne
permettent pas d’obtenir des indications directement utilisables. Il est en outre possible que les personnes
Plan de mesures de l’ANQ, rapport de recherche 2012
13
interrogées se référaient à des domaines thématiques différents lorsqu’elles ont formulé leurs prises de
position clairement divergentes. Pour une uniformisation des résultats, des discussions interactives (p.ex.
dans le cadre d’une procédure Delphi structurée) auraient sans doute été plus utiles que la voie initialement
retenue des interviews individuelles.
Perspectives au regard des indicateurs isolés, des paquets d’indicateurs, des systèmes de scoring et
des relevés multiaxiaux
Une majorité des expert(e)s souhaitait un ancrage plus fort des indicateurs multiaxiaux, bien que les coûts de
mesure d’un tel système soient en même temps estimés très élevés, formant par là-même un obstacle
important à sa réalisation. Par ailleurs, une vaste majorité s’accordait sur le fait que les «paquets
d‘indicateurs» et les mesures multiaxiales, en particulier dans les interfaces de la chaîne de soins, pouvaient
contribuer à la réalisation d’un important progrès dans la GQ, à défaut d’une base de données appropriée
pour une GQ suprasectorielle.
L’idée de vouloir pratiquer la GQ en la subdivisant en petits thèmes et efforts organisationnels simplement à
l’aide d’un indicateur spécifique a été unanimement rejetée, en particulier dans le cadre de la mise en place
d’un programme de mesure national. Le lien étroit entre les paquets d’indicateurs et les variables de
processus parle également en faveur de l’introduction desdits paquets dont les variables thématiquement
proches sont présentées en parallèle : dans l’esprit d’une présentation chronologique du processus de soins,
cela permettrait également de mieux identifier les éventuels problèmes de déroulement. Pour la moitié des
personnes interrogées, le regroupement de multiples indicateurs dans un même score présente un tel
avantage qu’elles accueilleraient vivement de nouvelles évolutions méthodiques à cet égard: des
pondérations justifiées visant à réduire la complexité pourraient ainsi contribuer à la fixation des priorités
dans la GQ. Dans la plupart des cas, les avis exprimés semblent en même temps correspondre aux
revendications personnelles émises à l’égard du système de santé.
7
Réflexions finales
7.1
Réponses aux questions liées à l’évaluation
Quels domaines thématiques de l’assurance de la qualité en médecine somatique aiguë revêtent une
importance nationale/internationale et comment sont-ils définis?
La littérature spécialisée relative au développement des indicateurs dans l’assurance de la qualité en
médecine somatique aiguë est fragmentée et décousue. Parmi les spécialités médicales, la chirurgie et la
médecine interne sont les plus actives, les départements dépourvus de lits font également l’objet de
multiples interrogations. La plupart des questions se rapporte toutefois à l’hôpital dans sa globalité.
Les diagnostics médicaux représentent à ce titre moins des thématiques de l’assurance de la qualité que les
critères de processus des traitements. Les motifs pondérés parlent à la fois en faveur d’indicateurs
«génériques» (càd. groupes de maladies communs) et d’indicateurs «spécifiques» (pour des interventions ou
diagnostics précis). Les experts n’ont pas été à même de s’accorder quant à la direction la plus favorable à
prendre en vue du développement futur de l’assurance de la qualité.
Quelles principales thématiques ne sont pas ou insuffisamment couvertes par le plan de mesure ANQ
actuel?
Le thème des erreurs de médication. Ce dernier englobe la qualité de l’indication, l’observance des patients
lors de la prise de médicaments (dosage et timing), le risque de confusion lors de la préparation, et
l’observation d’éventuelles réactions croisées provoquées par des médicaments différents lors de la pose de
l’indication. Il s’agit du thème majoritairement discuté dans la littérature quant au développement futur des
Plan de mesures de l’ANQ, rapport de recherche 2012
14
mesures de la qualité. Son importance clinique est élevée. Pour le domaine de la sécurité de médication, il
n’existe à ce jour aucune procédure finale standardisée au niveau de la forme de réalisation d’une telle
mesure de la qualité.
Quels indicateurs de la qualité des résultats sont compris dans les thématiques importantes?
Globalement, l’analyse de la littérature n’a relevé aucun concept d’opérationnalisation réellement divergent
des thématiques ANQ actuelles. Un constat que l’on pouvait sans autre tirer au vu de la stratégie adoptée
(pas de développement propre mais reprise de concepts de mesure existants).
Quels indicateurs de la qualité des résultats sont à vérifier tenant compte de la stratégie et des
objectifs de l’ANQ pour l’intégration au plan de mesure?
A notre avis, il n’est pas possible de répondre à cette question de manière brève et concise, puisque le
champ des erreurs de médication semble beaucoup trop complexe. Il existe toutefois une littérature
méthodique exhaustive qui traite des erreurs de médication, de leurs mesures et stratégies d’évitement.
Quelles sont les méthodes de relevé existantes pour les indicateurs de la qualité identifiés?
A l’instar de la question précédente, les mêmes arguments s’appliquent: une méthode de relevé simple pour
les erreurs de médication n’est pas envisageable en raison de la complexité des thématiques. Il existe de
nombreuses propositions pour les méthodes de mesure et critères d’évaluation qui requièrent néanmoins
une étude préalable conceptuelle et technique (d’un point de vue des relevés) pour l’intégration dans le plan
de mesure ANQ.
En accord avec les propositions des experts interviewés, la proposition est faite de commander une étude
Delphi pointue et spécifique, réalisée par des experts reconnus des secteurs cliniques et pharmacologiques,
mais aussi actifs dans l’informatique médicale. Une telle étude devrait néanmoins être conduite par des
spécialistes compétents jouissant d’un excellent know-how en matière de jugements de groupe et de
domaines de jugement cognitifs.
Comment ces indicateurs de la qualité sont-ils jugés au niveau du rapport coût-utilité?
La littérature scientifique ne tire aucun constat au sujet du rapport coût-utilité des indicateurs de la qualité
spécifiques retenus par l’ANQ. Du point de vue de l’économie de la santé, des questions méthodiques
(surtout la question de l’intégration des coûts indirects) doivent encore être résolues avant de pouvoir
s’attaquer, sous l’angle empirique, au bénéfice économique généré par les mesures de la qualité.
Les indicateurs de la qualité se prêtent-ils à une comparabilité et à la publication?
La littérature ne voit en principe aucun problème à publier des résultats qualitatifs, pour autant qu’ils soient
transparents et corrects sur le plan méthodologique. Le problème d’une publication à l’attention d’un public
intéressé mais amateur résident dans les malentendus générés par l’utilisation d’une terminologie complexe
mais aussi de graphiques inadéquats sur le plan de la perception psychologique.
7.2
Conclusion et autres recommandations
Le mandat d’expertise assigné par l’ANQ se limitait expressément au secteur de soins aigus résidentiels et
aux mesures de la qualité nécessaires ou judicieuses à l’échelle nationale. De nombreux experts ont précisé
qu’une philosophie suprasectorielle relative à l’assurance de la qualité constituera à l’avenir un aspect de
plus en plus décisif pour le succès de la thérapie et la sécurité des patients.
La gestion des interfaces avec des institutions de suivi revêtira un rôle de plus en plus important pour la
qualité de toute la chaîne de soins. La littérature exige à ce titre une étroite interaction avec les principaux
groupes d’entraide pour les maladies chroniques, une étape de développement capitale pour les soins
hospitaliers.
Plan de mesures de l’ANQ, rapport de recherche 2012
15
Pour conclure, il convient de retenir que les indicateurs choisis par l’ANQ couvrent des thèmes importants de
la médecine somatique aiguë. Indépendamment du haut degré de complexité, le thème de la sécurité de
médication forme une thématique vivement discutée à l’international, revêtant une importance clinique
élevée. Il est recommandé de vérifier son intégration dans le plan de mesure ANQ.
En 2ème partie de rapport, les méthodes utilisées pour les divers thèmes de mesure ont été analysées et
discutées de manière approfondies quant à leurs forces et faiblesses. Les résultats des analyses qui en
découlent ont été adressés aux instituts de mesure respectifs pour prise de position. Les conclusions du
processus d’évaluation sont transmises aux commissions de l’ANQ. Les éventuelles adaptations à apporter
aux concepts de mesure seront également discutées.
Plan de mesures de l’ANQ, rapport de recherche 2012
16
Téléchargement