N° d’ordre : 486 SGE THESE présentée par Cyrille BRONNER Pour obtenir le grade de Docteur de l’Ecole Nationale Supérieure des Mines de Saint-Etienne Spécialité : Science et Génie de l’Environnement Utilisation des données opérationnelles pour l’aide à la décision en situation accidentelle impliquant une substance dangereuse : Application à l’identification du terme source Soutenue à Alès le 30 juin 2008 Membres du jury C. MOESCH J-M. FLAUS Professeur, Faculté de Pharmacie, Université de Limoges Professeur, Université Joseph Fourier, Grenoble Rapporteur Rapporteur D.GRAILLOT D. PEARSON Professeur, Ecole des Mines de Saint-Etienne Professeur, Université de Saint-Etienne Président du jury Examinateur G. DUSSERRE Maître de recherche, Ecole des Mines d’Alès Directeur de thèse A. DANDRIEUX Maître-assistant, Ecole des Mines d’Alès J. CHAPELAIN F. FONTAINE Colonel, Ecole Nationale Supérieure des Officiers des Sapeurs-Pompiers Responsable Sûreté, malveillance, terrorisme, INERIS Encadrant Invité Invité ◘ Spécialités doctorales : Responsables : SCIENCES ET GENIE DES MATERIAUX MECANIQUE ET INGENIERIE GENIE DES PROCEDES SCIENCES DE LA TERRE SCIENCES ET GENIE DE L’ENVIRONNEMENT MATHEMATIQUES APPLIQUEES INFORMATIQUE IMAGE, VISION, SIGNAL GENIE INDUSTRIEL MICROELECTRONIQUE J. DRIVER Directeur de recherche – Centre SMS A. VAUTRIN Professeur – Centre SMS G. THOMAS Professeur – Centre SPIN B. GUY Maitre de recherche – Centre SPIN J. BOURGOIS Professeur – Centre SITE E. TOUBOUL Ingénieur – Centre G2I O. BOISSIER Professeur – Centre G2I JC. PINOLI Professeur – Centre CIS P. BURLAT Professeur – Centre G2I Ph. COLLOT Professeur – Centre CMP ◘ Enseignants-chercheurs et chercheurs autorisés à diriger des thèses de doctorat (titulaires d’un doctorat d’Etat ou d’une HDR) AVRIL BATTON-HUBERT BENABEN BERNACHE-ASSOLANT BIGOT BILAL BOISSIER BOUCHER BOUDAREL BOURGOIS BRODHAG BURLAT CARRARO COLLOT COURNIL DAUZERE-PERES DARRIEULAT DECHOMETS DESRAYAUD DELAFOSSE DOLGUI DRAPIER DRIVER FOREST FORMISYN FORTUNIER FRACZKIEWICZ GARCIA GIRARDOT GOEURIOT GOEURIOT GRAILLOT GROSSEAU GRUY GUILHOT GUY GUYONNET HERRI KLÖCKER LAFOREST LI LONDICHE MOLIMARD MONTHEILLET PERIER-CAMBY PIJOLAT PIJOLAT PINOLI STOLARZ SZAFNICKI THOMAS VALDIVIESO VAUTRIN VIRICELLE WOLSKI XIE Stéphane Mireille Patrick Didier Jean-Pierre Essaïd Olivier Xavier Marie-Reine Jacques Christian Patrick Laurent Philippe Michel Stéphane Michel Roland Christophe David Alexandre Sylvain Julian Bernard Pascal Roland Anna Daniel Jean-Jacques Dominique Patrice Didier Philippe Frédéric Bernard Bernard René Jean-Michel Helmut Valérie Jean-Michel Henry Jérôme Frank Laurent Christophe Michèle Jean-Charles Jacques Konrad Gérard François Alain Jean-Paul Krzysztof Xiaolan MA MA PR 2 PR 1 MR DR PR 2 MA MA PR 1 MR PR 2 PR 1 PR 1 PR 1 PR 1 ICM PR 1 MA PR 2 PR 1 PR 2 DR PR 1 PR 1 PR 1 MR CR MR MR MR DR MR MR DR MR DR PR 2 MR CR EC (CCI MP) MR MA DR 1 CNRS PR1 PR 1 PR 1 PR 1 CR CR PR 1 MA PR 1 MR CR PR 1 Glossaire : Centres : PR 1 Professeur 1ère catégorie PR 2 Professeur 2ème catégorie MA(MDC)Maître assistant DR (DR1) Directeur de recherche Ing. Ingénieur MR(DR2) Maître de recherche CR Chargé de recherche EC Enseignant-chercheur ICM Ingénieur en chef des mines SMS SPIN SITE G2I CMP CIS Mécanique & Ingénierie Sciences & Génie de l’Environnement Sciences & Génie des Matériaux Génie des Procédés Génie des Procédés Sciences de la Terre Informatique Génie Industriel Sciences de l’inform. & com. Sciences & Génie de l’Environnement Sciences & Génie de l’Environnement Génie industriel Mathématiques Appliquées Microélectronique Génie des Procédés Génie industriel Sciences & Génie des Matériaux Sciences & Génie de l’Environnement Mécanique & Ingénierie Sciences & Génie des Matériaux Génie Industriel Mécanique & Ingénierie Sciences & Génie des Matériaux Sciences & Génie des Matériaux Sciences & Génie de l’Environnement Sciences & Génie des Matériaux Sciences & Génie des Matériaux Génie des Procédés Informatique Sciences & Génie des Matériaux Sciences & Génie des Matériaux Sciences & Génie de l’Environnement Génie des Procédés Génie des Procédés Génie des Procédés Sciences de la Terre Génie des Procédés Génie des Procédés Sciences & Génie des Matériaux Sciences & Génie de l’Environnement Microélectronique Sciences & Génie de l’Environnement Sciences & Génie des Matériaux Sciences & Génie des Matériaux Génie des Procédés Génie des Procédés Génie des Procédés Image, Vision, Signal Sciences & Génie des Matériaux Sciences de la Terre SITE Génie des Procédés Sciences & Génie des Matériaux Mécanique & Ingénierie Génie des procédés Sciences & Génie des Matériaux Génie industriel CIS SITE SMS CIS SPIN SPIN G2I G2I DF SITE SITE G2I G2I CMP SPIN CMP SMS SITE SMS SMS G2I CIS SMS CIS SITE CMP SMS SPIN G2I SMS SMS SITE SPIN SPIN CIS SPIN SPIN SPIN SMS SITE CMP SITE SMS SMS SPIN SPIN SPIN CIS SMS SPIN SMS SMS SPIN SMS CIS Sciences des Matériaux et des Structures Sciences des Processus Industriels et Naturels Sciences Information et Technologies pour l’Environnement Génie Industriel et Informatique Centre de Microélectronique de Provence Centre Ingénierie et Santé Remerciements Je remercierai tout d’abord les membres du GIS AGECRIS : l’INERIS, l’ENSOSP et l’Ecole des Mines Alès qui ont rendu possible cette thèse. J’exprime toute ma reconnaissance à Monsieur le Professeur Didier Graillot pour m’avoir fait l’honneur de présider ce jury, à Messieurs les Professeurs Christian Moesch et Jean-Marie Flaus pour avoir accepté de juger ce travail en tant que rapporteurs, ainsi qu’à Monsieur le Professeur David Pearson pour sa participation en tant que membre du jury. J’adresse mes remerciements à Monsieur Gilles Dusserre, pour avoir assuré la direction de ce travail, m’avoir accueilli au sein de l’équipe risques industriels et naturels et pour la liberté qu’il m’a laissée sur la conduite de ce sujet de recherche. J’adresse tous mes remerciements à Madame Aurélia Bony-Dandrieux pour l’encadrement de ce travail, qui a contribué au bon déroulement de cette thèse par ses conseils avisés, son soutien et sa gentillesse et avec qui j’ai pris beaucoup de plaisir à travailler. Je voudrais également remercier Madame Anne Johannet pour m’avoir fait profiter de ses connaissances sur les réseaux de neurones avec toute la pédagogie dont elle sait faire preuve. C’est un domaine très intéressant et j’ai eu beaucoup de chance de rencontrer Anne pour me guider dans mes travaux. J’adresse mes remerciements à Monsieur François Fontaine pour la confiance qu’il m’a accordée et pour l’aide qu’il m’a apportée dans les moments les plus opportuns. Je tiens à exprimer toute ma gratitude à Monsieur le Colonel Jean Chapelain qui a su se rendre disponible pour suivre ce travail, pour son soutien et pour les échanges constructifs que nous avons pu avoir à propos de la thèse et sur bien d’autres sujets. J’exprime également ma reconnaissance particulière à Monsieur le Lieutenant de Vaisseau Alexandre Lacoste pour avoir accepté de partager une part de son savoir-faire, pour avoir initié les travaux d’évaluation sur les matériels de détection et pour toute l’aide apportée qui a rendue possible cette étude. Je tiens à remercier également Monsieur Laurent Verneuil pour ses conseils, en particulier en matière de chimie et de matériels de détection. Je remercie les sapeurs-pompiers de la CMIC du Gard pour leur participation et plus particulièrement à Monsieur le Lieutenant-Colonel Jean-François Roure. Je tiens aussi à remercier Messieurs Nicolas Dechy, Stéphane Pagnon, Jean-Marc Lacome, Denis Foisy, Christophe Gay et Marcel Welfringer pour leur aide au cours de cette thèse. Je remercie chaleureusement l’ensemble de l’équipe risques industriels et naturels pour leur bonne humeur et leur écoute, Rosario pour son aide à la mise en place des expérimentations, Marc et Alexandre pour leurs corrections mais surtout pour leur complicité. Un grand MERCI également à l’ensemble du personnel du LGEI pour ses trois années passées en leur compagnie, et aux secrétaires, Cathy, Corinne, Dédé et Domi, Virginie et Véronique dont l’efficacité n’a d’égale que leur gentillesse. Enfin, je terminerai par une pensée spéciale pour ma compagne, Christine, qui m’a aidé et m’a soutenu pendant le DEA et la thèse, ainsi qu’à ma fille, Auriane, dont la naissance a certainement contribué aux bouleversements qui accompagnent les derniers mois de thèse mais dont je ne garde que d’immenses joies. TABLE DES MATIERES Préambule 6 Introduction 7 Chapitre I LES SITUATIONS D’URGENCE I.1 11 Présentation des situations d’urgence 12 I.1.1 Définitions 12 I.1.2 Dimension temporelle des situations d'urgence 13 I.1.3 Les acteurs des situations d'urgence 16 I.2 Les accidents d’origine chimique 18 I.3 Récapitulatif sur les situations d'urgence 20 Chapitre II L’AIDE A LA DECISION EN SITUATION D'URGENCE II.1 La prise de décision 22 II.2 Les données opérationnelles 22 II.2.1 Les données utiles en situation d’urgence 23 II.2.1.1 Données relative à la source 23 II.2.1.2 II.2.1.3 II.2.1.4 II.2.1.5 Flux dangereux Données décrivant l’environnement Conséquences Cibles 28 28 29 30 II.2.2 Nature des données opérationnelles II.3 Outils d’aide à la décision pour les urgentistes II.3.1 Guide et fiches réflexes 30 33 34 II.3.1.1 II.3.1.2 Guide National de Référence (GNR) Fiches réflexes 34 34 II.3.1.3 II.3.1.4 Le Guide des mesures d'urgence (GMU) Guide orange des sapeurs pompiers genevois 35 35 II.3.2 Bases de données 36 II.3.2.1 Accidentologie 36 II.3.2.2 Produits chimiques 37 II.3.3 Systèmes d’Information Géographique (SIG) 40 II.3.4 Calcul de flux dangereux 41 II.3.4.1 II.3.4.2 1 21 Estimation préétablie des distances Outils de simulation 41 43 II.3.5 Evaluation des conséquences 44 II.4 Analyses des besoins en situation d'urgence 45 II.4.1 Identification de la substance chimique 47 II.4.2 Evaluation du terme source 49 II.4.3 Imprécision et incertitude des données opérationnelles 49 Chapitre III LES METHODES D’AIDE A LA DECISION 50 III.1 L’aide à la décision multicritère 51 III.1.1 Généralités sur l’aide à la décision multicritère 51 III.1.2 Différentes approches 53 III.1.3 Conclusions sur les méthodes multicritères 57 III.2 Les arbres de décision 57 III.2.1 Généralités sur les arbres de décision 57 III.2.2 Développement d’un arbre binaire 59 III.2.3 Arbre binaire à variables binaires 62 III.2.4 Conditions d’arrêt et élagage 63 III.2.5 Un arbre non optimal 64 III.2.6 Conclusions sur les arbres de décision 66 Chapitre IV IDENTIFICATION DES SUBSTANCES CHIMIQUES IV.1 Introduction 67 68 IV.1.1 Identifier les substances chimiques : une information primordiale 68 IV.1.2 Des situations inhabituelles 69 IV.2 Les moyens de détection et d’identification existants IV.2.1 Les matériels de détection au sein des CMIC IV.2.1.1 IV.2.1.2 Une grande variété de matériels Limites de la capacité à identifier une substance chimique IV.2.2 Les logiciels d’identification des substances chimiques IV.2.2.1 IV.2.2.2 IV.2.2.3 Présentation du logiciel WISER Limites de la base de données du logiciel WISER Limites du logiciel WISER à l’identification des substances IV.3 Réalisation d’une base de données opérationnelles 71 71 71 72 77 78 82 84 85 IV.3.1 Choix des sources d’information 85 IV.3.2 Fusion des bases de données 88 IV.3.3 Renseignement des données manquantes 88 IV.3.4 Choix d’une classification des dangers 89 IV.3.4.1 IV.3.4.2 Présentation de la classification retenue Différence de seuils des classifications européenne et NFPA IV.3.5 Différentes versions de bases de données 89 90 94 2 IV.3.5.1 Version pour étude de faisabilité – suppression des incompatibilités IV.3.5.2 Version intégrée au logiciel 94 96 IV.3.6 Conclusions sur la base de données 96 IV.4 Quantité d’information nécessaire à l’identification d’une subst. 96 IV.4.1 Estimation du nombre de données nécessaires à l’identification d’une substance IV.4.1.1 IV.4.1.2 IV.4.1.3 IV.4.1.4 IV.4.1.5 IV.4.1.6 IV.4.1.7 IV.4.1.8 97 Estimation du nombre de symptômes nécessaires Estimation du nombre de critères descriptifs et physico-chimiques nécessaires Estimation du nombre de données opérationnelles nécessaires à l’identification d’une substance Imprécision du critère « couleurs » Imprécision du critère « pH » Imprécision du critère « odeur » Sélection des substances à partir de critères imprécis Récapitulatif et discussion 97 99 99 100 102 103 106 109 IV.4.2 Estimation de la précision de l’identification à l’aide de retours d’expérience110 IV.4.2.1 IV.4.2.2 IV.4.2.3 Intoxication à l’acide cyanhydrique Intoxication au bromure de méthyle Discussion 110 113 115 IV.5 Identification des dangers liés à une substance chimique à partir des données opérationnelles 115 IV.5.1 Démarche 116 IV.5.2 La quantité d’information est-elle suffisante ? 116 IV.5.2.1 IV.5.2.2 Recherche des paramètres discriminants à l’aide des arbres de décision Information utile IV.5.3 Identification des dangers à l’aide d’arbre de décision IV.5.3.1 IV.5.3.2 IV.5.3.3 IV.5.3.4 Formalisation du problème de discrimination Ensemble d’apprentissage et généralisation Evaluation de l’identification des dangers par les arbres de segmentation Conclusions sur l’identification des dangers par les arbres de décision IV.5.4 Conclusions sur les méthodes d’identification des dangers 117 120 123 124 125 129 136 136 IV.6 Conception d’un outil opérationnel d’identification des dangers liés à une substance chimique IV.6.1 Présentation du logiciel AERO IV.6.1.1 IV.6.1.2 138 Généralités Un outil d’aide à l’identification des substances chimiques 138 139 IV.6.2 Méthodologie d’identification d’une substance chimique 140 IV.6.2.1 Recueil d’informations et saisies des données 141 IV.6.2.2 IV.6.2.3 Sélection des substances correspondant aux données opérationnelles Une alternative à un degré de concordance fixe 142 148 IV.6.3 L’identification des dangers 148 IV.6.3.1 Affichages des substances et des dangers 148 IV.6.3.2 Aide au recueil de données 151 IV.7 Discussion sur l’identification des substances chimiques 3 138 157 IV.7.1 Bilan 157 IV.7.2 Limites et perspectives 158 Chapitre V ESTIMATION DU TERME SOURCE D’UN PHENOMENE DANGEREUX V.1 L’estimation du terme source : un problème inverse V.1.1 Généralités sur les méthodes inverses V.1.1.1 V.1.1.2 V.1.1.3 Formalisation mathématique Présentation des différentes méthodes inverses Bilan sur les méthodes inverses V.1.2 Les algorithmes génétiques V.1.2.1 V.1.2.2 V.2 Utilisation des algorithmes génétiques pour résoudre un problème inverse Principes généraux des algorithmes génétiques Application aux explosions de solides 162 163 164 164 167 172 173 173 174 178 V.2.1 Données opérationnelles 179 V.2.2 Modèle retenu : l’équivalent TNT 179 V.2.2.1 V.2.2.2 Principes généraux Modélisation de la surpression dans l’espace 179 180 V.2.2.3 Sensibilité du modèle aux erreurs d’estimation des surpressions 181 V.2.3 Paramètres de l’algorithme génétique V.2.3.1 V.2.3.2 Terme source et paramètres Complexité de l’algorithme et temps de calcul V.2.4 Evaluation de la méthode inverse 182 182 183 183 V.2.4.1 V.2.4.2 V.2.4.3 Méthode de référence Evaluation de l’algorithme à l’aide de données artificielles Validation de la méthode à partir de retours d’expérience 183 184 188 V.2.4.4 Application aux situations opérationnelles 189 V.2.5 Prise en compte de la distribution des points de mesure 191 V.2.5.1 V.2.5.2 Principes Le diagramme de Voronoï 191 191 V.2.5.3 V.2.5.4 V.2.5.5 V.2.5.6 Estimation de la densité Ajustement de la pondération des points en périphérie. Choix des positions d’estimation de la surpression Evaluations et perspectives 193 195 197 200 V.3 Conclusions sur les méthodes inverses et perspectives Conclusions et perspectives 201 203 4 ANNEXE I Classification des substances chimiques 211 ANNEXE II Critères de la base de données 213 ANNEXE III Classification des phénomènes 214 ANNEXE IV Outils de modélisation 215 Glossaire 221 Références bibliographiques 223 5 Introduction Préambule Ce travail de recherche s’inscrit dans le cadre du Groupement d’Intérêt Scientifique d’Aide à la GEstion des CRISes (AGECRIS) mis en place entre l’École des Mines d’Alès (EMA), l’Ecole Nationale Supérieure des Officiers SapeursPompiers (ENSOSP) et l’Institut National de l’Environnement industriel et des RISques (INERIS), le 18 mai 2004 et rejoint par l’Institut National des Hautes Etudes de la Sécurité (INHES) en 2007. AGECRIS a pour objet de développer, entre autres dans les domaines du risque technologique et naturel, une approche intégrée associant l’identification, l’analyse, la gestion et l’organisation des secours en cas de sinistre. Ses missions sont de conduire, d’élaborer et de coordonner des programmes de recherche et développement, aux niveaux national et international, en vue d’améliorer les connaissances pour répondre à la demande publique, industrielle et sociétale dans le domaine de la gestion de crise, qui requiert la mise en œuvre de moyens de secours. La recherche menée au sein du GIS AGECRIS, à la fois théorique et pratique, s’inscrit dans une démarche pluridisciplinaire alliant les sciences humaines et sociales, les sciences de gestion et les sciences de l’ingénieur. 6 Introduction Introduction L’activité économique et industrielle génère des risques technologiques de toutes natures. Les récents accidents, Feyzin (1966), Flixborough (1974), Seveso (1976), Bhopal (1984), Toulouse (2001) rappellent la place préoccupante qu’occupe le risque chimique. L’importance des conséquences humaines, économiques et environnementales justifie la préoccupation que représente la gestion de ces risques industriels. La démarche est double ; elle consiste en une réduction des risques par une approche préventionniste, combinée à une amélioration de l’efficacité des moyens de secours et une réduction de l’exposition en cas d’occurrence du risque. En particulier dans les premiers instants où la prise de décisions appropriées est souvent déterminante sur les conséquences de l’événement. Face aux risques liés aux divers secteurs d'activité de l'industrie chimique, les autorités prévoient par la circulaire ministérielle du 14 mai 1986, la création de Cellules Mobiles d'Intervention Chimique (CMIC) afin d’améliorer le potentiel d'intervention existant dans ce domaine. Depuis la création des CMIC, les besoins en matière de lutte contre les risques chimiques n’ont cessé de progresser [DDSC, 2006]. Pour répondre à des demandes de plus en plus nombreuses d’aide à la décision durant le déroulement d’un accident, une Cellule d’Appui aux Situations d’Urgence (CASU) est créée le 15 avril 2003. Sa position au sein de l’INERIS et son mode d’organisation permettent de mobiliser un réseau de compétences et de délivrer en temps réel et 24 heures sur 24 un avis d’expert lors du déroulement d’événements accidentels à caractère technologique. Lors d’une situation d’urgence, les sapeurs-pompiers et les experts des cellules d’appui doivent faire face à des phénomènes complexes et incertains. Ils doivent alors prendre les décisions appropriées afin de limiter les conséquences potentielles de l’événement. La pression temporelle, synonyme d’urgence, 7 Introduction l’incertitude due au manque d’information et la complexité du système affectent considérablement le processus décisionnel [Dautun et al., 2007]. Ces travaux de recherche ont pour objectif de contribuer au développement de méthodologies et d’outils d’aide à la décision adaptés aux situations d’urgence et destinés aux primo intervenants que sont les sapeurspompiers et les cellules d’appui telles que la CASU. Pour y parvenir, nous nous sommes appuyés sur différents moyens de recherche : l’analyse bibliographique et les entretiens avec des experts pour déterminer les besoins des sapeurspompiers et des experts des cellules d’appui en termes d’aide à la décision. Nous nous intéressons particulièrement aux situations d'urgence d’origine accidentelle, survenant sur un site industriel ou lors d’un transport de matières dangereuses, provoquant ou pouvant provoquer un phénomène dangereux de type explosion, incendie ou dispersion atmosphérique de substances toxiques. Dans de telles situations, l’aide à la décision peut porter sur différentes interrogations relatives notamment à la dangerosité de la substance, l’estimation des effets potentiels, la stratégie d’intervention et le choix des matériels de protection. Mais toutes ces informations primordiales découlent inévitablement de la connaissance de la « source ». La « source » regroupe à la fois la substance chimique et le « terme source » qui est un ensemble de paramètres descriptifs de la source d’émission du flux dangereux. La connaissance de la substance est donc indispensable à l’évaluation des conséquences. Souvent, la signalisation, les documents de transport, les personnels informés permettront une identification précise de la substance. Mais, lorsque la source de la dispersion n’est pas localisée précisément (odeur suspecte, malaise dans les personnes aux alentours, etc.) ou qu’il n’y a pas de marquage sur un stockage (étiquette absente, plaque danger illisible ou détruite, etc.), l’identification de la substance chimique devient complexe, nécessitant, par exemple, l’emploi de matériels spécialisés qui ne sont pas toujours disponibles à cause de leur nombre limité et du délai d’acheminement. A défaut de moyens matériels suffisants à l’identification précise d’une substance chimique, une alternative est d’utiliser les données opérationnelles disponibles (description de la substance et effets sur l’homme) pour parvenir à identifier la substance ou les dangers qui y sont liés. Dans cette optique, une méthodologie de recueil des données et un logiciel d’aide à l’identification des dangers liés aux substances chimiques ont été développés. 8 Introduction La connaissance de la substance chimique ne suffit pas à elle seule, à évaluer les conséquences potentielles. L’utilisation des modèles d’évaluation des conséquences requiert la connaissance précise du « terme source » [MEEDDATINERIS, 2006]. Mais, souvent, en situation d'urgence, les paramètres du « terme source » ne sont pas tous connus avec précision et complétude. Cependant, d’autres données comme des mesures du flux en différents points ou une estimation des conséquences observées, peuvent permettre d’évaluer certains paramètres du « terme source ». Il s’agit alors de résoudre un problème inverse puisque les conséquences observées ou mesurées sont utilisées pour remonter à la source. Traitant de l’identification de la source d’un phénomène dangereux en situation d’urgence, ce mémoire est composé de cinq chapitres : Le premier chapitre a pour but d’introduire les situations d’urgence auxquelles sont confrontés les sapeurs-pompiers et les permanents des cellules d’appui. Un intérêt tout particulier sera porté aux situations impliquant des substances chimiques dont il est question tout au long de ce mémoire. Le deuxième chapitre propose un état de l’art des outils et méthodes d’aide à la décision à disposition des sapeurs-pompiers et des experts des cellules d’appui lors d’interventions en présence de risques chimiques. L’étude des moyens existants et l’avis d’experts permettent d’exprimer des besoins en termes d’aide à la décision adaptée aux situations opérationnelles. Le troisième chapitre est consacré à la présentation des grands principes des méthodes d’aide à la décision. Il s’agit notamment des méthodes multicritères d’aide à la décision, des méthodes de fusion de sources d’information multiples et des arbres de décision. Le quatrième chapitre s’attache à apporter une solution au premier besoin identifié : l’identification des substances chimiques à l’aide des données opérationnelles. A défaut de données suffisantes, la méthodologie développée consiste à apporter une aide à l’identification des dangers liés à la substance, fournissant ainsi un premier niveau d’information utile pour la prise de décisions. Le cinquième chapitre traite de l’évaluation du terme source d’un phénomène dangereux, qui est une information souvent absente en situation d’urgence, mais nécessaire à la modélisation. Ce chapitre est divisé en deux 9 Introduction parties : une présentation des principales méthodes inverses, puis une application aux explosions de solides. En conclusion, nous présenterons l’intérêt et l’apport de ce travail de recherche ainsi que les aspects qui mériteraient d’être approfondis dans le cadre de recherches futures. 10 Chapitre I Les situations d’urgence CHAPITRE I LES SITUATIONS D’URGENCE I. La première partie est consacrée à définir les situations d’urgence et plus particulièrement du point de vue des acteurs que sont les sapeurs-pompiers et les experts des cellules d’appui. L’accent sera mis sur les situations d’urgence survenant à la suite d’accidents impliquant des substances chimiques. Des situations complexes, variées et incertaines pour lesquelles la prise de décisions est difficile. 11 Chapitre I I.1 Les situations d’urgence Présentation des situations d’urgence I.1.1 Définitions Le terme « Situation d’urgence » est employé dans de nombreux domaines tels que ceux de la sécurité civile, de l’aéronautique, de la sûreté nucléaire ou encore médical. Afin de donner une définition générale qui corresponde à l’ensemble de ces domaines, on peut se référer à la Loi canadienne sur la Gestion des Situations d’Urgence (LGSU) qui définit la situation d’urgence comme une « situation ou situation imminente causée par un fléau naturel, un accident, un acte intentionnel ou d’une autre façon, et qui constitue un grand danger pour la vie ou pour les biens. » [Gouvernement de l'Ontario, 1990]. Plusieurs notions apparaissent dans cette définition : - La cause qui est un événement indésirable et de nature variée. - Les conséquences possibles ou avérées pour les individus, les biens et l’environnement. Il faut également y associer la dimension temporelle ; un temps limité qui constitue une contrainte forte, d’où une liberté d’action réduite par la nécessité d’agir vite (du latin urgere, « presser, pousser à agir ») pour limiter les conséquences possibles. Ces aspects sont mis en avant dans la définition adoptée par l’Autorité de Sûreté Nucléaire : « Une "situation d’urgence" est une situation inhabituelle ou un événement qui nécessite une action rapide principalement pour atténuer un risque ou limiter les conséquences pour la santé humaine, la sécurité, la qualité de vie, les biens et les équipements ou l’environnement. » [ASN, 2006] On parle également de la phase d’urgence d’une situation accidentelle. « La phase, caractérisée par une émission, durant laquelle des actions sont engagées, dans l'urgence, de manière rapide et organisée, […], de façon à limiter les conséquences d'un événement. »1 1 (JO n° 279 du 1er décembre 2005) - Directive interministérielle du 29 novembre 2005 relative à la réalisation et au traitement des mesures de radioactivité dans l'environnement en cas d'événement entraînant une situation d'urgence radiologique application de la loi relative à la modernisation de la sécurité civile 12 Chapitre I I.1.2 Les situations d’urgence Dimension temporelle des situations d'urgence La phase d’urgence d’une situation accidentelle ou d’une situation à risque est toujours la phase initiale de courte durée. Lors d’un événement de sécurité civile, la phase d’urgence est définie comme débutant immédiatement après l’événement, et d’une durée de quelques heures à quelques jours (Figure 1). Figure 1 : Différentes phases d’un événement de sécurité civile Dans le cas, d’une situation d'urgence radiologique2, la phase d’urgence correspond à la durée de l’émission. Et dans le cadre du risque chimique, l’étude des appuis de la CASU de l’INERIS montre une mobilisation des experts de l’ordre de quelques heures en moyenne, même si l’intervention peut s’étendre à plusieurs jours. La phase d’urgence a une durée de quelques heures à quelques jours et comprend elle-même plusieurs phases. Une phase réflexe durant laquelle la situation est incertaine et dont le peu - d’information ne permet pas une prise de décision éclairée. Les sapeurspompiers s’appuient alors sur des fiches réflexes et guides. Les zonages mis en place comportent une forte part d’a priori. 2 JO n° 279 du 1er décembre 2005 13 Chapitre I - Les situations d’urgence Une phase réfléchie pour laquelle les délais permettent la mise en place de moyens plus conséquents (prélèvements, systèmes de mesure) et la concertation de plusieurs experts. Au cours de la phase réflexe, les actions sont cadrées, définies par des documents de référence et connues des sapeurs-pompiers formés à ces interventions. Les méthodes et outils d’aide à la décision développés lors de ce travail de thèse s’appliquent à la phase réfléchie et s’adressent particulièrement aux sapeurs-pompiers et aux experts des cellules d’appui aux situations d'urgence. A la différence des phases « réflexe » et « réfléchie », une autre distinction chronologique peut être faite en se rapportant à l’émission du flux. Nous distinguons alors trois phases dans le déroulement de la situation (avant, pendant et après l’émission du flux) au cours desquelles les moyens et les besoins sont différents : - La phase de menace Différents termes sont employés selon les domaines. Il s’agit de situations non souhaitées, d’accidents mineurs, de presque accidents ou d’incidents. Il s’agit de situations pouvant s’aggraver lors d’une intervention visant un retour à la « normale » ou par un emballement à cause d’un environnement peu propice. Nous préférerons le terme utilisé dans le domaine de l'urgence radiologique, définissant la phase de menace comme « la période liée à un événement, précédant une éventuelle émission ; cette phase peut ne pas exister en fonction de la nature de l'événement »3. En risque chimique, l’émission n’est pas un flux radioactif, mais un flux thermique, mécanique ou toxique. Il s’agit de situations où l’accident redouté n’a pas encore eu lieu, où il est encore possible d’agir sur la source pour éviter la création d’un flux et d’anticiper pour avoir recours à des moyens de protection du voisinage. Il faut également inclure les incidents donnant lieu à une fuite peu conséquente ne présentant pas de réel danger en l’état actuel, mais pouvant s’aggraver naturellement ou par l’intervention humaine au cours de la réparation d’une brèche par exemple. Concrètement, il peut s’agir également d’une fuite de produits dangereux suspectée mais non avérée ou encore de l’évacuation d’un transport de matières dangereuses immobilisé. 3 JO n° 279 du 1er décembre 2005 14 Chapitre I - Les situations d’urgence La phase d’urgence proprement dite : les situations en cours d’évolution. Ce sont les situations pour lesquelles l’accident redouté s’est produit et a généré un flux dangereux pour le voisinage. La phase caractérisée par une émission durant laquelle des actions sont engagées, dans l'urgence, de manière rapide et organisée. La différence avec les situations décrites précédemment est l’existence d’un flux dangereux. Agir sur la source permet d’empêcher que ce flux devienne plus conséquent (par exemple en stoppant la fuite à l’origine d’une dispersion ou en éteignant un incendie). Pour limiter les conséquences du flux existant, il est alors nécessaire de mettre en place des barrières de protection ou d’évacuer les cibles potentielles. Pour les phénomènes en cours d’évolution, qu’il s’agisse d’incendies chimiques, de dispersions atmosphériques ou de fuites liquides, le terme source (nature des produits, la quantité, le débit, …) est nécessaire pour évaluer précisément l’évolution du phénomène dans le temps et les conséquences sur la population et son environnement. - La phase post-accidentelle Il s’agit de la phase descendante où la situation est stabilisée, pendant laquelle s’effectue le traitement des conséquences de l'événement. Cela comprend les explosions qui sont des événements instantanés et tous les phénomènes de dispersions ou d’incendies qui se sont achevés. Le flux est terminé, il ne représente plus une menace directe et il n’est alors plus possible d’agir sur la source ou les cibles pour limiter les conséquences dues au flux. Mais il est important de connaître les conditions initiales pour évaluer plus précisément les conséquences difficilement observables et identifier le(s) produit(s) pouvant être impliqué(s). Procéder à un diagnostic de la situation permet d’avoir une vision plus globale et apporte une aide aux décideurs dans l’organisation des moyens de secours. Cela permet également d’identifier les zones touchées pour évaluer les risques d’effets domino et l’impact sanitaire à court, moyen et long terme. On s’intéressera plus particulièrement à l’impact sanitaire à court terme, comme la contamination d’un point d’eau potable qui nécessite une prise de décision rapide. Les impacts sanitaires à long terme dont la gestion est moins urgente, pourront être évalués avec plus de précision lorsque des données plus nombreuses et fiables seront disponibles après expertise. 15 Chapitre I I.1.3 Les situations d’urgence Les acteurs des situations d'urgence Lors d’une situation d’urgence, de nombreux acteurs interviennent afin de gérer au mieux cette dernière, et ce, le plus rapidement possible afin de limiter les dommages et de secourir les personnes impliquées. « Les rôles, les responsabilités et les hiérarchies sont bien établis. La situation est perçue comme gérable techniquement, économiquement et socialement. La durée est limitée. Une simple brèche, dans un univers stable. » [Lagadec, 1997]. La gestion des accidents et des crises est partie intégrante des missions de la Sécurité Civile qui a pour objectif la prévention des risques de toute nature, l'information et l'alerte des populations ainsi que la protection des personnes, des biens et de l'environnement contre les accidents, les sinistres et les catastrophes par la préparation et la mise en œuvre de mesures et de moyens appropriés relevant de l'Etat, des collectivités territoriales et des autres personnes publiques ou privées.4 La direction des opérations de secours La réponse aux situations d’urgence exige la mobilisation rapide de tous les moyens publics et privés et leur coordination efficace sous une direction unique. A cet égard, la France bénéficie d’une tradition juridique éprouvée et réaffirmée par loi n°2004-811 de modernisation de la sécurité civile, qui investit les maires et les préfets, autorités de police générale, de pouvoirs étendus en situation d’urgence. Ainsi, la direction des opérations de secours repose dans le cas général, le plus fréquent, sur le maire au titre de ses pouvoirs de police (articles L. 2211-1 et L. 2212-2 du code général des collectivités territoriales). Le cas échéant, si la gravité de l’événement tend à dépasser les capacités locales d’intervention ou lorsque le problème concerne plusieurs communes, l’Etat, par l’intermédiaire du préfet, prend la direction des opérations de secours. Si les conséquences peuvent dépasser les limites ou les capacités d’un département, le représentant de l’Etat dans le département du siège de la zone de défense, voire le Gouvernement, interviennent dans la conduite des opérations lorsque c’est nécessaire. Les sapeurs-pompiers : les premiers intervenants Les sapeurs-pompiers restent les premiers intervenants, spécialistes des risques et de l’urgence. Ainsi, les sapeurs-pompiers, en tant qu’acteurs permanents de la sécurité civile et conformément à leurs missions générales de protection des personnes, des biens et de l’environnement, sont appelés quotidiennement à conduire des interventions. 4 J.O n° 190 du 17 août 2004 16 Chapitre I Les situations d’urgence Les accidents d’origine chimique occupent une part de plus en plus importante des accidents technologiques [BARPI, 2008] et les interventions des sapeurspompiers englobent également ces accidents, qu’il s’agisse d’une fuite de gaz, d’un accident routier, autoroutier ou ferroviaire d’un véhicule transportant des matières dangereuses ou encore de pollution des eaux intérieures ou maritimes. Pour ce faire, les services d’incendie et de secours se sont dotés de moyens matériels allant du simple appareil de détection du niveau de risque « explosif » aux cellules mobiles d’intervention chimique (CMIC) constituant un moyen d’appui spécialisé destiné à compléter et à améliorer le potentiel d'intervention existant dans ce domaine et relevant de l'autorité locale. Le domaine de la lutte contre le risque chimique comprend différents emplois avec des compétences et des missions spécifiques qui sont détaillés dans [DDSC, 2006]. Leur principale mission est de déterminer le plus précisément possible les composants du risque chimique et de guider les secours pour une neutralisation rapide. Dotés de matériel spécialisé, les CMIC répondent aux premiers impératifs dictés par l'urgence de la situation, à savoir la détection et la localisation des dangers et la mise en place de contre-mesures immédiates. Ces premières dispositions prises, l'ensemble des renseignements collectés est transmis à la cellule d'identification départementale qui va évaluer plus précisément les conséquences prévisibles de l'évènement et proposer les solutions adéquates. La CMIC joue également le rôle d’expert et a pour mission de conseiller le Directeur des Opérations de Secours (DOS), qui peut faire appel également à d’autres experts comme ceux de la Cellule d’Appui aux Situations d’Urgence (CASU). Les cellules d’experts Il existe plusieurs cellules d’urgence avec des domaines bien définis. Pour les domaines du nucléaire et de la radioprotection, l’IRSN (Institut de Radioprotection et de Sûreté Nucléaire) s’est doté d’un Centre Technique de Crises (CTC), afin de remplir les missions d’expertise au profit des personnes publiques en cas d’urgence. Pour les pollutions marines, fluviales et lacustres, le CEDRE (CEntre de Documentation, de Recherche et d’Expérimentations sur les Pollutions Accidentelles des Eaux) possède une cellule d’urgence. La CASU de l’INERIS est la principale cellule opérationnelle dans le domaine des risques chimiques. La CASU est chargée, avant tout, de fournir dans les meilleurs délais aux services de l’Etat (préfet, DRIRE, SIDPC par exemple), en réponse à leur 17 Chapitre I Les situations d’urgence demande, les informations scientifiques et techniques pour faciliter les décisions pendant la phase accidentelle. La CASU intervient d’une part pour les installations industrielles à risque telles que les établissements classés Seveso et les installations soumises à la réglementation ICPE qui fabriquent, stockent ou utilisent des matières dangereuses. D’autre part, la CASU peut être mobilisée pour des accidents de transport de matières dangereuses à l’exclusion des produits infectieux en complément des instances d’appui habituelles (Transaid et CEDRE), qu’il soit réalisés par fer, route, canalisations, voies navigables (mer et eaux intérieures). Cela inclut le transport proprement dit, ainsi que les opérations de chargement, déchargement et les phases de transit dans les infrastructures prévues à cet effet (gares de triage, ports, plates-formes multi-modales…). D’autres situations peuvent être concernées mais toujours à la condition que le risque provienne de substances dangereuses. On peut citer l’utilisation de substances dangereuses hors installations industrielles à risque (PME, Collectivité, particuliers) ainsi que les actes d’attentats ou de malveillance. La CASU peut fournir les prestations suivantes [Tremeaud, 2005] : - transmission au demandeur des informations sur la dangerosité de la substance ou des réactions chimiques directement incriminées (principaux risques, propriétés physico-chimiques, etc.) ou celles qui sont susceptibles de se former au cours de l’accident (produits de décomposition, composants des fumées d’incendie, etc.) ; - fourniture des renseignements sur l’accidentologie. La connaissance d’événements similaires antérieurs constitue en effet des points de référence pour le décideur ; - estimation des effets avant, pendant ou après la survenance du phénomène et évaluation des effets immédiats ou différés sur l’homme, des effets sur l’environnement (milieu naturel, bâtiments et infrastructures). Les sapeurs-pompiers et les membres de la CASU sont amenés à intervenir régulièrement sur des accidents d’origine chimique. I.2 Les accidents d’origine chimique L’activité économique et industrielle de nos jours génère des risques de toutes natures parmi lesquels il y a lieu de considérer les risques chimiques. L’une des causes des situations d'urgence sont les accidents chimiques et, potentiellement, ces accidents menacent toutes les régions françaises par 18 Chapitre I Les situations d’urgence l’implantation des sites industriels et les transports de matières dangereuses. De plus, ces accidents peuvent provoquer de conséquences importantes en vies humaines comme le montre ces accidents tristement célèbres : en 1966, l’incendie d’une industrie pétrochimique à Feyzin (Rhône) a provoqué la mort de 18 personnes. En 1974 à Flixborough (Grande-Bretagne) une explosion sur un site industriel faisait 28 morts. En 1976, 37000 personnes sont touchées par une fuite de dioxine à Seveso (Italie). En 1984, la fuite d’un gaz toxique à Bhopal (Inde) était à l’origine du décès de plus de 2500 personnes. Toujours en 1984, l’explosion de plusieurs citernes de gaz de pétrole liquéfié faisait 500 morts au Mexique. Enfin, en 2001, l’explosion de l’usine AZF faisait 30 morts à Toulouse. Malgré l’amélioration des méthodes d’analyse des risques, les progrès techniques et l’emploi progressif de systèmes formalisés de gestion de la sécurité, les courbes des accidents mortels relatives à l’ensemble des installations classées ou susceptibles de l’être ne semblent pas évoluer depuis 15 ans. La proportion des accidents liés à l’industrie chimique est devenue la plus importante ces dernières années [BARPI, 2007]. Une typologie des accidents chimiques fait apparaître clairement que les incendies et le rejet de matières dangereuses sont les évènements les plus fréquents (Cf. Tableau 1). Tableau 1 : Répartition des types d’accidents chimiques (22 933 accidents) Base ARIA du BARPI. Type d’événement 2006 1992 à 2006 Répartition (%) Répartition (%) Incendies 54 53 Rejets de matières dangereuses 53 50 Effets dominos 12 4 Explosions 6,6 5,8 0,3 0,2 Projections, chutes d’équipements 2,8 2,7 Irradiations 1,0 0.3 Presque accidents 3,7 2,2 dont BLEVE Note : Un même événement peut engendrer plusieurs phénomènes. Par exemple, en France, sur 106 explosions recensées en 2003, 60 ont été accompagnées ou résultent d’incendies. 19 Chapitre I I.3 Les situations d’urgence Récapitulatif sur les situations d'urgence Cette typologie révèle une première distinction des accidents chimiques en fonction du type d’événement. Il n’existe pas un type de situations d’urgence, mais une pluralité de situations qui se différencient par de nombreux paramètres. En effet, les récents événements, incendie de Buncefield (2005), Ghislenghien (2004), AZF (2001), Mexico (1984), Bhopal (1984), Seveso (1976) montrent que les risques menaçant les populations et l’environnement sont de plus en plus diversifiés. Diversifiés du fait d’une multitude de produits dangereux pouvant être impliqués, par les phénomènes variés et complexes, par les cibles impactées, etc. Les situations d’urgence font intervenir des phénomènes complexes, mobilisant de nombreux acteurs dont le but est de limiter les conséquences. Dans le cadre du GIS AGECRIS, nous nous intéressons plus particulièrement aux besoins des sapeurs-pompiers et de la CASU de l’INERIS lorsque survient un accident impliquant des substances chimiques. Souvent, un amalgame est fait entre situation de crise, situation d’urgence et accident. Dans certains ouvrages traitant des situations de crise, les situations d'urgence s’en distinguent par un univers mieux « cadré » auquel s’applique une gestion conventionnelle. « La crise c'est l'urgence plus la déstabilisation. » [Lagadec, 1997] Dans ce mémoire, nous nous intéresserons à la gestion de la situation d’urgence et non de la crise. Et pour être plus précis, le mémoire portera sur l’aide à la décision afin de faciliter la gestion de la phase d’urgence de situations accidentelles d’origine chimique que sont amenés à gérer les sapeurs-pompiers, en faisant éventuellement appel aux cellules d’appui. 20 Chapitre II L’aide à la décision en situation d'urgence CHAPITRE II L’AIDE A LA DECISION EN SITUATION D'URGENCE II. La prise de décision en situation d'urgence repose sur les données opérationnelles et les connaissances des acteurs permettant de se représenter la situation et son devenir. Après une présentation des données opérationnelles, il est fait un tour d’horizon des outils d’aide à la décision les plus répandus. 21 Chapitre II L’aide à la décision en situation d'urgence II.1 La prise de décision « Gérer une situation d’urgence nécessite de prendre des décisions rapides, adaptées et justifiées au milieu d’un flux d’informations, sous la pression politique, médiatique, sociale et économique des acteurs de terrain, des victimes sanitaires ou économiques, et en interaction avec de nombreux acteurs locaux, nationaux et internationaux. » [ASN, 2006] Apporter une aide à la décision c’est fournir des données, des outils ou des méthodes pour progresser dans un processus de décision. Les données véhiculent de l’information à laquelle l’expert, fort de ses connaissances, donnera un sens afin de progresser dans le processus de décision. Nous nous intéresserons dans la première partie, aux données opérationnelles susceptibles d’être utilisées par les experts. Ces données ne sont pas toujours directement exploitables et pour faciliter la prise de décision, les experts disposent outils que nous réunirons sous le terme d’outils d’aide à la décision et qui seront présentés dans la deuxième partie. Enfin, après avoir dégagé les besoins des experts des situations d'urgence, nous verrons au chapitre suivant les méthodes susceptibles d’apporter une aide à la décision pour y répondre. Décider ne représente que l’ultime étape d’un processus cognitif, où s’opère un choix entre diverses alternatives possibles. Aider à la décision, c’est apporter l’information qui autorise une appréciation plus sûre du champ des possibles et une anticipation plus correcte des résultats susceptibles de découler des actions projetées. La décision finale restant la responsabilité du décideur final. « Le but d’un système d’information n’est pas de se substituer à l’homme, mais d’apporter une assistance qui doit se concrétiser par la réduction des délais de traitement. Il n’est pas envisageable qu’une machine ou un système de machines puisse remplacer l’esprit humain qui devra rester le seul décideur de la conduite à tenir. » [Cdt Vert, 2001] Les données opérationnelles sont toutes les données susceptibles d’être disponibles en situation d'urgence et apportant de l’information utile à l’appréhension de la situation et de son devenir et par conséquent, éclairant les décideurs quant aux choix possibles pour gérer la situation. II.2 Les données opérationnelles Après avoir présenté quatre catégories de données opérationnelles, un paragraphe est consacré à leur nature imprécise et incertaine. 22 Chapitre II II.2.1 L’aide à la décision en situation d'urgence Les données utiles en situation d’urgence En situation opérationnelle, plusieurs sources d’information vont permettre de mieux cerner le contexte. Il s’agira d’avis d’experts ou de données recueillies sur site telles que des observations (description du produit, forme de panache, type de stockage, personnes blessés, matériels endommagés, …) ou des mesures. Une détection et d’éventuelles mesures de concentration pourront être réalisées à l’aide de matériels spécialisés. Parmi les sources informatiques, il est possible d’utiliser des outils tels que les bases de données ou les systèmes d’information géographique. On peut également inclure toutes les informations qu’impose le cadre réglementaire (état des stocks, document de transport, Plaque danger, code ONU, …). En se basant sur une approche systémique classique (source-flux-cibles) et en ajoutant les données liées à l’environnement nécessaire à toutes modélisations, les données permettant d’analyser les situations d’urgence ont été réparties en quatre catégories de données relatives : - - à la source, o substance chimique o terme source (quantité de produit, mode d’émission, …) o localisation à l’environnement, o (nature du sol, occupation des sols par des obstacles, orographie, …) o les conditions météorologiques (champ de vent, température,…) - au flux, - et aux conséquences sur les cibles. II.2.1.1 Données relatives à la source II.2.1.1.1 Substance chimique Afin d’identifier rapidement les substances chimiques et les dangers qui y sont liés, la réglementation européenne5 impose un marquage des matières dangereuses (code ONU sur les emballages et les transports, code danger, pictogramme des dangers, …). En l’absence de signalisation, certaines données renseignent sur la substance comme sa couleur, son état, sa viscosité, sa densité lorsqu’elle peut être estimé visuellement et surtout son odeur qui se révèle un bon indicateur pour les substances courantes (gaz de ville, ammoniac, …). Des mesures pourront également être effectuées (pH) ou l’emploi de matériels de 5 JO du 8 mai 1994 - Arrêté du 20 avril 1994 relatif à la déclaration, la classification, l'emballage et l'étiquetage des substances 23 Chapitre II L’aide à la décision en situation d'urgence détection permettra de lever le doute ou de confirmer la présence d’une substance précisé ou d’une famille de substances. Les produits chimiques se différencient par : - Les propriétés physico-chimiques qui définissent la nature des dangers associés (toxique, explosif, inflammable, …) et vont conditionner les précautions à prendre et les moyens d’intervention possibles. Elles interviennent dans le calcul des distances de sécurité et sont donc indispensables à l’évaluation des conséquences. Les effets sur l’homme et l’environnement qui peuvent être observés. - Les moyens de détection, qu’il s’agisse de matériels de mesure ou d’identification, ou de critères observables. - Les moyens d’intervention (utilisation de matériels, de méthodes) - Les produits de décomposition possibles qui peuvent entraîner des risques importants et qui nécessitent donc de prendre certaines mesures de protection. - Le mode de stockage Le type de stockage et le conditionnement vont être déterminants sur les scénarios possibles. Le conditionnement va définir s’il s’agit, par exemple, d’une dispersion gazeuse, liquide ou diphasique (Tableau 2). Tableau 2 : Scénarios possibles en fonction de l’état d’une substance Etat / Stockage Scénarios Gazeux rejet gazeux Liquide fuite liquide avec formation de nappe et évaporation Liquide sous pression trois scénarios possibles selon la position de la brèche : rejet liquide, gazeux ou diphasique De même la température de stockage déterminera le comportement d’un rejet gazeux en champ proche ; par exemple un gaz passif peut se comporter comme un gaz lourd quand il est refroidi (ex. NH3). II.2.1.1.2 Terme source En amont de la modélisation de la dispersion atmosphérique d’une substance, il convient généralement de caractériser un « terme source ». Par extension, on peut parler de terme source pour les autres phénomènes dangereux comme l’explosion ou l’incendie. Ce que l’on désigne alors par « terme source » est un ensemble de paramètres descriptifs de la source d’un 24 Chapitre II L’aide à la décision en situation d'urgence phénomène, suffisant aux modèles pour effectuer les calculs de flux. Ces paramètres sont tous ceux qui conditionnent la formation du flux dangereux, c’est-à-dire les caractéristiques de la source d’émission initiale éventuellement modifiées par le champ proche. Par exemple, dans le cas de la dispersion atmosphérique, la source d’émission initiale est caractérisée par le type de produit (état physique, quantité), sa pression, sa température qui conditionnent le débit, l’état physique et la vitesse à la brèche, etc. Il faut également tenir compte de son environnement proche ; par exemple la présence d’un mur (jet dit « impactant »), ou d’un local de confinement qui influencent directement le devenir du terme source initial (devenir de la fraction liquide, évaporation de flaque, etc.) [MEEDDAT-INERIS, 2006]. Il faut souligner l’importance de la quantification du terme source. Quel que soit l’outil de calcul utilisé, la caractérisation du terme source doit être la meilleure possible. « la caractérisation du terme source est déterminante, parce que les meilleurs modèles de dispersion donneront toujours des résultats erronés si le terme source est incorrect. » [Bouet, 1999]. A partir de l’étude des modèles, des logiciels et de documents de référence, une liste des principaux paramètres du « terme source » par phénomènes a été réalisée (cf. Figure 2). Certains paramètres peuvent être omis lorsqu’ils ne sont pas pris en compte par les modèles classiques. 25 Chapitre II L’aide à la décision en situation d'urgence Figure 2 : Paramètres importants pour la modélisation des phénomènes dangereux Ces paramètres peuvent être tout simplement connus (état des stocks, surface du bassin de rétention) ou calculés à partir de données comme la pression, la taille de la brèche, etc. Ils peuvent être observés (présence d’une flaque, …) ou encore estimés (majoration par le volume du type de stockage, surface de flaque, …). 26 Chapitre II L’aide à la décision en situation d'urgence En situation d’urgence, les données relatives au terme source sont rarement connues avec précision ou sont manquantes La localisation de la source pourra être connue, car le lieu de l’accident est identifié par des témoins, par une reconnaissance des sapeurs-pompiers, par la présence d’un nuage de fumée ou de gaz produit par un incendie ou une fuite, ou encore par la présence d’un cratère d’une explosion. Dans d’autres cas, l’ampleur de l’accident et le disfonctionnement des moyens de communication ne permet pas de connaître la localisation dans les premiers instants (AZF 2001) ou la présence d’une fuite d’un gaz incolore uniquement détectée par l’odeur, nécessite l’emploi de matériels adaptés pour remonter à la source. Pour une dispersion, la quantité totale rejetée peut être majorée lorsque le volume du stockage est connu. L’identification du type de stockage ou du TMD qui répondent à un standard permet de connaître facilement le volume. Il ne s’agit que d’une borne maximum, car on ne connait pas le taux de remplissage du stockage. Le type de stockage renseigne également sur la phase du produit. Par contre, le débit est plus difficile à estimer. Bien qu’il existe des outils de calcul de débit, la taille de la brèche et sa forme ne peuvent être estimé que visuellement, pouvant être masquée par le jet, de la fumée, des obstacles ou un feu. Les situations permettant de calculer précisément le débit restent rares. On peut citer l’accident de Ghislenghien (2004) causé par la rupture d’une conduite de gaz naturel sous haute pression. S’agissant d’une rupture guillotine, la section de la brèche était connue, ainsi que la pression de la conduite et sa longueur. Il était alors facile de calculer le débit, mais cela reste un cas rare. D’une manière générale, bien qu’il existe parfois des éléments visuels directement liés à certains paramètres du terme source, il est rarement connu avec précision, voire totalement inconnu. II.2.1.1.3 Site fixe ou Transport de Matières Dangereuses Il faut aussi distinguer le site de l’accident : - Les sites fixes pour lesquels la population est sensibilisée à ce genre d’accidents pouvant disposer de sources d’informations (produits, stocks, …), être formés aux risques (formation, POI, …), voire disposer sur place de moyens de secours (pompiers sur site) et éventuellement de réseaux de mesures (détecteurs de gaz, capteurs de concentration, mesures de débit dans les canalisations, …). - Les sites fixes disposant de plus ou moins d’informations mais dont l’activité permet de rechercher l’information et de limiter le champ des hypothèses sur les stocks et les produits. 27 Chapitre II - L’aide à la décision en situation d'urgence Les Transports de Matières Dangereuses peuvent présenter plus de difficultés pour obtenir les informations et survenir dans des zones de forte densité de population ou difficile d’accès. II.2.1.2 Flux dangereux La modélisation des effets d’un phénomène accidentel comprend trois composantes, à savoir la modélisation du « terme source », de la « propagation » de cette source dans l’environnement et l’impact du flux dangereux sur les « cibles » [MEEDDAT-INERIS, 2006]. Les flux dangereux sont de plusieurs natures selon les phénomènes : flux thermique dans le cas d’une explosion ou d’un incendie, flux toxique dans le cas d’une dispersion atmosphérique, aquatique ou dans les sols, ou encore dans le cas d’émission de fumées, flux mécanique (onde de surpression, effets dits « missiles ») dans le cas d’une explosion. On s’intéresse plus souvent à la modélisation du phénomène en termes de propagation du flux. L’approche classique pour calculer un flux dangereux est de réaliser une modélisation du phénomène. Les outils de modélisation sont présentés en annexe IV. II.2.1.3 Données décrivant l’environnement II.2.1.3.1 Topographie et orographie Il s’agit des données liées à la topographie du site, à l’occupation des sols (bâtiments, murs de protection, …), et de la nature des sols (rugosité, …). Ces données sont rarement disponibles avec précision car les systèmes d’information géographique (S.I.G.) sont peu utilisés ou ne sont pas disponibles dans des formats exploitables pouvant être utilisées directement par les outils d’évaluation des conséquences (format électronique différents ou plus généralement plan de site sur support papier). Lorsque les moyens sont mis en œuvre pour développer un tel système pour couvrir une zone à risque [Mallet et al., 2005], la difficulté est dans la mise à jour des données lorsque l’on est confronté à une occupation des sols variables comme dans le cas du port du Havre. De plus, ces données sont souvent ignorées parce que les outils utilisés comme les modèles simples, n’en tiennent pas compte. Un terrain trop encombré ou accidenté permettra uniquement d’émettre des réserves sur les résultats de modèles et la présence d’éléments plus petits (habitations, arbres, etc.) seront pris en compte par un paramètre de rugosité relevant d’estimations. 28 Chapitre II II.2.1.3.2 L’aide à la décision en situation d'urgence Conditions météorologiques Il s’agit notamment de la direction et de la vitesse du vent, de la température ambiante et du taux d’hygrométrie. Dans le cadre de cette étude, ces conditions météorologiques sont considérées comme connues, soit par des mesures effectuées par les sapeurs pompiers sur le site de l’accident, soit par la station Météo France la plus proche. Un autre paramètre important est la stabilité atmosphérique relevant de processus complexes [Couillet, 2002] et souvent simplifiés par l’emploi de classes de stabilité (classes de Pasquill par exemple [Pasquill, 1974]). La classe de stabilité est un paramètre important, difficile à déterminer avec précision en situation d'urgence. Il existe des outils (ALOHA et MEMPLEX par exemple) permettant d’en faire une estimation en se servant d’élément visuel comme la présence de nuages et la distinction jour/nuit. II.2.1.4 Conséquences Le flux généré par l’accident chimique et les propriétés des substances entrainent des conséquences sur les victimes, les matériels et l’environnement. Relatifs à la substance chimique, les symptômes développés par les victimes sont des données aidant à l’identification à condition de disposer d’une base de données recensant l’information. La réaction avec l’environnement comme le dégagement de gaz au contact de l’eau ou la corrosion des métaux sont également des données opérationnelles utiles à l’identification des dangers liés à la substance. L’utilisation de ces données sera détaillée au chapitre III. Enfin, les conséquences sont également le résultat du flux thermique ou mécanique. Comme il a déjà été mentionné plus haut, la présence d’un ou plusieurs cratères permet de localiser l’épicentre d’une explosion. L’ampleur des dommages sur les personnes et les matériels sont signes de l’importance du flux en un point donné. Il existe des abaques pour estimer un flux thermique ou la surpression maximale d’une onde de surpression, mais leur emploi nécessite un travail d’expert, un temps considérable au-delà de la durée de la situation d’urgence et ces évaluations restent imprécises. II.2.1.5 Cibles L’environnement proche est primordial puisqu’il sera très souvent le premier exposé aux flux et cela déterminera l’ampleur des conséquences. En fonction des enjeux, le choix des actions à mener peut être complètement différent selon les priorités : protection de la population, protection d’installation à risque ou rétablissement de la situation (réparation). 29 Chapitre II - L’aide à la décision en situation d'urgence La proximité de la population est prépondérante car le nombre de victimes est le critère principal de l’évaluation des conséquences. Il s’agit même très souvent de l’unique critère des évaluations des conséquences des scénarios de danger utilisés dans les études scientifiques avec le bilan financier en post crise. - La présence de sites industriels à risque dans le voisinage pouvant engendrer des effets domino doit être prise en compte et complique la situation. II.2.2 Nature des données opérationnelles Les données opérationnelles présentent certaines caractéristiques qu’il faut prendre en compte lors de leur traitement. Il s’agit d’informations : - Hétérogènes o Binaires (présence d’une fuite ou non, substance toxique ou non) o Numériques (mesures de concentration) o - • Continues (vitesse du vent) • Discrètes (classes de stabilité atmosphérique) Symboliques (« concentrations élevées », couleurs) Non structurées et éparses. Ce sont des données issues de plusieurs sources d’informations dont les supports et les formats (structures) sont différents. - Asynchrones Les informations sont délivrées à des temps différents. Il faut tenir compte que les informations fournies reflètent rarement la situation à son commencement à l’instant t0. Et plus il y a de décalage entre le moment ou l’information est obtenue et le moment où elle sera traitée (délai de transmission) et moins elle reflétera la situation qui aura pu évoluer. Les observations sur les conséquences ne sont pas le résultat d’un phénomène instantané, mais leur évolution dans le temps jusqu’à l’arrivée des services de secours. Les conséquences ont lieu sur un « système » dynamique qui réagit à l’agression. Ainsi les victimes capables de se déplacer vont s’éloigner de la source de danger, des personnes vont agir sur les cibles pour porter secours, etc. 30 Chapitre II - L’aide à la décision en situation d'urgence Indirectes Il s’agit d’informations dont la signification n’est pas immédiate. Par exemple, la largeur du jet à la paroi du container donne une information sur la taille de la brèche et la pression. - Imparfaites o Données imprécises • Erreur de mesure La mesure d’une grandeur physique est généralement entachée d’une imprécision liée au système de mesure et/ou de son utilisation. Dans le cas de la dispersion atmosphérique, la direction du vent est un paramètre indispensable pour déterminer l’évolution du panache, mais qui est difficile à obtenir avec précision. Bien qu’elle puisse être mesurée par les stations de Météo France, la mesure n’est pas locale à l’incident et on note des écarts importants avec une mesure trop distante. Les pompiers disposent d’appareils de mesure locale, mais ces capteurs ne peuvent pas s’utiliser n’importent où, ils nécessitent notamment d’être positionnés sur une zone dénuée d’obstacles majeurs, ce qui n’est pas toujours possible d’où des mesures faussées par une erreur de protocole. • Observations imprécises Dans le cas des observations, de nombreux facteurs peuvent entraîner des erreurs d’appréciation. Il peut s’agir tout simplement de grandeurs difficilement évaluables ou nécessitant une certaine habitude. Ce sont parfois des informations difficiles à restituer, à exprimer dans des termes simples. « Les dégâts sur la structure sont importants. » Que signifie « important » ? Le stress de la situation, la panique, la précipitation, le manque d’attention peuvent amener à des erreurs d’estimation. o Informations incertaines Il ne s’agit pas d’erreur sur la qualité du résultat mais sur sa validité. « Je crois qu’il y a une brèche à la citerne. » L’information n’est pas sûre. 31 Chapitre II L’aide à la décision en situation d'urgence « La victime, après inhalation, est sujette à des nausées ». Le symptôme est-il réellement du à l’inhalation de la substance chimique ? Une distinction supplémentaire peut être faite en tenant compte de la confiance que l’on a en la source d’information. Par exemple, nous aurons plus confiance en les dires d’un expert que dans le témoignage d’une personne inexpérimentée ou surprise. Cette distinction est prise en compte dans la typologie de l’incertitude de Demolombe dans [Demolombe, 1997]. o Informations incomplètes (Incomplétude) Absence d’une source d’informations dans certains scénarios « Nous n’avons pas de mesure de concentration. » ou d’une partie de l’information. « Il n’y a pas de mesure de vent pendant les 30 premières minutes. » o Informations contradictoires (Inconsistance) En cas de redondance des informations, il peut y avoir des contradictions. Nous distinguons l’imprécision et l’incertitude, réunies sous le terme de données imparfaites. Souvent imprécision et incertitude sont confondues à tort. La notion d’incertitude est souvent assimilée à l’incertitude de mesure qui représente l’imprécision d’une méthode de calcul ou d’un système de mesure. Dans [NCSLI, 2006], l’incertitude de mesure est défini comme le paramètre qui caractérise la dispersion des valeurs attribuées à un mesurande (grandeur que l’on veut mesurer), à partir des informations utilisées. L’erreur est alors définie comme étant la différence entre un résultat individuel et la valeur exacte du mesurande [EURACHEM/CITAC, 2000]. Toutefois cette définition de l’incertitude ne correspond pas aux données opérationnelles et il est important de distinguer incertitude et imprécision comme il est fait état dans [El Najjar et al., 2003] : « L’incertitude sur une hypothèse représente le doute sur son existence réelle ou sur sa validité. L’imprécision représente l’erreur associée à une donnée fournie par une source d’information (par exemple un capteur) par rapport à la valeur vraie idéale. Elle modélise simplement une partie de l’imperfection du moyen de perception. On peut interpréter l’imprécision comme une évaluation de l’aspect quantitatif de cette 32 Chapitre II L’aide à la décision en situation d'urgence imperfection et l’incertitude comme une représentation de l’aspect qualitatif. » L’incertitude ne peut pas être réduite à des probabilités subjectives [Carluer et al., 2002] qui est un raccourci séduisant pour représenter l’incertitude et la traiter à l’aide de méthodes probabilistes bien connues. L’incertitude comprend également un caractère ambigu (ambiguity) et approximatif (vagueness) que [Smithson, 1989] propose dans une taxonomie de l’ignorance (Figure 3). Figure 3 : Taxonomie de l’incertitude [Smithson, 1989] Ce sont donc des données imparfaites, issues de différentes sources d’informations qu’il faut traiter et confronter pour élaborer l’aide à la décision qui convient à la situation et aux données disponibles. II.3 Outils d’aide à la décision pour les urgentistes Il existe différents types de situation d’urgence auxquels correspondent des besoins spécifiques et donc une d’aide à la décision adaptée à chaque cas de figure. L’aide à la décision peut se décliner en quatre catégories : - Informations relatives à une substance chimique (principalement les dangers qui y sont liés). - 33 Calcul de distances d’effets (effets létaux, effets irréversibles, …). Chapitre II L’aide à la décision en situation d'urgence - Recherche de REX comparables. - Evolutions possibles de la situation. Pour une même situation, il peut être fourni à la fois des informations sur le produit à la source (fiche toxicologique), un REX pour la méthode d’intervention à employer et une évaluation des conséquences. L’étude bibliographique, les mains courantes de la CASU et plusieurs entretiens avec des urgentistes ont permis de lister différents outils d’aide à la décision en situation d’urgence. II.3.1 Guide et fiches réflexes II.3.1.1 Guide National de Référence (GNR) Rédigé à l’attention des sapeurs-pompiers et élaboré en concertation avec les différents partenaires impliqués, le GNR s’appuie sur les REX des interventions et des exercices pour préciser les méthodologies d’intervention. Il propose également une approche théorique du risque chimique, ainsi que des fiches "produits" et des fiches réflexes. II.3.1.2 Fiches réflexes En plus de sa formation, le sapeur-pompier peut se référer à des fiches réflexes. Leur objectif est d’apporter aux premiers intervenants, un canevas d’intervention permettant de faire face aux situations les plus couramment rencontrées dans les interventions à caractère chimique [FNSPF, 1992b]. Il s’agit d’aides opérationnelles synthétiques indiquant la conduite à tenir face à certaines situations identifiées par la phase de la substance chimique et des dangers qui y sont liés (émission de gaz inflammables, émission de gaz toxiques/corrosifs, incendie avec fumées toxiques, écoulement de liquides inflammables, …). Les fiches du GNR par exemple, sont toutes conçues de la même façon avec : - un exemple de matière dangereuse - les codes "dangers" se rapportant au titre de la fiche - les moyens nécessaires pour l’engagement des premiers intervenants - l’analyse de la situation - les mesures immédiates préconisées. Ces fiches réflexes peuvent être complétées et adaptées par les SDIS notamment en fonction des moyens dont ils disposent ou des fiches de synthèse 34 Chapitre II L’aide à la décision en situation d'urgence sur un point particulier comme les protections individuelles ou le zonage. Des fiches réflexes ont été réalisées par le SDIS de Meurthe et Moselle [SDIS 54, 1999]. Les sapeurs-pompiers français se servent également des guides d’autres pays comme le GMU et le guide orange. II.3.1.3 Le Guide des mesures d'urgence (GMU) Le GMU élaboré conjointement par Transports Canada, le Département aux Transports des États-Unis et le Secrétariat aux Communications et aux Transports du Mexique est destiné aux pompiers, aux services de police et au personnel d'autres services d'urgence qui peuvent être les premiers à arriver sur les lieux d'un incident mettant en cause des marchandises dangereuses. Il s’agit avant tout d’un guide pouvant aider les premiers intervenants à déterminer rapidement les dangers précis ou généraux de la (des) matière(s) visée(s), et à se protéger et à protéger le grand public au cours de la phase d'intervention initiale consécutive à cet incident. [CANUTEC, 2004] Le GMU est disponible gratuitement en version électronique par téléchargement. II.3.1.4 Guide orange des sapeurs pompiers genevois Il donne le relevé précis de produits chimiques et nocifs permettant aux sapeurs-pompiers de détecter, lors d’incidents, ces produits dans les meilleures conditions et d’intervenir de façon appropriée pour la sécurité des intervenants et de la population. - distance (d’approche, d’évacuation, …) - dangers secondaires (en cas d’incendie, de polymérisation, …) - les techniques de neutralisation - les matériels à employer - … Le guide orange peut être considéré comme une base de données de substances chimiques. 35 Chapitre II II.3.2 L’aide à la décision en situation d'urgence Bases de données Au format numérique ou sur support papier, les bases de données font partie des aides à disposition des sapeurs-pompiers et des permanents des cellules d’appui. Lors des situations d'urgence, deux types de bases de données sont couramment utilisées : - Les bases de données sur les substances chimiques nécessaires aux calculs des modèles d’évaluation des conséquences. Elles renseignent également sur les propriétés des substances et les dangers qui y sont liés, informations capitales aux services de secours pour conduire leur intervention. - Les bases de données sur l’accidentologie pour la recherche de REX comparables. II.3.2.1 Accidentologie Chaque entité travaillant dans le domaine semble avoir développé sa propre base de données (Aria du BARPI, GEIDE de l’INERIS, MHIDAS développé par le HSE, FACTS du TNO). Une première étude a montré que les bases de données en France n’ont que très peu d’accidents en commun et que les paramètres recensés ne sont pas les mêmes. Certaines bases se veulent plutôt opérationnelles avec une vision terrain, et d’autres sont plus orientées paramètres expérimentaux destinés à la modélisation. Les formats des bases sont hétérogènes puisqu’il peut s’agir de bases formatées avec des champs bien définis ou de descriptions non structurées qui ne facilitent pas la recherche par mots-clés. Le tableau fait l’inventaire des bases de données utilisées par la CASU de l’INERIS et liste leurs principales limites (Cf. Tableau 3). Tableau 3 : Bases de données utilisées par la CASU de l’INERIS [Tremeaud, 2005] Nom Adresse Eléments intéressants Limites CASU Intranet - Liste des appuis archivés - pas de système de CASU GEIDE Intranet recherche - EDD, analyses critiques, - pas toujours analyses d’accidents, rapports opérationnel titre IV, recherches - Terme sources, scénarios, distance d’effets - Eléments sur des installations particulières, type silos 36 Chapitre II RAI ARIA L’aide à la décision en situation d'urgence Portables - Accidents similaires - Peu d’accidents (47) CASU - Conseils à l’intervention http://aria.ecol - Accidents similaires (beaucoup - Pas ou peu d’éléments ogie.gouv.fr/ d’accidents répertoriés) sur les méthodes d’intervention - Descriptif d’accidents très concis IMPEL http://europa.e - enseignements tirés (mesures - Pas d’éléments sur les u.int méthodes d’intervention de prévention) - Recherche longue II.3.2.2 Produits chimiques Nous pouvons faire le même constat pour les bases de données de produits chimiques en termes de données stockées et de format. Les sources de données sont très nombreuses ; 66 bases de données ont été recensées [Celle et al., 2006]. Dans le domaine des risques et de la santé, de nombreux pays mettent à disposition de telles sources via différents organismes (INERIS, INRS, NIOSH, NFPA, USCG, EPA, CCOHS, …). A celles-là s’ajoutent les bases de données issues de l’industrie chimique et pharmaceutique (American Chemical Society, MERCK, …). Les logiciels d’évaluation des conséquences intègrent également leur propre base de données de produits chimiques (par exemple CAMEO contient plus de 6000 produits chimiques [NOAA, 1999], ALOHA moins de 1000 [Lacôme et al., 2006], Safer Systems rassemble environ 720 éléments chimiques [Lacôme et al., 2007]). Il s’agit de bases de données réduites en nombre de substances comparées à celle du Chemical Abstract Services (CAS-registry) de l’American Chemical Society, où sont enregistrées plus de 27 millions de substances. Ces bases de données sont spécifiques et regroupent essentiellement les données nécessaires à la modélisation des phénomènes physiques. Quelques rares logiciels spécifiques aux services de secours contiennent aussi des recommandations à l’intervention (par exemple, le logiciel allemand Memplex de la société de K.W. Keudel [Keudel av-Technik GmbH, 2007]). Le mode de fonctionnement de ces bases de données est similaire à n’importe quelle base de données classique. Lorsque la substance chimique est connue selon un identifiant unique, ces bases de données permettent d’accéder aux caractéristiques contenues et destinées à une activité spécifique (santé, modélisation, chimie, pharmacie, …). 37 Chapitre II L’aide à la décision en situation d'urgence De ce fait, ces bases de données spécialisées ne contiennent qu’une partie des données qui sont utiles, voire nécessaires en situation d’urgence. Un premier constat est qu’il faut consulter plusieurs sources pour obtenir l’ensemble des données nécessaires. Les bases de données n’ont pas la même vocation et ne sont pas conçues pour les mêmes utilisateurs. Ainsi, la nature des renseignements qu’elles contiennent, peut largement différer de l’une à l’autre. Une autre limite à l’utilisation de bases de données destinées à d’autres applications est qu’elles contiennent des données inutiles en situation d’urgence et, de ce fait, les données nécessaires sont noyées dans la masse. De plus, elles adoptent des formats hétérogènes (html, pdf, …), formatées avec des champs bien définis ou contenant des descriptions non structurées (par exemple des fiches en langage naturel sans formalisme commun) qui ne facilitent pas la recherche par mots-clés. La localisation de l’information n’est pas immédiate et occasionne une perte de temps. Dans [Dobbins et al., 2003], les auteurs montrent la nécessité de créer une base de données centralisées opérationnelle dans le cas des dispersions en mer. Mais cela est également valable pour l’ensemble des situations d’urgence d’origine chimique. Il est important de faire une recherche unique, rapide et à l’aide d’informations disponibles sur le terrain. Lorsque plusieurs bases de données sont consultées, des incohérences peuvent apparaître entre les différences sources de données. Qu’il s’agisse d’erreurs, de lacune dans les données ou de différences de référentiels, il est indispensable de vérifier l’information. Mode de recherche Les bases de données comprennent des moteurs de recherches plus ou moins évolués et complexes. La majorité des moteurs ne permettent qu’une simple recherche par clé primaire6 ou par mots-clés comme l’outil développé spécifiquement pour les REX de la CASU [Genoux et al., 2006]. Certaines bases de données permettent des recherches étendues par intervalles ou listes de valeurs (pH ∈ [1-6], couleur∈{ blanc, jaune, gris }). Cependant, pour des données qualitatives, la recherche de valeurs « proches » n’est pas possible ; bien que la saisie de plusieurs valeurs possibles soit autorisée, la notion de « degré de similitude » n’existe pas. Recherche de REX similaires 6 Clé primaire : contrainte d'unicité qui permet d'identifier de manière unique un enregistrement dans une table d’une base de données relationnelle. 38 Chapitre II L’aide à la décision en situation d'urgence Cette notion serait intéressante lors de la recherche de scénarios d’accidents similaires pour évaluer les risques. Un retour d’expérience avec les mêmes conditions et un produit chimique précis n’est peut-être pas disponible, mais un scénario faisant intervenir un produit aux caractéristiques comparables s’avérerait utile. Actuellement, il est nécessaire de faire appel à une personne compétente, capable d’identifier les substances similaires et de faire ensuite plusieurs recherches. Une telle recherche doit être étendue à d’autres critères. Il faudrait pour cela s’appuyer sur une typologie de situations d’urgence pour recenser les scénarios caractéristiques pour chaque type d’accidents, puis développer une méthode de comparaison de scénarios à partir d’éléments flous. Cette approche est utilisée notamment dans le domaine médical pour la recherche automatique de cas similaires pour une aide préopératoire de cas de scoliose [Chusseau et al., 2000]. Recherche inverse Dans le cas des bases de données de substances chimiques, c’est une possibilité de recherche inverse qui s’avère intéressante pour aider à l’identification. La quasi-totalité des bases de données nécessite de connaître la substance chimique par son nom ou son numéro CAS ou sa formule par exemple. Il n’est pas possible de faire une recherche inverse, une identification d’une substance à partir des données opérationnelles. Seulement deux bases de données ont été recensées comme disposant d’un mode recherche à partir de la description et des propriétés du produit chimique, des symptômes observés chez l’homme ou de la classification NFPA (si la signalisation est connue). Le « Chemical Companion » développé par le Georgia Tech Research Institute (GTRI) permet ce type de recherches parmi 130 substances chimiques. Le logiciel WISER [NLM, 2005] présenté au paragraphe IV.2.2.1 offre également un tel mode de recherche. En fonction des informations saisies (par exemple la couleur du produit, son pH, et des effets sur la peau) WISER sélectionne tous les produits satisfaisant à l’ensemble de ces critères. Autres bases de données D’autres bases de données sont utilisées par des outils d’évaluation des conséquences et au cours d’études. Les données les plus utilisées sont les données météorologiques de la région étudiée, l’état du trafic et des informations sur les accidents de la route pour l’évaluation d’itinéraires, mais ces dernières informations sont plutôt à considérer comme des SIG. 39 Chapitre II II.3.3 L’aide à la décision en situation d'urgence Systèmes d’Information Géographique (SIG) Ces l’utilisation dernières des années systèmes ont vu un d’information développement géographique considérable pour l’étude de de la vulnérabilité et l’évaluation des conséquences. Les SIG sont sans aucun doute une aide précieuse par la quantité d’informations centralisées, la sélection des couches de données d’intérêt, la possibilité de croiser différents niveaux d’informations et l’affichage spatialisé des résultats. Cependant la collecte des informations à l’échelle d’une région est un travail considérable. Les informations ne sont pas toujours faciles à obtenir, elles doivent être standardisées, traitées et régulièrement actualisées car elles peuvent varier rapidement en particulier celles touchant à la population. Par ailleurs, ces méthodes sont souvent imprécises. Ainsi, les calculs de densité de population à la surface de la commune ou au prorata de l’occupation des sols ne sont pas assez précis. Dans [Tran Le Tam et al., 2005] une méthode est utilisée pour déterminer la répartition de la population à partir de la base de données BD TOPO de l’IGN, en utilisant le recensement général de la population et couplé à un MNT pour déterminer la hauteur des bâtiments. Néanmoins, l’absence de référencement de certains bâtiments (petits commerces, cinémas, écoles, …) revient à les considérer comme des habitations et introduit des erreurs d’évaluation de la densité de population. Cette méthode permet d’évaluer la densité de population par habitation ; valeur que l’on peut considérer représentative de la répartition pendant la nuit, mais qui ne reflète pas la distribution en journée plus dense en zones industrielles, commerciales et dans les transports. Cela n’est pas suffisant pour l’application à l’évaluation des conséquences d’un accident puisqu’il est nécessaire de connaître la répartition de la population à tout instant et cela représente une difficulté majeure. La plateforme SIBARIMAS propose une solution par le modèle PRET (Population Réaliste dans l’Espace et le Temps) qui évalue la densité de population dans les zones résidentielles qui peut être considérée comme une répartition nocturne ; et diurne en déterminant la proportion de personnes qui se déplacent et occupent les zones industrielles [Mallet et al., 2005]. Le trafic serait représenté par un découpage des routes en tronçons accueillant une distribution de cette proportion de population aux heures de pointes. Il n’y a plus une densité de population, mais une série de « photographies » de la population à différentes heures de la journée. Nous pouvons aussi citer [Caetano et al., 2005] qui adopte la même approche consistant à définir plusieurs distributions dans le temps. Dans [Leonelli et al., 1999] la distribution de la population suit les saisons. Il 40 Chapitre II L’aide à la décision en situation d'urgence existe d’autres approches essayant de modéliser dynamiquement le déplacement de la population au sein d’une ville. Les méthodes multi-agents se prêtent bien à ce genre de modélisation du « comportement » des individus. Pour l’évaluation des conséquences, ces SIG doivent donc être couplés à des modèles de calcul de flux. SIBARIMAS est une plateforme opérationnelle combinant ces informations pour évaluer les conséquences d’un scénario d’accident sur la population. Dans [Ioannidis et al., 1999] une plateforme opérationnelle présente d’autres niveaux d’informations comme le réseau hydraulique, les réseaux de transport et les types d’industries avec les stockages de produits dangereux. La connaissance du réseau hydraulique permet d’évaluer les conséquences d’une pollution. Les données sur les réseaux de transport sont utilisées par un algorithme calculant en temps réel les itinéraires pour une évacuation de la population. On peut envisager d’utiliser le même principe pour l’acheminement des moyens de secours. On retrouve d’autres études d’utilisation de SIG pour le calcul des voies d’accès en situation d’urgence, mais dans un but préventif [Voiron-Canicio et al., 2005]. II.3.4 Calcul de flux dangereux La connaissance du flux dangereux est une information des plus utiles pour déterminer un zonage en fonction des caractéristiques de la substance chimique (IDLH, VLE, VME, LIE, LSE, etc.). L’approche classique pour calculer un flux dangereux est de réaliser une modélisation du phénomène. La modélisation prédictive permet de recréer des phénomènes réels afin de les étudier et de prévoir des résultats à partir de l'application d'une ou plusieurs théories à un niveau d'approximation donné. La modélisation des effets des phénomènes dangereux a deux objectifs. Elle permet d’évaluer les distances d’effets demandées par la réglementation dans une étude de dangers et de définir le zonage en situation d’urgence ou encore évaluer les conséquences sur des cibles localisées. Elle permet également de conforter des choix techniques (par exemple la conception d’un réseau de capteurs - nombre et positionnement - d’une chaîne de détection de fuite afin d’optimiser la cinétique de détection/réaction). II.3.4.1 Estimation préétablie des distances Les distances d’intérêt peuvent être déterminées au préalable pour un nombre limité de configurations de termes sources, de conditions météorologiques, d’environnement et de matières dangereuses. Pour chaque 41 Chapitre II L’aide à la décision en situation d'urgence paramètre du terme source, un nombre limité de valeurs sont retenues en fonction de la sensibilité du modèle afin de couvrir l’ensemble des valeurs significatives. De même, un nombre plus ou moins important de substances chimiques représentatives sont choisies. Les fiches réflexes donnent des distances à appliquer a priori dès le début de l’intervention en attendant une meilleure analyse de la situation pour un calcul mieux adapté. • Sans vent • Avec vent • Risque de BLEVE R = 500 m Figure 4 : Fiche réflexe – Distance de sécurité [SDIS 54, 1999] Il existe d’autres alternatives comme l’utilisation de distance précalculées. Le projet de recherche européen MITRA (Monitoring and Intervention for the TRAnsportation of dangerous goods) qui s’articule autour des responsabilités régionales de surveillance du transport de marchandises dangereuses en Europe utilise des distances précalculées [Presutto, 2005]. Dans le projet MITRA, deux valeurs sont retenues pour la vitesse du vent et trois types de couverture nuageuse (ensoleillé, nuageux, brouillard), ainsi que la température extérieure et les classes de Pasquill, qui décrivent assez largement les conditions météorologiques les plus courantes. La distinction est faite entre jour et nuit. Chacun des cas a été simulé pour un nombre limité de neuf substances chimiques à l’aide de modèles performants afin de déterminer les périmètres utiles aux sapeurs-pompiers 42 Chapitre II L’aide à la décision en situation d'urgence Dans le projet MITRA, l’informatisation des résultats a permis de retenir un grand nombre de situations. Dans le GMU du CANUTEC, l’approche est différente. Le nombre de situations est limité en termes de paramètres du terme source (deux valeurs de quantités inférieures ou supérieures à 200 litres) et la distinction jour/nuit, mais appliqué à l’ensemble des substances chimiques de la Base de données. La prise en compte des autres paramètres est faite par une approche statistique. Pour chaque substance et pour chacune des quatre configurations (jour/nuit x petit ou grand déversement) des milliers de fuites ont été modélisées, en prenant les paramètres des données sur les incidents du Hazardous Materials Incident Reporting System (HMIRS) du Département aux Transports des États-Unis, de données atmosphériques réelles pour plus de 120 sites aux États-Unis, au Canada et au Mexique, afin de représenter statistiquement les variations dans les quantités déversées ainsi que les variations de conditions atmosphériques. Suite à cette analyse, les distances résultantes ont été retenues afin de majorer 90 pourcents des incidents. En ce qui a trait aux quantités déversées et aux taux d’émission, quatre facteurs ont été pris en considération, à savoir : - la base de données du HMIRS du Département aux Transports des États-Unis, - le format autorisé des emballages utilisés pour le transport des marchandises dangereuses sous le CFR 49 172.101 et 173, - les propriétés physicochimiques des matières impliquées - et les conditions atmosphériques d’une base de données historique. II.3.4.2 Outils de simulation Enfin, lorsque les données sur la source et l’environnement sont connues, une modélisation plus fine peut être faite à l’aide de codes de calcul. De plus en plus, ces codes de calcul permettant de résoudre les équations des modèles sont intégrés à des logiciels de simulation disposant de bases de données de substances chimiques et d’outils de visualisation pour afficher un périmètre, le faire apparaître en surimpression sur une carte comme le proposent les logiciels tels que CAMEO (Computer-Aided Management of Emergency Operations), OSIRIS ou SAFER REAL-TIME (cf. Figure 5). Ce dernier disposant également d’un SIG pour repérer les cibles potentielles. 43 Chapitre II L’aide à la décision en situation d'urgence Figure 5 : Trace au sol du panache – Logiciel SAFER Real Time II.3.5 Evaluation des conséquences L’évaluation des conséquences peut être réalisée par un rapprochement à un REX comparable ou à un précalcul d’un scénario caractéristique ressemblant ; mais ces informations nécessitent l’interprétation d’experts. Plus généralement, les conséquences seront estimées en les considérant comme le résultat de l’action d’un flux sur les cibles (humaines, matériels et environnementales). En disposant d’un calcul du flux réalisé précédemment par des modèles, il faut disposer en plus de la localisation et de la nature des cibles potentielles. Ces données sont rarement disponibles avec précision. Des études sont réalisées en utilisant les densités de populations obtenues par extrapolation à partir d’un découpage en zones (résidentielles, industrielles, rurales, …). La plupart de ces études tiennent compte uniquement des cibles humaines pour l’évaluation des conséquences. 44 Chapitre II L’aide à la décision en situation d'urgence II.4 Analyses des besoins en situation d'urgence Pour identifier les besoins en termes d’aide à la décision lors d’une situation d’urgence, nous pouvons nous référer aux études réalisées dans le cadre de la CASU de l’INERIS. Toutes les demandes formulées auprès de la CASU ont un objectif commun : obtenir des éléments permettant de faciliter la prise de décision du demandeur. La CASU fournit des prestations qui sont déclinées en trois catégories dans la Circulaire du 15 juillet 20057 : informations sur la dangerosité de la substance, renseignements sur l’accidentologie et estimation des effets. En tenant compte de l’étude réalisée dans [Dolladille, 2002], lors de l’analyse des demandes adressées à la CASU, nous aboutissons au classement suivant : La transmission d’informations - Les informations demandées concernent essentiellement les substances dangereuses (principaux risques, propriétés physico-chimiques…) et le retour d’expérience (accidents similaires). o informations sur la dangerosité de la substance ou des réactions chimiques directement incriminées (principaux risques, propriétés physico-chimiques, etc.) ou celles qui sont susceptibles de se former au cours de l’accident (produits de décomposition, composants des fumées d’incendie, etc.) ; o renseignements sur l’accidentologie. La connaissance d’événements similaires antérieurs qui constituent des points de référence pour le décideur. L’évaluation des conséquences - o L’estimation des effets avant, pendant ou après la survenance du phénomène et l’évaluation des effets immédiats ou différés sur l’homme, des effets sur l’environnement (milieu naturel, bâtiments et infrastructures). Elle est demandée, dans une large majorité, pour connaître les effets sur l’homme. Elle l’est beaucoup moins pour l’environnement mais il est probable qu’elle devienne plus systématique dans le futur [Dolladille, 2002]. Par ailleurs, les demandes d’évaluation des risques concernent aussi bien le domaine accidentel que chronique. o Le calcul de flux dangereux Il peut être fait à l’aide de calculs numériques. 7 BOMEDD n° 05/19 45 Chapitre II - L’aide à la décision en situation d'urgence Le conseil à l’intervention Les demandes de conseil à l’intervention sont formulées pour des opérations de lutte proprement dites, ou de mise en sécurité après un sinistre. Lorsque l’on met en relation les demandes faites à la CASU et les moyens existants d’aide à la décision, le manque se situe au niveau de la source dont découle l’ensemble des aides à la décision (modélisation, évaluation des conséquences, stratégie d’intervention, choix des matériels de protection, …). L’évaluation des conséquences est possible en connaissant les cibles potentielles et le flux impactant. Le calcul d’un flux généré par une explosion, une dispersion ou un incendie fait intervenir plusieurs paramètres liés à la source du phénomène, la nature du produit de réaction, l’environnement et la météorologie (Cf. Figure 6). Figure 6 : De la données à la décision Un intérêt tout particulier est porté à l’évaluation du terme source et à l’identification de la substance chimique car ce sont des paramètres nécessaires à toute aide à la décision élaborée comme le calcul du flux et l’évaluation des conséquences et que ces données peuvent manquer en situation d'urgence. 46 Chapitre II II.4.1 L’aide à la décision en situation d'urgence Identification de la substance chimique La connaissance de la substance chimique est une information capitale en situation d'urgence. Elle est nécessaire à l’utilisation des bases de données pour obtenir différentes informations : - connaissance des risques associés aux produits impliqués (toxique, incendie, explosion…), - connaissance des grandeurs physiques qui servent à quantifier ces risques (seuils de toxicité, point éclair, domaine d’inflammabilité…), - connaissance des premières mesures à mettre en œuvre lors de l’intervention (protection individuelle du personnel à engager, consignes de premiers secours, règles de lutte contre le sinistre…). Mais dans certains cas, il faudra admettre que les sources d’information se montreront inutilisables formellement la car substance il pourra y dangereuse. avoir « Si impossibilité dans de d’identifier nombreux cas, l’identification de la substance chimique incriminée est aisée (réservoirs de gaz ou de liquides, et unités de synthèse de produits chimiques soumis à la réglementation ICPE…), dans d’autres elle se révèle plus problématique » [Dolladille, 2001] : - Transport de matière dangereuse La réglementation relative au TMD impose un certain nombre de mesures qui permettent d’identifier les produits et leurs risques. Au niveau du transport terrestre, le RID pour le fer et l’ADR pour la route, exigent l’application de plaques signalétiques sur les wagons et les camions ainsi que la présence de documents de bord. Au niveau du transport maritime le code IMDG et MARPOL exigent des mesures similaires concernant l’identification du vrac, des containers ou des colis. Cependant, il est fréquent, lors des accidents de transport de marchandises dangereuses, que l’identification des produits impliqués ne soit pas immédiate. Les raisons sont multiples. Parmi elles on peut citer : o l’absence de documents de bord, o le défaut de marquage, o la détérioration des plaques signalétiques par un incendie ou un agent chimique, o l’incapacité de dialoguer avec le conducteur, soit parce qu’il est victime de l’accident, soit parce qu’il est étranger, o l’impossibilité de pouvoir approcher la citerne ou le chargement incriminé (présence d’un nuage de gaz ou de vapeur…), o l’effacement des indications containers perdus en mer, 47 portées sur les colis ou les Chapitre II - L’aide à la décision en situation d'urgence o la difficulté à joindre l’armateur, o … Entrepôts Lorsque les entrepôts sont soumis à la réglementation des installations classées, l’arrêté d’autorisation d’exploiter peut apporter des informations sur la nature des produits stockés. De leur côté les exploitants connaissent de façon plus ou moins précise la nature et les quantités des marchandises entreposées dans leurs locaux. Cependant, il est fréquent qu’en cas d’incendie, ces données soient difficiles à obtenir, surtout pour les entrepôts qui abritent des marchandises de nature très hétéroclite dont les rotations sont fréquentes (logistique, zone de fret et de transit…). - Centres de collecte ou de traitement des déchets. La problématique est similaire à celle des entrepôts en cas d’incendie, mais la nature des déchets est encore plus fréquemment méconnue, à l’exception des filières de récupération spécifiques. La connaissance de la substance est donc indispensable à l’évaluation des conséquences, mais cette information peut manquer dans certaines situations. Il est donc important de définir s’il existe des méthodes ou de proposer une méthodologie pour identifier la nature du ou des produits en réaction à partir des données opérationnelles comme l’état, la couleur et l’odeur. « La nature du produit : en général cette information ne pourra être donnée par l’appelant que si lui-même est un professionnel (cadre de l’usine, chauffeur du camion, secouriste professionnel sachant interpréter les panonceaux d’informations apposés sur les réservoirs mobiles). Dans le cas contraire, on s’efforcera seulement de recueillir des informations sur la couleur et l’odeur. » [Nemitz et al., 2000]. Mais il sera très difficile identifier précisément un produit à partir d’observations, car elles seront imprécises et en nombre faible par rapport à l’imposante quantité de produits chimiques. Mais une telle précision n’est peutêtre pas nécessaire pour déterminer uniquement les paramètres utiles listés précédemment : nature des risques possibles, paramètres de calcul d’effets et réactions possibles. 48 Chapitre II II.4.2 L’aide à la décision en situation d'urgence Evaluation du terme source Comme il a déjà était fait mention, le terme source doit être connu précisément. « En effet, le phénomène physique qui en résulte (la dispersion atmosphérique en l’occurrence) ne peut être correctement appréhendé si le terme source n’a pas été bien évalué » [MEEDDAT-INERIS, 2006]. Cependant, en situation d'urgence, il est rare que l’information disponible soit suffisante pour envisager de faire un calcul de débit. On est alors dans l’impossibilité de définir le terme source avec précision. Cependant, pour parvenir à évaluer certains paramètres du terme source, d’autres données peuvent se révéler utiles comme des mesures du flux en différents points ou une estimation des conséquences observées. Cela consiste alors, dans ce cas, à résoudre un problème inverse puisqu’il s’agit de remonter à la source à partir des conséquences observées ou mesurées. L’évaluation du terme source peut se révéler utile pour l’ensemble des phénomènes pouvant survenir, qu’il s’agisse de dispersions atmosphériques, d’explosions ou de feux. II.4.3 Imprécision et incertitude des données opérationnelles Enfin, un des aspects importants à prendre en compte est le côté imparfait des données opérationnelles. L’insuffisance, voire l’absence, l’imprécision et l’inexactitude sont inhérents à la collecte et la transmission des informations en provenance du terrain. « L’inexactitude des informations parvenant à l’INERIS peut s’avérer aussi problématique que leur absence. La vision erronée qu’elles donnent de la situation, à des personnes qui sont coupées du terrain, conduit à fournir une réponse totalement inadaptée par rapport aux événements qui se produisent réellement. » [Dolladille, 2002] Ce côté imprécis et incertain des données opérationnelles doit être appréhendé lors de la conception des méthodologies d’aide à la décision. Ce sera un critère permettant de discuter l’adéquation des méthodes d’aide à la décision à une utilisation en situation d'urgence. 49 Chapitre III Les méthodes d’aide à la décision CHAPITRE III LES METHODES D’AIDE A LA DECISION III. Aider à la décision, c’est apporter l’information qui autorise une appréciation plus sûre du champ des possibles et une anticipation plus correcte des résultats susceptibles de découler des actions projetées. En théorie de la décision, les méthodes multicritères d’aide à la décision apparaissent souvent comme une solution séduisante. Permettant de donner une préférence à chaque décision possible envisagée en tenant compte de plusieurs critères ou points de vue, les méthodes multicritères sont adaptées à de nombreux problèmes de décision. Après une présentation des grands principes des méthodes multicritères, nous nous intéresserons à une autre méthode d’aide à la décision permettant de construire des règles de décisions à partir de données expertisées : les arbres de décision. 50 Chapitre III Les méthodes d’aide à la décision III.1 L’aide à la décision multicritère III.1.1 Généralités sur l’aide à la décision multicritère Dans ce cadre d’étude, le système d’aide à la décision ne sert pas à évaluer la meilleure décision ou stratégie comme c’est souvent le cas. La décision reste du ressort du poste de commandement. Notre objectif se situe en amont, avant la stratégie à employer, il s’agit de caractériser la situation et de mieux identifier la source. L’aide à la décision multicritère peut s’appliquer à l’identification du produit chimique, à la comparaison de REX ou à l’évaluation d’hypothèses sur le terme source. Il s’agit alors de méthodes permettant de vérifier la véracité d’un ensemble d’hypothèses correspondant aux informations utiles aux décideurs et aux données nécessaires aux modèles. « L’aide multicritère à la décision vise, comme son nom l’indique, à fournir à un décideur des outils lui permettant de progresser dans la résolution d’un problème de décision où plusieurs points de vue, souvent contradictoires, doivent être pris en compte. » [Vincke, 1989] Les progrès dans le domaine de la technologie de l’information mettent à disposition d’importantes quantités de données pouvant alimenter le processus d’aide à la décision. Mais cela pose de nouveaux défis car il faut pouvoir traiter ces données rapidement et efficacement en développant des outils pour permettre des recherches, tris, affichages et autres traitements. L’aide à la décision à ce niveau peut s’illustrer par une procédure automatique, comme les algorithmes utilisés dans certains domaines effectuant la recherche de retour d’expérience similaire au cas traité [Chusseau et al., 2000]. L’automatisation de cette tâche nécessite de pouvoir comparer les cas entre eux, ce qui peut être trop complexe, voire impossible. Les grands principes des méthodes multicritères sont détaillés dans [Merad, 2003] avec une approche générale en trois phases : - la formulation du problème (description du contexte et processus décisionnel, construction des actions, identification des situations de décision et élaboration des critères), - l’exploitation qui consiste à trouver une procédure d’agrégation des informations, - et la phase de recommandation comprenant une analyse de sensibilité et de robustesse entraînant si besoin une nouvelle itération du processus. 51 Chapitre III Les méthodes d’aide à la décision Nous privilégierons pour l’explication des différentes méthodes, un découpage en trois principales étapes qui s’applique à tout domaine et contexte. - Lister les hypothèses à vérifier (ou les actions potentielles). - Lister les critères à prendre en considération, ceux permettant la comparaison des différentes hypothèses (ou actions). - Evaluer ces différentes possibilités à l’aide d’un ou plusieurs critères pour proposer la ou les meilleures solutions. La deuxième étape consistant à lister les critères peut être décomposée en deux étapes plus explicites [Ben Mena, 2000] : - Dresser la liste des critères à prendre en considération. - Et établir le tableau des performances de ces critères pour chaque action. Cette notion de performances est expliquée ci-dessous, dans la deuxième étape. La première étape consistant à lister les hypothèses peut être implicite lorsqu’il n’y a qu’une hypothèse et un résultat binaire (Cette zone est-elle à risque ?) ou que les possibilités sont contraintes par le contexte (Choix d’un candidat parmi les postulants). Pour des cas plus complexes, une étude est souvent nécessaire pour définir la liste des actions possibles la plus exhaustive et ce travail fait souvent appel à l’aide d’un ou plusieurs experts. L’ensemble est défini en extension par énumération des actions lorsque ceci est envisageable ; dans le cas où l’ensemble est trop grand, voire infini, il est défini par compréhension en passant par des propriétés caractéristiques ou des contraintes mathématiques [Vincke, 1989]. Ensuite, il s’agit de recenser les critères qui vont permettre d’évaluer les différentes hypothèses. Ces critères sont des « indices » que l’on peut rattacher à un ensemble restreint d’hypothèses. Essentiellement, deux approches ont été proposées pour construire une famille de critères : - L’approche descendante qui consiste à partir de l’objectif global et à le décomposer en sous objectifs ; et ainsi de suite jusqu’à obtenir des attributs mesurables. - La deuxième approche, dite du « bas vers le haut » consiste à identifier toutes les indicateurs élémentaires et à les structurer en axes de signification autours desquels on construit les critères. Les méthodes multicritères nécessitent de définir un degré d’importance entre les différents critères qu’il soit général (théorie de l’utilité multiattribut) ou non. Cette « pondération » (hiérarchisation) peut être le résultat d’un apprentissage sur un certain nombre de cas (importance du retour d’expérience) ou être définie par un groupe d’experts. Dans [Mendoza et al., 52 Chapitre III Les méthodes d’aide à la décision 2000] plusieurs méthodes sont comparées pour évaluer l’importance de critères et les classer d’après des avis d’experts. [Purnomo et al., 2005] utilisent un modèle symbolique basé sur la méthode NIAM/ORM pour formaliser les connaissances des experts. La méthode des cartes de Simos est utilisée dans [Merad et al., 2004] pour la fusion d’avis d’experts sur l’importance des critères. Les « poids » ainsi calculés sont alors utilisés par la méthode de surclassement multicritère ELECTRE-TRI. Cette évaluation des différentes hypothèses constitue la dernière étape qui vise à déterminer la ou les meilleures solutions compte tenu du contexte et des informations disponibles ou encore à ordonner les différentes solutions. Le domaine de l’aide multicritère à la décision s’est considérablement développé depuis les années 70 et les procédures multicritères sont nombreuses et ne conduisent pas nécessairement à la même solution. « L’aide multicritère à la décision va de pair avec la quête non pas d’une vérité mais d’un mode d’insertion dans un processus de décision pour y apporter des éclairages, des éléments de réponse à des questions dont la formulation peut être plus ou moins confuse et évolutive. » [Roy, 1975] La méthode de sélection la plus simple consiste à ramener chaque choix possible à un coût, à une valeur numérique facilitant la comparaison. Ce coût peut être directement l’un des critères (nombre de victimes) ou être un critère de synthèse qui est le résultat d’une fonction combinant l’ensemble des critères. La difficulté réside alors dans le choix de la fonction. Il existe des méthodes dont le mécanisme n’est pas de ramener chaque choix à un coût comme les méthodes de surclassement. Les méthodes peuvent aussi être différenciées par leur mode de déroulement. Les méthodes les plus répandues fournissent un résultat issu d’un calcul déterministe tandis que les méthodes interactives alternent les étapes de calcul et les étapes de dialogues destinées à obtenir des nouvelles informations de la part des décideurs en réaction aux solutions proposées. III.1.2 Différentes approches Ces méthodes peuvent être réparties en trois grandes familles : 1) La théorie de l’utilité multiattribut (courant anglo-saxon), qui consiste à calculer un critère unique de synthèse permettant de comparer les différentes décisions possibles. [Gérard-Varet et al., 1976] l’interprètent comme la « traduction numérique de la description qualitative du choix contenue dans la définition de la structure de préférence ». Ensuite, l’évaluation de chaque solution (ou action) revient à maximiser une 53 Chapitre III Les méthodes d’aide à la décision fonction qui intègre tous les points de vue à prendre en compte. Ces méthodes sont possibles uniquement avec l’hypothèse qu’il existe une fonction d’utilité mettant en relation les différents critères. La forme la plus utilisée est le modèle additif qui est le plus simple analytiquement : la fonction d’utilité est une moyenne pondérée des différents critères. Il existe de nombreuses méthodes qui différent notamment par les conditions d’agrégations des critères, les formes des fonctions d’utilité et les méthodes de construction de ces fonctions. Dans [Zoller et al., 1992], les techniques monocritères sont divisées en trois familles : o La première famille est celles des méthodes d’analyse avantages-coûts (cost benefit analysis). o La deuxième famille s’appuie sur la théorie de l’utilité multidimentionnelle. o Et enfin, il existe aussi des « techniques de programmation mathématique » comme le « goal programming ». Les principales méthodes sont : MAUT, SMART, UTA, TOPSIS, AHP et G.P. SAATY. Mais toutes ces méthodes reposent sur l’hypothèse forte de l’existence d’une fonction d’utilité ce qui implique qu’il n’y a ni incomparabilité, ni intransitivité entre les différentes solutions. Calcul d’un coût pour l’évaluation des conséquences Pour l’évaluation des conséquences de scénarios d’accident, aucune méthode calculant un critère de synthèse n’a été recensée. Plusieurs critères peuvent être calculés, mais ils ne sont pas « directement » comparables (enjeux économiques, vies humaines, …) et ce sont aux experts de se faire leur opinion à partir de ces valeurs, que ce soit un critère tenant compte de l’ensemble des conséquences ou se limitant aux cibles humaines. Comme signalé dans [Giampiero E.G. Beroggi et al., 1997], la probabilité de décès est le paramètre le plus important dans l’évaluation des conséquences. [Leonelli et al., 1999] restreint les conséquences aux cibles humaines (blessures légères, graves et létales) et le seul critère retenu au final pour l’évaluation du risque est le nombre de décès. Dans [Egidi et al., 1995] également, le seul critère retenu est le nombre de décès potentiel pour des raisons de simplification. 54 Chapitre III Les méthodes d’aide à la décision Cela simplifie la prise de décision car l’unicité du critère rend triviale la comparaison des différents scénarios. De plus, la cible considérée est unique, cible humaine, ce qui diminue les calculs de modélisation puisqu’on ne tient pas compte des effets des flux sur les matériels et l’environnement. L’évaluation peut être réalisée sur l’ensemble des critères avec une acceptation uniquement si tous des critères satisfont une condition comme une valeur seuil (utilisation dans un cadre réglementaire : détermination d’un site à risque). Il peut s’agir d’une comparaison monocritère avec utilisation du critère suivant en cas d’égalité. Cela sous-entend de classer les critères par ordre d’importance (blessure létale > blessure grave > blessure légère > … > dégâts matériels > …). Ces méthodes monocritères sont attrayantes car, lorsqu’il est possible de les utiliser la prise de décisions devient triviale. En effet, si l’on suppose l’existence d’une fonction d’utilité, le problème est dit « bien posé » et connaître une telle fonction conduit facilement à calculer un ordre total de l’ensemble des solutions. Cependant bien qu’il s’agisse d’un problème « bien posé » au sens mathématique, on ne peut affirmer qu’il est bien formulé et qu’il correspond à la situation car il repose sur des conditions fortes : transitivité et comparabilité de l’ensemble des critères. Comme le mentionne J.-M. Martel : « Nombreuses sont les situations concrètes où les conséquences sont suffisamment complexes pour qu’une seule fonction objectif (un seul critère) ne puisse appréhender adéquatement toute l’information nécessaire à la comparaison globale des actions (projets, options, scénarios…). » [Martel, 1999]. Les approches monocritères ne seront pas détaillées d’avantage car elles ne sont pas des mieux adaptées à l’analyse et l’identification de données en situations d’urgence (terme source par exemple). En effet, les critères disponibles en situation d’urgence ne sont pas tous comparables, il n’existe pas d’échelle universelle permettant de comparer l’ensemble des critères. De plus, certains critères ne peuvent être associés à une valeur numérique. 55 Chapitre III Les méthodes d’aide à la décision 2) Les méthodes de surclassement : Ce concept fondé par B. Roy consiste à passer d’une relation de comparaison établie sur chaque critère à une relation de comparaison globale. Définition (Roy, 1974) : « Une relation de surclassement est une relation binaire S définie dans A telle que aSb si, étant donné ce que l’on sait des préférences du décideur et étant donné la qualité des évaluations des actions et la nature du problème, il y a suffisamment d’arguments pour admettre que a est au moins aussi bonne que b, sans qu’il y ait de raison importante de refuser cette affirmation ». (A étant l’ensemble des décisions) En plus de définir les préférences entre les différentes solutions deux à deux, certaines méthodes introduisent des seuils de discriminations (préférence, indifférence) et même de veto, pour chacun des critères afin de modéliser localement les choix du décideur. Les principales méthodes ou familles de méthodes sont : ELECTRE, PROMETHEE, ORESTE, QUALIFEX. 3) Les méthodes interactives ou méthodes d’agrégation locale alternent les étapes de calcul et les étapes de dialogues avec les décideurs destinées à obtenir une préférence locale en réaction à la solution proposée. Il ne s’agit pas comme pour les deux autres approches, d’utiliser des règles explicitées pour apporter une réponse synthétique globale. L’un des intérêts de cette approche est qu’elle peut s’appliquer lorsque le nombre de choix possibles est très grand voire infini. La technique consiste, à partir d’une première solution aussi bonne que possible, à étudier itérativement les solutions proches qui pourraient s’avérer meilleures. Chaque itération peut se décomposer en trois phases [Roy, 1975] : o Une phase de recherche au cours de laquelle il s’agit d’exploiter les informations recueillies à l’itération précédente afin de mieux définir les préférences du décideur. o Une phase de réinitialisation qui consiste à utiliser toutes les informations disponibles pour élaborer une nouvelle proposition à soumettre aux décideurs. o Une phase de réaction où le décideur émet un avis sur la dernière proposition, fournissant ainsi de nouvelles informations pour l’itération suivante. Ces trois familles de méthodes sont encore appelées par B. Roy, approche du critère de synthèse évacuant toute incomparabilité, approche du surclassement 56 Chapitre III Les méthodes d’aide à la décision de synthèse acceptant l’incomparabilité et approche du jugement local interactif avec itération essai-erreur, tandis que A. Schärlig parle de méthodes d’agrégation complètes, partielles ou locales [Schärlig, 1985]. III.1.3 Conclusions sur les méthodes multicritères Ces méthodes, par le calcul d’un critère unique ou par des mécanismes de comparaisons globales, permettent de sélectionner un ou plusieurs choix comme étant les meilleurs compte tenu du contexte et des informations disponibles. Cette hiérarchisation des choix possibles constitue en elle-même la prise de décision. Leur intérêt apparait, en particulier, dans le cas non trivial, où les choix possibles ne constituent pas un pré-ordre total. La première critique à l’utilisation des méthodes multicritères en situation d’urgence est la complexité des situations qui rend difficile les phases d’énumération des actions potentielles et des critères à prendre en considération. De plus, « une action envisagée est un moyen qui s’apprécie en fonction du résultat attendu avec raison ou non par rapport aux aspects pertinents du problème. » [Zoller et al., 1992]. La préférence est déterminée par rapport aux conséquences espérées, pour déterminer quelles actions entreprendre. Mais en situation d'urgence il règne une forte incertitude quant aux conséquences des actions entreprises. La principale difficulté est de lever cette incertitude. III.2 Les arbres de décision III.2.1 Généralités sur les arbres de décision Développées autour de 1960, ces méthodes ont été utilisées pour des problématiques d’analyse discriminante [Belson, 1959; Friedman, 1977] et de régression [Morgan et al., 1963]. « Délaissées par les statisticiens, elles ont connu un regain d’intérêt avec les travaux de Breiman & al. (1984) qui en ont renouvelé la problématique. Elles sont devenues un des outils les plus populaires du data mining ou fouille de données en raison de la lisibilité des résultats. » [Saporta, 2006] Les arbres8 de décisions sont une technique non paramétrique capable de déterminer, parmi un ensemble complexe de variables, celles qui sont les plus importantes ainsi que leurs interactions pour expliquer une variable à analyser. 8 Arbre : Un graphe non-orienté G = (X,E) est un arbre s’il est connexe sans cycle. Il comporte un sommet particulier appelé racine. Les sommets de degré égal à 1 sont appelés feuilles. Les autres sommets sont les nœuds. 57 Chapitre III Les méthodes d’aide à la décision Les arbres de décision permettent, en effet, de faire intervenir un ensemble complexe de variables descriptives (descripteurs) pour créer des groupes homogènes d’individus en cherchant à maximiser ou à minimiser au sein des groupes la fréquence d’une même valeur de la variable à expliquer. Ils permettent d’identifier les variables descriptives les plus pertinentes (les plus discriminantes). De ces arbres, il est possible d’extraire des règles de décision permettant de prédire la variable à expliquer. Ces méthodes sont également capables de prédiction, calcul de valeur ou discrimination. Après une phase d’apprentissage au cours de laquelle un arbre a été construit à partir d’exemples supervisés, il peut être utilisé pour discriminer de nouveaux exemples. L’arbre de segmentation utilise alors la description des nouveaux pour lui associer une classe. Chaque nœud de l’arbre correspond à un descripteur et les branches correspondent aux valeurs possibles. De la sorte, en suivant une séquence de nœuds et de branches depuis la racine jusqu’à une feuille, on affine progressivement la description des individus jusqu’à obtenir une description correspondant aux individus d’une classe. Chaque branche correspond à une conjonction de conditions sur les descripteurs des individus. Une classe ne correspond pas toujours à un unique chemin de la racine à une feuille. Dans ce cas, les individus de cette classe sont ceux qui suivent au moins l’un de ces chemins. La règle de décision prend alors la forme d’une disjonction de conjonctions de conditions. L’objectif de la segmentation est d’expliquer la partition connue sous forme de K classes à l’aide de prédicteurs décrivant les objets. Les arbres peuvent être utilisés pour prédire une variable quantitative (arbres de régression) ou qualitative (arbres de décision, de classification, de segmentation) à l’aide de prédicteurs quantitatifs ou qualitatifs. Le terme de partitionnement récursif est parfois utilisé [Saporta, 2006] A la distinction faite en fonction de la variable à expliquer s’ajoute le type de division suivant qu’elle est binaire ou n-aire. Graphe non-orienté : Un graphe non-orienté est un couple (X,E) où X est un ensemble de sommets et un ensemble E d’arêtes qui est inclus dans P² (X) (ensemble des parties à deux éléments de X). Cycle : un cycle est une chaine fermée : une suite d’arêtes µ={x1,…xk} telles que (xi,xi+1)∈E pour i∈{1,…,k-1} sans répétition d’arêtes et avec x1=xk 58 Chapitre III Les méthodes d’aide à la décision Hiérarchisation des critères L’arbre de segmentation introduit une hiérarchisation des critères (Figure 7). Les critères proches de la racine ont plus d’importance que ceux qui en sont éloignés. Dans le cas des arbres de segmentation, plus un critère est proche de la racine et plus il est discriminant vis-à-vis de la population totale. Figure 7 : Arbre de segmentation avec hiérarchisation des critères Hiérarchie de concepts Ces arbres de segmentation n’introduisent pas de hiérarchie des concepts comme il existe dans certains domaines comme la taxonomie des espèces (Figure 8). Figure 8 : Arbre de segmentation avec hiérarchisation des concepts III.2.2 Développement d’un arbre binaire Formulation du problème Soit Ω la population composée d’individus xi, pour laquelle on connait a priori une partition en K classes Cj (K=2). Chaque individu est décrit par p 59 Chapitre III Les méthodes d’aide à la décision descripteurs notés yj. La valeur d’un individu xi pour le critère yj est notée yj(xi). sa classe est notée C(xi). Principe de l’algorithme Le procédé consiste à la première étape à diviser l’échantillon Ω en deux sous ensembles ΩT, ΩF à l’aide d’un des prédicteurs yj*. Ensuite, la division est réitérée séparément dans chaque sous-ensemble et ainsi de suite. Pour chaque variable explicative, il faut donc trouver la meilleure partition de ses valeurs ou modalités en deux sous-ensembles selon un critère d’explication de yj*. Il s’agit donc d’une classification descendante à but prédictif opérant par sélection de variables : chaque classe doit être la plus homogène possible vis à vis de yj*. Partant de l’ensemble on cherchera à le diviser en deux sousensembles d’effectifs n1 et n2 tels qu’en moyenne on améliore le plus possible l’homogénéité des deux classes. Algorithme récursif de construction d’un arbre de segmentation binaire Soit Ω : La population de X individus notés xi avec i∈[1..X] Ψ : L’ensemble comprenant un nombre Y de descripteurs yj Construction_Arbre_de_Segmentation ( Ω , Ψ ) 1 : Recherche du meilleur descripteur yc* (au sens du critère de division - Cf. Note 2) Test toutes les divisions possibles ∀c∈[1.. Y] (Cf. Note 1) 2 : Calcul des deux partitions obtenues par division selon yc* ΩT={ xi∈Ω / yc*( xi)=1 } ΩF={ xi∈Ω / yc*( xi)=0 } 3 : La procédure est répétée sur les deux partitions obtenues pour construire les sous-arbres Construction_Arbre_de_Segmentation( ΩT , Ψ - yc* ) Construction_Arbre_de_Segmentation( ΩF , Ψ - yc* ) 4 : Conditions d’arrêt La construction du sous-arbre s’arrête : - Lorsque la taille inférieure de l’effectif d’une partition est atteinte. 60 Chapitre III Les méthodes d’aide à la décision - Lorsque la borne inférieure du seuil de similarité d’une partition est atteinte. - Lorsque tous les descripteurs ont déjà servi à faire une division. Dans ce cas, au moins un sous-ensemble final comporte des individus qui ne sont pas homogènes. Note 1 : Division par rapport à la valeur d’un descripteur Le nombre de divisions en deux sous-ensembles que l’on peut réaliser à l’aide d’un prédicteur (et que l’on doit donc examiner pour choisir la meilleure) dépend de la nature de ce prédicteur. - Si x est qualitatif ordinal à m modalités et que les coupures doivent respecter l’ordre, il n’y a m-1 dichotomies. - Il en est de même si x est numérique à k valeurs distinctes, il y a k-1 dichotomies ou coupures possibles entre deux valeurs. - Si x est qualitatif nominal à m modalités non ordonnées, il y a 2m-1 –1 dichotomies possibles. En présence d’un prédicteur qualitatif à m modalités, une autre solution consiste à construire des arbres non binaires en découpant en m sous ensembles. En général, cette approche n’est pas bonne car, avec m trop grand par rapport à l’échantillon, elle conduit à des subdivisions avec trop peu d’observations et souvent non pertinentes. L’intérêt des arbres binaires est de pouvoir regrouper les modalités qui ne se distinguent pas vis à vis de y. Note 2 : Critère de division Pour déterminer le descripteur suivant lequel sera faite la division, une mesure d’impureté des sous-ensembles vis-à-vis des classes est réalisée. Cette mesure doit être nulle si tous les individus appartiennent à la même classe, maximale si les classes sont également représentées. Les mesures les plus usuelles sont l’entropie E et l’indice de Gini G [Saporta, 2006]. E = ∑ nk . n k . ln n k =1 n Eq. 1 G = nk . nk . 1 − , G ∈ [0;1] n k =1 n Eq. 2 K K ∑ S’écrivant encore : G = 1 − K nk . ∑( n ) 2 k =1 Avec K le nombre de classes et 61 nk . la fréquence de la classe d’indice k n Chapitre III Les méthodes d’aide à la décision Plus G est faible et plus le nœud est pur. L’indice de Gini est utilisé dans la méthode CART (Classification And Regression Tree) dont une vue d’ensemble théorique et méthodologique est détaillée dans [Breiman et al., 1984]. Pour une présentation de l’algorithme de construction d’un arbre de segmentation avec la méthode CART, complétée d’exemples, se reporter à [Yohannes et al., 1999a; Yohannes et al., 1999b] Il existe d’autres critères comme « Twoing » notamment utilisé dans le logiciel Matlab et le test du χ 2 de Fisher utilisé dans la méthode CHAID (Chi-square Automatic Interaction Detection) mise au point par Kass (1980). n ×n n − k . .l K L kl n χ 2 = ∑∑ , χ 2 ∈ [0;+∞] n × n k. .l k =1 l =1 n 2 Eq. 3 Le lecteur intéressé trouvera un tutorial sur la méthode CHAID dans [Rakotomalala, 2005]. Les méthodes CHAID et CART sont implémentées dans le logiciel StatBox Pro de Grimmer Soft. L’aide en ligne donne des indications sur ces deux méthodes [Grimmer Soft, 2003]. A noter qu’il existe également d’autres méthodes, notamment ID3 utilisant l’indice de Twoing [Quinlan, 1986]. L’utilisation des critères de division en fonction de l’application (classification, régression, …) est discutée dans [Leland, 1992]. Dans la suite de ce mémoire, les arbres de décision sont destinés au traitement de données binaires. III.2.3 Arbre binaire à variables binaires Pour le cas particulier des arbres binaires dont la variable à expliquer est binaire ainsi que les descripteurs, la construction de l’arbre s’en trouve simplifiée. A chaque nœud, le descripteur étant binaire, la division est unique. D’une part l’ensemble des individus vérifiant le descripteur xy*=1 (la substance chimique flotte) et d’autre part ceux qui ne le vérifient pas xy*=0 (la substance chimique coule). Lorsqu’il n’y a que deux modalités en proportions p et 1-p l’indice de Gini vaut 2p(1-p) et a un comportement très proche de l’entropie [Saporta, 2006] et les indices de Gini et de Twoing sont équivalents [Maimon et al., 2005]. 62 Chapitre III Les méthodes d’aide à la décision III.2.4 Conditions d’arrêt et élagage Pour les méthodes CART, CHAID, ainsi que toutes méthodes descendantes (en distinction des méthodes ascendantes telles que les CAH), se pose le problème de savoir où arrêter la construction de l’arbre. Faut-il s’arrêter lorsque chaque feuille de l’arbre constitue un groupe homogène devant y ou qu’il n’y ait plus de critères permettant d’améliorer la segmentation ? Le nombre de nœuds terminaux croit exponentiellement avec le niveau de l’arbre et il est nécessaire de fixer des limites, sinon l’arbre est trop grand et inutilisable car s’ajustant trop bien aux données d’apprentissage. L’un des intérêts des arbres de segmentation est de proposer, au final, une méthode de décision (ou de classification). Mais, construire un arbre « complet » peut permettre une bonne discrimination de l’ensemble d’apprentissage (de l’échantillon ayant servi à sa construction), mais se révéler trop spécialisé et ne pas être capable de généraliser l’ensemble des possibles (d’être applicable à l’ensemble des éléments hors ensemble d’apprentissage). De même que d’autres méthodes comme les réseaux de neurones, les arbres de décisions construits sur un ensemble d’apprentissage tendent à se spécialiser, à apprendre par cœur et perdent de leur pouvoir de généralisation. Pour éviter d’avoir des arbres de décision trop spécialisés, plusieurs approches existent. La profondeur de l’arbre peut être définie arbitrairement. Mais cela ne garantit en rien la représentativité de l’arbre. Cette limitation de l’arbre n’intervient que pour améliorer la lisibilité et la recherche de critères discriminants aux premiers étages de l’arbre. Une autre solution consiste à ajouter un test statistique pour stopper la division de l’arbre. On parle alors de pré-élagage. C’est la solution adoptée par la méthode CHAID qui peut interrompre la construction de l’arbre en fonction du test d’indépendance du χ 2 utilisé pour vérifier l’homogénéité des classes. Mais ces tests statistiques nécessitent l’emploi de seuils arbitraires d’où les nombreuses critiques à leur égard. Avec les travaux de [Breiman et al., 1984] une nouvelle approche voit le jour pour devenir la plus répandue. La méthode CART consiste à ne plus fixer de seuil mais à diviser les données en deux ensembles disjoints, l’un destiné à l’apprentissage et l’autre à la validation. En premier, l’arbre complet est construit lors de l’apprentissage. Ensuite une phase de post-élagage est réalisée sur un ensemble de validation pour déterminer les sous-arbres terminaux devant être supprimés et éviter ainsi la spécialisation de la méthode d’identification. 63 Chapitre III Les méthodes d’aide à la décision III.2.5 Un arbre non optimal L’algorithme de construction de l’arbre présenté en III.2.2 ne permet pas de trouver la solution optimale en termes de complexité de l’arbre obtenu (nombre de nœuds et nombre de critères nécessaires). La complexité du problème étant NP-complet9, l’algorithme de construction est une heuristique de complexité maximum O(C) = C × X × D avec C le nombre de critères, X le nombre d’individus et la population et D le nombre de dichotomies possibles. Pour des critères binaires la complexité est O(C) = C × X . Ne pouvant tester l’ensemble des solutions, l’heuristique consiste à limiter le nombre de combinaisons en n’effectuant qu’une recherche locale des critères discriminants. L’exemple suivant réalisé avec des données fictives (Tableau 4), illustre ce problème en exhibant d’une part la solution obtenue avec les méthodes classiques (Figure 9) et d’autre part la solution optimale (Figure 10). Le critère n°1 est le plus discriminant (plus fort χ 2 ) si l’on effectue une recherche locale, cependant les critères n°2 et n°3 sont parfaitement complémentaires et, combinés, deviennent plus discriminants que le premier. Il existe donc un arbre plus intéressant en nombre de critères que celui obtenu par les méthodes classiques (CHAID, CART, …) Tableau 4 : Exemple fictif illustrant la construction d’arbre non optimal Individus Classe 1 2 3 4 5 6 7 8 9 10 11 χ2 9 A A A A A B B B B B B Critère Critère Critère n°1 n°2 n°3 1 1 0 0 1 0 1 1 0 0 0 1 1 0 1 0 1 1 1 1 1 0 1 1 1 0 0 0 0 0 0 0 0 1,45455 0,54545 0,54545 Problème NP-complet : Problème dont la recherche de la solution optimale nécessite de tester un nombre exponentiel de solutions par rapport à la taille de l'instance. 64 Chapitre III Les méthodes d’aide à la décision Figure 9 : Arbre de segmentation (méthodes CHAID) Figure 10 : Arbre de segmentation optimal 65 Chapitre III Les méthodes d’aide à la décision III.2.6 Conclusions sur les arbres de décision Il existe différentes méthodes pour calculer des arbres de décision. Le principal avantage est l’extrême lisibilité qui fait que tout utilisateur peut comprendre et utiliser un arbre. Parmi les autres avantages figure le fait de pouvoir utiliser des prédicteurs de toute nature, de ne faire aucune hypothèse sur leurs distributions, de hiérarchiser et sélectionner les prédicteurs. Enfin, la construction de la règle de décision est triviale à partir de tels arbres (binaires ou n-aires). Malgré cela, les inconvénients ne sont pas négligeables : les arbres sont instables : de légères variations dans les données peuvent conduire à d’autres choix de nœuds qui deviennent irréversibles puisque chaque division détermine les autres [Saporta, 2006]. Les arbres ne peuvent être utilisés qu’avec de grands échantillons de plusieurs centaines ou milliers d’observations. 66 Chapitre IV Identification des substances chimiques CHAPITRE IV IDENTIFICATION DES SUBSTANCES CHIMIQUES IV. Guide de lecture : Les urgentistes sont parfois confrontés à un problème de taille lorsque la substance chimique en cause n’est pas identifiée. Et les CMIC ne disposent pas toujours du matériel nécessaire à son identification, alors que la connaissance de la substance chimique apporte des informations indispensables à la bonne conduite de l’intervention. La première partie de ce chapitre propose un rapide tour d’horizon des technologies utilisées par les matériels portables de détection et d’identification des substances chimiques. La faible diffusion au sein des CMIC de matériels de pointe tels que les spectromètres, constitue une limite à leur capacité d’identification d’une substance chimique. En l’absence de ces matériels, une approche logicielle est envisageable. Elle sera étudiée dans une deuxième partie. Lorsque les moyens matériels et logiciels ne sont plus suffisant à l’identification précise d’une substance, la solution étudiée est d’utiliser les données opérationnelles disponibles afin d’identifier les dangers qui y sont liés, et fournir ainsi un premier niveau d’aide à la décision. Dans cette optique, et tirant partie des limites exposées, une méthodologie de recueil des données et un logiciel d’aide à l’identification des dangers liés aux substances chimiques ont été développés. 67 Chapitre IV Identification des substances chimiques IV.1 Introduction IV.1.1 Identifier les substances chimiques : une information primordiale En situation d’urgence d’origine chimique, les services de secours ont besoin de connaître les substances chimiques10 impliquées afin de définir la stratégie d’intervention appropriée. La connaissance des substances chimiques permet de déterminer les dangers11 qui leur sont associés, de définir le périmètre de sécurité ou, encore, de choisir les matériels adaptés à l’intervention (emploi d’eau ou de mousses, protections individuelles pour les substances toxiques, pompes adaptées aux liquides corrosifs, etc.). Cette information permet également d’utiliser les fiches réflexes des sapeurs-pompiers qui reposent inéluctablement sur la connaissance de l’état physique de la substance (gaz, liquide, solide, fumées) et des dangers associés (inflammable, toxique, corrosif, …). Afin d’identifier rapidement les substances chimiques, la réglementation européenne impose un marquage des substances dangereuses (code ONU sur les emballages et les transports, code danger, pictogramme des dangers, …). Mais les services de secours n’ont pas toujours connaissance de cette information. En effet, la source de la dispersion peut ne pas être localisée précisément (odeur suspecte, malaise dans les personnes aux alentours) ou il peut ne pas y avoir de marquage sur un stockage (étiquette absente, plaque danger illisible ou détruite, …) qui rend difficile l’identification de la substance et, par conséquent, l’intervention qui doit s’effectuer dans un climat d’incertitude. 10 Substances chimiques : Eléments chimiques et leurs composés à l’état naturel ou tels qu’obtenus par tout procédé de production, contenant tout additif nécessaire pour préserver la stabilité du produit et toute impureté dérivant du procédé, à l’exclusion de tout solvant qui peut être séparé sans affecter la stabilité de la substance ni modifier sa composition. (Directive 67/548/CE) 11 Danger : Propriété intrinsèque d’une substance dangereuse ou d’une situation physique de pouvoir provoquer des dommages pour la santé humaine et/ou l’environnement. (Directive 96/82/CE dite « SEVESO II ») 68 Chapitre IV Identification des substances chimiques Deux situations sont possibles. 1) Le produit en cause est identifié rapidement, car s’échappant d’un conteneur fixe ou mobile dument répertorié. C’est évidemment le cas le plus favorable. Il est alors aisé, par simple consultation des fichiers (guide orange des sapeurs-pompiers genevois, guide de l’intervention face aux risques chimiques de la Fédération nationale des sapeurs-pompiers, fiches toxicologiques de l’INRS, etc.) et des banques de données existantes, de connaitre les risques encourus par les victimes et les mesures spécifiques a prendre pour en diminuer l’incidence, le recours a un centre antipoison pouvant trouver ici toute son utilité. Par ailleurs, cette situation favorable offre aussi parfois l’avantage de permettre une évaluation de la quantité de produit susceptible d’être libérée. 2) Le produit en cause est inconnu, car s’échappant d’un conteneur détérioré, non identifiable ou parce qu’issu de réactions chimiques mal déterminées, comme c’est souvent le cas lorsque le dégagement du produit est consécutif à un incendie ou à une explosion. Dans ce cas, « en l’absence de moyens spécialisés, c’est seulement l’observation des victimes et des troubles qu’elles présentent qui permet d’évoquer le type de produit auquel on a à faire » [Nemitz et al., 2000]. IV.1.2 Des situations inhabituelles Bien que de telles interventions au cours desquelles la substance chimique n’est pas identifiée ne constituent pas le quotidien des services de secours ; elles surviennent et font partie des cas à prendre en considération, avec leur lot de difficultés supplémentaires pour la prise de décisions, dues au manque d’information sur les substances chimiques impliquées. Les entretiens avec les sapeurs-pompiers des CMIC révèlent que la majorité des interventions où la substance chimique n’est pas connue font suite à des appels téléphoniques de personnes remarquant une odeur suspecte incommodante. A l’origine de ces pollutions, il s’agit souvent de composés soufrés ou d’hydrocarbures présents dans les égouts et difficile à identifier précisément. 69 Chapitre IV Identification des substances chimiques L’étude d’expérience des fait retours apparaître une autre origine ; lors d’accidents de TMD également, la substance chimique n’est pas toujours connue dans les premiers instants. Le 7 mars 2001, la plaque orange détruite dans l’incendie, ne permet plus Figure 11 : Accident sur l’autoroute A9 (Midi-Libre - 7 mars 2001) d’identifier l’éthylène glycol que transporte le camion citerne accidentée sur l’autoroute A9 . En 1979, dans l’accident de plus grande envergure à Toronto, le contenu de certains wagons est rendu impossible à identifier en raison des flammes et il est alors difficile de vérifier la présence redoutée de polychlorobiphényle (PCB). L’identification est d’autant plus complexe que plusieurs produits chimiques sont présents. Ce REX est détaillé dans [Lagadec, 1981]. Dans un contexte différent, il y a également le cas des attentats où la nature du produit toxique est volontairement dissimulée, masquée par un autre produit comme dans le cas de l’attentat au sarin à Tokyo en 1995. D’après la base de données A.R.I.A. (Analyse, Recherche et Information sur les Accidents) du Bureau d’Analyse des Risques et Pollutions Industrielles (BARPI) [BARPI, 2008], seulement 18 accidents avec des substances chimiques non identifiées ont été recensés entre janvier 1987 et août 2006. Il s’agit d’accidents pour lesquels la substance chimique reste non identifiée à ce jour, ou, du moins, jusqu’à la réalisation du retour d’expérience. Il n’y a pas de statistiques sur les situations où la substance n’était pas connue dans les premiers instants et ayant nécessité l’utilisation de matériel d’identification. Dès lors que la substance est identifiée, même postérieurement à la phase d’urgence, le REX n’en fait pas état. Dans la base de données, la faible proportion de retours d’expérience pour lesquels il est fait mention de l’absence d’identification est donc inférieure au nombre réel de ces situations d’urgence. Pour palier ce manque d’information, la CMIC doit alors effectuer une identification qui n’est pas toujours possible avec les moyens disponibles. 70 Chapitre IV IV.2 Les Identification des substances chimiques moyens de détection et d’identification existants IV.2.1 Les matériels de détection au sein des CMIC IV.2.1.1 Une grande variété de matériels Dans ces cas de figure où la substance chimique n’est pas connue, les sapeurs-pompiers ont à leur disposition des matériels de détection pour aider à l’identification. Il existe toute une diversité de détecteurs spécifiques ou génériques, permettant d’identifier un liquide, un gaz ou les vapeurs émises par un liquide ou un solide (tubes colorimétriques, capteurs électrochimiques, détecteur par infrarouge, spectromètres de masse, …). Aujourd’hui, certains de ces matériels équipent les CMIC afin de détecter certaines substances (AP4C, Appareil Portable pour le contrôle de la Contamination Chimique, utilisé dans la détection de toxiques de guerre) et éventuellement d’effectuer une mesure de concentration d’un produit identifié. En l’absence d’identification, certains de ces matériels apportent également une aide à l’identification au travers d’information comme l’explosivité, le pH ou en indiquant la famille de produits et plus rarement une analyse qualitative et quantitative. Ces données sont synthétisées dans le tableau ci-dessous (Cf. Tableau 5), recensant les détecteurs portables et autonomes, ainsi que les matériels transportables12 plus rarement disponibles en CMIC. Toutes les CMIC ne sont pas équipées de matériels permettant une identification fine des substances rencontrées. Certains détecteurs initialement destinés à un usage de laboratoires (les spectromètres de masse par exemple) sont rarement utilisés sur le terrain en raison des difficultés d’acheminement (poids, volume, …) et de complexité de mise en œuvre et d'interprétation des résultats. Plusieurs unités disposent tout de même de ce type de matériel (UISC 1, BMPM), D’autres détecteurs, destinés à une utilisation terrain car peu encombrants et dont le mode d’emploi est plus simple, font partie de l’équipement des véhicules CMIC des sapeurs-pompiers. Bien que l’équipement varie d’une CMIC à l’autre en fonction des risques propres au département concerné et de l’organisation et des objectifs du SDIS, chaque cellule doit 12 Matériel transportable : matériel acheminé par un véhicule dédié jusqu’au lieu de rejet de la substance chimique prélevée pour analyse. 71 Chapitre IV Identification des substances chimiques disposer au minimum d’explosimètres, de papiers pH et de tubes réactifs. Ces matériels équipent aussi bien les cellules de reconnaissance que la cellule d’identification qui composent les CMIC [FNSPF, 1992a]. L’équipe d’intervention doit posséder également un appareil de détection des toxiques de guerre, conformément au Guide National de Référence (GNR) [DDSC, 2006]. Cependant, le constat est que ces appareils ne sont pas très répandus. Souvent, la capacité d’identification d’une CMIC repose sur l’expertise de spécialistes RCH2 ou RCH313 formés aux risques chimiques et à l’utilisation de matériels de détection difficilement utilisables pour l’identification. En effet, il n’est pas toujours possible de réaliser l’identification de substances à partir de détecteurs portables et de tubes réactifs, ces derniers n’étant pas adaptés à l’ensemble des substances chimiques [FNSPF, 1992a]. IV.2.1.2 Limites de la capacité à identifier une substance chimique Tous les matériels possédent des limites d’utilisation (température, humidité, seuils de détection, …) et sont plus ou moins sensibles lorsque les conditions d’emploi ne sont pas respectés comme peuvent l’imposer les interventions sur le terrain. Ensuite, les matériels ne sont pas adaptés selon l’état de la substance chimique (gaz, vapeur, liquide). Ou encore, la technologie des détecteurs n’est destinée qu’à certaines substances (COV, molécules pouvant être ionisées, …) (Cf. Tableau 5). A cela s’ajoute la sensibilité à des interférents, c'est-à-dire des substances chimiques faussant la mesure de la substance ciblée, soit en étant détectée à sa place (faux positif), soit en empéchant la détection de la substance (faux négatif). Concernant les matériels obligatoires équipant les CMIC, trois types de détecteurs sont mentionnés par le GNR [DDSC, 2006]. Ces matériels ne permettent pas d’identifier précisément une substance chimique : - Les explosimètres sont capables de détecter la présence de gaz inflammables, mais ne permettent pas de faire de l’identification. - Les détecteurs de toxiques de guerre n’équipent pas toutes les CMIC et présentent une gamme de détection spécifique et de nombreux interférants 13 RCH2 : sapeurs-pompiers formés aux risques chimiques. La formation comprend quatre niveaux. 72 Chapitre IV Identification des substances chimiques quelle que soit la technologie utilisée, qu’il s’agisse de la spectrométrie de mobilité ionique IMS (ion mobility spectrometry) ou de la spectrométrie à émission de flamme. Pour la détection par IMS utilisée par le ChemPro 100 de la société Environics, l’étude de l’EPA [Derringer et al., 2006] fait état des limites et liste les effets de certains interférents conduisant à des faux positifs et à des faux négatifs qui sont plus problématiques. Un des paramètres source d’erreur de détection est la présence d’un taux d’humidité trop fort. Ces interférents, en partie, faussent également la détection d’autres appareils comme les AP2C et AP4C qui utilisent la spectrométrie par émission de flamme. Enfin, les tubes colorimétriques très fréquemment présents dans les CMIC, - sont également sujets à des perturbations dues aux conditions d’utilisation qui interviennent sur la précision des résultats [Bissonnette, 2007]. A cette approximation s’ajoute l’erreur quantitative indiquée par le fabricant (entre 5% et 30% selon les tubes), la sensibilité à l’humidité, à la température, aux rayons UV et à de nombreux interférents [Dräger, 2002]. L’INRS souligne également la nécessité d’un opérateur humain pour réaliser une interprétation visuelle pouvant être approximative du fait d’un changement de coloration parfois peu évident [Gallad et al., 2005]. Il faut également ajouter à cela, un nombre important de tubes colorimétriques correspondant à des familles de substances ou spécifiques à une substance qui fait que les CMIC ne sont équipées que d’une partie de la gamme. Généralement, il s’agit des tubes de la dichotomie14 permettant d’orienter vers les grandes familles de substances chimiques, complétés par des tubes spécifiques aux risques locaux. Une évaluation de la capacité d’identification des tubes colorimétriques en situation d’urgence a été réalisée afin de compléter les limites exposées dans les documents existants. Cette étude portant sur neuf substances chimiques pures montre la difficulté à identifier précisément une substance chimique simple uniquement à l’aide de tubes colorimétriques [Bronner et al., 2008]. Au travers des études sur les équipements [Derringer et al., 2006], [Gallad et al., 2005], [Bissonnette, 2007], [Bronner et al., 2008] et des entretiens avec des experts (communications privées), il ressort que pour être 14 Dichotomie : méthodologie d’utilisation des tubes pour identifier une substance par des tests successifs déterminés selon la réaction ou la non-réaction des tubes. 73 Chapitre IV capable de Identification des substances chimiques détecter la plupart des substances chimiques pouvant être rencontrées en intervention de la CMIC, il est nécessaire de disposer d’un panel de matériels de détection. Outre leur spécialisation à un ou plusieurs états (liquide, gaz, vapeur), ces matériels ne sont pas adaptés à l’ensemble des substances chimiques et ils sont sensibles à des interférents. Il faut donc disposer de matériels complémentaires et sélectifs, donc perfectionnés. Mais le coût en termes d’investissement et de formation que représentent certains matériels (IR et spectromètre de masse) ne permet pas d’équiper l’ensemble des CMIC. Ces matériels couteux sont donc centralisés dans des zones où le risque chimique est plus important, avec un rayon d’action limité par un temps d’acheminement parfois considérable. Il en est de même dans d’autres pays tels que le Canada ou l’Allemagne. Concernant l’Allemagne, une des orientations est de laisser l’analyse et l’identification à une unité spécialisée (die Analytiche Task Force) rapidement mobilisable et acheminée par hélicoptère [König, 2006] et de spécialiser les premiers intervenants aux prélèvements de substances. 74 Chapitre IV Identification des substances chimiques Tableau 5 : Matériels de détection autonomes ++++ Facilité d’utilisation et d’entretien ++++ - Nombreux Interférents ++++ ++++ Pas toutes - Nombreux Interférents ++ ++++ NON OUI si déjà identifié ++++ OUI NON OUI si déjà identifié Gaz OUI NON OUI si déjà identifié + Gaz inflammables - Détection peu sensible - Dépend du taux d’oxygène (correction nécessaire) - Très rapidement empoisonné en présence de silicone ou d’un mercaptan - Gaz de l’air (CO2, N2, O2, H2O), - GNL - Acides -… - Sensibilité variable - Non sélectif - Composés organiques volatiles - Sensibilité variable - Non sélectif Gaz OUI NON OUI si déjà identifié Gaz Liquide Solide OUI Certains produits OUI - Nombreux Interférents - Empoisonnement des capteurs par les mercaptans Utilisés en zonage et réseau de mesures + Méthode rapide (quelques secondes) + Identification de 15 000 produits + Quantification de nombreux produits (≈100) Limites et avantages Phase 75 Détc. Ident. Quant. Tubes colorimétriques Gaz Vapeur OUI NON Plaquettes colorimétriques Bandelettes colorimétriques Explosimètre Gaz Vapeur Liquide OUI NON Pas tous les tubes Semi quantitatif Pas toutes OUI NON Gaz OUI PID (détecteur à photo-ionisation) Gaz FID (détecteur à ionisation de flamme) Toximètres (cellules électrochimiques) IR (détecteur infrarouge) Les limites sont indiquées par un signe "-" et les avantages par un signe "+" - Nombreux Interférents Dispo. en CMIC ++ ++ + + +++ +++ + + Chapitre IV Spectromètre à émission de flamme (AP2C, AP4C) GCMS Gas Chromatography Mass Spectrometry Identification des substances chimiques Gaz Liquide Variable OUI OUI Non Mesure le soufre et le phosphore OUI Semi quantitatif OUI - Mélange de plus de 3 produits - Difficulté d’interprétation - Limite de détection basse de l’ordre du ppm - Détection impossible de certaines molécules (Cl2, F2, Br2, H2 …) et de certains toxiques de guerre. - Impossibilité de détecter des substances fortement diluées (Pour une concentration de l’ordre de 10% ou moins, le spectre de l’eau masque la réponse) + Détection d’hydrocarbures (C-H) et de composés soufrés (S), phosphorés (P-H et P-C), azotés (N) et arséniés (As). + Détection sensible de nombreux toxiques de guerre - Nombreux Interférents Utilisation en reconnaissance et en contrôle de décontamination + Identification formelle des COV + Excellente sensibilité + Analyse de mélanges complexes (fumées) - Gaz permanents (CO, Cl2, NH3, HCN …) • Durée d’analyse (15 min. pour le risque chimique 30 min. pour les fumées) ++ +++ + + Légende : Détc. Capacité de détection d’une substance précise Ident. Capacité d’identification qualitative d’une substance Quant. Possibilité de faire un dosage quantitatif Dispo. en CMIC La disponibilité dans les CMIC est notée de un à quatre par des signes "+". Quatre indiquant les matériels courants et un les matériels rarement présent dans les CMIC. La facilité d’utilisation et d’entretien est également notée de un à quatre avec la même échelle. 76 Chapitre IV IV.2.2 Les Identification des substances chimiques logiciels d’identification des substances chimiques Les sapeurs-pompiers et les experts des CASU disposent de bases de données de substances chimiques pour obtenir les informations utiles à l’intervention. Mais pour pouvoir utiliser ces bases de données, il est nécessaire de connaître la substance chimique. Cependant, les bases de données contiennent des informations qui peuvent être mises en correspondance avec les données opérationnelles disponibles sur le terrain afin de sélectionner les substances chimiques concordantes. C’est ce que réalisent deux logiciels : Le « Chemical Companion » développé par le Georgia Tech Research Institute (GTRI), effectuant ce type de recherches parmi 130 substances chimiques [Becker, 2006] et le logiciel WISER [NLM, 2005] qui dispose d’une base de données de 412 substances. Ces logiciels, conçus pour une utilisation opérationnelle, constitue une aide à l’identification des substances chimiques. Le paragraphe suivant (IV.2.2.1) présente le fonctionnement de ces deux logiciels. Biens que les exemples soient spécifiques au logiciel WISER, les informations sont valables également pour le « Chemical Companion » qui est similaire dans son fonctionnement. Le choix s’est porté sur WISER, car dans sa version évaluée par l’INERIS [Pagnon et al., 2007], il est le plus abouti en termes de fonctionnalité et de base de données. De plus, il fait l’objet de plus de documentations et de publications, dont l’étude de [Bhavnani et al., 2007] qui sera complétée et qui servira de base de réflexion au paragraphe IV.4.1. Depuis la réalisation de ce travail, des améliorations ont été apportées au « Chemical Companion », dont une base de données enrichie contenant 2000 substances [GTRI, 2008]. Il parait nécessaire d’y porter plus d’attention est d’en faire une étude approfondie au même titre que celle réalisée pour le logiciel WISER [Pagnon et al., 2007]. Quant au logiciel WISER, des substances chimiques sont ajoutées régulièrement à la base de données. 77 Chapitre IV Identification des substances chimiques IV.2.2.1 Présentation du logiciel WISER IV.2.2.1.1 Une base de données avec une interface dédiée aux situations d'urgence WISER (Wireless Information System For Emergency Responders) est un logiciel gratuit, entièrement et uniquement en anglais, développé par la NLM (National Library of Medicine) et destiné aux premiers intervenants lors d’accidents impliquant des matières dangereuses [NLM, 2004]. Comme son nom l’indique, il fonctionne en mode déconnecté sur un ordinateur autonome et non relié à Internet. WISER est disponible sur Palm©, Pocket PC et plateforme Microsoft Windows™. Lorsqu’une connexion Internet est disponible, il permet d’accéder directement à des bases de données en ligne pouvant contenir des informations complémentaires. WISER dispose d’une base de données contenant diverses informations sur un certain nombre de produits chimiques dangereux et d’une aide à l’identification de ces produits à partir d’éléments observables (état, couleur, odeur, …) ou mesurables (pH, …) et de symptômes observés chez l’homme (nausées, maux de tête, irritations, …). Une fois le produit identifié, la base de données contient également des informations pour aider à la prise de décision lors de la phase réflexe (périmètre de sécurité/évacuation, matériels de protection, premiers soins, recommandations du DOT15 (Departement Of Transportation), réactivité et incompatibilité avec d’autres substances. La base de données, comporte 412 substances chimiques (dans sa dernière version), décrite par 161 critères binaires séparés en trois familles : - les propriétés chimiques et thermodynamiques observables ou mesurables (état, couleur, opacité, odeur, goût, pH, densité liquide gazeuse), - les symptômes cliniques sur l'homme. Le logiciel WISER permet l’identification de 89 signes différents rassemblés en 10 sous-groupes physio-pathologiques (température, neurologie, oreilles, ophtalmologie, nez, bouche/gorge, système cardiovasculaire, système respiratoire, système gastro-urinaire, peau), - et la codification NFPA : inflammabilité, instabilité, santé, autre. Ces critères sont également regroupés par thème (Figure 12) et l’affichage des informations est adapté au profil de l’utilisateur (Tableau 6). Il y a trois 15 Version américaine du guide CANUTEC 78 Chapitre IV profils Identification des substances chimiques utilisateurs : premier intervenant, spécialiste HAZMAT (HAZardous MATerials : matières dangereuses), Médecin urgentiste. Premier intervenant Spécialiste HAZMAT Médecin urgentiste Equipements de Propriétés physico- traitements protection chimiques Distances de sécurité PPE Effets sur la santé Procédures en cas IDLH Information sur la toxicité Réactivités Limites d’inflammabilité IDLH traitements Classification NFPA 704 Classification NFPA 704 d’incendie Tableau 6 : Informations affichées pour chaque profil Figure 12 : Informations sur le chlore triées par catégorie (logiciel WISER) 79 Chapitre IV Identification des substances chimiques IV.2.2.1.2 Une aide à l’identification Afin d’identifier une substance chimique en situation d’urgence, WISER propose un mode de recherche à partir de la description et des propriétés du produit, des symptômes observés chez l’homme et de la classification NFPA (si la signalisation est connue). En fonction des informations saisies (par exemple la couleur du produit, son pH, et des effets sur la peau) WISER sélectionne tous les produits satisfaisant à l’ensemble de ces critères. La recherche est effectuée immédiatement après chaque saisie d’information et un curseur permet de visualiser en temps réel le nombre de substances correspondant aux critères sélectionnés. Le mode de recherche est simple. L’ensemble des solutions de départ est constitué de tous les produits de la base de données, et à chaque valeur de critère saisie, les produits ne correspondant pas à la valeur saisie sont retirés de la liste des solutions possibles. Exemple de recherche : Nombre de substances chimiques de l’ensemble de départ (toute la base de données) = 407 Produits étant des liquides visqueux = 44 ET de couleur jaunâtre = 22 ET pouvant provoquer des troubles de la vision = 11 ET qui flotte sur l’eau (densité<1) = 3 Trois produits correspondent aux critères saisis : Collodion, Kérosène, n-Ethylaniline. Les deux premiers sont très inflammables, le troisième est toxique. Pour poursuivre l’identification, il est nécessaire de disposer d’autres critères. Par exemple, l’odeur serait un critère discriminant supplémentaire (Figure 13). 80 Chapitre IV Identification des substances chimiques Figure 13 : Identification de substances chimiques avec WISER Incontestablement, la fonction la plus intéressante de WISER par rapport aux autres bases de données existantes est la possibilité de rechercher un produit en fonction de sa description et des effets sur l’homme [Pagnon et al., 2007]. Pour une utilisation en situation d'urgence, ce logiciel est intéressant en d’autres points : - Son interface est simple, parfaitement adaptée à une utilisation en situation d’urgence. - Le vocabulaire est également adapté aux situations d'urgence et la base de données contient des informations utiles pour l’aide à l’intervention. A la suite de l’étude réalisée par l’INERIS [Pagnon et al., 2007], la CASU a retenu le principe d'utilisation de WISER. Le choix fait par l’INERIS est d’intégrer 81 Chapitre IV Identification des substances chimiques ce logiciel aux outils de la CASUBOX (ensemble d’outils de calcul et d’aide à la décision destiné aux membres de la CASU lors des appuis). Comme il est mentionné dans le rapport d’étude [Pagnon et al., 2007], il est important d’en préciser les limites d’utilisation. Car bien que le concept du logiciel soit très pertinent, sa mise en œuvre est jugé toutefois très délicate (incertitude due à l’origine parfois indirecte des informations, critères du logiciel difficilement identifiables, peu de produits, …). Le logiciel WISER présente d’autres inconvénients [Pagnon et al., 2007] : - Certains critères ne sont pas renseignés ce qui peut générer des résultats aberrants ou en très grand nombre (ex : couleur, opacité, …). - Certaines données ne sont pas corrélées entre elles provoquant également des résultats incohérents (ex : couleur / état). - La base de données contient des erreurs. - Il s’agit d’un logiciel développé pour le continent Nord-Américain. Exclusivement en anglais, il contient des données toxicologiques issues uniquement des bases américaines qui ne tiennent pas compte des valeurs réglementaires françaises. - Ce logiciel ne peut être modifié et aucune valeur ne peut être ajoutée L’étude réalisée valide un mode de fonctionnement intéressant et utilisable en situation opérationnelle, mais sans pouvoir juger, pour l’instant, de la qualité des résultats obtenus, de la justesse de l’identification et de l’utilisation possible pour les sapeurs-pompiers. Ces points sont abordés dans le paragraphe suivant. IV.2.2.2 Limites de la base de données du logiciel WISER Données manquantes Dans la base de données WISER, certains produits ont des critères de sélection qui ne sont pas renseignés (ex : pas d'indication sur la couleur du Phenyl Isocyanate). Mauvaise gestion des critères non renseignés Malgré ces absences de données, les produits peuvent être sélectionnés par WISER sur la base d'une sélection effectuée sur ces critères non renseignés. 82 Chapitre IV Identification des substances chimiques Par exemple, si dans WISER, une recherche est effectuée sur plusieurs couleurs : bleu, vert et incolore, trois produits sont alors sélectionnés par WISER : Lewisite, Phenyl Isocyanate, Delta-Hexachlorocyclohexane. En réalité, seul la Lewisite remplit effectivement les trois conditions de couleur (bleu, vert et incolore). Les deux autres produits (Phenyl Isocyanate, Delta-Hexachlorocyclohexane) n'ont aucun critère de couleur renseigné dans la base de données. De même, une recherche des produits inoffensifs (code NFPA égal à zéro pour tous les risques) affiche une liste de 174 produits. Parmi ceux-là on compte le sarin, l’arsenic et autres produits dangereux pour lesquels la classe NFPA n’est pas renseignée. Informations non corrélées entre elles Dans l’exemple précédent, il peut paraître curieux qu’une substance chimique ait un critère tel que la couleur associé à plusieurs valeurs possibles. En fait, ces données sont conditionnelles à d’autres données. Par exemple, la couleur est fonction de l’état. Mais il manque cette information, les corrélations entre les données ne sont pas indiquées, les couleurs d’un produit ne sont pas associées à l’état correspondant. Par exemple, le naphtalène de formule chimique C10H8 et de numéro CAS : 91-20-3. C’est un produit blanc à l’état solide (source : base de données inchem IPCS) et blanc à brun-jaunâtre à l’état liquide. Mais si on recherche un produit à la fois solide ET de couleur brunâtre, ce qui n’est pas le cas du naphtalène, le logiciel WISER affichera ce produit comme résultat de la recherche. Informations différentes selon les catégories de critères L’absence d’information peut également donner des résultats surprenants lorsque qu’il s’agit de données redondantes. Par exemple, le symptôme « toux » est à la fois présent dans les symptômes liés au système pulmonaire et dans ceux liés à la gorge. Le manque de données fait que l’on obtient des résultats différents selon si l’on associe la toux à un problème pulmonaire ou à une irritation de la gorge : - 216 substances provoquent une toux liée au système pulmonaire, - 273 substances provoquent une toux liée à la gorge - et 210 substances sont communes aux deux. 83 Chapitre IV Identification des substances chimiques Absence de distinction entre effets immédiats et risque chronique Dans le mode de recherche, il n’y a pas de distinction entre les effets immédiats et les symptômes observables à long terme. Pour une utilisation en situation d’urgence, les effets liés au risque chronique ne sont d’aucune utilité pour identifier les produits. IV.2.2.3 Limites du logiciel WISER à l’identification des substances Lors de la présentation du logiciel WISER, un point fondamental a été abordé : la méthode de recherche en base de données avec pour but une identification précise d’une substance à partir des données opérationnelles. Mais il n’est pas prouvé que les données opérationnelles en situation d'urgence permettent une telle identification. Dans l’étude de l’utilisation du logiciel WISER en situation d’urgence [Pagnon et al., 2007], il est noté que pour identifier un produit inconnu à partir d'observations « simples », il faut disposer d’un nombre important d’informations. Ce point n'est pas spécifique à WISER mais du à la complexité du problème à résoudre. En effet, les données sont peu discriminantes. Sur la base des produits testés dans cette étude, il est estimé que les symptômes observés en situation d'urgence seront peu efficaces pour déterminer précisément un produit. Sur les dix produits qui ont été testés dans l’étude de WISER, six sont des suffocants à action locale prédominante (NH3, Cl2, HF, HCl, NO2 et SO2). Les symptômes cliniques pouvant être observés seront donc principalement des effets non spécifiques d’irritation des voies aériennes et de troubles respiratoires qui sont assez proches pour l'ensemble des produits testés : - Gorge / Bouche : toux, irritation - Système Respiratoire : respiration irrégulière, souffle court, arrêt respiratoire, brûlure / irritation, œdème pulmonaire, congestion, toux / obstruction, éternuement, hypoxie/cyanose - Système Cardiovasculaire : douleur, hypoxie/cyanose Les symptômes secondaires spécifiques (conduisant à l’identification d’une substance) ne se déclarent généralement que dans les cas d’intoxication très importante ou d’exposition particulière. Ce constat est moins vrai pour les toxiques à action systémique (acrylonitrile, HCN, CO et CO2) pour lesquels certains symptômes sont spécifiques. 84 Chapitre IV Identification des substances chimiques Il apparait clairement que tous les symptômes ne sont pas tous discriminants et que malheureusement, les critères spécifiques ne seront pas les plus fréquemment observés. Il est donc nécessaire de vérifier si la quantité d’information disponible en situation d’urgence est suffisante pour identifier une substance chimique. IV.3 Réalisation d’une base de données opérationnelles L’utilité de la base de données est double. Elle doit servir à réaliser les études de faisabilité sur l’identification d’une substance et des dangers qui sont liés (IV.4, IV.5), puis à termes, intégrer le logiciel d’aide à l’identification (IV.6). Il a été fait le choix de développer une base de données avec une structure simplifiée, adaptée aux traitements de recherche de substances et de construction d’arbres de décision. La base de données se limite à une table principale de données, majoritairement binaires, décrivant les différentes substances. Chaque substance chimique est associée, d’une part, aux données opérationnelles disponibles en situation d’urgence, et d’autre part, aux classes de danger qu’il s’agira d’identifier. Mais pour respecter des contraintes différentes présentées ci-après, il a été nécessaire de décliner la base de données en deux versions distinctes : - une base de données destinée aux études de faisabilité (IV.4, IV.5) contenant un nombre suffisamment grand de substances. - Une base de données intégrée au logiciel d’aide à l’identification. Avant de détailler les deux versions, nous allons détailler les différentes étapes de la création de la base de données commune. IV.3.1 Choix des sources d’information Pour alimenter ces bases de données, une sélection de plusieurs sources de données a été faite. Parmi les bases de données existantes, plusieurs caractéristiques ont été retenues pour effectuer une sélection des sources à utiliser pour le développement d’une base de données opérationnelles intégrée à notre logiciel. La base de données doit : 85 Chapitre IV Identification des substances chimiques - Contenir les données opérationnelles (description, symptômes, danger, …) - Les informations doivent être dans une même langue pour pouvoir fusionner plusieurs bases de données dans une même base de données centralisée. Pour des facilités de compréhension, seules les bases de données en anglais ou en français ont été retenues. - Les informations doivent pouvoir être réutilisées. Il faut donc s’orienter vers les bases de données gratuites non protégées. - Enfin, la base de données est destinée à des traitements mathématiques automatisés et doit pouvoir être accessible par des logiciels développés en C++. De plus, la création de la base de données nécessite un énorme travail de recherche de données, de vérification et de saisie pour l’ensemble des produits. Ce travail fastidieux est également source d’erreurs de saisie. Le choix a été d’effectuer en automatique ce traitement de récupération, de formatages et de centralisation des données. Peu de bases de données en libre accès correspondent à l’ensemble des critères cités précédemment. Certaines bases de données intéressantes ne sont pas structurées pour faciliter la récupération automatique de l’information et très peu de bases de données contiennent les données opérationnelles utilisables en situation d’urgence et les données utiles aux services de secours. Le tableau suivant (Tableau 7) présente une liste non exhaustive des bases de données consultées. Certaines bases de données ont été rapidement écartées en raison d’une inadéquation avec les propriétés recherchées. Une liste plus complète est disponible dans [Celle et al., 2006]. 86 Chapitre IV Identification des substances chimiques Tableau 7 : Bases de données de produits chimiques répondant en partie aux critères de sélection Bases de données Nombre de produits TOXNET Langue Informations Description Effets oui oui difficile oui oui oui ang. Autres Accès auto. http://toxnet.nlm.nih.gov/cgi-bin/sis/htmlgen?hsdbb.htm NIOSH ≈ 900 fr., ang., autres http://www.inchem.org/ et http://www.cdc.gov/niosh/ipcsnfrn/nfrnun.html Base Biotox INRS ≈ 100 français oui oui "Famille" non français oui oui stockage non ≈ 7000 français non non UV, IR, spectre .. ? 405 anglais oui oui oui français oui oui ? oui oui non / oui non anglais / oui ? fr., ang. / oui ? français / oui oui Fiches INRS http://www.inrs.fr/ NIST Chemistry WebBook http://webbook.nist.gov WISER (BD v2.2.95) http://wiser.nlm.nih.gov/index.html REPTOX (CSST) http://www.reptox.csst.qc.ca/RechercheProduits.asp#resultats Fiche tox (ATSDR) anglais http://www.atsdr.cdc.gov/toxprofiles BD Toxico (INERIS) 911 http://chimie.ineris.fr/fr/lien/basededonnees/toxicologie/recherche.php IRIS (EPA) http://www.epa.gov/iris/subst/0405.htm ESIS (ECB) http://ecb.jrc.it/esis/ AGRITOX (INRA) http://www.inra.fr/agritox/php/fiches.php Base Dräger Voice fr., ang., autre Réaction aux tubes réactifs difficile http://www.draeger.com/voice/index.html TELETOX non oui non oui http://www.uvp5.univ-paris5.fr/TELETOX/TELMENU.asp CANUTEC 3315 fr., ang., autre ≈ 720 anglais ≈ 6000 anglais Logiciel ergo 2004 SAFER Logiciel CAMEO online database http://cameochemicals.noaa.gov/ 87 oui Chapitre IV Identification des substances chimiques Le choix s’est porté sur la base de données du logiciel WISER qui correspond à l’ensemble des critères de sélection malgré un nombre de produits chimiques restreint puisque la version utilisée (v2.2.95) n’en comporte que 405. Cette base de données étant incomplète, les données manquantes ont été récupérées des « International Chemical Safety Cards (ICSC) » du NIOSH, publiées sur internet. Les fiches ICSC ont été utilisées également pour renseigner la classification des dangers avec la classification européenne. La base de données du NIOSH n’a servi qu’à compléter celle de WISER car certaines données comme les effets ou la description ne sont pas formatées, ce qui ne facilite pas leur récupération. Mais la confrontation des différentes sources d’information a montré des incohérences qui ont nécessité plusieurs traitements. IV.3.2 Fusion des bases de données La récupération des données et leurs traitements ont nécessité l’emploi des logiciels Access et Excel de Microsoft©, ainsi que l’écriture d’un programme en C++ en particulier pour rechercher automatiquement l’information dans la base de données du NIOSH via le web. Ces traitements de formatage de données et de recherche syntaxique ne seront pas développés dans ce mémoire. En complément de ce travail, une analyse sémantique des bases de données non formatées permettrait d’extraire des données supplémentaires. IV.3.3 Renseignement des données manquantes Pour plusieurs produits, il manque des données dans les bases de données utilisées. Il peut s’agir de produits pour lesquels l’information n’existe pas, comme la mesure du pH pour un solide, mais il peut s’agir de la couleur ou de la classification NFPA. La base de données a été complétée à l’aide d’autres sources d’information comme le Merck Index [O'Neil et al., 2004], la base de données de CAMEO [NOAA, 1999] et la base de données INCHEM [CCOHS, 2008]. Lorsqu’il s’avérait impossible de trouver une substance pour compléter des données importantes ou que l’information était exprimée de façon ambigüe, elle était retirée de la base de données. 88 Chapitre IV Identification des substances chimiques IV.3.4 Choix d’une classification des dangers La connaissance des classes de risques associées à un produit est primordiale puisque la méthode développée vise à rechercher cette information à partir des données opérationnelles. Il existe plusieurs classifications16 des substances chimiques (cf. Annexe I) mais il est difficile d’en choisir une plutôt qu’une autre comme il est expliqué dans un rapport de l’INERIS [Bernuchon et al., 2002]. Pour notre étude, une classification simplifiée a été réalisée à partir de la classification européenne et de celle de la NFPA. Ces deux informations n’étant pas disponibles pour l’ensemble des substances chimiques des bases de données utilisées, il a été nécessaire de fusionner les deux classifications pour conserver un jeu de données suffisamment grand pour une étude statistique. IV.3.4.1 Présentation de la classification retenue Le choix a été de réaliser des classes de danger simplifiées en distinguant uniquement deux valeurs pour les trois risques retenus dans cette étude (toxique ou non, inflammable ou non, explosif ou non). Soit un recouvrement17 de trois classes correspondant à la partition18 de huit (23) classes suivantes : "Aucun risque", 16 "Inflammable", Classification : Le "Explosif", terme "Toxique", « classification » est "Inflammable ambigu et et peut explosif", avoir deux significations : établir une classification en regroupant des objets d’un champ d’étude en fonction de - leurs similarités en un certain nombre de classes ou groupes homogènes. Simpson [Simpson, 1961] propose une définition dans le domaine de la biologie qui fut ensuite adaptée par [Sokal et al., 1974] « the ordering or arrangement of objects into groups or sets on the basis of their relationships » ou être utilisée au sens de la discrimination ou de l’identification, c'est-à-dire de - définir l’appartenance de chaque objet à l’un des groupes d’une classification déjà établie. Dans les domaines connexionnistes, on parle de classification supervisée. Parmi les méthodes de classification automatique, les centres mobiles ou les hiérarchies sont souvent utilisées. Il existe également des méthodes issues des réseaux de neurones comme les cartes de Kohonen. 17 Recouvrement : Un recouvrement d’un ensemble E est un ensemble de parties P=(P1,…Pk) non vides dont la réunion forme E et tel qu’il n’y a pas d’inclusion entre les parties. 18 Partition : Une partition d’un ensemble E est un ensemble de parties P=(P1,…Pk) non vides, disjointes, dont la réunion forme E. 89 Chapitre IV Identification des substances chimiques "Inflammable et toxique", "Explosif et toxique", "Inflammable, explosif et toxique". L’appartenance d’un produit à une classe de risque est déterminée en fonction de la présence du risque dans les classifications EU et NFPA. Par exemple, un produit appartient à la classe « produits inflammables » si la valeur pour le risque « inflammable » dans la classification NFPA est supérieure à zéro ou si sa valeur dans le classification EU est F+, F ou l’une des phrases de risque en rapport (R10, R11, R12, …). Inflammable = 1 : « NFPA – Inflammable » > 0 ou EU ε {F+, F, R10, R11, R12, R17, R15} 0 sinon Explosif = 1 : « NFPA – Réactivité » > 0 ou EU = {E, R2, R3, R14} 0 sinon Toxique = 1 : « NFPA – Santé » > 0 ou EU ε {T+, T, Xn, R23, R24, R25, R39, R48, R26, R27, R28, R20, R21, R22, R40, R48, R65, R29} 0 sinon Note : Le choix des phrases de risque à retenir présente des difficultés. Dans [Bernuchon et al., 2002], la classification par regroupement des phrases de risque ne peut être utilisé tel quel, car en plus des trois classes (inflammable, toxique, explosif), une quatrième classe est introduite « stabilité avec l’eau » avec les phrases de risque R14, R15 et R29. Cette précision n’est pas faite dans la classification NFPA. Deux classifications ont été testées : - sans tenir compte de ces trois phrases de risque, - puis en incluant ses phrases de risque, tel qu’il est décrit ci-dessus. Aucune différence sensible n’a été notée entre les résultats obtenus avec l’une ou l’autre des deux classifications. IV.3.4.2 Différence de seuils des classifications européenne et NFPA En comparant les classes de danger des substances communes aux deux bases de données (soit 350 substances chimiques), on remarque des proportions différentes d’une base de données à l’autre pour les substances inflammables et toxiques (cf. Tableau 8). 90 Chapitre IV Identification des substances chimiques Tableau 8 : Proportion de substances par classe de danger Inflammable Explosif Toxique Classification européenne 34,3% 32,3% 89,7% Classification NFPA 59,7% 32,3 63,7 Dans le cas des substances toxiques, la différence de proportion (89,7% ou 63,7%) s’explique par les données non renseignées. Car il y a très peu substances avec des classifications différentes (1,4%) en ne comparant que les données renseignées dans les deux bases de données (cf. Tableau 9). On note également peu d’erreur dans le cas des produits explosifs (0,6%). Tableau 9 : Proportion de substances par classe de danger Inflammable Explosif Toxique 32,3% 31,7% 31,7% Même classification 37,4% 67,7% 66,9% Classification différente 30,3% 0,6% 1,4% Non renseigné dans l’une des deux classifications Par contre, les produits inflammables présentent 30,3% de différences entre les deux classifications. Cela s’explique par les différences des seuils réglementaires d’affectation des classes de danger notés dans les Tableau 10 et Tableau 11 et illustrés en Figure 14. 91 Chapitre IV Identification des substances chimiques Tableau 10 : Classification NFPA 704 des substances inflammables Classe Critères de classement des produits liquides NFPA 4 Will rapidly or completely vaporize at normal atmospheric pressure and temperature, or is readily dispersed in air and will burn readily (e.g., propane). Flash point below 23°C (73°F). 3 Liquids and solids that can be ignited under almost all ambient temperature conditions (e.g., gasoline). Flash point below 38°C (100°F) but above 23°C (73°F) 2 Must be moderately heated or exposed to relatively high ambient temperature before ignition can occur (e.g., diesel fuel). Flash point between 38°C (100°F) and 93°C (200°F). 1 Must be pre-heated before ignition can occur. Flash point over 93°C (200°F). 0 Will not burn Tableau 11 : Classification des substances inflammables : Directives 67/548/CEE et 1999/45/CE (article R.231-53 du code du travail). Catégorie Phrase Critères de classement des produits liquides de risque Extrêmement inflammable R12 F+ Pour les liquides ayant un point éclair < 0°C et température d'ébullition < 35°C Pour les gaz qui, à température et pression ambiantes, sont inflammables à l'air Facilement inflammable F R11 Pour les solides susceptibles de s'enflammer facilement après un bref contact avec une source d'inflammation et qui continuent à brûler ou se consumer après élimination de cette source Pour les liquides ayant un point éclair < 21°C mais qui ne sont pas extrêmement inflammable Pour les substances qui, au contact de l'eau ou de l'air humide dégagent des gaz extrêmement inflammables à raison de 1 I/kg/h minimum. Inflammable R10 21°C < point éclair < 55°C 92 Chapitre IV Identification des substances chimiques Les substances chimiques enflammables mais dont le point éclair19 est supérieur à 55°C ne sont pas répertoriées comme substances inflammables par la réglementation européenne contrairement à la classification NFPA. Point éclair 120°C 1 100°C 080°C 2 060°C 040°C R10 3 020°C F 4 000°C -020°C -040°C F+ Classification Classification Seveso européenne NFPA NFPA Figure 14 : Seuils des produits inflammables en fonction de leur point éclair Le choix a été fait de garder une classification majorante ; une substance est considérée inflammable dès qu’elle apparait dans l’une des deux classifications. Cependant des erreurs peuvent subsister dans la base de données en complétant les données absentes dans la classification NFPA par la classification européenne indiquée dans les fiches du NIOSH. Une substance pouvant être inflammable pour la législation américaine (classe NFPA-inflammable égale à un ou deux) sans être considérée comme dangereuse pour la réglementation européenne. 19 Point éclair : Une définition simple du point éclair pourrait être : le point éclair est la température la plus basse où un liquide peut former un mélange inflammable à sa surface. Donc plus une substance a un point éclair bas, plus elle sera facile à enflammer. 93 Chapitre IV Identification des substances chimiques IV.3.5 Différentes versions de bases de données IV.3.5.1 Version pour étude de faisabilité – suppression des incompatibilités Nous avons vu précédemment que les données de la base de données de WISER ne sont pas corrélées. Cela entraine des incompatibilités entre les critères. Mais pour réaliser les études de faisabilité, les arbres de décisions seront utilisés, mais leur méthode de construction ne permet pas de tenir compte de ces incompatibilités. Par exemple, pour une substance stockée à l’état solide ou liquide, l’information pH sera présente mais ne sera valide que pour l’état liquide. D’un point de vue statistique, le pH peut apparaître comme un critère discriminant mais il est bien évidemment aberrant de demander une mesure de pH en présence d’un solide. De même, les couleurs d’un produit ne sont pas associées à l’état correspondant. Le naphtalène de formule chimique C10H8 et du numéro cas 9120-3, est blanc à l’état solide [IPCS, 2001b] et blanc à brun-jaunâtre à l’état liquide. Cela présente l’énorme inconvénient suivant : lors d’une recherche d’une substance à la fois solide ET de couleur brunâtre, le logiciel affiche le naphtalène dans les résultats de la recherche alors qu’il ne correspond pas à cette description. Une solution consisterait à dupliquer les substances en fonction des différents cas existants. Pour une substance, à chaque état correspond des critères (pH uniquement pour les liquides par exemple) et des valeurs de critères (pour un état correspond une ou plusieurs couleurs). Structure actuelle : Nom Formule Naphtalène C10H8 CAS Etat Etat Couleur Couleur Couleur pH 91- solide liquide blanc brun jaunâtre base 20-3 Structure avec données corrélées : Nom Formule CAS Etat Couleur Naphtalène (solide) C10H8 91-20- solide blanc liquide brun Couleur pH X 3 Naphtalène (liquide) C10H8 91-20- jaunâtre base 3 94 Chapitre IV Identification des substances chimiques Mais cela demanderait de rechercher toutes ces informations dans d’autres bases de données et ce traitement ne peut se faire en automatique au vu des formats des sources d’information listées précédemment. La solution adoptée a été de séparer les données en trois bases distinctes, une par état (liquide, solide et gazeux) et de supprimer les champs de données incompatibles : Solides - Suppression du pH - Suppression de "Vapor Density" - Suppression de "Clarity" peu renseigné et pas significatif - Suppression du goût peu renseigné - Suppression de "Vapor Density" - Suppression du goût peu renseigné - Suppression de "Clarity" peu renseigné - Incomplétude pour "Specific Gravity" (7 produits retirés sur 249) - Suppression du pH - Suppression de "Specific Gravity" - Suppression du goût peu renseigné - Suppression de "Clarity" peu renseigné - Incomplétude pour "Vapor Density" (7 produits retirés sur 71) Liquides Gaz Toutefois, cette solution ne permet pas de corréler certains champs comme la couleur, mais ce travail nécessiterait une recherche de l’information considérable pour compléter la base de données. La base de données du NIOSH contient en partie cette information mais nécessite un travail de saisie ou, pour un traitement automatique, de réaliser une analyse sémantique. Le nombre de données est alors le suivant : - 95 Un nombre total de 324 substances chimiques, Chapitre IV - Identification des substances chimiques 242 liquides décrits par 132 critères, dont 19 substances ayant les mêmes descripteurs et classe, - 134 solides décrits par 110 critères, tous différents - et 71 gaz décrits par 120 critères, dont 2 substances ayant les mêmes descripteurs et classe. Certaines substances étant présentes dans la base de données sous plusieurs états. IV.3.5.2 Version intégrée au logiciel Pour la version de base de données intégrée au logiciel d’aide à l’identification des substances, le problème des données incompatibles est traité par l’algorithme développé en conséquence. Cette version ultérieure, plus aboutie, a été complétée avec de nouvelles substances (les toxiques de guerre). Les classes de dangers ont été enrichies par l’ensemble des classes de la réglementation européenne. La réponse positive ou négative aux tubes de la société Dräger, soit 191 tubes qualitatifs, ont également été ajoutés à la base de données. La base de données est détaillée en annexe II. IV.3.6 Conclusions sur la base de données Des programmes de récupération automatique et le traitement de données ont été développés afin de créer une base de données opérationnelles. Deux versions distinctes de bases de données ont ensuite été construites, l’une destinée aux études de faisabilités à l’aide d’arbres de segmentation, l’autre intégrée au logiciel d’aide à l’identification des substances. Disposant de données fiables, il est alors possible de déterminer la quantité d’information nécessaire à l’identification d’une substance. IV.4 Quantité d’information nécessaire à l’identification d’une substance La quantité d’information disponible en situation d'urgence n’est pas toujours suffisante pour identifier précisément une substance chimique parmi plus de 27 millions de substances enregistrées à ce jour sur la base de données du Chemical Abstract Services (CAS-registry) de l’American Chemical Society. 96 Chapitre IV Identification des substances chimiques Bien que d’un point de vue purement combinatoire, les 140 critères binaires de la base de données de WISER soient amplement suffisants pour distinguer l’ensemble des substances chimiques répertoriées à ce jour, il n’est pas aussi évident qu’une distinction soit possible en situation d'urgence : ces critères ne seront pas tous connus en situation d'urgence et, de plus, la répartition des produits chimiques en fonction des critères n’est pas homogène. Par exemple, dans la base de données utilisée, il y a moins de 1% des produits qui sont des gaz de couleur orange, alors que plus de 50% des produits sont des liquides incolores pouvant irriter les yeux. IV.4.1 Estimation du nombre de données nécessaires à l’identification d’une substance IV.4.1.1 Estimation du nombre de symptômes nécessaires Une estimation du nombre de symptômes nécessaires à l’identification d’une substance est faite dans [Bhavnani et al., 2007]. L’analyse faite à partir de la base de données de WISER (version antérieure contenant 390 substances), donne une estimation du nombre de symptômes nécessaire de 40 ou plus, pour estimer précisément une substance chimique. Afin de compléter ces résultats, nous avons réalisé plusieurs estimations. Dans un premier temps, nous avons réalisé la même estimation sur une base de données contenant moins de substances chimiques (324 substances de notre base de données complète). De même que dans [Bhavnani et al., 2007], la méthode utilisée est dite de Monte Carlo. Cette méthode se justifie par un nombre de combinaisons de symptômes trop grand pour permettre de toutes les tester. Nombre de combinaisons de symptômes : Ρ ∑ Ρ C p = ∑ p=1 p =1 n n! p!(n − p )! Eq. 4 Avec p le nombre de symptômes observés en même temps sur le terrain, P le nombre maximum de symptômes observés en même temps (P = 40) Avec n le nombre total de symptômes (79 dans la base de données) 97 Chapitre IV Identification des substances chimiques Figure 15 : Nombre de substances en fonction du nombre de symptômes qu’elles provoquent En moyenne, le nombre de substances chimiques correspondant à 40 symptômes observés est encore supérieur à un (Figure 15). Il faudrait donc un nombre important de symptômes pour identifier précisément une substance chimique dans une base de données réduite. D’après [Bhavnani et al., 2007], il n’est pas nécessaire d’arriver à un produit unique. Une liste limitée est suffisante pour permettre aux urgentistes d’orienter leurs investigations pour identifier le produit. Avec 14 symptômes, le nombre de substances chimiques est faible (de l’ordre de 10) et cette information est alors utilisable par les urgentistes alors capables d’affiner l’identification. Mais, il faut également tenir compte que la base de données utilisée dans l’étude de Bhavnani ne contient que 400 produits, ce qui est très réduit par rapport au grand nombre de produits chimiques existants. En effectuant une même recherche sur des bases de données plus conséquentes comme celle du logiciel CAMEO (6000 produits), la liste des substances correspondant aux critères saisies serait plus importante et, par conséquent, difficile à utiliser. De plus, la sélection aléatoire de ces symptômes ne tient pas compte de leur apparition en situation d’urgence. Beaucoup de symptômes observés sur le terrain ne sont pas spécifiques [Pagnon et al., 2007], donc peu discriminants. Le nombre de symptômes nécessaires estimé à 14 dans [Bhavnani et al., 2007] est une sous-estimation. Indépendamment de ce fait, il est déjà rare de disposer d’autant de symptômes en situation d’urgence. 98 Chapitre IV Identification des substances chimiques IV.4.1.2 Estimation du nombre de critères descriptifs et physicochimiques nécessaires La même estimation a été réalisée en utilisant les critères descriptifs et physico-chimiques (couleur, odeur, goût, pH, état, densité de vapeur, gravité). La méthode est adaptée afin de tenir compte des incompatibilités de critères. Par exemple, pour une substance à l’état de gaz, le pH n’est pas connu. Et une seule valeur est possible par critère : une fois une couleur choisie, une autre couleur ne peut pas être prise. Il en est de même pour toutes les catégories de critères : Un état, une valeur de pH, une couleur, une odeur et une valeur de densité à la fois. Les résultats (cf. Figure 16) montrent le pouvoir discriminant des critères descriptifs par rapport aux symptômes, puisque les sept critères physicochimiques contenus dans la base de données sont suffisants pour identifier en moyenne une substance précise. Figure 16 : Nombre de substances correspondantes en fonction du nombre de critères physico-chimiques IV.4.1.3 Estimation du nombre de données opérationnelles nécessaires à l’identification d’une substance Les données disponibles en situation d'urgence sont généralement moins précises que celles utilisées pour l’estimation précédente et difficiles à obtenir. 99 Chapitre IV Identification des substances chimiques Une nouvelle estimation du nombre de données nécessaires à l’estimation d’une substance a été faite, en tenant compte de la précision et de la disponibilité en situation d'urgence. Pour que les données utilisées à cette évaluation soient représentatives des données opérationnelles, plusieurs traitements ont été effectués : - l’état à été simplifié à « liquide », « gaz » ou « solide », sans distinction de liquide visqueux, de solide métal ou poudre, etc. - Il a été fait de même pour le pH qui ne prend que trois valeurs (acide, neutre ou base) au lieu des sept de la base de données. - L’information sur le goût a été supprimée car extrêmement rare en situation d'urgence et très subjective. - Il a été tenu compte de l’imprécision de l’odeur, de la couleur et du pH. La méthode probabiliste est décrite plus loin. - La densité a été supposée connue pour cette estimation. Bien que ce critère reste difficile à estimer sans appareil de mesure, il a été conservé pour disposer d’un nombre suffisant de critères et la valeur étant binaire, aucune imprécision ne pouvait être prise en compte. L’imprécision relative aux critères « odeur », « couleur » et « pH » est prise en compte par l’utilisation de distributions de probabilités. Ainsi, un critère sélectionné n’est plus traité comme une valeur sûre à 100%, mais comme un degré de vraisemblance de plusieurs critères. Par exemple, si la couleur orangeâtre est observée, il s’agira peut être d’une substance de couleur orange (sans certitude), mais il pourra aussi s’agir d’une substance d’une couleur proche de l’orange. Les substances chimiques alors retenues seront celles qui sont de couleur orangeâtre ou rougeâtre ou jaunâtre ou brunâtre, et avec des probabilités différentes. Ces probabilités peuvent être interprétées ensuite comme un degré de concordance avec les critères observés/mesurés. Une substance rouge coïncide à 100% avec la couleur rougeâtre observée, alors qu’une substance de couleur orangeâtre ne coïncidera qu’à 50% (cf. Figure 17). IV.4.1.4 Imprécision du critère « couleurs » Ne disposant d’aucune donnée sur le taux d’erreur de perception des couleurs, c'est-à-dire les probabilités de voir une couleur en présence d’une autre couleur, une modélisation a été réalisée d’après l’avis d’experts. S’inspirant de la logique floue, des fonctions de croyance ont été déterminées. Il ne s’agit pas, ici, 100 Chapitre IV Identification des substances chimiques d’une modélisation par triangle, trapèze ou autres fonctions usuelles. Ces modélisations se prêtent bien à des données dont les degrés de similarité sont représentables sur un axe unique, ce qui n’est pas le cas ici. Les modélisations habituellement utilisées s’appliquent aux couleurs du spectre lumineux associées à une valeur de longueur d’onde (représentation unidimensionnelle) ou décomposées en triplet de couleurs primaires (rouge, vert et bleu), et ne sont pas adaptées à la perception de couleurs soustractives des substances chimiques. Pour chacune des onze couleurs présentes en base de données, une distribution de probabilité a été réalisée (Cf. Figure 17, Figure 18 et Figure 19). Il faut les interpréter comme un indice de concordance. En prenant l’exemple d’un sapeur-pompier du binôme de reconnaissance sous ARI (Appareil Respiratoire Isolant) et en scaphandre limitant la visibilité lors d’une intervention de nuit, qui rapporte avoir constaté une fuite laissant s’échapper un liquide orangeâtre, on considérera que toutes les substances de couleur orange en base de données correspondent à 100%. Mais il pourra s’agir d’une substance jaune avec un indice de concordance (ou une probabilité) de 50%. Les substances rouges auront également une probabilité de 50% et les substances marrons correspondront à 25% (Cf. Figure 17, courbe orange). 100 80 Jaunâtre Orangâtre Rougeâtre Brunâtre % 60 40 20 0 Bleu Vert Violet Marron Rouge Orange Jaune Blanc Gris Noir Incolore Figure 17 : Distribution de probabilité par couleur (couleurs chaudes) 101 Chapitre IV Identification des substances chimiques 100 80 Violacé Bleuâtre Verdâtre % 60 40 20 0 Bleu Vert Violet Marron Rouge Orange Jaune Blanc Gris Noir Incolore Figure 18 : Distribution de probabilité par couleur (couleurs froides) 100 80 Blanchâtre Grisâtre Noirâtre Incolore % 60 40 20 0 Bleu Vert Violet Marron Rouge Orange Jaune Blanc Gris Noir Incolore Figure 19 : Distribution de probabilité par couleur (non couleurs) Un cas particulier est la présence suspectée d’une substance incolore. L’absence de coloration peut être due à une concentration faible d’une substance colorée. Donc toutes les couleurs ont une probabilité non nulle. IV.4.1.5 Imprécision du critère « pH » Il a été fait de même pour le pH, mais ce sont des fonctions triangle qui ont été utilisées. Il existe de telles modélisations dans la littérature, mais elles sont adaptées à des applications précises et souvent ne s’appliquent qu’à une plage de valeurs restreintes (acides forts par exemple). La figure ci-dessous présente la modélisation du pH telle que : - Le choix a été fait d’accepter un degré d’imprécision. - Bien que le pH soit une grandeur continue, les valeurs portées sur l’axe des abscisses appartiennent à un ensemble discret correspondant aux sept intervalles de la base de données. 102 Chapitre IV - Identification des substances chimiques Le pH « données opérationnelles » ne prend plus que trois valeurs, d’où les trois courbes de distribution de probabilités. 100 80 60 % Acide Neutre Base 40 20 0 1 acid (<3) acid (3-5) weak acid (6) neutral (7) pH weak base (8-9) base (10-12) base (>12) 14 Figure 20 : Distribution de probabilité du critère pH IV.4.1.6 Imprécision du critère « odeur » Les retours d’expérience nous apprennent que les indicateurs qui préviennent de la présence d’une substance chimique, conduisant à alerter les services de secours, sont l’apparition de symptômes et plus souvent la perception d’une odeur chimique ou incommodante. L’étude sur l’identification d’une substance chimique à l’aide des tubes colorimétriques et de l’expertise des sapeurs-pompiers [Bronner et al., 2008] a montré que l’odeur est un paramètre utile à l’identification, mais qui n’est pas toujours fiable. Pope et al. (2000) soutiennent que « la science d’évaluation de l’odeur est subjective à cause de ses différentes facettes : caractère, acceptabilité, intensité, caractère hédonique, etc. » L’identification d’une substance par son odeur reste subjective et incertaine : - Tous les produits ne sont pas perceptibles par l’odorat humain (monoxyde de carbone par exemple). - La détection et la reconnaissance d’une odeur dépendent de la concentration de la molécule odorante. A très faible concentration, « l'image » d'activation des centres intégrateurs n'est pas suffisamment différente du « bruit de fond » et l'information n'est pas détectable. A une concentration supérieure, on atteindra le seuil de détection : une odeur indéfinissable. A plus forte concentration encore, « l'image » devient nette et peut alors être comparée à une information déjà mémorisée. - Les personnes n’ont pas la même sensibilité selon le nombre et la répartition des cellules nasales. 103 Chapitre IV - Identification des substances chimiques Et la reconnaissance d’une signature olfactive dépend de l’expérience des personnes. - Il faut également tenir compte de l’accoutumance d’une personne, c'est-àdire la perte de sensibilité temporaire. - De plus, certains produits ne sont plus perceptibles lorsque la concentration dépasse un seuil car ils provoquent une anesthésie olfactive. Par exemple, l’H2S dont le seuil de détection olfactive varie de 0,02 à 0,1 ppm, a un seuil d'anesthésie olfactive égal à 150 ppm. L’utilisation de l’odeur comme critère discriminant est sujet à discussions à cause des risques à sentir une substance toxique. La perception de l’odeur dépend du seuil olfactif et certains produits comme l’isopropanol, ont un seuil olfactif supérieur à leur VLE (Valeur Limite d’Exposition). De plus, une fois équipés des tenues de protection type scaphandre, les sapeurs-pompiers sont isolés et ne peuvent plus sentir la substance. Mais l’odeur peut avoir été perçue par les personnes incommodées ou lors de l’arrivée des premiers intervenants. D’ailleurs l’odeur est mentionnée dans les fiches réflexes de reconnaissance [SDIS 54, 1999]. L’odeur est donc un critère discriminant à utiliser si l’information est disponible, mais, pour les raisons citées précédemment, il faut tenir compte de son imprécision. Ainsi, une odeur dégagée par une substance chimique (notée Oréelle) sera perçue différemment (notée Operçue) selon les personnes, les interférents, les concentrations, etc. La théorie des probabilités permet de calculer la probabilité conditionnelle P (O perçue / O réelle ) de sentir une odeur Operçue (d’un ensemble fini) en présence d’une odeur précise Oréelle. Pour déterminer les probabilités conditionnelles à la perception d’une odeur, des tests ont été réalisés sur 15 personnes. Aucune distinction n’a été faite en fonction de l’expérience des personnes et de leur sensibilité car le groupe de tests était trop restreint pour tenir compte de catégories de personnes en fonction de leur habitude à sentir des substances chimiques (néophyte, sapeurpompier RCH, chimiste, …). Les tests ont consisté à faire déterminer la nature des produits chimiques et à leur demander de reconnaître l’odeur perçue parmi une liste limitée correspondant aux critères utilisés dans la base de données. Les réponses au test permettent de calculer les distributions de probabilités (de 104 Chapitre IV Identification des substances chimiques sentir une odeur) conditionnelles à la présence réelle d’une odeur avérée, ou plus précisément, à la présence d’une substance chimique associée à une odeur. L’association odeur avérée et produit chimique est une simplification pouvant introduire des erreurs mais nécessaire au calcul des probabilités a posteriori P (O perçue / O réelle ) qui est l’information intéressante car elle va permettre de sélectionner les produits possibles en fonction de l’odeur perçue en tenant compte de l’imprécision. P (O réelle / O perçue ) = P (O réelle ).P (O perçue / O réelle ) P(O perçue ) Eq. 5 A partir des bases de données (WISER, NIOSH, INRS, …), une odeur Oréelle de notre base de données a été associée à l’odeur du produit Oprod. On a donc Oréelle = Oprod Par exemple, le dichorométhane est associé à une odeur fruitée/sucrée dans la base de données de WISER. Oprod=dichorométhane = "fruitée/sucrée". Il y a des associations triviales telles que la solution d’ammoniac qui est associée à une odeur d’ammoniac. Oprod=ammoniac = "ammoniac". D’après les bases de données, certaines substances peuvent être associées à plusieurs odeurs. Dans ce cas, chaque odeur sera associée au produit. L’isopropanol est associé à l’odeur d’acétone et d’alcool. Oprod=isopropanol = Oréelle="alcool" Oprod=isopropanol = Oréelle="acétone" Mais lors des calculs, la probabilité d’apparition P(Oréelle="alcool") sera divisée par le nombre d’odeurs associées à un même produit, soit deux odeurs dans le cas de l’isopropanol. Modifications apportées aux distributions de probabilités conditionnelles Les substances inodores De même que pour les couleurs, l’absence de perception d’odeur ne signifie pas qu’il s’agit uniquement d’une substance chimique inodore, mais il se peut que la concentration est soit trop élevée, soit trop faible. Donc en l’absence 105 Chapitre IV Identification des substances chimiques d’odeur, une probabilité forte est associée à la présence d’une substance inodore mais les autres odeurs ont également une probabilité (plus faible) d’être présente. La valeur « autre odeur » de la base de données Dans la base de données, seulement 14 odeurs sont distinguées, plus les substances inodores. Certaines substances chimiques n’ont pas une odeur correspondant aux 14 de la base de données ; elles sont alors associées à la valeur « autre odeur ». Le critère « autre odeur » rassemble trop de valeur pour être traité comme précédemment avec des odeurs précises. Faute de données, la distribution de probabilité associée est construite sur le même principe que pour l’absence d’odeur. Une forte probabilité pour la valeur « autre odeur » et une faible probabilité pour les autres valeurs excepté « inodore ». Les odeurs qui n’ont pas été testées par notre groupe « test » La démarche est la même pour les odeurs qui n’ont pu être testées : fruité, ail, menthe, pomme, amende, … En l’absence d’information, la distribution de probabilité a été choisie pour favoriser l’odeur en question et laisser une imprécision faible pour toutes les autres odeurs. 100 80 acetone alcohol ammonia chlorine odorless petroleum sulfur % 60 40 20 0 acetone alcohol almond ammonia apple banana chlorine fishy fruity garlic minty mothball odorless other petroleum sulfur Figure 21 : Distribution de probabilités du critère odeur IV.4.1.7 Sélection des substances à partir de critères imprécis La concordance de la description d’une substance chimique avec les critères observés est le produit des probabilités conditionnelles maximums associé à chaque critère. Une substance S est décrite par n descripteurs binaires. 106 Chapitre IV Identification des substances chimiques S : [s1 ,..., sn ] ∈ {0,1} n Eq. 6 Et m critères décrivent la substance recherchée T définie comme : T : [t1 ,..., t n ]∈ {0,1} et n ∑ n i =1 i t =m Eq. 7 La concordance d’une substance S avec les observations ti est : { } concordance( S ) = ∀j / t j = 1, ∏ j max (P (si / t j ) , ∀i ∈ [1..n] ) Eq. 8 Exemple : Odeur perçue = Acétone Couleur = Orange Une substance orange avec une odeur d’acétone a une probabilité de (1 x 1 = 1) Alors qu’une substance rouge qui sent l’alcool aura une probabilité de (0,5 x 0,4 = 0,2) Et une substance incolore avec une odeur d’acétone aura une probabilité nulle (0 x 1) du fait que la valeur « incolore » est trop éloignée de la valeur « orange » Pour chaque critère observé, c’est la probabilité conditionnelle maximum qui intervient dans le produit. En effet, pour un même critère (par exemple la couleur), une substance peut être associée à plusieurs valeurs (rouge, orange) de probabilités conditionnelles différentes (s’il s’agit d’une substance brunâtre, P(rouge/brunâtre)=0,5 alors que P (orange/brunâtre)=0,25). Chaque substance est alors associée à une valeur comprise entre 0 et 1, qui correspond à la ressemblance de chacun de ses critères par rapport aux critères perçus. Un produit sera retenu si sa probabilité est supérieure à un seuil à définir. Le graphique ci-dessous (Figure 22) représente le nombre de substances chimiques correspondant à un nombre de critères donnés pour des seuils de 100%, 50%, 25% et 12%. Avec les distributions de probabilités définies précédemment, un seuil à 50% revient à un degré d’écart tous critères confondus. Quel que soit le nombre de critères observés, une substance ne sera retenue que si un seul critère est 107 Chapitre IV Identification des substances chimiques différent des valeurs observées d’un degré. Par exemple, une couleur rouge au lieu d’orange, ou un pH légèrement différent : acide faible au lieu de neutre. Une concordance de 25% autorise deux critères différents (rouge et acide faible au lieu de orange et pH neutre) ou un critère différent mais avec un écart plus important (pH acide (3-5) au lieu de acide faible, ou encore couleur brunâtre au lieu d’orange). La dernière limite à 12% permet de sélectionner toutes les substances avec trois degrés d’écart. 300 Nombre de substances chimiques 250 200 Seuil > 12% Seuil > 25% Seuil > 50% Seuil = 100% 150 100 50 0 0 1 2 3 4 Nombre de criteres physico-chimiques 5 Figure 22 : Nombre de substances correspondantes à un nombre de critères physico-chimiques imprécis Pour une combinaison de cinq critères physico-chimiques, le nombre de substances correspondantes est de l’ordre de cinq. Mais en tolérant une imprécision de trois degrés (seuil à 12%) avec les distributions de probabilités admises, le nombre de substances est triplé. Les critères physico-chimiques permettent, en moyenne, de cibler un petit nombre de substances chimiques, mais dans le cas d’une petite base de données et pour six critères connus précisément. De plus, tous les critères ne sont pas spécifiques et le nombre de substances correspondantes est très variable selon les critères connus. Pour quatre critères, le nombre de substances varie de 1 à 47 pour une moyenne de 108 Chapitre IV Identification des substances chimiques 11. L’identification est précise lorsque les critères sont spécifiques (un gaz orange), mais d’autres critères (un liquide acide incolore et inodore) ne sont pas discriminants et correspondent à 47 substances. IV.4.1.8 Récapitulatif et discussion Est-il possible d’identifier précisément une substance chimique à partir des données opérationnelles disponibles en situation d’urgence ? D’après notre étude et celle de Bhaynani [Bhavnani et al., 2007], il ressort qu’en moyenne, les combinaisons de symptômes ne sont pas suffisamment discriminantes : plus de 40 symptômes sont nécessaires pour identifier précisément une substance chimique et plus de 14 symptômes pour disposer d’une liste réduite de substances possibles. Ce nombre de symptômes est trop important pour être disponibles en situation d’urgence. De plus, Il est parfois difficile d’identifier un symptôme (imprécision qui n’a pas été prise en compte dans cette étude) et que la cause d’un symptôme n’est pas toujours liée à la présence de la substance chimique (incertitude difficile à prendre en compte). Les critères physico-chimiques sont plus discriminants, mais doivent être estimés avec précision, ce qui est difficile sur le terrain. Lorsque l’imprécision est prise en compte, les critères physico-chimiques restent discriminants en moyenne. Mais, il y a une très grande variabilité selon les critères connus et les choix effectués tendent à minorer l’imprécision relative aux données opérationnelles : - La densité est considérée connue. - Le seuil d’imprécision fixé arbitrairement et les distributions de probabilités restent favorables par rapport à la réalité du terrain dans certains cas. Mais sans expérimentation sur le terrain, il n’est pas possible de préciser le seuil d’imprécision. Les résultats de cette étude sont à prendre comme une borne optimiste de la qualité de l’identification par une approche logicielle. Avec une imprécision plus grande et en tenant compte de l’incertitude, il est légitime de penser que l’identification en situation d’urgence conduira à une liste de substances chimiques trop importante pour être exploitable par les urgentistes. Qui plus est, cette étude a été réalisée sur une base de données réduite, dont le contenu n’est peut-être pas représentatif de l’ensemble des substances chimiques pouvant être rencontrées en situations d’urgence. 109 Chapitre IV Identification des substances chimiques La précision de l’identification par cette approche logicielle n’a pas été évaluée en combinant à la fois critères physico-chimiques et symptômes. La combinaison des deux est abordée dans le paragraphe suivant à l’aide de deux retours d’expérience. IV.4.2 Estimation de la précision de l’identification à l’aide de retours d’expérience Dans ce paragraphe, deux retours d’expérience (REX) sont utilisés pour évaluer la précision de l’identification à l’aide des données opérationnelles. La démarche consiste à saisir dans le logiciel WISER, les symptômes et critères physico-chimiques mentionnés dans le REX. A chaque saisie de critère, le nombre de substances chimiques correspondant est indiqué et une vérification de la concordance entre les critères saisie et la substance chimique recherchée est faite. La base de données utilisée est la version v3.0.39 contenant 416 substances. IV.4.2.1 Intoxication à l’acide cyanhydrique IV.4.2.1.1 Présentation du REX Le 19 janvier 1983, dans une usine à Montreuil (France), il se produit une intoxication collective à l’acide cyanhydrique (n° CAS : 74-90-8) [Noto et al.]. Description : Gaz incolore, de faible densité avec une odeur d’amende amère décelable à la dose de 1ppm. Symptôme : 5 personnes en arrêt cardio-respiratoire 1ère victime : nausée, maux de tête, sensation d’oppression thoracique puis arrêt cardio-respiratoire 2ème à 5ème victime : arrêt cardio-respiratoire 6ème : incommodée, présentant des vertiges 110 Chapitre IV IV.4.2.1.2 Identification des substances chimiques Informations saisie dans WISER D’après le REX, plusieurs critères descriptifs sont connus ainsi que des symptômes. critères descriptifs : Etat = Gaz 75 substances Color = Colorless 71 substances Specific gravity < 1 43 substances Odor = Almond 5 substances (critère très discriminant) On supposera la densité connue, bien que ne pouvant être estimée visuellement. Avec ces critères, cinq substances sont identifiées comme pouvant être la substance recherchée Nom de la substance N° CAS Cyanogen 460-19-5 Cyclobutane 287-23-0 Hydrogen Cyanide 74-90-8 Neopentane 463-82-1 Vinyl Methyl Ether 107-25-5 Symptômes : Arrêt cardio-respiratoire 4 substances : Vinyl Methyl Ether éliminé Nausée 4 substances Maux de tête 3 substances : Neopentane éliminé Vertiges (Dizziness) 2 substances: Hydrogen Cyanide éliminé Au final, l’ajout du symptôme « vertiges » conduit à supprimer la substance chimique recherchée et conduit à une erreur d’identification. Dans la base de données, le symptôme « vertiges » n’est pas associé au produit recherché. Par contre, ce symptôme apparait dans la description au format texte de l’acide cyanhydrique dans le logiciel WISER dans la section relative aux risques chroniques "chronic exposure". 111 Chapitre IV Identification des substances chimiques Dans [Us Army Chemical School, 2005], les vertiges sont indiqués dans les symptômes d’une exposition aigüe : "Inhalation of small amounts causes giddiness". Dans [O'Neil et al., 2004], également : "Headache, vertigo, nausea and vomiting may occur with lesser concns." Il s’agit d’une donnée manquante dans la base de données qui se traduit par l’élimination de la substance recherchée. Par contre, deux substances correspondent aux critères saisies (Cyanogen et Cyclobutane). L’absence de données dans la base de données peut conduire à une erreur d’identification. Après l’ajout de cette donnée manquante, la saisie se poursuit avec le dernier symptôme constaté sur la première personne intoxiquée. Cette dernière information conduit à une identification impossible car aucune substance ne correspond à l’ensemble des critères. Oppression thoracique 0 substance Cette information n’est pas répertoriée. Dans les bases de données consultées, l’acide cyanhydrique ne provoque pas d’oppression thoracique. D’où plusieurs conclusions possibles : - cette information est manquante en base de données, - ou le symptôme n’est pas avéré, - ou il est du à une autre cause. IV.4.2.1.3 Résultats obtenus Les critères physico-chimiques se révèlent discriminants, en particulier l’odeur, à condition de l’identifier clairement. Par contre, les symptômes n’apportent que peu d’information : 80 substances chimiques correspondent aux cinq symptômes observés contre cinq substances correspondant aux quatre critères. De plus, deux symptômes qui ne sont pas associés à la substance recherchée sont source d’erreur. En situation d'urgence seule l’odeur aurait pu orienter vers la substance recherchée car seulement huit substances sont des gaz ayant une odeur d’amande. Les autres données n’apportent que peu information ou sont des sources d’erreur. 112 Chapitre IV Identification des substances chimiques IV.4.2.2 Intoxication au bromure de méthyle IV.4.2.2.1 Présentation du REX Etude d’un cas d’intoxication au travail [Maréchal-Blanckaert et al., 1997] : Une personne, âgée de 27 ans, est hospitalisée à la suite d’une exposition accidentelle aux vapeurs toxiques de bromure de méthyle (N° CAS : 74-83-9) pendant environ 15 minutes, à des concentrations de 20 g/m3, soit 5 000 PPM. Description : « Le bromure de méthyle est un gaz incolore, inodore, toxique et redoutable en raison de son caractère insidieux. II est peu soluble dans l’eau, et sa densité est plus importante que celle de l’air. » Symptôme : « A l’entrée, il est conscient mais présente un syndrome cérébelleux avec démarche ébrieuse, troubles gastro- intestinaux (nausées, vomissements, douleurs abdominales et diarrhée). » IV.4.2.2.2 Informations saisie dans WISER Description : Gaz incolore, Inodore 24 substances Densité > 1 21 substances Symptômes en observation clinique : Nausées, vomissements, Douleurs abdominales et diarrhée 8 substances (erreur) Dans la base de données de WISER, le bromure de méthyle n’est pas associé au symptôme « douleurs abdominales ». Pourtant cette substance chimique est bien référencée comme provoquant des douleurs abdominales dans la base de données du NIOSH. La recherche est poursuivie sans ce symptôme. 113 Chapitre IV Identification des substances chimiques Nausées, vomissements et diarrhée 9 substances L’observation « d’un syndrome cérébelleux avec démarche ébrieuse » n’est pas facile à traduire en critères proposés dans WISER. D’après un expert, cinq symptômes pourraient correspondre, mais il n’est pas possible d’être affirmatif. Agitation 6 substances Confusion mentale 5 substances Vertiges 3 substances Céphalées 3 substances Perte de la coordination 0 substance Le symptôme « Perte de la coordination » est donc retiré de la saisie. Présence d’un érythème au niveau des mains et des pieds (parties cutanées en contact avec le toxique). Erythème 0 substance Le symptôme ne conduit à aucune identification. Il aurait donc induit en erreur. Il est également retiré pour la suite. Les lésions cutanées avaient un aspect bulleux pouvant correspondre à une brulure de stade II. Brûlure 2 substances Le patient va présenter 12 heures après son admission, une crise convulsive généralisée, suivie d’un coma profond aréactif et hypertonique, […] Convulsions IV.4.2.2.3 2 substances Résultats obtenus Cette fois encore, ce sont les critères physico-chimiques qui sont discriminants. Dans le meilleur des cas, l’identification conduit à deux substances : l’hexafluorure de sélénium et le bromure de méthyle qui est la substance recherchée. Mais pour cela, il faut bien interpréter deux symptômes particulièrement difficiles même pour des personnes accomplies. Certains 114 Chapitre IV Identification des substances chimiques symptômes qui n’apparaissent que plusieurs heures après l’incident ne seront donc pas disponibles en phase d’urgence. IV.4.2.3 Discussion Sur les deux retours d’expérience ayant servi à tester la précision de l’identification grâce au logiciel WISER, il ressort la difficulté d’identifier précisément une substance chimique. D’une part, par la nécessité de connaître de nombreux critères et symptômes. Pendant la phase d’urgence, tous les critères renseignés dans le REX ne seront pas connus (densité, certains symptômes, …). Et la prise en compte de l’imprécision et de l’incertitude ne ferait que dégrader la précision de l’identification avec l’ajout de nombreuses substances. D’autre part, l’utilisation de critères mal renseignés en base de données ou mal identifiés sur le terrain conduit à des erreurs. L’identification précise d’une substance chimique étant difficile à réaliser à partir des données opérationnelles en faible nombre, il faut alors s’orienter vers une autre solution : l’identification des dangers liés à la substance. IV.5 Identification des dangers liés à une substance chimique à partir des données opérationnelles Indéniablement, la prise de décision opérationnelle repose sur la connaissance de la substance chimique. Elle permet d’évaluer les conséquences possibles et de déterminer les périmètres de sécurité. Elle renseigne également sur son comportement dans le milieu ambiant (solubilité, réactions possibles avec d’autres produits, produits de décomposition pouvant se former), qui va servir aux choix des moyens à utiliser en cas d’intervention des services de secours, ainsi que les précautions à prendre. Mais en l’absence d’une connaissance précise de la substance chimique, d’autres informations peuvent aider à la prise de décision. L’identification des dangers constitue déjà un premier niveau d’aide à la décision. Par exemple, la connaissance précise de la substance chimique n’est pas nécessaire pour l’utilisation des fiches réflexes [FNSPF, 1992b] p287-303. Il est uniquement nécessaire de connaître l’état du produit (gaz ou liquide) et les risques qui y sont liés (inflammable, toxique, corrosif) ; l’état liquide ou gazeux pouvant être 115 Chapitre IV Identification des substances chimiques facilement connu sur le terrain. Les dangers relatifs à la substance contraignent également le choix des protections, matériels (pompe, pinoche, …) et permettent la sélection de périmètres par défaut. Le choix a donc été de proposer une méthodologie d’aide à l’identification des dangers liés à une substance chimique. L’étape préliminaire est de vérifier que l’information disponible en situation d'urgence permet d’identifier les dangers. Ensuite, un logiciel adapté à cette problématique a été développé sur la base du fonctionnement du logiciel WISER. IV.5.1 Démarche L’objectif principal est de développer une méthode d’identification des dangers en fonction des données opérationnelles, c'est-à-dire une fonction capable d’associer à une substance dont on connait les descripteurs, la classe correspondante avec un taux d’erreur acceptable. La première étape est de constituer une base de données fiables (IV.3) pour réaliser une étude de faisabilité d’une telle méthode. Puis il s’agit de s’assurer que l’information disponible en situation d'urgence est suffisante à l’identification des dangers qui sont liés aux substances chimiques. IV.5.2 La quantité d’information est-elle suffisante ? Les arbres de décision apportent un début de réponse en indiquant : - la complexité des arbres nécessaires à une identification précise (construction d’arbres complets), - la qualité de l’identification pour des arbres plus restreints (construction d’arbres limités en profondeur), - le nombre de critères discriminants différents pour chaque arbre. Dans un premier temps, nous ne nous intéresserons pas à la règle de décision produite par les arbres, mais à l’information qu’ils contiennent à travers la hiérarchisation des critères discriminants. C’est le premier principe, celui de la construction de l’arbre qui va permettre d’identifier cette information. Cette recherche d’information est présentée au paragraphe suivant. 116 Chapitre IV Identification des substances chimiques IV.5.2.1 Recherche des paramètres discriminants à l’aide des arbres de décision La classification des substances selon huit classes (trois types de dangers de valeur binaire soit 23 classes) a été séparée en trois problèmes distincts, en identifiant séparément les trois dangers. Trois arbres sont donc construits, un par danger. Seuls les résultats obtenus sur les liquides sont présentés, mais l’argumentation de ce paragraphe est valable aussi pour les solides et les gaz. La base de données contient 242 substances chimiques à l’état liquide, décrites par 132 critères binaires. Et pour chacun des trois risques, le logiciel StatBox Pro20 a été utilisé pour construire les arbres de décision selon deux méthodes : la méthode CART qui repose sur l’indice de Gini pour évaluer la dispersion et cherche à obtenir les classes les plus pures possibles ; la méthode CHAID qui utilise, quant-à-elle, le test du χ 2 pour obtenir des divisions en fonction du descripteur qui a le plus fort lien statistique avec la classe. Les résultats sous forme d’arbre sont facilement lisibles. Pour chaque nœud de l’arbre, sont indiqués : - l’effectif de la population - le pourcentage de chaque classe (non inflammable et inflammable - le critère le plus discriminant, celui selon lequel est partagée la population en deux groupes - la valeur de χ 2 de ce critère Un exemple d’arbre obtenu avec le logiciel StatBox est présenté en Figure 23. La construction de l’arbre a été limitée à quatre niveaux pour une question de lisibilité. 20 StatBox Pro est un logiciel commercialisé par la société Grimmersoft et s’utilise avec Microsoft Excel. La version de Statbox Pro qui a été utilisée est la v6.40. 117 Chapitre IV Identification des substances chimiques 1| Effectif : : 49,00 : 73,47% 1 : 26,53% 1| Effectif : : 86,00 : 59,30% 1 : 40,70% 0| Effectif : : 46,00 : 78,26% 1 : 21,74% 1| Effectif : : 33,00 : 33,33% 1 : 66,67% Gastro/Urinary=vomiting 0,0131 0| Effectif : : 4,00 : 100,00% 1 : 0,00% Respiratory=pulmonary edema 0,0475 1| Effectif : : 7,00 : 28,57% 1 : 71,43% Effectif : : 242,00 : 23,14% 1 : 76,86% Temperature=shivering 0,0143 Respiratory=congestion 0,0189 0| Effectif : : 37,00 : 40,54% 1 : 59,46% 1| Effectif : : 114,00 : 46,49% 1 : 53,51% 1| Effectif : : 3,00 : 0,00% 1 : 100,00% 0| Effectif : : 28,00 : 7,14% 1 : 92,86% Specific Gravity=sinks in water (> 1) 0,0971 Taste=other taste 0,0035 1| Effectif : : 5,00 : 0,00% 1 : 100,00% Eyes=impaired vision 0,0118 0| Effectif : : 2,00 : 100,00% 1 : 0,00% 0| Effectif : : 21,00 : 0,00% 1 : 100,00% 1| Effectif : : 1,00 : 100,00% 1 : 0,00% 0| Effectif : : 128,00 : 2,34% 1 : 97,66% Skin=sweating 0,0079 0| Effectif : : 127,00 : 1,57% 1 : 98,43% 1| Effectif : : 1,00 : 100,00% 1 : 0,00% Nose=bloody nose 0,0081 0| Effectif : : 126,00 : 0,79% 1 : 99,21% 1| Effectif : : 99,00 : 0,00% 1 : 100,00% Neurological=lowered mental state 0,0002 0| Effectif : : 27,00 : 3,70% 1 : 96,30% Figure 23 : Premiers niveaux de l’arbre de décision du danger « inflammable » des liquides (méthode CART) 118 Chapitre IV Identification des substances chimiques En tout, six arbres ont été construits (3 dangers x 2 méthodes) pour chaque état. La profondeur des arbres n’a pas été limitée puisqu’il s’agit pour l’instant de rechercher les critères discriminants et pas de déterminer une fonction d’identification. Le tableau ci-dessous (Tableau 12) synthétise les caractéristiques des arbres obtenus pour les substances à l’état liquide. Tableau 12 : Comparaison des arbres construits par les méthodes CHAID et CART (liquides) CHAID CART Nombre de Profondeur Nombre de Nombre de Profondeur Nombre de critères max. nœuds critères max. nœuds INF 23 8 26 28 11 30 TOX 20 10 25 26 12 27 EXP 39 9 61 48 14 61 Les deux méthodes produisent des arbres permettant une discrimination complète des dangers. C'est-à-dire que toutes les feuilles des arbres contiennent des substances présentant le même danger. Cependant il faut disposer de beaucoup de critères pour identifier les dangers de l’ensemble des substances, en particulier pour le danger « explosif ». La profondeur maximum comprise entre 8 et 14 selon la méthode et les dangers donne une indication du nombre maximum de critères à connaitre pour identifier les dangers. Un constat est que les arbres obtenus avec la méthode CHAID sont mieux équilibrés. C'est-à-dire que les chemins (racine, feuille) sont de tailles voisines alors qu’avec la méthode CART les arbres sont plus déséquilibrés. En dehors d’une vérification graphique ou de la théorie des graphes (profondeur plus grande pour un nombre de nœuds similaire), l’analyse de l’indice de Gini et du χ 2 permet de l’expliquer : Le test de Gini effectue une comparaison des proportions, mais l’effectif des sous-ensembles obtenus à chaque division n’intervient pas. Cela explique qu’à certaines divisions, il sera privilégié d’extraire un petit groupe homogène d’un ensemble, alors que la méthode CHAID tend à créer des sous-ensembles d’effectifs proches. • Avec la méthode CHAID la profondeur moyenne δ moy de l’arbre est plus petite donc il faut moins de critères, en moyenne, pour identifier la classe. δ CART ≥ δ CHAID 119 Chapitre IV Identification des substances chimiques δ ≥ δ ≥ log 2 ( N ) avec N le nombre de nœud de l’arbre Figure 24 : Arbres binaires de profondeurs différentes • Le nombre de critères différents nécessaires est plus petit avec la méthode CHAID. La quantité d’information totale est donc moins importante pour l’identification de l’ensemble des substances chimiques. • Le nombre de nœuds et la profondeur de l’arbre sont également plus petits avec la méthode CHAID. Il faudra donc moins de critères pour identifier l’ensemble des produits. En dehors de ces différences, les arbres utilisent globalement les mêmes critères. Il n’y a pas des arbres radicalement différents. Cela ne signifie pas qu’il n’existe pas d’autres arbres, d’autres combinaisons de critères pour réaliser l’identification des dangers, mais que certains critères se distinguent des autres et apparaissent comme étant plus discriminants quelle que soit l’indice utilisé ( χ 2 , indice de Gini, …). Dans un arbre de décision, les critères les plus discriminants sont proches de la racine de l’arbre. L’étude des premiers niveaux des arbres en tenant compte des tailles des groupes et du test associé au χ 2 permet d’identifier ces critères contenant l’information utile. IV.5.2.2 Information utile L’identification des paramètres discriminants peut déboucher sur deux utilisations : 1) Vérifier l’intérêt des critères à collecter pour compléter la base de données. Cela permet un gain de temps dans la réalisation de la base de 120 Chapitre IV Identification des substances chimiques données, en réalisant l’étude des données utiles sur une base réduite avant de réaliser la collecte d’information pour un plus grand nombre de substances. La condition nécessaire est que la base de données utilisée pour l’étude soit représentative de l’ensemble des substances chimiques de la base de données finale. 2) Déterminer les critères opérationnels à rechercher sur le terrain en situation d’urgence. Pour cette application, il faut limiter les critères à ceux qui peuvent être acquis et ne pas garder des critères comme les effets sur les victimes qui ne sont pas forcément présents ou demander d’obtenir des critères comme le goût d’une substance. Pour cette recherche d’information utile, les arbres ont été construits à partir des critères descriptifs (excepté le goût) et sans utiliser les effets potentiels sur les victimes. Les critères qui ressortent de cette étude sont présentés ci-après. Produits inflammables moins denses que l’eau Pour l’identification du danger d’inflammabilité d’un liquide, la densité se révèle être un critère très caractéristique des produits inflammables (Figure 25). En effet, dans la base de données utilisée, plus de 50% des produits sont plus légers que l’eau et plus de 97% de ces produits sont inflammables. Figure 25 : Critères discriminants pour les liquides inflammables Sur le plan opérationnel, ce critère est assimilé à un repère visuel : « estce que le produit flotte ou coule ? ». Mais c’est sans compter le fait que la fuite n’a pas toujours lieu dans l’eau, que le produit peut être incolore dans la majorité 121 Chapitre IV Identification des substances chimiques des cas ou encore être miscible. Mais il existe des appareils portatifs de mesure de densité qui pourraient être utilisés par les CMIC. La couleur, ainsi que l’odeur avec un degré moindre, sont également des critères discriminants selon les valeurs qu’ils prennent (critères non représentés sur cet arbre). Un liquide incolore ou inodore n’apportera pas beaucoup d’information, mais dans les autres cas, l’information permettra de cibler rapidement les dangers. A noter également une corrélation entre liquides explosifs et inflammables. Liquides explosifs et toxiques La arbres construction de des segmentation montre un lien entre les liquides explosifs et toxiques. Cependant le faible nombre de substances et la grande majorité de toxiques ne permet de tirer de Figure 26 : Critères discriminants pour les conclusions. liquides explosifs et toxiques Viscosité Il ressort également que tous les liquides visqueux sont des substances toxiques. Mais pour la même raison évoquée précédemment, la base de données manquant de substances non toxiques, il serait hasardeux de tirer de conclusions. Figure 27 : Critères discriminants pour les liquides toxiques 122 Chapitre IV Identification des substances chimiques Gaz Les gaz lourds ou odorants sont en grande majorité toxiques (Figure 28). Il y a également un lien entre gaz inflammables et gaz explosifs. Figure 28 : Critères discriminants pour les gaz toxiques Bilan sur la recherche d’informations discriminantes Les arbres de décision ont permis de montrer que les liquides moins denses que l’eau sont majoritairement inflammables. Il s’agit d’un critère très discriminant. En dehors de ce constat, les résultats obtenus avec les arbres ne permettent pas de mettre en évidence des critères très discriminants qui seraient à rechercher en priorité en situation d'urgence. Il n’y a pas de critères qui se distinguent des autres par leur valeur de χ 2 . IV.5.3 Identification des dangers à l’aide d’arbre de décision Un arbre de décision combine les critères discriminants pour constituer une de règle de décision. Dans notre cas, la règle de décision permet de connaitre pour une substance, si elle présente ou non le danger ciblé. Dans le paragraphe IV.5.2.1, les arbres obtenus montrent que l’information contenue dans l’ensemble des critères était suffisante pour permettre une identification des dangers de l’ensemble des substances avec un 123 Chapitre IV Identification des substances chimiques taux d’erreur nul. En effet, pour chacun des trois dangers retenus, il est possible de construire un arbre de segmentation dont chaque feuille regroupe des substances d’une même classe (toxique ou non, explosif ou non, …). Mais rien de garantit qu’il ne s’agit pas d’arbres spécialisés, adaptés aux données qui ont servies à les construire et incapables de généraliser à l’ensemble des possibles, ne permettant pas d’obtenir une bonne identification des autres substances chimiques. De même que d’autres méthodes comme les réseaux de neurones par exemple, les arbres de décisions construits sur un ensemble d’apprentissage tendent à se spécialiser, à apprendre par cœur et perdent de leur pouvoir de généralisation. IV.5.3.1 Formalisation du problème de discrimination Nous disposons d’un ensemble ou population X de N = 242 substances chimiques ou individus xi. Données d’entrée : Les paramètres d’entrée de la méthode sont les données opérationnelles contenues dans la base de données réalisée. Chaque substance est décrite par 132 critères binaires. x = { x1, x2 ,…, xd } ∈ {0,1}d (avec d=132 ) (9) Données de sortie : classes de risques Chaque substance est associée à trois des dangers de la classification NFPA (inflammable, explosif, toxique). C = {c1 , c2 ,..., c K } (avec K = 2 3 ) (10) Méthode de discrimination L’objectif de la méthode est de déterminer une fonction d’identification : f :X →C (11) A partir d’exemple d’apprentissage, c'est-à-dire des couples ( x, c) de X × C . Telle que la sortie de la fonction u i = f ( xi ) soit conforme à la classe ci (la valeur de sortie espérée) avec le moins d’erreur possible. Usuellement on choisira de calculer l’erreur moyenne quadratique. 124 Chapitre IV Identification des substances chimiques f ( xi ) − ci E = ∑ N i =1 N 2 (12) Simplification Afin de mieux visualiser la corrélation entre les descripteurs et chacun des dangers liés aux substances chimiques, l’identification des huit classes sera décomposée en trois fonctions distinctes (une par danger) réalisant une décision binaire. Cela permet également d’obtenir des fonctions moins complexes plus faciles à obtenir lors de la phase d’apprentissage. f danger : χ → { 0 ; 1 } avec danger ∈{inflammable, toxique, explosif} (13) IV.5.3.2 Ensemble d’apprentissage et généralisation Apprentissage et généralisation vont de paire. La phase d’apprentissage (construction de l’arbre) permet de tirer des règles à partir d’exemples. Et ces règles doivent être généralisables à l’ensemble des cas pouvant être rencontrés. Cela n’est possible qu’à certaines conditions sur le choix de l’ensemble d’apprentissage : - être de taille suffisante pour contraindre le problème d’ajustement de la fonction d’identification - et être représentatif de l’ensemble des possibles. Le principe de la construction d’arbre de segmentation limite de lui-même la taille de l’arbre et, par conséquent, la complexité de la fonction d’identification (son nombre de variables). Le problème n’est donc pas sous-déterminé. Il est possible de le vérifier par analogie avec les réseaux de neurones, les arbres de segmentation pouvant être reproduits par des réseaux de neurones de type perceptron multi-couches constitués de deux couches. Une rapide présentation des réseaux de neurones et du perceptron multicouches est nécessaire avant de poursuivre. Brève introduction aux réseaux de neurones Les réseaux de neurones (RN) ou modèles connexionnistes sont fondés sur « une analogie avec la physiologie de la transmission de l’information et de l’apprentissage dans les systèmes cérébraux. » [Cornuéjols et al., 2002]. 125 Chapitre IV Identification des substances chimiques D’un point de vue mathématique, un réseau de neurones peut être décrit simplement comme un graphe orienté21 dont les arêtes sont pondérées par un coefficient synaptique et dont les sommets sont les neurones. C'est-à-dire des unités élémentaires de calcul aux possibilités relativement faibles mais dont leurs interconnexions permettent d’effectuer des calculs globaux complexes. Neurone formel Un neurone artificiel est une approximation du fonctionnement du neurone biologique [McCulloch et al., 1943]. Cet élément de base des RN comporte n entrées Entrées x1 w1 x2 w2 et une sortie et réalise une fonction non linéaire, paramétrée, à valeurs bornées [Dreyfus et al., 2002]. Le neurone effectue y v wn une somme pondérée de poids wi sur ses entrées xi (variables sur lesquelles il opère), à laquelle b xn Figure 29 : Neurone formel s’ajoute un terme constant ou biais b. Le potentiel v, résultat du calcul, est soumis à une transformation par une fonction linéaire ou non, appelée fonction d’activation f. v = b + ∑i =1 wi xi n Eq. 14 Il existe plusieurs formes de fonction d’activation (identité, seuil, sigmoïde, …). Pour une grande majorité d’applications, la fonction d’activation est une sigmoïde dont l'expression habituellement retenue est : 1 f (v ) = 1+ e − ( v −θ ) T Eq. 15 où ß représente le seuil et T contrôle la pente. On utilise également la tangente hyperbolique d’équation : tanh(v ) = 21 e v − e −v e v + e −v Eq. 16 Un graphe orienté G=(S,A) est donc la donnée d’un ensemble fini non vide de sommets S et d’une relation binaire A définie sur S. Voir la théorie des graphes. 126 Chapitre IV Identification des substances chimiques Perceptron multi-couches Un PMC est constitué de plusieurs couches (Figure 22) : - une couche d’entrée - une ou plusieurs couches de neurones cachées n’ayant pas d’interaction avec l’extérieur - une couche de neurones de sortie Chaque neurone est relié à l’ensemble des neurones des couches voisines. Figure 30 : Architecture du PMC Arbres de segmentation et réseaux de neurones Un arbre de segmentation peut être classe qui réalise un OU des feuilles décrit comme un Perceptron Multi- correspondant à une même classe. Couches (PMC) particulier à deux couches cachées auxquelles il manque des liaisons (ou de poids nul). Les neurones de la première couche correspondent aux nœuds de l’arbre (n1 et n2) ; et la deuxième couche qui réalise un ET, est constituée des feuilles (f1 à f3). Il existe une connexion entre un neurone ni et un neurone fj s’il existe un chemin (ni ; fj) dans l’arbre. Enfin, la couche de sortie a un neurone par 127 Figure 31 : Arbre binaire et PMC équivalent Chapitre IV Identification des substances chimiques Taille de l’ensemble d’apprentissage Pour un arbre binaire comportant N nœuds, le nombre de feuilles est égal à N+1. Il faut donc un ensemble d’apprentissage de cardinal supérieur ou égal à N+1 ; cela dans le meilleur des cas, où les exemples correspondent précisément aux différents cas couverts par l’arbre. Dans le pire cas, il faut un nombre d’exemples doit correspondre à l’ensemble des cas potentiellement couverts par l’arbre. Il s’agit alors des combinaisons possibles de critères utilisés dans l’arbre, qui est au pire égal au nombre de nœuds. Le nombre de combinaison vaut 2N. La transformation en réseau de neurones permet de préciser cet intervalle [ N+1 ; 2N ] trop large pour être réellement utile. Pour un PMC, le nombre de paramètres à calculer lors de l’apprentissage est égal au nombre de coefficients synaptiques U. Soit un nombre minimum d’exemples équivalent à U. Par construction, le PMC équivalent à un arbre à un nombre de coefficients synaptiques - égal au nombre de feuilles N+1 en sortie de la couche cachée - égal à la somme des longueurs des chemins de l’arbre en entrée de la couche cachée. La somme des longueurs des chemins est maximale pour un arbre dont les nœuds sont sur un même chemin et vaut ( N + 1) × N + N . Elle est minimale pour 2 un arbre équilibré et vaut N × log 2 ( N ) . En considérant le pire des cas, il est nécessaire d’avoir un ensemble d’apprentissage d’une taille de l’ordre de ( N + 1) × N + N exemples. 2 Dans le cas des arbres de décision construits les bases de données de substances chimiques, le nombre d’exemples nécessaires dépassent la taille de la base de données. Le calcul du nombre exact d’exemples nécessaires en utilisant les longueurs réelles de l’ensemble des chemins (racine-feuille), on obtient des nombres légèrement inférieurs à la taille de la base de données. L’apprentissage est possible, mais ces nombres d’exemples nécessaires proches de la taille des bases de données indiquent que les arbres sont spécialisés. 128 Chapitre IV Identification des substances chimiques IV.5.3.3 Evaluation de l’identification des dangers par les arbres de segmentation Pour éviter d’avoir des arbres de décision trop spécialisés, la méthode CHAID peut interrompre la construction de l’arbre (pré-élagage) en fonction du test d’indépendance du χ 2 utilisé pour vérifier l’homogénéité des classes (pour un problème de classification). Une autre approche, la plus répandue, consiste à diviser les données en deux ensembles disjoints, l’un destiné à l’apprentissage et l’autre à la validation. Dans le cas des arbres de décision, la méthode CART construit l’arbre complet lors de l’apprentissage. Ensuite une phase de post-élagage est réalisée sur un ensemble de validation pour déterminer les sous-arbres terminaux devant être supprimés et éviter ainsi la spécialisation de la méthode d’identification. Mais ces méthodes utilisées pour la construction d’arbres de décision reposent sur un seuil devant être fixé par un expert et ne garantissent pas que le résultat est proche de l’optimal, ni même qu’il est suffisant. Il est donc nécessaire d’évaluer l’efficacité de la règle de décision. Etude des caractéristiques des arbres L’étude des caractéristiques des arbres obtenus ne permet pas de valider la méthode d’identification, mais donne tout de même une tendance. Cela fournit des indices permettant une première appréciation du pouvoir de généralisation. Les arbres de segmentation, quelle que soit la méthode, comporte un grand nombre de feuilles (avec en moyenne 2 à 5 produits par feuilles). Sachant qu’au final, il n’y a que deux classes à distinguer (présentant le risque en question ou non), le nombre de feuilles et la répartition des individus par feuille laisse à penser qu’il s’agit d’un arbre spécialisé et qu’il n’y a pas de véritable corrélation entre les critères et les individus. Il faut souligner que la taille des segments obtenus n’est exploitable que si on obtient au moins 20 à 30 observations au niveau des feuilles d’un arbre construit avec au moins 500 individus. Ainsi, dans le cas des liquides, les feuilles devraient contenir au moins dix individus, ce qui est le cas pour moins de 15% d’entre elles. Une évaluation rigoureuse peut être réalisée par validation croisée sur des données de validation qui n’interviennent pas lors de la phase d’apprentissage. 129 Chapitre IV Identification des substances chimiques Evaluation par validation croisée La méthode des échantillons-tests recommande d’effectuer l’apprentissage sur une partie de l’échantillon disponible et de tester les règles de discrimination sur l’autre partie. La mesure de performance est faite sur l’échantillon de test, à partir des pourcentages d’erreurs dans chaque classe. Le calcul peut faire intervenir un coût de mauvais classements, en différenciant les faux positifs des faux négatifs pour évaluer le risque d’erreur. Un faux positif, c'est-à-dire identifier un produit inoffensif comme dangereux entrainera la mise en place de moyens superflus, ce qui est moins dommageable qu’un faux négatif où une substance dangereuse ne sera pas reconnue comme telle. Qu’il s’agisse d’effectuer un calcul d’erreur ou d’utiliser un test statistique, il est nécessaire de disposer d’un échantillon suffisamment grand pour être représentatif de l’univers observé, de l’ensemble des substances chimiques. Avec un échantillon de moins de 500 observations, il est plus difficile d’estimer la stabilité des résultats de la phase d’apprentissage. La validation croisée apporte une solution à ce problème. Généralement, la validation croisée sera utilisée pour améliorer le calcul du taux d’erreur. Cette méthode consiste à diviser l’ensemble de n individus en m parties égales disjointes ; l’apprentissage sera réalisé sur m-1 parties et le taux d’erreur sera calculé sur l’échantillon-test qui n’est autre que la partie restante. La mesure de performance correspond au taux d’erreur moyen des m calculs d’erreur. Lorsqu’un seul individu est retiré, il s’agit alors d’un sous-échantillonnage exhaustif où m vaut 1 et la moyenne est donc faite sur n échantillons [Baradat et al., 2006]. Cette technique dite « de Jackknife », proposée par [Quenouille, 1949] et reprise par [Tukey, 1958] est surtout utilisée pour l’estimation du biais et de la variance d’estimateurs classiques [Lebart et al., 1995]. Dans les techniques précédentes, un individu est présent, au plus, une seule fois dans un échantillon. A l’inverse, le « Bootstrap » introduit par [Efron, 1979] est une technique de rééchantillonnage avec remise qui génère des échantillons de taille n et inclut la possibilité d’avoir plusieurs fois le même individu dans un échantillon. Chaque individu a une probabilité 1/n d’être sélectionné. Certains individus auront de e fait un poids plus important tandis que d’autres ne seront pas représentés. Cette méthode est employée pour analyser la variabilité des paramètres statistiques simples en produisant des intervalles de confiance. Dans le cas des arbres de décision, un contrôle peut être effectué en construisant plusieurs arbres à partir de sous-échantillons différents. Si les 130 Chapitre IV Identification des substances chimiques arbres obtenus sont presque équivalents, l’apprentissage sera considéré comme stable. S’ils sont très différents, il faudra être prudent quant aux conclusions de l’étude. C’est pour cette raison qu’il est préférable de disposer d’une population suffisante. Un premier contrôle de ce type a été réalisé, puis, en s’appuyant sur la validation croisée, des tests ont été réalisés sur la base de données des liquides qui est la plus complète. Comparaison des arbres obtenus sur différents échantillons Plusieurs arbres ont été construits à la fois à l’aide des méthodes CHAID et CART sur des échantillons comprenant 75% des individus (m=n/4). Ces arbres obtenus différent énormément. Pour les quatre arbres, le critère le plus discriminant (à la racine) est le même : la densité. Ensuite, les critères « pupilles dilatées » et « congestion » sont présents dans les trois premiers niveaux de l’arbre pour trois arbres sur quatre. Nous retrouvons effectivement la densité comme critère discriminant relevé au paragraphe IV.5.2.2. Figure 32 : Premiers niveaux de l’arbre de décision sur l’ensemble des substances liquides Il y a peu de ressemblances pour le reste des nœuds. Mais cela ne prouve pas que ces arbres ne soient pas capables de généraliser à l’ensemble des 131 Chapitre IV Identification des substances chimiques substances chimiques. En effet, lorsque plusieurs critères ont des indices ( χ 2 , indice de Gini, …) très proches, une faible variation de l’ensemble d’apprentissage peut conduire à de grandes modifications des arbres obtenus [Saporta, 2006]. Afin de vérifier l’efficacité des arbres de décision obtenu, il est nécessaire de les tester sur un ensemble n’ayant pas servi à l’apprentissage. Ebauche d’évaluation des arbres de décision Une validation croisée rigoureuse implique un nombre important d’apprentissages-tests ce qui n’a pas été possible du fait que le calcul des arbres n’était pas fait par une procédure automatique. Cependant la tendance qui se dégage d’un petit nombre de tests est parfois suffisante pour en tirer des conclusions. Les substances chimiques ont été séparées aléatoirement en deux sousensembles, le premier servant à construire l’arbre, l’autre à vérifier sa capacité d’identification. Ce sont encore les liquides et le danger d’inflammabilité qui ont servi à effectuer se travail. Sur les 242 produits liquides en base de données, 232 ont permis la construction de l’arbre, les 10 autres ont servi pour le test de l’arbre. Les résultats du test de l’arbre de décision sur 10 produits chimiques sont présentés dans le tableau suivant. Tableau 13 : Résultats de la méthode d’identification sur dix substances chimiques. N° Substances 1 2 3 4 5 6 7 8 9 10 chimiques Hydrogen Sulfide Sulphur Dioxide Acrylonitrile Toluene Nitroglycerin Chloroform Carbon Monoxide Kerosene Phosgene Benzyl Chloride classe de danger classe calculée (inflammable = 1) 1 0 1 0 1 0 1 1 0 1 (inflammable = 1) 1 1 1 1 1 0 1 1 0 0 132 Chapitre IV Identification des substances chimiques Le danger « inflammable » des produits n°2, 4 et 10 est mal identifié. Le dioxyde de soufre et le diisocyanate de toluène sont ininflammables ou peu inflammables [IRSN, 2006a; 2006b] et ne sont donc pas classés dans les produits inflammables (classification EU et NFPA). Mais d’après les règles de décisions définies précédemment, ces produits apparaissent comme inflammables. Et inversement, le Chlorure de Benzyle qui est inflammable [IPCS, 2001a] n’est pas identifié comme tel dans l’arbre de décision. Une partie de l’arbre de décision est présenté en Figure 33. Les règles de décision utilisées pour classer les trois substances (dioxyde de soufre, diisocyanate de toluène et Chlorure de Benzyle) sont représentées sous forme de trois chemins de couleurs différentes (respectivement vert, bleu et fuchsia). Sur les dix substances chimiques qui constituent l’échantillon test, trois sont mal classées. Cette procédure a été répétée cinq fois avec des ensembles de tests disjoints. Le nombre d’erreurs obtenu varie de une à trois substances mal identifiées, pour une erreur moyenne de 16%. 133 Chapitre IV Identification des substances chimiques Figure 33 : partie de l’arbre de décision des produits chimiques liquide : risque inflammable 134 Chapitre IV Identification des substances chimiques Pureté des feuilles d’arbres élagués Dans le cas d’arbres élagués, fournissant a priori une règle de discrimination généralisable, la pureté des feuilles constitue un autre indicateur de la capacité d’identification. Si les feuilles sont constituées d’individus de même classe, la règle d’identification correspondant au chemin racine-feuille permet une identification généralisable totale sous les de ce sous-ensemble, hypothèses que et que l’échantillon cette règle est d’apprentissage est représentatif et que le seuil d’élagage de l’arbre est choisi convenablement au problème de discrimination. Le nombre de substances des feuilles pures des arbres obtenus après élagage sont très différents selon les classes à identifier. Dans le cas des substances liquides (Tableau 14), 73,6% d’entre elles peuvent être identifiées avec certitude. Cette qualité d’identification n’est pas vraie pour les autres dangers. Tableau 14 : Effectif des feuilles pures d’arbres élagués (cas des liquides) Danger Effectifs des Erreur feuilles pures d’identification Inflammable 178 73,6% Toxique 73 30,2% Explosif 45 18,6% Il est également possible d’utiliser des règles de décision conduisant à des feuilles qui ne sont pas pures, mais cela se fait au prix d’erreurs d’identification. Le taux d’erreur d’identification pour chaque danger est présenté ci-dessous (Tableau 15) Tableau 15 : Erreur d’identification par danger (cas des liquides) Danger Substances Erreur correctement d’identification identifiées 135 Inflammable 208 14,0% Toxique 227 6,2% Explosif 234 3,3% Chapitre IV Identification des substances chimiques IV.5.3.4 Conclusions sur l’identification des dangers par les arbres de décision Les arbres de décision constituent une base de règles capable d’identifier précisément les dangers liés à une substance chimique. L’identification ne comporte aucune erreur dès l’instant que l’arbre a été construit sur la totalité des exemples de la base de données. Cela signifie que l’information contenue dans les critères est suffisante pour identifier les dangers. Cependant, l’étude des arbres et les tests réalisés en distinguant apprentissage et validation tendent à montrer que ces arbres ne sont pas capables de généraliser à d’autres substances sans erreurs d’identification. La procédure de vérification, s’effectuant aujourd’hui en manuel, nécessite d’être automatisée pour permettre l’ensemble des tests et le calcul du taux d’erreur en généralisation. IV.5.4 Conclusions sur les méthodes d’identification des dangers Les arbres de segmentation constituent un outil adéquat pour la recherche de critères discriminants. Appliqués à l’utilisation des données opérationnelles pour identifier les dangers liés aux substances chimiques, les arbres de segmentation n’ont pas révélés de critères très discriminants. En dehors de la densité des liquides pour le danger « inflammable », il n’y a pas de critères qui se dégagent nettement des autres. Il n’y a donc pas d’informations à rechercher en priorité, ni de moyens à mettre en œuvre pour l’obtenir. La recherche des critères discriminants trouvent une autre utilité dans la création de bases de données opérationnelles. Si l’on s’intéresse cette fois aux critères les moins discriminants, on peut détecter des données inutiles qu’il est possible de supprimer. Cela présente un intérêt dans la création d’une base de données opérationnelles. Cibler au préalable l’information à emmagasiner afin de ne pas collecter des données inutiles, représente un gain de temps en conception, mais également lors des recherches en situation d'urgence car l’information utile n’est pas noyée dans la masse. Si les arbres de segmentation ne se prêtent pas à la recherche des critères peu discriminants, les réseaux de neurones peuvent apporter une solution. L’analyse des coefficients synaptiques aux entrées permet un classement des critères correspondant à leur « contribution globale » dans la fonction d’identification. 136 Chapitre IV Identification des substances chimiques Les arbres de régression (de même que d’autres méthodes comme les réseaux de neurones) sont capables de réaliser une fonction de discrimination des dangers. Les résultats obtenus en apprentissage montrent que l’information des données opérationnelles est suffisante pour identifier les dangers qui sont liés à n’importe quelle substance avec une fiabilité de 100%. La profondeur des arbres est une borne majorante du nombre maximum de critères qu’il est nécessaire de connaître pour identifier un danger. Ce nombre de critères étant au plus de dix pour l’identification des dangers quelle que soit la substance (IV.5.2.1). Mais le nombre de substances chimiques de la base de données comparé au nombre de descripteurs ne permet pas de tester le pouvoir de généralisation des arbres de décision ou de réseaux de neurones autres que des séparateurs linéaires. Le problème n’est pas assez contraint par un nombre suffisant d’exemples (de substances) pour permettre un calcul efficace d’arbres ou de réseaux de neurones. Enfin, la principale limite à l’utilisation de ces méthodes en situation d'urgence est que certains critères sont imposés et doivent être obligatoirement connus. Pour l’utilisation d’un réseau de neurones, tous les critères doivent être renseignés. Même si une erreur sur la valeur des critères de poids synaptiques très faibles ne devrait pas prêter à conséquence, il reste un nombre trop important de critères à renseigner. Dans le cas des arbres de décision, la procédure d’identification peut être bloquée dès la racine, si le critère demandé n’est pas connu. Par exemple, dans le cas des liquides, l’identification du risque « inflammable » impose en premier choix de connaître la densité du liquide. Sans cette information l’arbre de décision n’est plus utilisable. Ne connaissant pas à l’avance les critères qui seront disponibles en situation d'urgence, il est impossible de réaliser un arbre de décision ou un réseau de neurones adapté à l’ensemble des situations. Le nombre de critères est trop important pour envisager la construction de plusieurs arbres et il n’existe pas un ensemble limité de critères très discriminants qui serviraient à construire un arbre de décision servant de base. L’arbre de décision doit donc être adapté à chaque situation, en tirant partie des critères déjà connus ou pouvant être connus. Utilisant les critères déjà connus, il permet de déterminer le sous-ensemble de substances chimiques correspondant et de calculer alors le ou les critères discriminants à rechercher pour améliorer l’identification des dangers. La complexité de l’algorithme ne 137 Chapitre IV Identification des substances chimiques requiert qu’un temps de calcul court et permet par conséquent une application en temps réel. Pour ces raisons, cette méthode a été retenue pour aider au recueil d’information en situation d'urgence et a été implémenté dans le logiciel AERO. IV.6 Conception d’un outil opérationnel d’identification des dangers liés à une substance chimique A partir des études réalisées précédemment, une méthodologie d’aide à l’identification des dangers liés à une substance chimique est proposée. Elle repose sur l’exploitation d’une base de données opérationnelles par l’intermédiaire du logiciel AERO développé afin de tirer profit des informations recueillies sur le terrain et présentes en base de données. Le but de cette méthodologie est d’aider à l’identification d’une substance chimique. Mais lorsque l’information n’est pas suffisante pour y parvenir, elle doit orienter la recherche d’information danger retenu, la proportion de substances correspondantes. Il permet également orienter le recueil de données pour affiner l’identification des dangers pour tendre vers l’absence de produit dangereux ou à l’inverse, la certitude qu’ils sont tous dangereux. Enfin il permet de prendre en compte l’imprécision des critères et l’incertitude des informations collectées. Après une rapide introduction du logiciel AERO, la méthodologie d’aide à l’identification des dangers d’une substance chimique est alors détaillée. Elle nécessite l’utilisation d’une base de données opérationnelles qui a été réalisée en complétant celle de l’étude précédente. IV.6.1 Présentation du logiciel AERO IV.6.1.1 Généralités AERO (Aide pour l’Evaluation des Risques en situation Opérationnelle) est un logiciel développé en langage C++ avec le compilateur Borland C++ v5.0. Son fonctionnement s’inspire de celui du logiciel WISER pour l’aide à l’identification d’une substance chimique. Pour répondre à une demande des sapeurs-pompiers, les données issues des différentes bases de données ont été traduites en français. Le logiciel est disponible en français et en anglais (Figure 34). 138 Chapitre IV Identification des substances chimiques Figure 34 : Interface du logiciel AERO IV.6.1.2 Un outil d’aide à l’identification des substances chimiques L’identification d’une substance chimique s’effectue à partir de la description et des propriétés du produit, des symptômes observés chez l’homme et de la classification des dangers et de la réaction aux tubes colorimétriques. En fonction des informations saisies (par exemple la couleur du produit, son pH, et des effets sur la peau), AERO sélectionne tous les produits satisfaisant à l’ensemble de ces critères. La recherche est effectuée immédiatement après chaque saisie d’information, avec un affichage des substances correspondant aux critères sélectionnés et la proportion de ces substances pour chacun des huit dangers retenus. Cette recherche est effectuée sur une base de données comportant 333 substances chimiques, décrite par des critères binaires séparés en quatre familles : 139 Chapitre IV - les Identification des substances chimiques propriétés chimiques et thermodynamiques observables ou mesurables (état, couleur, opacité, odeur, goût, pH, densité liquide gazeuse) reprises de la base de données de WISER, - les symptômes cliniques sur l'homme, également repris de la base de données de WISER, - les dangers de la classification américaine NFPA et européenne issus de la base de données du NIOSH, - les réponses aux tubes colorimétriques Dräger. Il s’agit des réponses attendues décrites dans le manuel de référence [Dräger, 2002], complétées par les résultats de l’étude réalisée dans le cadre de la thèse [Bronner et al., 2008]. IV.6.2 Méthodologie d’identification d’une substance chimique Figure 35 : Méthodologie opérationnelle d’identification des substances chimiques 140 Chapitre IV Identification des substances chimiques IV.6.2.1 Recueil d’informations et saisies des données La première phase consiste à recueillir les informations collectées par les premiers intervenants. Il s’agit aussi bien des informations obtenues par des témoignages, des personnes se plaignant de maux ou incommodées par des odeurs, que de la description de la situation par des sapeurs-pompiers. Le recueil d’information se fait en plusieurs temps. Il s’agit, dans un premier temps (étape n°1), des témoignages des personnes sur place mais surtout des données collectées par les premiers intervenants. Il s’agira essentiellement d’observations. Ensuite, lors de la mise en place d’une cellule d’identification de la CMIC, d’autres données pourront être obtenues, notamment des mesures. Enfin, le recueil d’information sera guidé avec l’affichage des critères discriminants à rechercher (étape n°5). Ces critères pouvant être obtenus et améliorant la précision de l’identification ou, dans le cas contraire, d’autres critères seront proposés ; des critères moins discriminants mais constituant tout de même un apport d’information. Ces informations ne sont pas à prendre avec la même certitude selon la nature des données et la qualification des informateurs. Pour prendre en compte cette incertitude, l’IHM autorise deux niveaux de confiance : les critères certains auxquels doivent correspondre les substances et les critères incertains pouvant être omis selon le degré de concordance (IV.4.2). L’IHM permet de saisir rapidement les critères et symptômes organisés dans plusieurs onglets. Les critères non sélectionnés ne sont pas observés sur le terrain. Un critère saisie apparaît en bleu, avec en gras les critères sûrs et en italique les critères incertains (Figure 36). Figure 36 : Saisie des critères (logiciel AERO) Un onglet supplémentaire affiche la dichotomie adaptée d’utilisation des tubes Dräger (Figure 37). L’IHM permet de renseigner si un tube colorimétrique utilisé a réagi de façon positive à la substance chimique (tube affiché en rouge) ou si le test a été négatif (tube affiché en jaune). 141 Chapitre IV Identification des substances chimiques Les différents tubes colorimétriques sont organisés selon la dichotomie fournie par Dräger et modifiée à la suite de l’étude réalisée en laboratoire [Bronner et al., 2008]. Figure 37 : IHM de saisie des réactions des tubes colorimétriques (logiciel AERO) La prise en compte de la fiabilité des informations lors de la sélection des substances est décrite ci-après. IV.6.2.2 Sélection des substances correspondant aux données opérationnelles Afin de sélectionner les substances chimiques correspondant aux données collectées, une requête classique de sélection en base de données est faite. Il s’agit du mode de fonctionnement du logiciel WISER. Prise en compte de l’imprécision Pour les critères imprécis (odeur, couleur et pH), la prise en compte de l’imprécision est rendue possible par l’utilisation de probabilités d’observation de critères « proches ». La valeur d’un critère imprécis est alors remplacée par la distribution de probabilités élémentaires correspondantes (IV.4.1). 142 Chapitre IV Identification des substances chimiques L’observation de la couleur bleue se traduira par la recherche des substances de couleur : - bleue avec une masse de croyance de 1 - verte avec une masse de croyance de 0,5 - violette avec une masse de croyance de 0,5. L’imprécision peut porter sur différentes valeurs possibles d’un même critère, par le fait que l’observateur peut exprimer un doute sur l’information qu’il fournit ou parce que l’information provient de deux sources différentes en désaccord partiel ou total (informations incompatibles). Lorsque plusieurs valeurs d’un même critère sont possibles, une première approche consiste à combiner l’information en faisant le produit des probabilités élémentaires. k critères C1obs ,..., Ciobs ,...C kobs observés parmi N critères C1 ,..., Ci ,...C k en base de données La probabilité associée à chaque critère C1 est : k P (Ci ) = ∏ P (Ci / Cθobs ) Eq. 17 θ =1 L’observation de la couleur bleue ou verte se traduira par la recherche des substances de couleur : - bleue avec une masse de croyance de P(bleu/bleu) x P(bleu/vert) = 1 x 0,25 = 0,25 - verte avec une masse de croyance de P(vert/bleu) x P(vert/vert) x = 0,25 x 1 = 0,25 - violette avec une masse de croyance P(violet/bleu) x P(violet/vert) x = 0,25 x 0 = 0 - brune avec une masse de croyance P(brun/bleu) x P(marron/vert) x = 0 x 0,25 = 0 Une substance est sélectionnée si sa concordance est supérieure à un seuil σ calculé en fonction de la meilleure concordance. Chaque substance Sj (j∈[1..n]) est définie par les valeurs de critères, Sj = {cj1, …, cji, …, cjk} Sj sélectionnée ssi sa concordance Γj >σ k Γ j = max ∏ c ji .P (C i ) i =1 143 Eq. 18 Chapitre IV Identification des substances chimiques Incertitude liée à la véracité de l’information Certaines informations peuvent se révéler fausses. Et les sources d’erreurs sont nombreuses : Une personne affirme souffrir de maux de tête, mais faut-il forcément rattacher le symptôme à la présence de la substance chimique ? La conversion d’un diagnostic médical sous forme de symptômes proposés dans la base de données est source d’erreur (cf. exemple en IV.4.2). L’erreur peut provenir de la base de données qui n’est pas complète. Bien que l’erreur provienne de l’outil et non de l‘information collectée, le problème revient au même : une différence entre la valeur observée et la valeur en base de données. Cela se traduit par l’élimination de substances chimiques qui sont potentiellement des solutions recherchées et inversement, des substances qui ne correspondent pas sont conservées à tort. Un degré de liberté δ peut être introduit pour limiter la suppression radicale de solutions concordantes. Au lieu d’effectuer une sélection sur l’ensemble des critères recensés, la recherche ne s’effectue que sur certains critères ; le nombre de critères de sélection restant à définir. Il peut s’agir d’un pourcentage du nombre de critères recensés. La concordance d’une substance chimique est alors égale à la valeur maximum des concordances correspondant à chaque combinaison de k −δ critères parmi les k observés, soit C kk −δ combinaisons. Deux cas peuvent se présenter. 1) Une valeur de critère est incompatible avec les autres valeurs observées. Dans l’exemple suivant deux personnes fournissent des informations incompatibles : La première personne a senti une odeur d’ammoniac alors que la seconde pense à une odeur d’acétone. Ces critères sont incompatibles : - ∀i, P (C i / C aobs = ammoniac) × P (C bobs = / acétone) = 0 Quels que soient les autres informations fournies (liquide, incolore, …), par la présence de ces critères incompatibles, aucune substance ne correspond. De même que dans WISER, aucune substance n’est sélectionnée. Mais en autorisant un degré de liberté, il se forme deux combinaisons de critères compatibles : - liquide, incolore, … et odeur d’ammoniac - liquide, incolore, … et odeur d’acétone 144 Chapitre IV Identification des substances chimiques Les autres combinaisons contenant à la fois les deux odeurs ne correspondent toujours à aucune substance chimique. 2) L’existence d’une ou plusieurs erreurs parmi les critères observés fait qu’aucune substance chimique ne correspond ou que la liste des substances chimiques sélectionnées ne contient pas la bonne. Avant de regarder ce que peut apporter la prise en compte de l’incertitude par l’ajout d’un degré de liberté, il est intéressant d’introduire une notion supplémentaire : la crédibilité donnée à chaque critère. Cette valeur renseigne sur la confiance, la certitude que l’on peut avoir en l’information. Pour certains critères, la crédibilité peut être fixée en amont par le jugement d’expert : « Selon la concentration, il est difficile de savoir si un liquide est visqueux - ou non. » « il s’agit d’un symptôme trop difficile à identifier pour être considéré - comme une donnée fiable, sauf si le diagnostic vient d’un médecin ». La crédibilité dépend alors du couple (source d’information, information). La crédibilité peut aussi être fixée lors de la saisie, selon la concordance des sources. Si une personne est sujette à des toux, la crédibilité ne sera pas élevée compte tenu qu’il existe d’autres explications (allergie, effets psychosomatiques, fume trop, …). Mais si c’est la majorité des personnes présentes qui sont sujettes à des toux, alors la crédibilité sera renforcée. Dans ce travail, aucune crédibilité a priori n’a été fixée a priori par des experts. Il est toutefois possible lors de la saisie des données dans AERO de distinguer les critères sûrs des critères incertains. Devant la difficulté pour déterminer ce qui est sûr de ce qui ne l’est pas, il n’est pas utile d’ajouter des degrés de crédibilité (sûr, pas tout à fait sûr, …, pas sûr du tout). La crédibilité reste binaire, avec des critères confirmés qui sont nécessaires lors de la sélection des substances chimiques, et les critères incertains qui ne servent pas forcément à la sélection. Une substance chimique ne sera sélectionnée que si elle correspond à l’ensemble des critères certains et à au moins un m − δ critères parmi les m critères incertains. δ étant déterminé en fonction du nombre k de critères observés tels que δ = k / 3 . Et, il faut également ajouter la prise en compte de l’imprécision comme il a été décrit précédemment. 145 Chapitre IV Identification des substances chimiques Le REX sur l’intoxication au bromure de méthyle (Cf. IV.4.2) a été utilisé comme exemple pour estimer la précision d’une identification avec prise en compte de l’incertitude. Nous avons utilisé le logiciel AERO développé au cours de cette thèse qui intègre les processus de prise en compte de l’imprécision et de l’incertitude. Trois séries de résultats sont présentés : - Le nombre de substances correspondant aux critères saisis à l’aide du logiciel WISER - Le nombre de substances correspondant aux critères saisis à l’aide du logiciel AERO. Ces nombres sont différents entre WISER et AERO car les logiciels n’utilisent pas la même base de données. - Le nombre de substances correspondant aux critères saisis à l’aide du logiciel AERO et en tenant compte de l’imprécision et de l’incertitude. Les critères considérés comme incertains sont indiqués en italique et soulignés. WISER AERO AERO 416 333 333 Gaz, incolore, Inodore 24 16 61 Densité > 1 21 10 51 Nombre total de substances La densité ne pourra pas être identifiée visuellement pour un gaz incolore. Le critère est utilisé pour comparer les résultats entre WISER et AERO, mais il est noté comme incertain. Nausées, vomissements, Douleurs abdominales et diarrhée 9 2 13 Agitation 6 2 13 Confusion mentale 5 2 11 Vertiges 3 2 10 Céphalées 3 2 11 Perte de la coordination 0 1 (erreur) 10 Ces cinq critères sensés décrire un « syndrome cérébelleux avec démarche ébrieuse » sont pris avec prudence car il est difficile de trouver une correspondance entre le vocabulaire médical et les termes utilisés dans le logiciel. Erythème 0 0 9 Brûlure 0 0 10 0 0 10 Il est difficile de distinguer les deux. Convulsions 146 Chapitre IV Identification des substances chimiques Avec la prise en compte de l’incertitude, un plus grand nombre de substances chimiques sont retenues puisqu’il y a moins de contraintes, moins de critères de sélection imposés en même temps. Avec quatre critères dont deux incertains et 12 symptômes dont huit incertains, AERO fournit une liste de dix substances chimiques contenant celle qui est recherchée. Sur cet exemple, AERO présente l’avantage de ne pas éliminer la substance recherchée contrairement aux logiciels existants. En contre partie, un nombre trop important de substances chimiques possibles peut masquer l’information recherchée. On remarque que le nombre de substances retenues peut augmenter à la saisie d’un nouveau critère. En fait, cette augmentation, si elle a lieu, se produit tous les trois critères. Le nombre de critères incertains nécessaire à la sélection des substances chimiques étant égal au tiers du nombre de critères total, tous les trois critères, le nombre de combinaisons augmente alors que le nombre de contraintes ne change pas. Il y a donc plus de substances chimiques qui sont sélectionnées. Le même travail est réalisé sur le REX de l’intoxication à l’acide cyanhydrique (cf. IV.4.2) : Nombre total de substances 416 333 333 Etat = Gaz 75 65 65 Couleur = incolore 71 61 61 Densité < 1 43 10 10 5 1 10 4 1 9 Odor = Almond Symptôme : Arrêt cardio-respiratoire Le symptôme est considéré comme sûr car il se déclare chez plusieurs victimes. Nausée 4 1 8 Maux de tête 3 1 8 2 erreurs 0 6 0 0 6 Vertiges Oppression thoracique Ces quatre symptômes ne sont présents que pour une seule victime et peuvent être raccordés à d’autres causes. Avec une recherche classique, l’erreur en base de données par l’absence du symptôme « vertige » provoque l’élimination de la substance chimique recherchée. La prise en compte de l’incertitude permet de conserver la substance chimique dans la liste des solutions possibles. 147 Chapitre IV Identification des substances chimiques IV.6.2.3 Une alternative à un degré de concordance δ fixe Pour une même valeur de δ, le nombre de substances chimiques sélectionnées varie d’une situation d’urgence à l’autre en fonction du nombre de critères et de leur pouvoir discriminant. Une liste trop longue n’est pas utilisable par les urgentistes pour identifier la substance chimique. Mais à partir d’une dizaine de substances, il est possible pour les urgentistes d’identifier plus précisément [Bhavnani et al., 2007]. Une alternative à une degré de concordance fixe, est de le déterminer en fonction d’un nombre maximum de substances sélectionnées. Pour ajuster la valeur de δ, une première sélection des substances est faite avec δ=0. Puis la valeur de δ est augmenté de 1 jusqu’à atteindre un nombre de substances limites. Par exemple, dès que le nombre de substances est supérieure à 10, on arrête d’incrémenter δ. Une autre condition d’arrêt peut être définie en fixant une borne maximale telle que δ = k / 3 pour tenir compte d’un minimum de critères. IV.6.3 L’identification des dangers Lorsqu’il n’est pas possible d’identifier précisément la substance chimique, pour une liste trop longue de solutions, il est préférable de s’intéresser aux dangers qui y sont liés afin de fournir un premier niveau d’aide à la décision. L’étape n°3 de la méthodologie consiste en l’affichage des résultats : liste de substance et proportion de substance par danger. L’étape n°4 a pour but de rechercher les critères permettant d’affiner l’identification des dangers liés aux substances chimiques. IV.6.3.1 Affichages des substances et des dangers Selon le nombre de substances retenues, le logiciel affichera la liste de ces substances ou, si la liste est trop longue, c’est la proportion de substances pour chaque danger qui sera plus pertinente. Lorsqu’une substance est identifiée précisément, il est possible de consulter dans le logiciel, la fiche du NIOSH correspondante (Figure 38). 148 Chapitre IV Identification des substances chimiques Figure 38 : Fiche du toluène du NIOSH affichée dans AERO Lorsque la substance n’est pas identifiée, il est possible de se reporter aux dangers des substances correspondant aux critères sélectionnés. Plusieurs options sont possibles pour afficher les dangers : 1) Une solution consiste à indiquer, pour chaque danger, la proportion de substances chimiques présentant ce danger, parmi les substances correspondant à l’ensemble des critères saisis. Pour tenir compte également des substances chimiques correspondant aux critères incertains et imprécis, une proportion est également calculée et indiquée de façon moins soutenue (Figure 39). Cette indication permet de vérifier comment un écart relatif dans la quantité d’information recueillie sur le terrain influe sur les dangers représentés par les substances chimiques potentielles. Si les proportions sont similaires, cela signifie qu’une faible erreur (observation ou mesure) dans les critères ne change pas significativement les dangers qui sont liés aux substances. 149 Chapitre IV Identification des substances chimiques Proportion de substances par danger Nombre de substances Figure 39 : Affichage des dangers (logiciel AERO) L’aide fournie par ces indications ne présentera pas la même utilité selon les pourcentages : o Savoir que la substance a une probabilité d’être inflammable (ou toxique, explosif, …) de 50% ne présente aucun intérêt. Il faut tenir compte du risque potentiel comme cela aurait le cas en l’absence complète d’information. o Un pourcentage moins élevé donne une tendance, mais ne permet pas d’exclure le risque. o Un pourcentage égal à 0%, c'est-à-dire une liste de substances potentielles excluses de substances inflammables, permet-il de certifier qu’il n’y a pas de risque ? Deux conditions doivent être remplies pour exclure le risque. Il faut que les critères de sélection ne soient pas erronés. L’incertitude et l’imprécision sont justement prises en compte pour accorder une marge de sécurité majorante. Et la seconde condition est que la substance chimique recherchée soit présente dans la base de données ou que les substances de la base de substances données soient rencontrées en représentatives situation de l’ensemble d'urgence. D’où des l’intérêt d’enrichir la base de données. 2) S’il n’est pas possible de s’appuyer sur l’exhaustivité de la base de données, une autre indication est de suivre l’évolution de la proportion de substances dangereuses. L’indicateur est alors l’augmentation ou la diminution de la proportion de substances dangereuses par rapport à la 150 Chapitre IV Identification des substances chimiques proportion de départ, de toutes les substances présentes dans la base de données. Par exemple, 58% des liquides de la base de données sont inflammables. Connaissant la densité (d<1), on remarque que le pourcentage augmente de 38 points. On s’intéresse alors à la relation entre les critères observés et les dangers, sans faire l’hypothèse que la base de données contient la substance recherchée. Cependant deux hypothèses fortes sont faites : la base de données est représentative des substances chimiques rencontrées en situation d'urgence et, il existe un lien fort de causalité entre les substances chimiques et les indicateurs. Mais il a été vu au paragraphe IV.5.3.2, qu’il était difficile de généraliser et donc d’obtenir un lien entre critères et dangers. L’aide à la décision se limite donc à la première solution. Il faut tendre vers une liste de substances chimiques identiques en termes de dangers et opter pour une base de données la plus complète possible. Dans les premiers instants, les données opérationnelles collectées n’aboutiront que très rarement à une identification des dangers sûre, avec 100% de substances chimiques dangereuses ou non. Et afin d’affiner l’identification des dangers, il sera nécessaire de rechercher d’autres informations et d’effectuer des mesures. Dans le paragraphe suivant, nous allons voir comment adapter un outil utilisé précédemment pour orienter le recueil de données. IV.6.3.2 Aide au recueil de données L’objectif étant de tendre vers un groupe de substances homogène en termes de danger, par la connaissance des critères adéquats : les plus discriminants. Les arbres de segmentation permettent d’identifier une combinaison de critères discriminants. En calculant les premiers nœuds d’un arbre de segmentation pour un danger précis, on obtient les critères à rechercher en priorité pour identifier la présence ou non de ce danger. IV.6.3.2.1 Utilisation opérationnelle Comme il a été mentionné précédemment (IV.5.4), un tel arbre ne peut être pré-calculé. Les différences d’une situation d'urgence à l’autre constituent trop de combinaisons pour avoir des arbres adaptés à tous les cas. Chaque nœud d’un arbre de segmentation correspond à un critère à rechercher, et lorsque la valeur d’un critère ne peut être connue, le reste de l’arbre devient alors inutile. 151 Chapitre IV Identification des substances chimiques L’arbre de segmentation doit être construit au fur et à mesure du recueil des données. Une autre raison pour limiter l’affichage de l’arbre de segmentation est que le nombre de nœuds croit de façon exponentielle et devient rapidement illisible. Le choix a été de limiter l’arbre aux trois premiers niveaux (soit sept nœuds). Pour le premier nœud, ce sont les trois critères les plus discriminants qui sont affichés pour laisser une marge de manœuvre par un choix plus large dans la recherche d’informations discriminantes et également diminuer le nombre d’interactions avec l’interface homme-machine (IHM). L’arbre construit se fait sur la base du premier critère, le plus discriminant. Un exemple d’affichage d’un tel arbre est présenté ci-dessous (Figure 40). A chaque nœud, le nombre de substances est affichée, ainsi que la proportion par danger, visualisée par un indicateur (barre rouge et verte). Dans le cas des feuilles homogènes, l’indicateur est un carré rouge si toutes les substances présentent le danger (inflammable dans l’exemple ci-dessous) ou un carré vert dans le cas inverse. Figure 40 : Arbre de segmentation des substances liquides : danger "inflammable" (logiciel AERO) IV.6.3.2.2 Adaptation des arbres de segmentations à une utilisation opérationnelle Il faut également faire une sélection des critères de la base de données pour ne demander la recherche que des critères possibles à obtenir. Il parait aberrant de demander le goût d’une substance potentiellement toxique. De même, il ne sert à rien de demander la présence de symptômes s’ils ne sont pas constatés, car ce n’est pas parce qu’un symptôme n’est pas identifié que la substance chimique ne peut pas le provoquer. Et il est inutile de demander de renseigner sur des symptômes en l’absence de victime. Nous partons du principe que toutes les informations connues, relative à la présence de symptômes, seront renseignés sans avoir à le demander. Parmi les critères à exclure, il y a 152 Chapitre IV Identification des substances chimiques également ceux qui ne seront jamais demandés car leur recueil n’est pas possible (goût par exemple) et les critères dépendant de la situation, c'est-à-dire les critères incompatibles, à définir en fonction des informations déjà connues. Il faut éviter la combinaison de critères incompatibles à différents nœuds de l’arbre. Par exemple, demander s’il s’agit d’un liquide et dans le cas contraire (gaz ou solide), demander ensuite de mesurer le pH. Ou, étant donné le codage de la base de données permettant plusieurs valeurs pour un même critère (couleur, odeur, …), demander une couleur, alors qu’il s’agit du sous-arbre des substances incolores. L’algorithme de construction des arbres de segmentation a été adapté pour supprimer ces incohérences. Algorithme récursif de construction d’un arbre de segmentation binaire avec prises en compte de critères incompatibles Soit Ω : La population de X individus notés xi avec i∈[1..X] Ψ : L’ensemble comprenant un nombre Y de descripteurs yj Ι : La matrice d’incompatibilités ιj de Ψ x Ψ Dc : L’ensemble des descripteurs connus Dc⊂Ψ Ds : L’ensemble des descripteurs de type symptômes Ds⊂Ψ 1 : Sélection des substances correspondant aux critères connus L’étape préalable est de restreindre la population aux individus correspondant aux critères déjà connus. Pour tout dj ∈ Dc ΩT={ xi∈Ω / yj (xi)= dj } // Construire l’arbre Appeler la fonction Construction_Arbre_de_Segmentation ( ΩT , Ψ - Dc - D , Ι , Dc ) 153 s Chapitre IV Identification des substances chimiques Construction_Arbre_de_Segmentation ( ΩT , Ψ , Ι , D ) 2 : Suppression des critères incompatibles // La matrice d’incompatibilité Ι est une matrice binaire symétrique. // Si deux critère yi et yj sont incompatibles, Ι (yi , yj) = 1 ∀ dj ∈ D Ψ = Ψ - xi / ∀ xi∈ Ω tq Ι (yj (xi ) , dj ) = 1 3 : Recherche du meilleur descripteur Ψy* (au sens du critère de division - Cf. Note 2) Test toutes les divisions possibles ∀y∈[1..Y] (Cf. Note 1) 4 : Calcul des deux partitions obtenues par division selon Ψ y* ΩT={ xi∈Ω / xy*=1 } ΩF={ xi∈Ω / xy*=0 } 5 : La procédure est répétée sur les deux partitions obtenues pour construire les sous-arbres Construction_Arbre_de_Segmentation( ΩT , Ψ - Ψy* , Ι , Ψy* ) Construction_Arbre_de_Segmentation( ΩF , Ψ - Ψy* , Ι , Ψy* ) 6 : Conditions d’arrêt La construction du sous-arbre s’arrête : - Lorsque la taille inférieure de l’effectif d’une partition est atteinte. - Lorsque la borne inférieure du seuil de similarité d’une partition est atteinte. - Lorsque tous les descripteurs ont déjà servi à faire une division. Dans ce cas, au moins un sous-ensemble final comporte des individus qui ne sont pas homogènes. 154 Chapitre IV Identification des substances chimiques Plusieurs incohérences sont présentes dans les arbres de décision issus des d’algorithmes classiques. Elles sont supprimées par les adaptations apportées à différentes étapes de l’algorithme que nous avons développé. Une des étapes préalables (étape n°1 de l’algorithme) est de garder uniquement les critères pouvant être recherchés en situation d'urgence. Tous les symptômes et le goût sont retirés des critères lors de la construction de l’arbre. A partir de l’exemple précédent, un nouvel arbre de segmentation est obtenu pour l’identification du danger « inflammable » dans le cas d’un liquide. Il ne fait plus apparaître ni les symptômes, ni le goût (Figure 41). Figure 41 : Arbre de segmentation des substances liquides avec suppressions des symptômes et du goût : danger "inflammable" (logiciel AERO) Dans l’arbre précédent (Figure 41), il apparait plusieurs incompatibilités. Par exemple, le troisième critère à la racine « reste au sol » ne s’applique que dans les cas des gaz, alors qu’il s’agit de liquides (critère sélectionné en amont). La matrice d’incompatibilités contenant l’ensemble des incompatibilités de critères, permet d’empêcher le choix de critères impossibles lors de la construction de l’arbre (Figure 42). Figure 42 : Arbre de segmentation des substances liquides avec suppressions des symptômes et du goût et prise en compte des incompatibilités : danger "inflammable" (logiciel AERO) 155 Chapitre IV Identification des substances chimiques Un autre exemple a été choisi pour illustrer les incompatibilités pouvant apparaître dans les arbres. L’identification du danger « corrosif » sur l’ensemble des substances chimiques, présente deux incompatibilités (Figure 43): - Lorsqu’il ne s’agit pas d’un liquide, le sous-arbre correspondant (sous-arbre gauche à partir de la racine) contient le critère « coule dans l’eau » qui ne s’applique ni au gaz, ni au solide. - Dans le sous arbre droit, une réponse positive à la question « est-ce une base forte ? » est suivie d’une demande de renseignement du critère « base faible ». La matrice d’incompatibilités intégrée à l’algorithme de construction d’arbre de segmentation permet de corriger ces défauts (Figure 44). Figure 43 : Arbre de segmentation avec incompatibilités : danger "corrosif" (logiciel AERO) Figure 44 : Arbre de segmentation sans incompatibilité : danger "corrosif" (logiciel AERO) 156 Chapitre IV IV.6.3.2.3 Identification des substances chimiques Conditions d’arrêt Il s’agit d’un processus itératif qui est répété tant que l’identification peut être affinée. Le processus de demande et saisie d’information puis de sélection des substances s’achève lorsque les dangers ont été identifiés de façon certaine ou idéalement lorsque la substance est identifiée. Le processus peut s’arrêter également sur une identification imprécise lorsqu’il n’y a plus d’éléments observables sur le terrain pouvant être collectés pour continuer la recherche discriminante ou lorsque l’information fournie aux intervenants leur est suffisante pour achever l’identification par d’autres moyens. IV.6.3.2.4 Limite Un arbre de segmentation est construit pour discriminer une seule variable à expliquer, un danger à la fois. L’arbre affiché correspond à un critère précis (danger inflammable, toxique ou explosif). Il n’y a pas de variable discriminante globale, commune à l’ensemble des dangers ce qui nécessiterait la construction de plusieurs arbres, un par danger. Cela encombrerait l’affichage et compliquerait le recueil de données. Il est préférable de laisser le choix du danger à estimer, soit le plus préoccupant (danger d’explosion), soit celui qui est mal identifié par une probabilité proche de 50%, soit celui qui parait plus rapide à confirmer (probabilité proche de 0% ou 100%). IV.7 Discussion sur l’identification des substances chimiques IV.7.1 Bilan Lorsqu’une substance chimique n’est pas identifiée, et à défaut de matériels d’identification performants, une recherche en base de données à partir de données opérationnelles est envisageable. Mais il sera extrêmement rare de parvenir à une identification précise avec le peu d’information discriminante contenue dans les données opérationnelles disponibles. Devant ce constat, lorsque les données opérationnelles disponibles ne sont pas suffisantes pour une identification précise, il devient nécessaire de limiter la recherche à un niveau d’information plus restreint. L’objectif est alors de permettre une identification des dangers qui sont liés à la substance chimique, pour fournir ainsi un premier niveau d’aide à la décision suffisant pour le calcul de périmètre en phase réflexe ou pour le choix de matériels adaptés à l’intervention. 157 Chapitre IV Identification des substances chimiques Pour faciliter cette recherche des dangers, une base de données a été conçue et un logiciel a été développé pour faciliter l’exploitation des données opérationnelles. L’incertitude et l’imprécision inhérentes aux données opérationnelles ont été prises en compte, notamment à l’aide de la théorie des probabilités. IV.7.2 Limites et perspectives La principale limite de cette approche est qu’elle ne s’applique que pour une substance chimique pure, ce qui n’est pas toujours le cas. En pratique, les « produits chimiques » pouvant être rencontrés dans des stockages, correspondent à deux types particuliers de produits : les substances et les préparations. La définition de ces produits est donnée par l’article R.231-51 du Code du Travail qui distingue : - les substances sont « les éléments chimiques et leurs composés tels qu’ils se présentent à l’état naturel ou tels qu’ils sont obtenus par tout procédé de production contenant éventuellement tout additif nécessaire pour préserver la stabilité du produit et toute impureté résultant du procédé, à l’exclusion de tout solvant pouvant être séparé sans affecter la stabilité de la substance ni modifier sa composition » ; - et « les préparations, les mélanges ou solutions composés de deux substances ou plus ». Dans le cas de mélanges, la base de données ne permet pas de les identifier à ce jour. Ce problème pourrait être pris en compte, mais pour cela, il faudrait envisager d’introduire les mélanges comme nouvelles données et y associer les valeurs des données opérationnelles. La difficulté est plus grande dans le cas de plusieurs substances qui se mélangeraient lors de l’accident. C’est par exemple le cas lors d’un TMD, la substance peut se mélanger à l’essence du camion ou au liquide de refroidissement d’un stockage sous pression. Il s’agit d’un problème différent d’un mélange stable, réalisé en amont et répertorié, pouvant alimenter la base de données. Dans le cas d’un mélange se produisant à la suite d’un accident, il devient difficile d’associer un critère à une substance précise. Et certains critères comme l’odeur, deviennent extrêmement difficiles à percevoir. Le mélange de substances peut également donner lieu à une réaction chimique, produisant de nouvelles molécules, avec des effets et des critères physico-chimiques différents. Il peut s’en suivre un recueil d’informations concernant différentes substances, avec des données décrivant une des substances d’origine et des symptômes dus aux produits formés lors de la 158 Chapitre IV Identification des substances chimiques réaction. Il en est de même dans le cas des produits de décomposition pouvant se former suite à une combustion. Enfin, il faut compter également avec les additifs utilisés pour le stockage ou le transport, notamment pour stabiliser. Pour résoudre les problèmes d’identification des mélanges faits en amont (préparations, solutions, etc.), la base de données doit être complétée avec des informations sur les mélanges usuels et les additifs utilisés. L’enrichissement de la base de données ne doit pas se limiter à ces seules informations. Nous avons vu tout au long de ce chapitre que l’identification d’une substance ou des dangers qui y sont liés est difficile à cause du manque d’information du à des données peu nombreuses, imprécises et incertaines. La base de données opérationnelles développée au cours de ce travail de thèse n’est qu’une première étape, elle doit être enrichie avec toute l’information disponible pouvant apporter une meilleure identification des dangers liés aux substances chimiques. Sans vouloir faire une liste exhaustive, plusieurs sources d’information ont été répertoriées comme potentiellement utiles à l’identification des substances ou des dangers : - Il s’agit notamment de critères physico-chimiques supplémentaires comme la solubilité. La densité est présente en base de données sous forme de comparaison à la densité de l’eau qui sert de repère pour une observation en situation opérationnelle. Mais il n’est pas tenu compte des liquides miscibles. - Des statistiques sur les substances chimiques pouvant être présentes sur le lieu de l’accident sont également des indicateurs pour limiter l’ensemble des solutions potentielles. Le référencement sous forme de SIG ou d’une liste informatisée des sites à risque et des substances chimiques stockées constitue un critère de sélection à prendre comme une information incertaine supplémentaire. Cette information est intéressante aussi bien dans le cas d’accident sur un site fixe que lors d’un TMD. Les sites fixes génèrent un flux de TMD acheminant des substances chimiques en relation avec l’activité du site. Dans le cas particulier des TMD, des statistiques sur les substances transitant sur l’axe ou la zone d’un accident sont également une indication précieuse pour effectuer une sélection en base de données. Dans le cas des grands axes comme les autoroutes, le nombre de substances est trop important pour apporter une information discriminante. Cependant, une étude réalisée par le CANUTEC a montré 159 Chapitre IV Identification des substances chimiques qu’il n’y a que quelques substances qui sont très fréquentes [Sari et al., 2000]. L’utilisation de distributions de probabilités permettrait de prendre en compte ces statistiques. - L’étude des bases de données et les entretiens avec les sapeurs-pompiers ont permis de mettre en exergue des indications pouvant s’obtenir par l’observation de réactions chimiques se produisant ou faciles à reproduire sur le terrain. Comme critères visuels, on peut citer la réaction effervescente du calcaire en présence d’acides forts, la détection d’hydrocarbure dans l’eau par le changement de couleur de dentifrice d’une certaine marque ou encore la formation de cristaux de sel lors de la mise en contact de l’acide fluoborique (n° CAS : 16872-11-0) avec les métaux [O'Neil et al., 2004]. - Le type de stockage apporte également une information. Toutes les substances chimiques ne sont pas transportées dans les mêmes conditions (réchauffées, réfrigérées, sous-pression, …). Il existe des repères visuels pour caractériser les différents stockages et une relation stockages / substances intégrée à la base de données pourrait servir de critère de sélection supplémentaire [Chamayou, 1997a; 1997b; Lees, 2004; Chazeau, 2007]. - Enfin, bien que les détecteurs non sélectifs comme les tubes colorimétriques ou les cellules électrochimiques ne permettent pas une identification précise, ils apportent également de l’information. Les tubes colorimétriques de marque Dräger ont été intégrés à la base de données opérationnelles, mais il faut encore ajouter les autres types de détecteur. Les tubes Gastec sont souvent présents dans les CMIC et certains tubes présentent peu d’interférents et apportent une information fiable (tubes acides notamment). Enfin, des améliorations peuvent également être apportées pour une meilleure prise en compte de l’imprécision. L’imprécision des critères physicochimiques repose sur des distributions de probabilités empiriques faute d’expérimentation. Le codage du pH en base de données n’offre que peu de liberté sur le choix des distributions de probabilités. Mais dans le cas de la perception des couleurs et des odeurs des tests plus complets seraient nécessaires. Des REX sur l’utilisation d’AERO lors des exercices permettraient de réaliser des distributions de probabilités plus représentatives. 160 Chapitre IV Identification des substances chimiques L’imprécision pourrait également être prise en compte dans le cas des symptômes. L’avis d’experts et les REX permettraient de déterminer les symptômes pouvant être confondus. Dans le REX sur l’intoxication au bromure de méthyle, il apparaît que les symptômes « érythème » et « brûlure » peuvent être confondus. Des distributions de probabilités pourraient être déterminées à partir d’avis d’experts pour prendre en compte cette imprécision de diagnostic. Une information imprécise serait plus discriminante qu’une information incertaine. Une fois la nature du produit connue, il est alors possible d’envisager de modéliser les effets possibles en utilisant des modèles de calcul de flux. Mais un autre problème se présente alors : Le terme source, nécessaire à l’utilisation des modèles prédictifs, est rarement connu avec précisions en situation d'urgence. L’évaluation du terme source à partir des données opérationnelles est traitée au chapitre suivant. 161 Chapitre V Estimation du terme source d’un phénomène dangereux CHAPITRE V ESTIMATION DU TERME SOURCE D’UN PHENOMENE DANGEREUX V. Guide de lecture : L’estimation du terme source d’un phénomène dangereux à partir de ses conséquences mesurées est un problème inverse. Parmi les différentes méthodes inverses présentées en première partie, le choix se porte sur les algorithmes génétiques pour leur capacité à s’adapter aux différents cas présents en situation d'urgence. Une méthode couplant algorithme génétique et modèle direct de calcul de flux est mise au point pour traiter les cas d’explosions de solide. Après une phase de développement et de tests à partir de simulations numériques, la méthode est vérifiée à l’aide de deux retours d’expérience. 162 Chapitre V V.1 Estimation du terme source d’un phénomène dangereux L’estimation du terme source : un problème inverse Habituellement, en matière de risque industriel, l’étude des phénomènes d’explosion, d’incendie et de dispersion atmosphérique d’un produit consiste à estimer un flux dangereux (thermique, toxique ou mécanique) à partir d’un terme source (produit, quantité, débit, …) et de données décrivant l’environnement proche (vent, température, topographie, obstacles, …). La connaissance du flux calculé à l’aide de modèles mathématiques permet notamment de déterminer les distances de sécurité pour l’aménagement du territoire (lorsqu’il s’agit d’études de danger) ou pour les services de secours intervenant sur des accidents chimiques (dans le cas des situations d’urgence). Le terme source est donc primordial pour le calcul des flux mais le constat est que les caractéristiques de la source sont souvent mal connues en situation d’urgence. Cependant il est possible dans certaines conditions, de l’estimer à partir des conséquences observées ou mesurées sur le terrain lorsque les données sont suffisantes. Il s’agit alors de résoudre un problème inverse. Le paragraphe suivant fait une description succincte de différentes approches de méthodes inverses susceptibles de permettre d’évaluer le terme source à partir de données opérationnelles. Figure 45 : Méthode directe et méthode inverse 163 Chapitre V V.1.1 Estimation du terme source d’un phénomène dangereux Généralités sur les méthodes inverses Le calcul du terme source d’un accident à partir de l’observation de ses conséquences est un problème inverse, puisqu’il s’agit d’utiliser les modèles prédictifs couramment utilisés (tels que les modèles de dispersion, de flux thermique, …) dans le sens inverse de celui habituellement pratiqué (figure 1). D’une manière générale, l’objectif des méthodes inverses est de déterminer des grandeurs difficilement mesurables à partir d’observations ou de mesures. Il peut s’agir de variables d’état, de paramètres du modèle ou de variables comme les conditions initiales ou les conditions aux limites [Faugeras, 2002]. Et Les domaines d’application des méthodes inverses sont nombreux (mathématiques, hydrologie, géologie, mécanique, architecture, économie, biologie, astrophysique …) dans le but d’améliorer les modèles, de définir un système d’observation ou encore dans notre cas, d’identifier certains paramètres. Un certain nombre de problèmes inverses classiques sont cités dans [Le Niliot, 2003] : - estimation de géométrie de domaine, - estimation de paramètres, - estimation d’un état initial (ou reconstruction d’un état initial), - estimation de sources - estimation de conditions aux limites V.1.1.1 Formalisation mathématique Soit e = (e1 , e2 ,..., en ) ∈ E , le vecteur constitué des variables d’entrée du modèle direct et s = ( s1 , s 2 ,..., s m ) ∈ S , le vecteur de sortie. Le modèle direct peut être décrit comme une application F : E → S Le modèle inverse consistant à déterminer e = (e1 , e2 ,..., en ) ∈ E en partie ou dans son ensemble telle que e = F −1 (s) On appelle dimension m du problème inverse, la taille du vecteur d'état e = (e1 , e2 ,..., en ) qui regroupe le nombre de paramètres à estimer. On appelle contraintes, les observations ( s1 , s 2 ,..., s m ) que les prévisions du modèle doivent approcher au mieux. Dans le cas des phénomènes dangereux (dispersion de gaz de toxique, explosion et incendie), il s’agit de mesures de concentrations de gaz, de surpressions ou de flux thermique, ou bien encore d’évaluation de ces flux à partir de leurs effets sur l’homme, l’environnement ou les matériels. Pour comparer les valeurs des contraintes aux prévisions, on relie 164 Chapitre V Estimation du terme source d’un phénomène dangereux le vecteur le vecteur d'état à l'espace des observations par un opérateur d'observation. D’un point de vue mathématique, le problème inverse consiste à minimiser une fonction coût (notée C ) ou fonction objectif (fitness function) représentant la pertinence des solutions potentielles au problème. Il s’agit de l’écart entre les résultats de la modélisation directe s et les données réelles s' mesurées ou observées. Avant d’essayer de résoudre un problème, il faut s’assurer qu’il est bien posé au sens d’Hadamard. Existence de la solution Pour un problème direct F : E → S , il existe une solution e ∈ E au problème inverse correspondant pour tout s ∈ S pouvant être rencontré ; le modèle F doit être complet. Unicité de la solution Il existe une solution unique e ∈ E quel que soit s ∈ S . Dans le cas d’un opérateur matriciel s = F .e , cela signifie que le déterminant de F ne doit pas être nul. Cela incite à limiter le nombre de paramètres à estimer pour ne pas introduire implicitement de relations inutiles [Pujos, 2006]. Dans un problème de détermination du nombre de sources d’émission, surestimer le nombre de sources débouche sur une surabondance de solutions. Quasi-solutions Les contraintes d’existence et d’unicité sont remplies dans le cas des problèmes académiques où toutes les données sont connues avec précision. Mais dans la réalité, les données s '∈ S issues de mesures ou d’observations sont entachées d’un bruit inhérent à leur acquisition s ' = s + ε . Lorsque le nombre de mesures p (par exemple des mesures de concentrations de gaz toxique en différents points de l’espace au sein du nuage) est suffisant pour avoir autant d’équations que d’inconnues (n paramètres du terme source), la résolution du problème inverse conduira à une unique solution dont l’exactitude dépendra du bruit de mesure (et de la précision du modèle à retranscrire le phénomène physique). Plus souvent, le nombre de mesures permet d’avoir plus d’équations que d’inconnues p>n. Dans ce cas il n’y a pas de solution exacte du point de vue mathématique et l’on recherche la meilleure solution au sens des moindres 165 Chapitre V Estimation du terme source d’un phénomène dangereux carrés [Forestier, 2004]. Le problème revient alors à minimiser la norme quadratique. min F (e) − s ' 2 Eq. 19 e∈E A contrario, lorsque le nombre d’équations est insuffisant, il s’agit d’un problème mal posé22, sous-déterminé, pour lequel il existe plusieurs solutions. Il est alors nécessaire d’employer des techniques d’optimisation et l’ajout de contraintes. C’est le principe de la régularisation qui consiste en l’ajout d’information a priori, d’hypothèses permettant de simplifier le problème en évitant que le modèle s’écarte trop de la réalité physique. Stabilité vis-à-vis des faibles variations L’estimation par méthode inverse s’apparente à un algorithme de minimisation sous contrainte d’une fonction. Les techniques classiques de recherche d’un minimum (notamment les méthodes de descente de gradient) fonctionnent bien pour une fonction convexe. Mais dans le cas des phénomènes physiques non linéaire à plusieurs variables, la fonction à minimiser est rarement convexe globalement, ce qui exclut souvent l’existence d’un minimum global. En général, il s’agit tout de même de fonctions convexes au voisinage des minima locaux. Il convient alors de choisir judicieusement l’initialisation de la recherche du minimum (restriction de l’ensemble des possibles par l’ajout de contrainte) ou comme nous le verrons par la suite, d’employer des méthodes stochastiques explorant l’univers des solutions potentielles au prix de plusieurs itérations. Problème inverse d’identification du terme source Dans le cadre de notre étude, le problème inverse à résoudre consiste à déterminer les conditions initiales de phénomènes physiques, linéaires ou non dans des situations où le nombre de données sera suffisamment grand pour ne pas être confronté à un problème sous-déterminé. A noter que les problèmes sous-déterminés peuvent être également traités à l’aide d’algorithmes génétiques prenant en compte l’écart entre les solutions dans la phase de sélection de celles-ci, afin d’exhiber non plus la meilleure solution, mais un ensemble de solutions potentielles [Bontemps, 2000]. Pour résoudre des problèmes inverses, il existe plusieurs approches qui sont présentées ci-après. 22 Problème mal posé : problème en partie sous-déterminé et en partie surdéterminé à l’inverse de la définition de Hadamard [Hadamard, 1932] d’un problème bien posé : il existe une solution, elle est unique et stable (elle dépend de façon continue des données pour une topologie raisonnable). 166 Chapitre V Estimation du terme source d’un phénomène dangereux V.1.1.2 Présentation des différentes méthodes inverses Les problèmes inverses sont rencontrés dans de nombreux domaines et, afin de les résoudre, deux approches se sont développées conjointement : les méthodes inverses directes ou modélisations inverses (backward methods) et les méthodes inverses indirectes ou itératives (forward methods). Les méthodes inverses sont qualifiées de directes lorsqu’elles modélisent la variation du flux des récepteurs vers la source, et elles sont dites indirectes lorsqu’elles nécessitent plusieurs itérations d’un modèle direct, modélisant la variation de flux de la source vers les récepteurs. D’autres distinctions des méthodes inverses sont également faites selon leur côté déterministe ou stochastique, ou encore selon leur faculté à résoudre des problèmes linéaires ou non linéaire. V.1.1.2.1 Méthodes inverses directes Contrairement aux méthodes itératives, les méthodes inverses directes n’utilisent qu’une seule modélisation mais dans le sens inverse, en partant des récepteurs pour remonter à la source et l’estimer. Recherche en grille Cette méthode de recherche en grille ou d’inversion en grille consiste à discrétiser l’espace des paramètres en un nombre fini de solutions possibles. Toutes ces solutions sont ensuite testées et celle qui minimise la fonction coût est conservée. Elle explore de manière homogène l’espace des paramètres et, par conséquent, présente l’avantage de ne pas être sujette aux minima locaux. Mais cette méthode n’est possible que pour des problèmes de faible dimension. Il existe des variantes itératives dichotomiques commençant avec une grille peu détaillée pour lesquelles une sélection de la « case » contenant le minimum est déterminée puis subdivisée jusqu’à une taille de cases définies. Malgré ces améliorations, ces méthodes ne s’appliquent qu’à des problèmes comportant peu de paramètres. De plus, les méthodes de sélection de la case à affiner, n’assurent pas de trouver le minimum global. Inversion simple – existence d’une fonction inverse Sans vraiment parler de méthode inverse, le problème direct est parfois modélisé par des équations mathématiques pour lesquelles il est possible de déterminer analytiquement la fonction inverse. Il est donc possible de définir la fonction inverse F −1 : S → E . Une fois la fonction connue et disposant de suffisamment de données, le problème peut alors être résolu par régression. 167 Chapitre V Estimation du terme source d’un phénomène dangereux Lorsque ce travail analytique d’inversion est impossible, la fonction inverse peut être approchée, notamment par partie (par exemple le modèle de l’équivalent TNT utilisé par l’INERIS pour les explosions de solides) ou en réalisant un réseau de neurones dont l’apprentissage peut être effectué à partir des données artificielles générées à l’aide du modèle direct. Problème linéaire Plus généralement, que la fonction soit inversable analytiquement ou non, on parlera plutôt de résoudre un problème linéaire ou non linéaire. Pour un problème linéaire, l’équation s = F (e) s’écrit sous forme matricielle s = F .e et peut être résolue par la méthode des moindres carrés en minimisant la norme du résidu r défini par : r = F .e − s Eq. 20 On recherche alors l’estimation ê du vecteur d’entrée e telle que : F .eˆ − s = min r 2 2 F .eˆ − s = min F .e − s 2 Eq. 21 2 Eq. 22 Ce qui revient, par équivalence, à résoudre l’équation normale suivante : F T F .eˆ = F T .s Eq. 23 Selon l’existence de l’inverse de F T F , la solution des moindres carrés est la suivante : [ eˆ = F T F ] −1 F T .s Eq. 24 Une application à la dispersion atmosphérique à l’aide d’un modèle gaussien est présentée dans [Fache, 2003]. Mais, le plus souvent, le problème est non linéaire, la mise sous forme matricielle s = F .e n’est plus possible et d’autres méthodes sont alors utilisées comme les méthodes itératives. V.1.1.2.2 Méthodes itératives Le principe consiste à minimiser la différence entre l'observation (flux dangereux caractérisé par les concentrations en gaz ou les bris de vitres suite à une explosion) et la prévision du modèle pour une ou plusieurs variables de sortie en modifiant les paramètres d’entrée (terme source) à estimer au cours de plusieurs itérations. Les valeurs de départ des paramètres (ou « first-guess »), sont choisies a priori dans l’espace d’état qui est plus ou moins vaste selon notre connaissance du problème. En prenant l’exemple de la localisation de la source 168 Chapitre V Estimation du terme source d’un phénomène dangereux d’un nuage de gaz dangereux, lorsque l’expert n’a pas la connaissance de la zone dans laquelle elle peut se situer, et qu’il dispose uniquement de mesures de concentration, il lui faut rechercher le point de rejet sur plusieurs kilomètres à la ronde. Mais dans certains cas, l’observation d’un panache de fumée permet de localiser plus ou moins précisément la source d’émission et de réduire ainsi l’espace de recherche. Ceci facilite la détermination de la source et réduit de façon non négligeable les temps de calcul. Dans la suite, les principales méthodes itératives sont présentées en distinguant les méthodes déterministes et non déterministes. Méthodes déterministes - Méthode de l’adjoint : Il existe des techniques pour corriger les paramètres d’entrée en fonction de l’écart entre les résultats du modèle et les mesures. La méthode la plus répandue dans l’inversion de modèles par éléments finis est le calcul d’un adjoint au modèle permettant d’ajuster les paramètres sources au vu des résultats obtenus. Les équations adjointes permettent de calculer la variation d'un paramètre de sortie d'un modèle en fonction de chaque paramètre d'entrée. Ainsi, il est possible de déterminer comment modifier des paramètres d’entrée pour minimiser la fonction coût en utilisant un algorithme de descente [Courtier et al., 1997]. Cette méthode est intéressante car le temps de calcul est indépendant du nombre de paramètres. - Méthodes de direction de descente Ces méthodes consistent à partir d’une solution initiale et à « descendre » pas à pas la fonction coût jusqu’à atteindre son minimum. Le calcul de la direction de descente nécessite que la fonction coût soit différentiable par rapport à E . De plus, il est fait l’hypothèse que la fonction coût est convexe ou que la solution initiale est proche de la solution optimale, afin d’éviter de rester bloqué dans un minimum local. o Méthode de descente de gradient La descente s’effectue selon un pas λ , choisi de manière à minimiser la fonction coût. Si λ est choisi trop grand, la méthode peut osciller autour de la solution, alors que pour un λ trop petit, la convergence sera très lente. Dans le cas d’un modèle à un paramètre, l’algorithme est donné par la relation : e ( i+1) = e (i ) − λ .d (C / de) e=e( i ) 169 Eq. 25 Chapitre V Estimation du terme source d’un phénomène dangereux Avec e ( i ) le vecteur d’entrée à l’étape i et λ le pas de descente qui est un réel strictement positif. Lorsque le vecteur d’entrée comprend plus d’un paramètre, la descente se fait suivant la pente la plus forte. o Gradient conjugué Dans le cas du gradient conjugué, on garde en mémoire les directions de descente précédentes. La méthode consiste à prendre une direction de descente λn orthogonale aux n-1 directions précédentes (n étant le nombre d’inconnues cherchées). o Méthode de Newton Avec la méthode de Newton, la descente se fait selon tous les paramètres de e à la fois. Pour cela, elle fait intervenir le hessien23 de la fonction coût. o Méthode Quasi-Newton La direction de descente est calculée en utilisant une approximation du hessien et le gradient de la fonction coût au point courant. Cette méthode est détaillée dans [Pison, 2005]. Les algorithmes de direction de descente telles que le gradient conjugué ou l’algorithme de Gauss-Newton sont présentées dans [Forestier, 2004]. La principale limite à ces méthodes est le risque de rester bloqué dans un minimum local. Pour résoudre ce problème, d’autres types de méthodes ont été proposés. Il s’agit notamment des méthodes non déterministes et des méthodes semi-globales qui font intervenir la notion de hasard. Méthodes non déterministes Il s’agit de méthodes stochastiques itératives directes (forward methods) qui consistent en des simulations de problèmes mathématiques ou physiques, basées sur le tirage de nombres aléatoires. - Méthodes de Monte Carlo : Le terme « Monte Carlo » est employé dans de nombreuses disciplines et fait référence aux procédures où les quantités d’intérêt sont approximées en 23 Hessien : Matrice des dérivées seconde au point e(i). 170 Chapitre V Estimation du terme source d’un phénomène dangereux générant de nombreuses réalisations aléatoires d’un processus stochastiques quelconque. Dans notre cas, une simulation Monte Carlo consiste à générer aléatoirement un ensemble de conditions initiales choisies au hasard parmi un ensemble borné et couvrant l’ensemble des possibles. Selon la complexité des problèmes traités (dimension du problème et « degré » de non linéarité de la fonction objectif), le nombre de conditions initiales devra être plus ou moins élevé pour obtenir une solution statistiquement proche de la solution recherchée avec la précision souhaitée. Cette méthode peut être utilisée si le nombre de paramètres à identifier est restreint. En effet, pour s’assurer que l’espace des possibles a été suffisamment exploré, un très grand nombre de modélisations directes est nécessaire. Ce type d’algorithme est donc très coûteux en temps de calcul ce qui limite son utilisation à des problèmes ayant un nombre restreint de paramètres. Les avantages de cette approche sont sa simplicité et sa faculté à détecter les non-unicités de solutions. Les méthodes hybrides ou semi-globales : Bien qu’étant non déterministes, les méthodes hybrides se distinguent par le fait qu’elles combinent plusieurs méthodes, en utilisant par exemple la méthode des gradients en partant d’un grand nombre de points choisis aléatoirement afin de déterminer tous les minima locaux de la fonction objectif. Parmi les méthodes hybrides, le recuit simulé et les algorithmes génétiques sont deux analogies à des mécanismes naturels présentant un mode de recherche intéressant, permettant de retenir « temporairement » des solutions moins bonnes que celles trouvées précédemment afin d’explorer le voisinage et de ne pas rester piégé dans un minimum local. - Le recuit simulé : Le recuit simulé est un algorithme qui s'inspire d'un mécanisme naturel. Il s’agit d’une technique consistant à chauffer un matériau et à le refroidir dans certaines conditions. Lors du refroidissement, les atomes de la matière s'organisent entre eux de manière à ce que les configurations de plus faible niveau d'énergie (les plus stables) soient privilégiées. Tant que le niveau d'énergie total du matériau (sa chaleur) reste élevé, les atomes peuvent trouver l'énergie pour changer de configuration, quitte à passer par des configurations moins stables. Au fur et à mesure que la température baisse les atomes auront 171 Chapitre V Estimation du terme source d’un phénomène dangereux une ressource d'énergie plus faible pour passer dans des configurations plus instables. A partir d’un point initial de l’espace des possibles pouvant être choisi aléatoirement, des déplacements aléatoires sont effectués afin d’explorer différentes solutions voisines. Un déplacement est accepté s’il mène à une valeur plus petite de la fonction objectif à minimiser. Sinon, il est accepté avec une probabilité P. P=e − ∆f kT Eq. 26 Avec ∆f la variation de la fonction objectif au cours du déplacement, T la température qui décroît au cours du temps et k une constante à déterminer en fonction du problème traité. Le recuit simulé est adapté aux problèmes dont la fonction à minimiser est mal connue et sans se soucier du nombre de dimensions de l’espace de recherche. Cette méthode n’est pas sensible à la présence de minima locaux. Elle ne nécessite pas non plus de connaître la fonction objectif à optimiser, ni les traitements mathématiques de dérivation ou de calcul d’adjoint [S. A. Teukolsky et al., 1992]. - Les algorithmes génétiques : Les algorithmes génétiques ou algorithmes évolutionnaires utilisent quant à eux, un processus stochastique pour générer des individus (solutions potentielles e (i ) ) sur lesquels sont appliquées plusieurs règles issues de la théorie de l’évolution (croisement, mutation et sélection) afin de conserver les meilleurs individus et converger plus rapidement vers une solution proche de l’optimum. Avant de poursuivre en détail sur les algorithmes génétiques, une comparaison des méthodes inverses sur leurs capacités d’exploration et exploitation de l’espace des possibles, explique l’intérêt suscité par les algorithmes évolutionnaires. V.1.1.3 Bilan sur les méthodes inverses Les méthodes purement stochastiques (Monte Carlo) permettent une bonne exploration puisque tout point de l’espace a une probabilité identique d’être atteint, mais il n’y a pas d’exploitation des résultats déjà obtenus. A contrario, avec les méthodes de direction de pente (ou gradient), l’exploration est locale mais l’exploitation des données précédentes permet une convergence plus rapide. Enfin, les algorithmes évolutionnaires offrent un bon compromis entre exploration et exploitation [Beasley et al., 1993]. 172 Chapitre V Estimation du terme source d’un phénomène dangereux Les algorithmes génétiques offrent également d’autres avantages qui en font une solution intéressante aux problèmes inverses d’évaluation du terme source en situation d'urgence. Le paragraphe suivant leur est consacré. V.1.2 Les algorithmes génétiques V.1.2.1 Utilisation des algorithmes génétiques pour résoudre un problème inverse Les algorithmes génétiques présentent l’avantage d’être adaptables aux différents problèmes inverses pouvant être rencontrés en situation d’urgence : o Un nombre variable de paramètres à identifier En effet, selon les situations, certains paramètres du terme source seront connus ou non. Pour une explosion, le paramètre habituellement recherché est la quantité de produit ayant réagi, mais dans un premier temps, la localisation de l’épicentre peut ne pas être connue. Pour une dispersion de gaz, le terme source comprend notamment le débit, la hauteur et la vitesse initiale du rejet. o La complexité et la non-linéarité des modèles mathématiques Les modèles sont plus ou moins complexes selon le phénomène modélisé et la précision des mécanismes physiques pris en compte (modèles gaussiens, modèles intégraux, modèles de la mécanique des fluides). Certains modèles ne sont pas inversibles, ne permettent pas le calcul d’un adjoint ou seront associés à une fonction coût non convexe. De plus, l’inversion d’un modèle ou le calcul d’un adjoint peut être un travail mathématique conséquent. Les algorithmes génétiques ne nécessitent pas ce travail mathématique et permettent de contourner les problèmes de non linéarité [Giacobbo et al., 2002]. o L’existence de plusieurs solutions Dans le cas de problèmes « mal posés » sous-déterminés, il n’existe pas une unique solution et la méthode doit permettre d’obtenir un ensemble représentatif de solutions possibles. La solution retenue pour estimer le terme source, est d’utiliser un algorithme génétique couplé à un modèle prédictif (Figure 46). 173 Chapitre V Estimation du terme source d’un phénomène dangereux Figure 46 : Méthode inverse par algorithme génétique V.1.2.2 Principes généraux des algorithmes génétiques Les algorithmes génétiques appartiennent à une famille d'algorithmes appelés métaheuristiques dont le but est d'obtenir une solution approchée à un problème d'optimisation en un temps de calcul acceptable [Bontemps, 2000]. Les algorithmes génétiques utilisent la notion de sélection naturelle développée au XIXe siècle par le scientifique Darwin et l'appliquent à une population de solutions potentielles au problème donné. Les premiers travaux sur les algorithmes génétiques ont commencé dans les années cinquante lorsque plusieurs biologistes américains ont simulé des structures biologiques sur ordinateur. Puis entre 1960 et 1970, John Holland, sur la base des travaux précédents, développa les principes fondamentaux des algorithmes génétiques dans le cadre de l'optimisation mathématique [Holland, 1975]. Mais les ordinateurs n’avaient pas encore une puissance de calcul suffisante pour envisager l'utilisation des algorithmes génétiques sur des problèmes réels de grande taille. Avec l’évolution des ordinateurs, des utilisations concluantes des algorithmes génétiques furent obtenues sans pouvoir néanmoins démontrer 174 Chapitre V Estimation du terme source d’un phénomène dangereux formellement les mécanismes observés à cause de la complexité induite par ces algorithmes. Il faut attendre 1993 pour que Raphaël Cerf établisse une démonstration complète et rigoureuse de convergence stochastique [Cerf, 1994]. Dans la suite de ce paragraphe, nous emploierons un vocabulaire similaire à celui de la génétique communément employé dans la littérature scientifique relative à ces algorithmes. Ainsi, un ensemble de solutions (termes source potentiellement solutions de problème) sera désigné comme une population d’individus possédant des caractères héréditaires (les différents paramètres constituant le terme source). Les principes de sélection, de croisement et de mutation introduits dans ce cadre artificiel, s'appuient sur les processus naturels du même nom. Pour un problème d'optimisation donné, un individu représente un point de l'espace d'état auquel est associée la valeur du critère à optimiser. L'algorithme génère de façon itérative des populations d'individus sur lesquelles sont appliqués des processus de sélection, de croisement et de mutation. La sélection a pour but de favoriser les meilleurs éléments de la population, tandis que le croisement et la mutation assurent une exploration efficace de l'espace d'état. Les algorithmes génétiques comprennent plusieurs étapes illustrées en Figure 47 et détaillées ci-dessous : - Le contenu de la population initiale d‘individus (solutions possibles) est généré aléatoirement. - Une évaluation de chacun des individus est effectuée pour leur affecter une note qui correspond à leur adaptation au problème. Il s’agira de l’erreur ou de l’écart entre la solution calculée et la solution recherchée. - Ensuite, une sélection des solutions est réalisée. Ce processus est analogue à celui de la sélection naturelle : les individus les plus adaptés vont pouvoir se reproduire tandis que les moins adaptés meurent avant la reproduction, ce qui améliore globalement l'adaptation. Il existe plusieurs techniques de sélection. Les principales utilisées sont : o La sélection par rang Cette technique de sélection choisit toujours les solutions possédant les meilleurs scores d'adaptation, le hasard n'entre donc pas dans ce mode de sélection. o La probabilité de sélection proportionnelle à l'adaptation (Méthode de Monte-Carlo par exemple) 175 Chapitre V Estimation du terme source d’un phénomène dangereux Pour chaque solution, la probabilité d'être sélectionnée est proportionnelle à son adaptation au problème. Afin de sélectionner une solution, on utilise le principe de la roue de la fortune biaisée. o La sélection par tournoi Cette technique utilise une sélection aléatoire ou non de paires de solutions, puis choisit pour chaque paire, la solution qui a le meilleur score d'adaptation. o La sélection uniforme La sélection se fait aléatoirement, uniformément et sans intervention de la valeur d'adaptation. Chaque solution a donc une probabilité 1/N d'être sélectionnée, où N est le nombre total de solutions dans la population. Par conséquent, cette technique ne retient pas forcément les meilleures solutions. - L’intérêt des algorithmes génétiques apparaît à l’étape suivante de génération d’une nouvelle population de solutions. Cette population est construite à partir de règles issues de l’évolution des espèces : o Le crossing-over ou recombinaison De façon analogue aux chromosomes lors de la reproduction sexuée, deux solutions s'échangent des parties de leurs paramètres, pour donner de nouvelles solutions. Ces crossing-over peuvent être simples ou multiples. Il existe plusieurs méthodes pour déterminer les couples subissant une recombinaison (aléatoire, par rang, …). o Les mutations De façon aléatoire, un paramètre d'une solution peut être substitué à un autre. La mutation sert à éviter une convergence prématurée de l'algorithme. Par exemple lors d'une recherche d'extremum la mutation sert à éviter la convergence vers un extremum local. - Tout processus itératif nécessite une condition d’arrêt. Deux approches existent : o Le nombre d’itérations (ou générations) est fixé a priori ou empiriquement afin de limiter le temps de calcul. o L’algorithme s’arrête lorsque la population d’individus cesse d’évoluer ou n’évolue plus assez rapidement. Dans les deux cas, la solution obtenue n’est qu’une valeur approchée de l’optimum. 176 Chapitre V Estimation du terme source d’un phénomène dangereux Figure 47 : fonctionnement des algorithmes génétiques Les algorithmes génétiques peuvent s’appliquer à de nombreux problèmes de recherche d’optimum, d’analyse de situations dynamiques complexes, ou encore à la modélisation de comportements d’agents et de stratégies. Ils sont donc adaptés à la résolution d’un problème inverse. Le paragraphe suivant présente une application possible des algorithmes génétiques pour résoudre un problème inverse d’identification du terme source d’une explosion de solides. 177 Chapitre V V.2 Estimation du terme source d’un phénomène dangereux Application aux explosions de solides Les algorithmes génétiques ont été appliqués aux explosions de solides pour lesquelles il s’agit de calculer avec précision la masse d’explosif ayant détonnée et de déterminer la position de l’épicentre. Bien que l’épicentre puisse être identifié visuellement en recherchant le cratère, il n’est pas toujours connu avec précision dans les premiers instants. La conception de l’algorithme et l’évaluation de la méthode ont été réalisées à partir de jeux de données artificielles générées selon un processus stochastique. L’étude des dommages issue des retours d’expérience de l’accident d’AZF (à Toulouse en 2001) et de l’explosion de Nitrochimie (à Billy-Berclau en 2003) ont servi pour la validation de la méthode [Mouilleau et al., 2001; Dechy et al., 2004]. Figure 48 : Usine AZF suite à l’explosion du 21 septembre 2001 Les explosions (qu’il s’agisse d’explosions de solides ou de nuages gazeux), sont des phénomènes extrêmement violents et à cinématique très rapide se caractérisant par une libération soudaine d’énergie pouvant donner lieu à des flux mécaniques (onde de pression et projectiles) et à des flux thermiques (boule de feu). Il existe différents types d’explosions qui se distinguent notamment par la phase du produit à l’origine de l’explosion (par exemple un explosif solide pouvant provoquer une déflagration ou une détonation), par les conditions de stockages (stockage sous-pression et température extérieure par exemple), ou encore, par le fait que l’explosion se produit en milieu confiné ou non. Nous nous intéresserons à une méthode destinée à évaluer le terme source d’une détonation de produit chimique à l’état solide. 178 Chapitre V V.2.1 Estimation du terme source d’un phénomène dangereux Données opérationnelles Lors d’une situation d’urgence suite à une explosion, le flux mécanique résultant (surpression) n’est pas mesuré car la cinématique rapide du phénomène ne permet pas de déployer un réseau de mesures lors de l’événement. Les informations dont disposent les services de secours et les experts sont des observations des dommages résultants. Une fois les dommages causés sur les structures répertoriés, il faut procéder à leur cotation pour les convertir en valeurs de surpression. La conversion des dommages observés en valeurs de surpression relève d’un travail d’experts et de l’utilisation de documents de référence. Les expertises utilisées pour cette étude se sont référées à un tableau réalisé à partir d’une synthèse des informations reportées dans [Clancy, 1972; Lannoy, 1984; BIT, 1993; INRS, 1994] et diverses analyses d’accident [Lechaudel et al., 1995], [Michaëlis et al., 1995]. Ce tableau est disponible notamment dans [Dechy et al., 2003b]. Cette cotation permet d’associer à chaque dommage observé et localisé, un encadrement plus ou moins précis de la valeur de surpression qui s’est exercée et d’obtenir des couples (distance à l’épicentre, surpression). Par exemple, pour ces dégâts observés sur les vitres d’un bâtiment situé à 1300 mètres de l’épicentre (cf. Figure Figure 49 : Bris de vitres 49), les experts ont estimé que la (cité universitaire « Daniel surpression était comprise entre 14 et 30 Faucher » à Toulouse) mbar, surpressions correspondant à 50% des vitres cassées.[BIT, 1993] A partir d’une distance et d’une surpression, la masse d’équivalent TNT peut alors être calculée à l’aide d’un modèle du phénomène d’explosion comme celui de l’équivalent TNT. V.2.2 Modèle retenu : l’équivalent TNT V.2.2.1 Principes généraux La méthode de l’équivalent TNT est incontestablement l’une des premières utilisées pour prévoir les conséquences de tout type d’explosion. Elle repose sur l’hypothèse qu’il doit être possible de reproduire le champ de surpression qui est 179 Chapitre V Estimation du terme source d’un phénomène dangereux engendré par une explosion donnée (de gaz, d’un explosif condensé, ...) en faisant exploser du TNT considéré comme l’explosif de référence en raison des nombreux essais réalisés avec ce produit. Ainsi, l’équivalent TNT d’une substance explosible correspond à la masse de TNT qui en explosant engendrerait le même champ de surpressions que celui généré par l’explosion d’un kilogramme du produit considéré. [Mouilleau et al., 1999]. La correspondance entre l’équivalent TNT et la masse de produit mise en jeu est faite par l’équation ci-dessous : M produit = Où M TNT × ETNT E produit Eq. 27 M produit est la masse de produit ayant participée à l’explosion (en kg), M TNT est la masse d’équivalent (en kg), E TNT est est l’énergie libérée par l’explosion d’un kg de TNT soit 4690 kJ, E produit est l’énergie libérée par l’explosion d’1 kg du produit en cause (en kJ). V.2.2.2 Modélisation de la surpression dans l’espace Le modèle de l’équivalent TNT représente la décroissance en fonction de la distance d à l’épicentre de la surpression ∆P au sol en champ libre engendrée par la détonation d’une masse de TNT notée M. On notera λ , la distance réduite λ= d 3 Eq. 28 M TNT 180 Chapitre V Estimation du terme source d’un phénomène dangereux Figure 50 : Courbe TNT - Abaque TM5-1300 extrapolé tiré de (Lannoy, 1984) Le modèle retenu est celui utilisé par l’INERIS noté ( FeqTNT ) : Si ∆P > 150, M = 0,026 × d 3 × ∆P 1,58 sinon M = 0,314 × d 3 × ∆P 2 ,874 V.2.2.3 Sensibilité du modèle aux Eq. 29 erreurs d’estimation des surpressions Il est important d’estimer avec précision la surpression exercée à partir des dégâts observés, car un écart de surpression se traduit par une différence significative de la masse calculée (entre 3,8 et 43,3 tonnes pour le premier exemple du tableau ci-dessous). Ceci est illustré en prenant deux exemples (points de dégât n°17 et n°1042) de l’étude des dégâts réalisée par l’INERIS suite à l’explosion d’AZF [Mouilleau et al., 2001]. Pour chacun des deux dommages constatés (déformation d’un calorifuge et bris de vitres) et localisés, les experts ont réalisé une estimation de la surpression qui s’est exercée sous forme d’un encadrement par deux valeurs exprimées en millibars. L’utilisation du modèle de l’équivalent TNT a permis de convertir la valeur de surpression à une distance donnée en masse d’équivalent TNT correspondante. 181 Chapitre V Estimation du terme source d’un phénomène dangereux Tableau 16 : Exemple de calcul de la masse d’équivalent TNT à partir de dommages convertis en surpression. N° Type Distance ∆P min. (m) 17 Déformations du (mbar) Eq. TNT ∆P Eq. TNT min. (tonnes) max. max. (mbar) (tonnes) 660 30 3,8 70 43,3 1700 10 2,8 20 20,2 calorifuge 1042 vitres brisées Sur ces exemples réels, issus du REX d’AZF, la surpression estimée par les experts est imprécise et peut prendre des valeurs allant du simple au double, pour une distance donnée. Pour ces valeurs de surpression, les masses d’équivalent TNT correspondantes, calculées à l’aide du modèle, varient alors d’un facteur sept à dix. V.2.3 Paramètres de l’algorithme génétique V.2.3.1 Terme source et paramètres Dans le cas d’une explosion, le vecteur d’état comprend la masse M d’équivalent TNT ayant détonné ainsi que la localisation (x ; y) de l’épicentre. Les contraintes sont les couples (d ,[∆P i i min ) , ∆Pi max ] ce qui complique l’élaboration de la fonction coût qui doit prendre en compte des intervalles dont la précision est variable. Il est préférable de réduire l’intervalle à une valeur unique (par exemple la moyenne), mais cela introduit un biais. La solution adoptée est d’introduire les intervalles au vecteur d’état avec le terme source. Lors de la génération d’une population d’individus, chaque surpression est choisie aléatoirement dans l’intervalle correspondant, puis l’algorithme génétique permet de produire les valeurs de surpressions constituant des solutions intéressantes au problème de minimisation de la fonction coût. Il est alors possible de réaliser l’évaluation des individus avec la méthode des moindres carrés. La sélection des individus repose principalement sur la méthode de la roue biaisée. Cette méthode permet une bonne exploration de l’ensemble des possibles. Mais ne garantissant pas de conserver les meilleurs individus, elle n’est utilisée que pour constituer 95% de la génération suivante. Les meilleurs individus (5%) sont conservés pour compléter la population suivante. Paramètres de l’algorithme : Nombre d’individus : 200 182 Chapitre V Estimation du terme source d’un phénomène dangereux Gênes de chaque individu : Masse de TNT X Y ∆P’1 … ∆P’i … ∆P’n Nombre de générations : 30 Probabilité de mutation : 0.5% Probabilité de croisement : 1 Sélection : roue biaisée 95% + meilleurs individus 5% V.2.3.2 Complexité de l’algorithme et temps de calcul Une des limites d’utilisation des algorithmes stochastiques est le temps de calcul qui est souvent long du fait d’un grand nombre de cas à tester pour couvrir l’espace des solutions. Bien que les algorithmes génétiques convergent plus rapidement que d’autres méthodes purement stochastiques, il faut déterminer la complexité de l’algorithme et estimer le temps de calcul nécessaire à l’obtention d’un résultat acceptable. La complexité dépend du nombre d’itérations, de la taille de la population d’individus et du taux de sélection. Le produit de ces trois paramètres détermine le nombre de solutions testées. Le nombre d’itérations et la taille de la population seront d’autant plus grands que le phénomène est complexe et qu’il fait intervenir un grand nombre de paramètres à déterminer (masse de TNT, localisation) et également un ensemble de valeurs possibles plus grand (masse de TNT compris entre 1 et 100 tonnes avec une précision de 100 kg par exemple). Le temps de calcul va dépendre (en dehors de la puissance de calcul disponible) de la complexité de l’algorithme et du temps de calcul nécessaire pour obtenir le résultat du modèle prédictif. Les temps de calcul pour des jeux de données utilisés dans cette étude et comportant jusqu’à 100 relevés de surpression sont inférieurs à une minute avec un ordinateur personnel classique (Processeur à 2 GHz). V.2.4 Evaluation de la méthode inverse V.2.4.1 Méthode de référence Les résultats de l’algorithme sont comparés à ceux d’une méthode de référence. La méthode retenue est celle qui est utilisée par l’INERIS lors des expertises pour estimer une masse de TNT à partir de relevés de surpression à différentes distances de l’épicentre. Cette méthode calcule un intervalle encadrant la masse de TNT (traits verts). Les bornes de l’intervalle sont calculées 183 Chapitre V Estimation du terme source d’un phénomène dangereux en faisant la moyenne arithmétique des masses de TNT correspondant aux bornes de l’intervalle des surpressions : M min = ∑ N i =1 ( FeqTNT ∆Pi min , d i N ); M ∑ = N i =1 max ( ) FeqTNT ∆Pi max , d i N Eq. 30 Il faut noter que la méthode de référence comporte un biais dans le calcul de la masse de TNT. En effet, une moyenne arithmétique est effectuée sur des résultats issus d’un modèle non linéaire, ce qui introduit un biais. La méthode utilisée par l’INERIS surestime la masse d’équivalent TNT. FeqTNT ( ∆P + ε , d ) − FeqTNT ( ∆P, d ) > FeqTNT ( ∆P − ε , d ) − FeqTNT ( ∆P, d ) Eq. 31 Le biais de la méthode peut être vérifié par simulation, en introduisant un bruit dont la distribution est centrée. Le biais est alors égal à : ∑ N i =1 ( FeqTNT ∆Pi + ε i , d i N ) ∑ − N i =1 ( FeqTNT ∆Pi , d i N ) avec ∑ N i =1 εi = 0 Eq. 32 Un jeu de données de 100 mesures de surpressions avec un bruit de mesure aléatoire compris entre -30% et +30% et de moyenne nulle. Toutes les mesures sont à une même distance de l’épicentre afin d’éviter que les distances relatives n’interviennent dans le calcul (cf. V.2.5). Quelle que soit la masse d’équivalent TNT, la distance entre l’épicentre et les mesures de surpression, le biais est toujours de +7,82%. V.2.4.2 Evaluation de l’algorithme à l’aide de données artificielles L’élaboration des méthodes inverses à base de modèles existants et l’étude de sensibilité nécessitent des jeux de données représentatifs des données disponibles en situation d’urgence. Mais actuellement, ces jeux de données ne sont pas disponibles en nombre suffisant, ce qui contraint donc à rechercher les données ailleurs. De plus, pour la conception de ces méthodes inverses il est préférable de travailler avec des données précises, complètes, et sans incertitude, ce qui n’est pas le cas des retours d’expérience ou des campagnes de mesures au travers d’essais. Afin de concevoir la méthode, des jeux de données artificielles (théoriques) ont été calculés à l’aide d’un modèle de calcul de flux (équivalent TNT) selon un processus stochastique. Toutefois, il faut tenir compte du fait que les données disponibles en situation d’urgence sont limitées en nombre et comportent des erreurs de mesures ou d’estimation. Il est donc nécessaire dans une seconde étape, d’ajouter un taux d’erreur (imprécision et biais) et réduire le nombre de données 184 Chapitre V Estimation du terme source d’un phénomène dangereux pour obtenir des jeux de données proches de ceux disponibles en situation d’urgence. Ces jeux de données bruitées ont ensuite servi à évaluer la précision de la méthode. Plusieurs expertises ont servi de référence pour déterminer l’imprécision des estimations des surpressions associées aux dommages. Aux surpressions calculées par le modèle, un bruit aléatoire compris entre -30% et +30% a été introduit. Cet intervalle a été déterminé à partir des cotations des dégâts matériels de l’étude de l’accident d’AZF réalisée par l’INERIS. Ainsi, le tirage aléatoire borné à 30% en valeur absolue permet d’obtenir une imprécision moyenne (taille des encadrements des surpressions) semblable à celle des données du REX d’AZF. Cependant, certaines valeurs extrêmes (imprécision pouvant atteindre 50%) ne sont pas reproduites. Les données issues du REX d’AZF ne permettent pas de déduire une distribution particulière d’imprécision. De ce fait, le tirage aléatoire pour générer le bruit est un tirage équiprobable. De plus, bien que les experts jugent que les estimations ne sont pas biaisées, un biais arbitraire de 25% a été ajouté afin de dégrader l’information et tenir compte ainsi d’éventuelles erreurs d’estimations. De sorte, les intervalles encadrant la surpression ne sont pas centrés autour de la valeur réelle. Enfin, le nombre de relevés de dégâts étant variable d’une situation à l’autre, différents jeux de données ont été générés en tenant compte de cette différence de quantité d’information. V.2.4.2.1 Estimation de la masse d’équivalent TNT Les premiers tests ont pour but d’évaluer l’algorithme dans le cas d’un terme source constitué d’un seul paramètre : la masse d’équivalent TNT. Dans les résultats présentés (Figure 51 et Figure 52), les 20 jeux de données comportent de 5 à 100 estimations de surpressions (20 jeux de données avec un pas de 5 estimations). Ces surpressions ont été générées afin de correspondre à une masse d’équivalent TNT de 50 tonnes (triangle bleu). Les résultats de l’algorithme (rond rouge) ont été comparés à la méthode de référence utilisée par l’INERIS. Il est délicat de comparer la précision de la méthode de référence et de l’algorithme car les résultats obtenus ne sont pas de même nature : un intervalle large (du simple au double) pour la méthode de référence et une valeur unique pour l’algorithme. Il n’est pas possible de calculer une valeur à partir de l’intervalle car la fonction est non linéaire et le calcul de la moyenne par exemple introduirait un biais qui ne peut être réduit. Pour tous les jeux de données, ces deux méthodes sont en accord puisque le résultat de l’algorithme est toujours dans l’intervalle obtenu par la méthode de référence. 185 Chapitre V Estimation du terme source d’un phénomène dangereux 100,00 90,00 M as se d’ éq ui va le nt T N T ● Algorithme 80,00 70,00 Méthode INERIS - Masse min. 60,00 50,00 40,00 - Masse max. 30,00 20,00 ▲ Masse réelle 10,00 (50 tonnes) 0,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 20 jeux de données Figure 51 : Evaluation sur données artificielles (sans biais) Masse d’équivalent TNT (tonnes) 100,00 90,00 80,00 ● Algorithme 70,00 Méthode INERIS - Masse min. - Masse max. 60,00 50,00 40,00 30,00 ▲ Masse réelle 20,00 (50 tonnes) 10,00 0,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 20 jeux de données Figure 52 : Evaluation sur données artificielles (biais=25%) Lorsqu’aucun biais n’est introduit (Figure 51), l’estimation de la masse d’équivalent TNT est très précise comparée à la méthode utilisée par l’INERIS. Avec un biais de 25% (Figure 52), sur l’ensemble des jeux de données, on constate une erreur moyenne de 14% dans le cas de données biaisées et une erreur maximum de 28,2% qui est tout à fait acceptable dans l’optique d’une utilisation opérationnelle. La figure suivante (Figure 53) présente les écarts de calcul de distances utiles (distances de l’épicentre où l’on observe des surpressions de 50, 140 et 200 mbar) provoqués par une erreur d’estimation de la masse d’équivalent TNT de 28,2% en plus ou en moins de la masse réelle. En termes de distances, l’erreur est inférieure à 10%. 186 Chapitre V Estimation du terme source d’un phénomène dangereux Figure 53 : Ecarts des distances à l’épicentre calculées avec une erreur de 28,2% de la masse d’explosif. V.2.4.2.2 Localisation de l’épicentre Dans les premiers instants qui suivent une explosion de grande ampleur, (dans le cas d’AZF, la première heure après l’arrivée des secours), la localisation de l’épicentre n’est pas toujours connue avec précision. Dans ce cas, la recherche de l’épicentre est visuelle, effectuée lors de la reconnaissance. Il existe des moyens pour localiser l’épicentre comme l’utilisation des enregistrements de l’onde sur des sismographes proches du lieu de l’explosion. Mais le traitement des données nécessite plusieurs jours et la précision n’est pas suffisante. Pour l’explosion d’AZF, les premiers résultats localisaient l’épicentre avec une erreur de l’ordre de huit kilomètres. Les résultats finaux permettent d’avoir une précision d’un kilomètre [Macé de Lépinay et al., 2002]. Sur les jeux de données artificielles l’erreur de localisation de l’épicentre est comprise entre 6 m et 340 m avec une erreur moyenne de 101 mètres pour des relevés de surpressions distants de 3,5 km à 5,5 km (Figure 54). Les calculs effectués ont montré que la localisation de l’épicentre est d’autant meilleure que les relevés de surpressions sont précis, nombreux, proches de l’épicentre et uniformément répartis autour. L’ignorance de la position de l’épicentre n’introduit pas d’erreur supplémentaire d’évaluation de la masse d’équivalent TNT. L’erreur moyenne est de 12% et l’erreur maximum de 28,4%. 187 Estimation du terme source d’un phénomène dangereux 1000 90,00 900 80,00 800 70,00 700 60,00 600 50,00 500 40,00 400 30,00 300 20,00 200 10,00 100 Masse d’équivalent TNT (tonnes) 100,00 0,00 ● Algorithme Distance (m) Chapitre V 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Méthode INERIS - Masse min. - Masse max. ▲ Masse réelle (50 tonnes) ♦ Décalage de l’épicentre (m) Figure 54 : Evaluation sur données artificielles (épicentre inconnu) V.2.4.3 Validation de la méthode à partir de retours d’expérience Enfin la méthode a été testée sur deux accidents faisant intervenir une explosion de solide : AZF (2001) où une explosion de nitrate d’ammonium s’est produite sur le site de la compagnie Grande Paroisse à Toulouse (France) et a causé le décès de 30 personnes, plus de 2242 blessés et des dégâts matériels considérables. Et l’accident qui s’est produit à Billy-Berclau (France) en 2003 dans un atelier de fabrication d’explosifs de la société Nitrochimie où une explosion de « dynamite » a causé la mort de quatre employés [Dechy et al., 2003a; Dechy et al., 2003b]. V.2.4.3.1 Estimation de la masse d’équivalent TNT Les résultats de l’algorithme obtenus sur ces deux accidents (Tableau 17) sont comparés à la méthode de référence utilisée par l’INERIS et également aux résultats finaux de l’expertise se basant sur la méthode de calcul précédente à partir de relevés de surpression, mais également sur une étude du cratère et aussi sur des calculs à partir des effets dits « missiles ». Tableau 17 : Résultats sur des accidents réels AZF Estimation des experts Méthode de référence Algorithme génétique Nitrochimie Estimation des experts Méthode de référence Algorithme génétique Masse TNT (tonne) Min. Max. 20,00 40,00 15,50 39,41 24,29 Masse TNT (kg) Min. Max. ≈100 76,73 199,74 123,70 188 Chapitre V Estimation du terme source d’un phénomène dangereux Pour les deux accidents d’AZF et de Nitrochimie, les résultats de l’algorithme sont concluants : ils sont en accord avec la méthode de référence et aussi avec les résultats finaux de l’expertise. V.2.4.3.2 Localisation de l’épicentre La recherche de l’épicentre par l’algorithme n’a été effectuée que dans le cas de l’accident d’AZF. L’algorithme localise l’épicentre avec une erreur de 60 m et évalue la masse d’équivalent TNT à 28 tonnes ce qui est toujours en accord avec les expertises. Dans le cas de l’accident de Billy-Berclau, seul les couples (d ,[∆P i i min ) , ∆Pi max ] étaient connus. L’absence des coordonnées cartésiennes des relevés des dégâts n’a pas permis la recherche de l’épicentre. V.2.4.4 Application aux situations opérationnelles Bien que la méthode fournisse des résultats précis en un temps de calcul très court, elle nécessite un grand nombre de données obtenues par un travail d’experts nécessitant plusieurs jours. En situation d’urgence, les relevés seront plus localisés et en nombre plus restreint. De plus, ces relevés ne seront pas effectués par des experts habitués à effectuer ces cotations et disposant du temps nécessaire à leur réalisation. Cela se traduit par une imprécision plus grande et les cotations se limitent à des types de dommages plus faciles à estimer (par exemple, la proportion de bris de vitres d’un bâtiment). Afin de vérifier l’efficacité de l’algorithme en situation d’urgence, nous avons limité le nombre de relevés de dommages à dix points répartis en trois zones distinctes car les services de secours ne peuvent quadriller toute la zone pour obtenir une répartition homogène. Afin de faciliter la cotation des dommages qui relève d’un travail d’expert, nous avons limité les types de dommages aux pourcentages de bris de vitres dont les surpressions correspondantes peuvent être déduites plus facilement en se référant aux abaques. Avec les tests réalisés sur les jeux de données artificielles, l’erreur moyenne pour le calcul de la masse d’explosif est de 15% et l’erreur maximum est de 39%. Cette précision reste acceptable pour dimensionner l’événement et déterminer la zone à couvrir. Par contre la localisation de l’épicentre est trop imprécise avec une erreur moyenne de 590 m lorsque les relevés de dommages sont effectués à 4 km. 189 Chapitre V Estimation du terme source d’un phénomène dangereux Pour les tests réalisés d’après les données du REX d’AZF, les relevés de dégâts se répartissent comme indiqué (Figure 55) : • 2 zones de 4 relevés de dégâts sur des bris de vitres (points rouges), • 1 zone de 2 relevés plus incertains (points fuchsias) qui pourraient être obtenus par les témoignages de personnes non averties, incapables de fournir des données d’une grande précision. La surpression serait alors déduite, considérée comme étant comprise entre la valeur nécessaire aux premiers bris de vitres (10 mbar) et la destruction totale des vitres (70 mbar) .(Cf. tableau de synthèse utilisé dans [Dechy et al., 2003b]). Figure 55 : Localisation des dommages à la suite de l’explosion d’AZF Lorsque l’épicentre est connu, la méthode développée dans le cadre de cette étude permet toujours d’estimer correctement la masse d’équivalent TNT avec 100% des résultats en accord avec les expertises. Cependant, lorsque l’épicentre doit être localisé, l’erreur moyenne de positionnement de l’épicentre est de 370 m et 30% des tests sous-estiment la masse d’explosif. 190 Chapitre V V.2.5 Estimation du terme source d’un phénomène dangereux Prise en compte de la distribution des points de mesure V.2.5.1 Principes La distribution des observations ou mesures de flux n’est pas homogène dans l’espace. Cette hétérogénéité introduit un biais dans le calcul du terme source en favorisant certaines données par rapport à d’autres. Plusieurs facteurs interviennent : - par exemple, dans le cas d’une régression linéaire, les points extrêmes interviennent plus dans le calcul. - D’autre part, effectuer plusieurs cotations d’un même bâtiment ou de bâtiments voisins peut s’interpréter comme plusieurs cotations d’un même dommage en un même endroit et, ainsi, lui donner un poids plus fort. Plusieurs solutions peuvent être envisagées afin de calculer une pondération des points de mesure de flux pour corriger l’hétérogénéité de la distribution des points. V.2.5.2 Le diagramme de Voronoï Le poids d’un point est calculé en fonction des distances à ses voisins déterminées par un diagramme de Voronoï [Boissonnat et al., 1995] (cf. Figure 56, diagramme en bleu). Plus un point (appelé foyer dans le diagramme de Voronoï) est proche de ses voisins et plus la zone (ou cellule) qu’il occupe est petite. En affectant un poids aux foyers en fonction de la taille de leur cellule permettrait de compenser les multiples cotations en un même lieu. Figure 56 : Diagrammes de Voronoï de surpressions relevées à Toulouse (AZF 2001) 191 Chapitre V Estimation du terme source d’un phénomène dangereux Figure 57 : Diagramme de Voronoï d’un exemple fictif Mais le diagramme de Voronoï présente deux inconvénients : • Si plusieurs cotations sont faites en un même lieu, il faut diminuer leur poids mais il ne faut pas en favoriser certaines par rapport aux autres. Leur poids doit être le même. Mais des points très proches peuvent avoir des pondérations sensiblement différentes alors qu’ils devraient avoir le même poids. Ce constat qui peut être fait à partir du diagramme de Voronoï calculé sur le REX d’AZF est mis en évidence dans l’exemple (Figure 57). Les deux foyers marqués d’un rond noir sont voisins spatialement et devraient avoir la même pondération. Mais les cellules associées (zones vertes et jaunes) ont des surfaces différentes (la zone jaune fait plus du double de la zone verte). • Les foyers en bordure n’ont pas de cellule finie. Il est nécessaire de limiter l’espace pour pouvoir calculer le poids des points en périphérie. Ces poids sont alors dépendants des limites fixées arbitrairement. L’espace est partitionné en fonction des foyers. La cellule d’un foyer est d’autant plus petite que ses voisins directs sont proches. Une autre approche classique est d’évaluer la densité de points et de pondérer chaque point inversement à sa densité. Le fonctionnement de l’estimation de la densité diffère du diagramme de Voronoï sur la prise en compte des voisins qui ne se limitent pas aux voisins directs de chaque côté. 192 Chapitre V Estimation du terme source d’un phénomène dangereux V.2.5.3 Estimation de la densité V.2.5.3.1 Présentation des méthodes d’estimation de la densité La densité peut être estimée par différentes méthodes, notamment des estimateurs dits « naïfs » à volume fixe ou la méthode des K plus proches voisins (Fix & Hodges,1951; Cover & Hart,1967). L'idée la plus naturelle pour évaluer la densité L au point x consiste à compter le nombre d'observations η contenues dans un certain voisinage υ de x. L’estimation de la densité L(xi) en un point xi se définit par le rapport suivant : L( xi ) = ηi nVi Eq. 33 Vi étant le volume du voisinage υi centrée en Xi, ηi, le nombre de sommets contenus dans υi et n la taille de l’échantillon. o Volume fixé Pour calculer la densité, une première solution consiste à fixer la « forme » du voisinage et ses dimensions. Le voisinage sera centré sur le point où est estimée la densité et il sera de forme régulière dans une métrique choisie. Le choix du volume est déterminant pour la précision des estimations. Il intervient dans les calculs en effectuant un lissage des densités [Duda et al., 1973]. Un volume trop grand provoque un nivellement des variations de L(xi), par contre si le volume est trop petit, L(xi) présentera de nombreuses discontinuités. • Hyper cube La forme du voisinage peut être choisie comme un intervalle dans chacune des dimensions. Le voisinage υ correspond à l’hyper cube en d dimensions, centré en xi, orienté suivant les axes du repère orthonormé et de volume Vcube = hd. • Hyper sphère Dans cette variante, le calcul de la densité en un point xi s’effectue en comptant tous les points à une distance de xi inférieure ou égale à r. Ce sont tous les points contenus dans la sphère de rayon r et centrée en xi. • Estimation de la densité par noyau L’estimation de la densité utilisant un voisinage de forme hypercube est la forme élémentaire des fenêtres de Parzen. Il s’agit d’une simplification de l’estimation par noyau [Rosenblatt, 1956; Parzen, 1962] qui consiste à pondérer 193 Chapitre V Estimation du terme source d’un phénomène dangereux les observations en fonction de leur distance au point estimé. Chaque individu n’est plus une observation élémentaire de poids égal à un, mais une distribution dans l’espace observé. La distribution suit une fonction d’intégrale égale à un, symétrique et centrée en zéro. o k plus proches voisins (KPPV) L’inconvénient de la méthode précédente est que le volume V du voisinage υ est fixe quelle que soit la densité à estimer. Nous savons que la taille du voisinage joue un rôle important dans le calcul de la densité et il est difficile de le fixer a priori [Lebart et al., 1995]. La méthode des k plus proches voisins offre une alternative à cette difficulté. Le volume V du voisinage υ n’est pas fixé a priori, mais choisi en fonction de sa capacité à contenir un nombre fixe d’éléments. Le volume υ est choisi en fonction d’une valeur a priori k de voisins de xi appartenant à υ. L’espace observé étant muni de la mesure de distance Euclidienne, le voisinage υ se définit comme la sphère de rayon minimum, centrée en xi et contenant k éléments. Avec cette méthode, il n’est plus besoin de fixer le volume, mais la difficulté réside dans le choix du nombre de voisins. V.2.5.3.2 Utilisation de la méthode des K plus proches voisins La méthode des K plus proches voisins a été utilisée pour pondérer chaque mesure de surpression. Plus un point (mesure de surpression) est dans une zone dense en nombre de mesures et plus son poids sera faible. La fonction coût comprend alors une pondération de chaque estimation du flux : (( ) C = ∑i Fxi (e) − s ' xi × P( xi ) N ) 2 xi un des N points de l’espace, où une estimation s ' xi du flux a été réalisé ainsi qu’un calcul du flux Fxi (e) à l’aide d’un modèle prédictif Mais, tout comme le diagramme de Voronoï, la méthode des K plus proches voisins donne un poids plus important aux points en périphérie. 194 Chapitre V Estimation du terme source d’un phénomène dangereux V.2.5.4 Ajustement de la pondération des points en périphérie. Une étude de sensibilité a été réalisée pour déterminer l’influence des points en périphérie et définir s’il faut leur accorder un poids important ou non. Plusieurs simulations numériques ont permis de déterminer l’importance de facteurs comme la distance des mesures de surpression à l’épicentre. Tous les paramètres sont fixés (terme source, nombre de mesures, configurations : grille, points équidistants, …) à l’exception de la distance x des mesures à l’épicentre (Figure 58). Pour chaque position, une valeur de surpression est associée, correspondant au flux mesuré avec précision à cet emplacement (carrés jaunes). Pour certaines valeur, une erreur a été introduite (carré rouge). Ces valeurs erronées sont minoritaires. Pour une configuration simple avec quatre points, une seule valeur de surpression est bruitée. x x Figure 58 : Configuration avec une distance x variable Lorsque la distance x de l’ensemble des points à l’épicentre varie, l’erreur d’estimation de la masse d’équivalent TNT reste la même. D’autres simulations numériques ont consisté à faire varier la distance relative d’une mesure erronée par rapport aux autres relevés de surpression dont la valeur est exacte. Cette fois encore, plusieurs configurations ont été testées. Les résultats sont similaires, qu’elle que soit la configuration utilisée. Seuls les résultats d’une configuration en croix avec quatre mesures de surpression sont présentés (Figure 59). Trois mesures de surpression effectuées à une distance x de l’épicentre sont exactes (carrés jaunes) et pour la quatrième à une distance variable y, une erreur a été introduite (carré rouge). 195 Chapitre V Estimation du terme source d’un phénomène dangereux y x x x Figure 59 : Configuration en croix Les résultats (Figure 60) montrent l’influence de la distance d’un point erroné par rapport aux autres points. Plus un point de mesure sera éloigné de l’épicentre relativement aux autres points et plus l’erreur (mesure/calcul par le modèle) sera prise en compte dans l’évaluation du terme source. 180% 160% 140% % Erreur TNT 120% 100% 80% 60% 40% 20% 0% 0 10 000 20 000 30 000 40 000 50 000 60 000 Distance (point de m esure avec 50% d'erreur) erreur TNT 750m erreur TNT 1500m Figure 60 : Erreur de calcul de la masse de TNT en fonction de la distance relevés / épicentre Il en est de même pour la localisation de l’épicentre. 196 Chapitre V Estimation du terme source d’un phénomène dangereux y épicentre calculé x épicentre x x réel Figure 61 : Configuration avec une distance x variable 1 200 180% 160% 1 000 800 120% 100% 600 80% 400 60% % Erreur (TNT) Distance (épicentre) 140% 40% 200 20% 0 0 10 000 20 000 30 000 40 000 50 000 0% 60 000 Distance (point de m esure avec 50% d'erreur) distance épicentre erreur TNT Figure 62 : Erreur de calcul masse de TNT et position de l’épicentre en fonction de la distance relevés / épicentre V.2.5.5 Choix des positions d’estimation de la surpression La configuration idéale serait de supprimer les points très éloignés relativement aux autres, voire d’avoir des estimations de surpression à une même distance de l’épicentre. Mais les évaluations de surpression sont effectuées à l’endroit des dommages et ne sont pas en nombre suffisant pour effectuer une sélection drastique. De plus, la nature des dommages est à prendre en compte, certaines cotations étant plus précises ou plus facile à réaliser donc moins incertaines. Et la 197 Chapitre V Estimation du terme source d’un phénomène dangereux validité du modèle est également à prendre en compte. En champ lointain le modèle est extrapolé, ce qui demande une certaine prudence lors de l’utilisation des faibles surpressions. Ces données sont également sujettes à critique de la part d’experts car elles correspondent majoritairement aux bris de vitres pour lesquels l’évaluation de la surpression ne prend pas en compte le type de vitre (verre, double vitrage, châssis, etc.) et l’orientation par rapport au flux. Enfin, ces données obtenues en champ lointain correspondent à une onde de surpression modifiée par la présence d’obstacles de toutes natures. Malgré plusieurs arguments contre la prise en compte des données en champ lointain, on observe dans le cas du REX d’AZF que ces données sont en accord avec les résultats de l’expertise qui donnent une masse d’équivalent TNT comprise entre 20 et 40 tonnes. Les résultats suivants (Tableau 18) sont les masses de TNT calculées à partir de plusieurs ensembles disjoints de valeurs de surpression. Le jeu de données complet est constitué de 107 intervalles de surpressions. Ces données sont divisées en trois sous-ensembles correspondant aux données : - en champ lointain, constituées des dommages sur les vitres et les toitures en tôles, - en champ proche, d’une surpression supérieure à 70 mBar, - du reste des données, hors champ proche et autres que bris de vitres et déformation de tôles. Tableau 18 : Masse de TNT calculée pour plusieurs ensembles de données (REX d’AZF) Nombre de mesures de surpression Jeu de données complet Vitres et tôles Champ proche Zone intermédiaire 107 32 31 44 Méthode de l’INERIS Min. 15,50 15,05 16,61 15,04 Max. 39,41 32,51 24,43 54,99 A.G. 24,29 21,45 20,18 29,26 Les résultats obtenus avec les données en champ lointain sont compris dans ceux des autres jeux de données. On ne peut pas conclure de l’imprécision des données en champ lointain. Toutes les valeurs de surpression doivent être conservées. Quelle que soit la méthode d’estimation de la densité utilisée (KPPV , etc.), les points en périphérie, étant dans une zone moins dense, se trouvent prépondérant dans le calcul du terme source, car la surface associée lors du calcul de la densité est plus grande (Figure 63). De plus ces points en périphérie 198 Chapitre V Estimation du terme source d’un phénomène dangereux sont statistiquement plus éloignés de l’épicentre. Plus un point est éloigné de l’épicentre par rapport aux autres points et plus il intervient dans le calcul du terme source. Afin de limiter la surface de la cellule associée à chaque point dans les zones périphériques, une limite a été introduite. Chaque zone sphérique calculée par la méthode des KPPV est limitée afin de ne pas dépasser l’enveloppe convexe de l’ensemble des points (Figure 64). Figure 63 : Surfaces calculées par la méthode des KPPV (K=7). Figure 64 : Surfaces calculées par la méthode des KPPV (K=7), bornées à l’enveloppe convexe. 199 Chapitre V Estimation du terme source d’un phénomène dangereux V.2.5.6 Evaluations et perspectives Plusieurs simulations numériques ont été réalisées pour tester l’apport d’une pondération des relevés de surpression. La pondération est calculée par un calcul de densité par la méthode des K plus proches voisins ajustée par l’enveloppe convexe pour la prise en compte des points périphériques. Lors de ces simulations, plusieurs valeurs de k, le nombre de voisins recherchés, ont été testées. Les résultats obtenus montrent l’inefficacité de cette pondération à évaluer plus précisément la masse d’équivalent TNT du terme source. Aucune amélioration n’est constatée. V.2.5.6.1 Discussion La pondération mise en place permet de lisser les contributions de chaque point dans le calcul du terme source. Ainsi, les points introduisant une erreur importante, isolés ou situés en périphérie, faussent moins les calculs. Cependant, il en est de même lorsque ces points sont justes, ils contribuent moins au calcul. La bonne pondération serait celle qui donne plus de poids aux évaluations de surpression qui sont justes, ce que l’on ne peut connaître a priori. V.2.5.6.2 Perspectives Bien que la justesse des évaluations de surpression ne puisse être connue a priori, les écarts de surpressions entre points voisins peuvent être détectés. Sous l’hypothèse que pour un groupe de points voisins, la majorité des évaluations seront justes, il est possible de donner une pondération plus faible aux points en désaccord. La comparaison des points est possible par la masse d’équivalent TNT correspondante. La distance à l’épicentre est connue (position réelle de épicentre ou supposée lors de la phase de génération ou mutation de l’algorithme génétique). La masse de TNT se calcule alors à l’aide du modèle de l’équivalent TNT avec la distance et la valeur de surpression. La taille du voisinage et le choix de la fonction de pondération reste à définir à l’aide de simulation numérique. Pour ces simulations, le bruit introduit doit être gaussien pour justifier l’hypothèse précédente. 200 Chapitre V V.3 Conclusions Estimation du terme source d’un phénomène dangereux sur les méthodes inverses et perspectives Les méthodes permettant de résoudre des problèmes inverses sont nombreuses. Dans le cas des situations d'urgence, l’hétérogénéité des problèmes pouvant être rencontrés, en particulier un nombre variable de paramètres et les différents types de modèles a conduit à choisir les algorithmes génétiques pour évaluer le terme source. Nous avons donc proposé une méthodologie basée sur un algorithme génétique couplé à un modèle prédictif classique permettant de calculer rapidement et précisément un terme source à partir d’estimations du flux. Sa validation a été réalisée dans le cas des explosions de solides et peut être adaptée à tous types d’explosions en changeant le modèle de calcul de flux. Cette méthode peut être utilisée lors des expertises, en particulier pour les situations complexes pour lesquelles plusieurs variables sont à identifier. Pour une utilisation en situation d'urgence, l’étude à partir du retour d’expérience de l’accident d’AZF montre que la méthode est également efficace pour le calcul de la masse d’équivalent TNT avec un nombre réduit d’évaluations de la surpression dont la précision peut être obtenue sur le terrain. Il est néanmoins nécessaire d’appliquer la méthode à d’autres retours d’expérience pour confirmer sa précision en situation d’urgence. Un nombre de données réduit se traduit par une plus grande imprécision et rend difficile l’évaluation de termes sources comprenant plusieurs paramètres (masse de TNT et localisation de l’épicentre par exemple). Les phénomènes de dispersions atmosphériques en particulier, ont un terme source qui comporte plusieurs paramètres pouvant être inconnus. Une étude particulière doit être réalisée dans le cas des dispersions atmosphériques de gaz toxiques car cette complexité plus grande amène des difficultés supplémentaires : - la non-unicité possible des solutions due à un problème sous-déterminé, - un nombre d’itérations (taille de population, nombre de générations) plus important, qui nécessite un temps de calcul plus long. En cas de non-unicité des solutions, les algorithmes génétiques peuvent être adaptés afin d’exhiber non plus la meilleure solution, mais un ensemble de solutions potentielles. Cette adaptation est nécessaire lorsque l’on veut estimer l’ensemble des minima locaux ou lorsque dans le cas des problèmes sousdéterminés, il existe plusieurs minima équivalents, dépendant de plusieurs paramètres. Le partage (ou « sharing ») consiste à répartir les individus en modifiant la fonction « coût » par la prise en compte du voisinage de chaque individu. Plus un 201 Chapitre V Estimation du terme source d’un phénomène dangereux individu sera entouré et plus sa probabilité de reproduction sera faible. La difficulté réside dans l’ajustement de la fonction « coût » par la notion de voisinage faisant intervenir un calcul de densité non paramétrique abordé précédemment (V.2.5). Une variante consiste à distinguer des bouquets d’individus avant de réaliser la sélection. Le principe de l’algorithme est détaillé dans [Bontemps, 2000]. Afin de réduire le temps de calcul, le nombre d’itérations peut être diminué en couplant les algorithmes génétiques à une méthode de descente de gradient comme le recuit simulé. L’étude de la convergence de ces deux méthodes montre une convergence plus rapide des algorithmes génétiques dans les premières itérations (meilleure exploration de l’espace des solutions). Mais au voisinage de la solution, les algorithmes génétiques convergent lentement, souvent par le mécanisme de mutation, alors que la méthode du recuit simulé atteint rapidement le minimum. Les deux méthodes peuvent être couplées, en commençant la recherche par un algorithme génétique avec moins d’itérations (au prix d’une perte de précision) et en poursuivant par recuit simulé à partir des meilleures solutions. Une autre solution est d’alterner les deux méthodes à chaque itération [Bontemps, 2000]. 202 Conclusions et perspectives Conclusions et perspectives Les travaux de recherche menés dans le cadre de cette thèse avaient pour objectif d’apporter une aide à la décision aux sapeurs-pompiers et aux experts des cellules d’appui lors des situations d'urgence impliquant des substances chimiques. Compte tenu des impératifs de temps très forts pour réagir lors de ces situations, l’aide à la décision à apporter est destinée aux premiers instants, lors de la phase réfléchie d’une situation d'urgence et en utilisant au mieux l’information disponible au travers des données opérationnelles. L’étude des moyens existants et des demandes formulées à la CASU de l’INERIS a permis de mettre en exergue plusieurs besoins, dont deux ont été définis comme prioritaires et ont été abordés dans le cadre de cette thèse. Il s’agissait d’apporter une aide la décision au travers d’informations sur la source d’un phénomène dangereux potentiel ou avéré. En effet, lors du processus décisionnel, il est nécessaire de se représenter la situation actuelle et son devenir, d’évaluer les conséquences possibles pour déterminer au mieux les actions à entreprendre pour protéger les populations, les biens et l’environnement. L’évaluation des conséquences n’est réalisée qu’au prix de plusieurs étapes, qui débutent avec la connaissance de la source du phénomène dangereux. Nous avons défini la source en deux parties : une substance chimique potentiellement dangereuse car toxique, inflammable ou explosive ; et le terme source regroupant les paramètres relatifs à la source d’un phénomène dangereux, nécessaires à sa modélisation. Il est peu commun que les sapeurs-pompiers soient en présence d’une substance chimique non identifiée par une plaque signalétique (ex : plaque orange) ou un document de transport. Mais lorsque cela se présente à eux, les aides à la décision à leur disposition sont inadaptées et il est alors nécessaire de prendre le maximum de précautions en prenant en compte l’ensemble des risques possibles. L’identification d’une substance chimique sans matériel de détection dédié, en utilisant uniquement les données opérationnelles, est très difficile compte tenu du peu d’information disponible en comparaison du nombre impressionnant de substances chimiques existantes. Même en se limitant à un nombre restreint de substances chimiques les plus courantes, l’identification peut difficilement être 203 Conclusions et perspectives précise. Des logiciels ont vu le jour pour aider à l’identification précise d’une substance chimique. Mais ils reposent sur une démarche visant à un résultat précis, ce qui s’avère optimiste, comme nous l’avons démontré. En l’absence d’information suffisante, il est préférable d’identifier les dangers qui sont liés à la substance chimique en cause et de fournir ainsi, un premier niveau d’aide à la décision. Pour cela, nous avons proposé une méthodologie d’identification des dangers et une aide au recueil de l’information, reposant sur une base de données opérationnelles et un logiciel, tous deux développés dans cette optique. Tirant partie des bases de données existantes, la base de données opérationnelles conçue lors de cette thèse doit être enrichie avec toutes données apportant une information supplémentaire, même minime. Elle a été complétée avec les données relatives à l’utilisation de matériels de détection que sont les tubes colorimétrique du fabricant Dräger et d’autres sources d’information potentiellement intéressantes ont été citées. Le côté imparfait des données opérationnelles a été également souligné. Le logiciel AERO dédié à l’exploitation des données opérationnelles prend en compte leur imprécision et leur incertitude. Cependant, les distributions de probabilités utilisées pour traiter de l’imprécision ne sont pas achevées et mériteraient des études approfondies pour être affinées et mieux adaptées aux situations d'urgence. Bien que l’outil développé présente des possibilités supplémentaires par rapport aux logiciels existants (base de données plus fiable, aide au recueil de données, affichage des dangers, source d’information supplémentaire), les performances n’offrent qu’une aide relative en situation d'urgence. L’information fournie reste encore trop imprécise pour permettre une prise de décision sûre, tant que la base de données ne sera pas enrichie. Et il s’avère difficile de l’utiliser dans le cas de mélanges de plusieurs substances chimiques. En l’état actuel, la solution à privilégier est de faire appel à des moyens d’identification performants comme les spectromètres lorsque la localisation correspond au rayon d’action des CMIC qui en sont équipées. Pour augmenter leur rayon d’action, les sapeurs-pompiers allemands ont su se doter de moyens pour héliporter les matériels d’analyse. En France, une première étape serait peut-être de faire appel plus souvent aux moyens existants. Ensuite, une seconde solution à privilégier, serait de faciliter l’identification de la substance à la source, plutôt que d’essayer de la retrouver ensuite. C’est déjà la raison d’être des marquages imposés par la réglementation tels que les codes dangers et les numéros d’identification. Mais nous avons vu que ces marquages peuvent être détruits lors d’un accident. D’autres solutions se développent pour transmettre ces informations primordiales lors d’un accident. 204 Conclusions et perspectives C’est notamment le cas du projet européen MITRA dont le principe est d’équiper les transports de matières dangereuses de balises transmettant la nature des produits transportés, mais également des données relatives au terme source des phénomènes dangereux potentiels qui est le deuxième point traité dans cette thèse. Le terme source est indispensable à la modélisation des phénomènes dangereux pouvant survenir lors d’une situation d'urgence. Mais il est rarement connu avec précision, d’où l’intérêt de l’estimer à l’aide des données disponibles : des mesures de flux ou, au pire, des estimations du flux au travers des conséquences sur les personnes, les matériels et l’environnement. L’évaluation du terme source dans ces conditions consiste à résoudre un problème inverse. Dans le cas des situations d'urgence, l’hétérogénéité des problèmes pouvant être rencontrés, en particulier un nombre variable de paramètres et les différents types de modèle, a conduit à choisir les algorithmes génétiques. Une méthodologie basée sur un algorithme génétique couplé à un modèle prédictif classique a été développée. Sa validation a été réalisée dans le cas des explosions de solides et elle permet de calculer rapidement et précisément un terme source à partir d’estimations du flux. Cette méthode peut être utilisée lors des expertises, en particulier pour les situations complexes pour lesquelles plusieurs variables sont à identifier. Pour une utilisation en situation d'urgence, l’étude à partir du retour d’expérience de l’accident d’AZF montre que la méthode est également efficace mais en limitant la complexité du problème par un nombre réduit de paramètres du terme source. Il est néanmoins nécessaire d’appliquer la méthode à d’autres retours d’expérience pour confirmer sa précision en situation d’urgence. Un nombre de données réduit se traduit par une plus grande imprécision et rend difficile l’évaluation de termes sources comprenant plusieurs paramètres. Il est donc indispensable de l’adapter et de la tester dans le cas des phénomènes de dispersions atmosphériques dont le terme source comporte un plus grand nombre de paramètres pouvant être inconnus. Mais pour l’instant, le problème majeur à l’évaluation du terme source d’un phénomène de type dispersion atmosphérique est l’obtention de mesures de flux précises et en nombre suffisant. L’évaluation des conséquences comme dans le cas des explosions ne serait pas suffisamment précise et disponible rapidement pour être utilisée. Il faut se tourner vers la mise en place de réseaux de capteurs qui posent des problèmes en termes de disponibilité et de délai d’installation, ou l’utilisation de drones de mesures. Des solutions existent déjà dans le cas des dispersions aquatiques, notamment au sein du CEDRE. 205 Conclusions et perspectives Le déploiement d’un réseau de capteurs ou l’utilisation d’un drone soulèvent de nombreuses questions quant à la stratégie de mesure à employer. Combien de mesures sont nécessaires (intervalle de temps entre deux mesures, durée de l’acquisition et nombre de capteurs) ? Où faut-il faire les mesures ? Et quelle doit-être la sensibilité des capteurs ? Les travaux menés lors de cette thèse ont permis d’étudier des solutions potentielles à l’apport d’aides à la décision en situation d'urgence. Les études réalisées ont conduit au développement d’outils utilisant les données opérationnelles pour apporter une aide à la décision au travers d’informations supplémentaires. Et même si des pistes ont été proposées pour améliorer ces outils, ils n’ont pas vocation à remplacer le décideur final ou les experts appelés lors des situations d'urgence. Aujourd’hui, l’élaboration d’une stratégie d’intervention reste trop complexe au vu de l’information disponible pour être réalisée par une intelligence artificielle et la décision finale relève de la responsabilité du commandant des opérations de secours. 206 TABLE DES FIGURES Figure 1 : Différentes phases d’un événement de sécurité civile ..........................................13 Figure 2 : Paramètres importants pour la modélisation des phénomènes dangereux ...........26 Figure 3 : Taxonomie de l’incertitude [Smithson, 1989] ........................................................33 Figure 4 : Fiche réflexe – Distance de sécurité [SDIS 54, 1999] ...........................................42 Figure 5 : Trace au sol du panache – Logiciel SAFER Real Time ........................................44 Figure 6 : De la données à la décision..................................................................................46 Figure 7 : Arbre de segmentation avec hiérarchisation des critères......................................59 Figure 8 : Arbre de segmentation avec hiérarchisation des concepts ...................................59 Figure 9 : Arbre de segmentation (méthodes CHAID) ..........................................................65 Figure 10 : Arbre de segmentation optimal ...........................................................................65 Figure 11 : Accident sur l’autoroute A9 (Midi-Libre - 7 mars 2001) .......................................70 Figure 12 : Informations sur le chlore triées par catégorie (logiciel WISER)..........................79 Figure 13 : Identification de substances chimiques avec WISER..........................................81 Figure 14 : Seuils des produits inflammables en fonction de leur point éclair .......................93 Figure 15 : Nombre de substances en fonction du nombre de symptômes qu’elles provoquent ...........................................................................................................................98 Figure 16 : Nombre de substances correspondantes en fonction du nombre de critères physico-chimiques................................................................................................................99 Figure 17 : Distribution de probabilité par couleur (couleurs chaudes)................................101 Figure 18 : Distribution de probabilité par couleur (couleurs froides) ..................................102 Figure 19 : Distribution de probabilité par couleur (non couleurs) .......................................102 Figure 20 : Distribution de probabilité du critère pH ............................................................103 Figure 21 : Distribution de probabilités du critère odeur......................................................106 Figure 22 : Nombre de substances correspondantes à un nombre de critères physicochimiques imprécis.............................................................................................................108 Figure 23 : Premiers niveaux de l’arbre de décision du danger « inflammable » des liquides (méthode CART) ................................................................................................................118 Figure 24 : Arbres binaires de profondeurs différentes .......................................................120 Figure 25 : Critères discriminants pour les liquides inflammables.......................................121 Figure 26 : Critères discriminants pour les liquides explosifs et toxiques............................122 Figure 27 : Critères discriminants pour les liquides toxiques ..............................................122 Figure 28 : Critères discriminants pour les gaz toxiques.....................................................123 Figure 29 : Neurone formel.................................................................................................126 Figure 30 : Architecture du PMC ........................................................................................127 Figure 31 : Arbre binaire et PMC équivalent .......................................................................127 207 Figure 32 : Premiers niveaux de l’arbre de décision sur l’ensemble des substances liquides ...........................................................................................................................................131 Figure 33 : partie de l’arbre de décision des produits chimiques liquide : risque inflammable ...........................................................................................................................................134 Figure 34 : Interface du logiciel AERO................................................................................139 Figure 35 : Méthodologie opérationnelle d’identification des substances chimiques ...........140 Figure 36 : Saisie des critères (logiciel AERO) ...................................................................141 Figure 37 : IHM de saisie des réactions des tubes colorimétriques (logiciel AERO) ...........142 Figure 38 : Fiche du toluène du NIOSH affichée dans AERO .............................................149 Figure 39 : Affichage des dangers (logiciel AERO).............................................................150 Figure 40 : Arbre de segmentation des substances liquides : danger "inflammable" (logiciel AERO)................................................................................................................................152 Figure 41 : Arbre de segmentation des substances liquides avec suppressions des symptômes et du goût : danger "inflammable" (logiciel AERO)...........................................155 Figure 42 : Arbre de segmentation des substances liquides avec suppressions des symptômes et du goût et prise en compte des incompatibilités : danger "inflammable" (logiciel AERO)...................................................................................................................155 Figure 43 : Arbre de segmentation avec incompatibilités : danger "corrosif" (logiciel AERO) ...........................................................................................................................................156 Figure 44 : Arbre de segmentation sans incompatibilité : danger "corrosif" (logiciel AERO)156 Figure 45 : Méthode directe et méthode inverse.................................................................163 Figure 46 : Méthode inverse par algorithme génétique.......................................................174 Figure 47 : fonctionnement des algorithmes génétiques.....................................................177 Figure 48 : Usine AZF suite à l’explosion du 21 septembre 2001 .......................................178 Figure 49 : Bris de vitres (cité universitaire « Daniel Faucher » à Toulouse)......................179 Figure 50 : Courbe TNT - Abaque TM5-1300 extrapolé tiré de (Lannoy, 1984) ..................181 Figure 51 : Evaluation sur données artificielles (sans biais)................................................186 Figure 52 : Evaluation sur données artificielles (biais=25%) ...............................................186 Figure 53 : Ecarts des distances à l’épicentre calculées avec une erreur de 28,2% de la masse d’explosif.................................................................................................................187 Figure 54 : Evaluation sur données artificielles (épicentre inconnu)....................................188 Figure 55 : Localisation des dommages à la suite de l’explosion d’AZF .............................190 Figure 56 : Diagrammes de Voronoï de surpressions relevées à Toulouse (AZF 2001) ....191 Figure 57 : Diagramme de Voronoï d’un exemple fictif .......................................................192 Figure 58 : Configuration avec une distance x variable.......................................................195 Figure 59 : Configuration en croix.......................................................................................196 Figure 60 : Erreur de calcul de la masse de TNT en fonction de la distance relevés / épicentre ............................................................................................................................196 Figure 61 : Configuration avec une distance x variable.......................................................197 208 Figure 62 : Erreur de calcul masse de TNT et position de l’épicentre en fonction de la distance relevés / épicentre................................................................................................197 Figure 63 : Surfaces calculées par la méthode des KPPV (K=7). .......................................199 Figure 64 : Surfaces calculées par la méthode des KPPV (K=7), bornées à l’enveloppe convexe..............................................................................................................................199 Figure 65 : Classification NFPA..........................................................................................211 Figure 66 : Classification des modèles ...............................................................................216 209 LISTE DES TABLEAUX Tableau 1 : Répartition des types d’accidents chimiques (22 933 accidents) Base ARIA du BARPI. .................................................................................................................................19 Tableau 2 : Scénarios possibles en fonction de l’état d’une substance.................................24 Tableau 3 : Bases de données utilisées par la CASU de l’INERIS [Tremeaud, 2005]...........36 Tableau 4 : Exemple fictif illustrant la construction d’arbre non optimal ................................64 Tableau 5 : Matériels de détection autonomes .....................................................................75 Tableau 6 : Informations affichées pour chaque profil ..........................................................79 Tableau 7 : Bases de données de produits chimiques répondant en partie aux critères de sélection...............................................................................................................................87 Tableau 8 : Proportion de substances par classe de danger ................................................91 Tableau 9 : Proportion de substances par classe de danger ................................................91 Tableau 10 : Classification NFPA 704 des substances inflammables ...................................92 Tableau 11 : Classification des substances inflammables : Directives 67/548/CEE et 1999/45/CE (article R.231-53 du code du travail). ................................................................92 Tableau 12 : Comparaison des arbres construits par les méthodes CHAID et CART (liquides) ...........................................................................................................................................119 Tableau 13 : Résultats de la méthode d’identification sur dix substances chimiques..........132 Tableau 14 : Effectif des feuilles pures d’arbres élagués (cas des liquides)........................135 Tableau 15 : Erreur d’identification par danger (cas des liquides).......................................135 Tableau 16 : Exemple de calcul de la masse d’équivalent TNT à partir de dommages convertis en surpression.....................................................................................................182 Tableau 17 : Résultats sur des accidents réels ..................................................................188 Tableau 18 : Masse de TNT calculée pour plusieurs ensembles de données (REX d’AZF) ...........................................................................................................................................198 Tableau 19 : Niveaux de danger de la classification NFPA.................................................211 Tableau 20 : Comparaison des types de modèles de dispersion atmosphérique................220 210 Annexe I Classification des substances chimiques ANNEXE I CLASSIFICATION DES SUBSTANCES CHIMIQUES Classification NFPA La classification NFPA comprend quatre natures de danger (inflammable, toxique, explosif, divers) et cinq niveaux de gravité numérotés de 0 à 4. Specific Hazard (White) OXY - Oxidizer ACID - Acid ALK - Alkali COR - Corrosive W (W/Slash - Use No Water Radiation Symbol - Radiation Hazard Figure 65 : Classification NFPA Tableau 19 : Niveaux de danger de la classification NFPA Health Hazard (Blue) Fire Hazard/Flash Point (Red) 0 - Normal Material 0 - Will Not Burn 0 - Stable 1 - Slightly Hazardous 1 - Above 200 Degrees F 1 - Unstable If Heated 2 - Hazardous 2 - Below 200 Degrees F 2 - Violent Chemical Change 3 - Extreme Danger 3 - Below 100 Degrees F 3 - Shock Detonate 4 - Deadly 4 - Below 73 Degrees F 4 - May Detonate 211 Reactivity(Yellow) & Heat May Annexe I Classification des substances chimiques Directive SEVESO II La classification vise à identifier toutes les propriétés physico-chimiques, toxicologiques et écotoxicologiques des substances ou préparations, pouvant constituer un risque lors de la manipulation ou de l'utilisation normales de ces substances ou préparations. Après identification de chaque propriété dangereuse, la substance ou la préparation doit être étiquetée de manière à indiquer le ou les dangers, afin de protéger l'utilisateur, le public et l'environnement. Les différentes catégories de dangers sont les suivantes : - Explosif ........................................ E - Comburant.................................... O - Extrêmement inflammable .............. F+ - Facilement inflammable .................. F - Inflammable.................................. R 10 - Très toxique.................................. T+ - Toxique ........................................ T - Nocif ............................................ Xn - Corrosif ........................................ C - Irritant ......................................... Xi - Sensibilisant.................................. R 42 et/ou R 43 - Cancérogène ................................. Carc. Cat (1) - Mutagène ..................................... Mut. Cat. (1) - Toxique pour la reproduction........... Repr. Cat. (1) - Dangereux pour l'environnement ..... N et/ou R.52, R.53, R.59. 212 Annexe II Classification des substances chimiques ANNEXE II CRITERES DE LA BASE DE DONNEES Il existe quatre familles de critères discriminants : - Les propriétés chimiques et thermodynamiques observables ou mesurables : état, couleur, opacité, odeur, goût, pH, densité liquide gazeuse. - Les symptômes cliniques sur l'homme : 89 signes différents rassemblés en 10 sous-groupes physio-pathologiques : − Température (4 signes) : hypothermie, hyperthermie, état fébrile et frissons. − Neurologie (12 signes) : agitation, confusion mentale, troubles de la sensibilité, somnolence, asthénie, vertiges, céphalées, troubles de la parole, engourdissement/fourmillement, perte de la coordination , spasmes/convulsions et paralysie. − Oreilles (2 signes) : perte de l’audition et acouphène. − Ophtalmologie (8 signes) : irritations oculaires/rougeurs, tuméfaction, photophobie, myosis, mydriase, larmoiement, troubles de la vision et cécité. − Nez (4 signes) : épistaxis, rhinorrhée, irritations nasales et éternuement. − Bouche/gorge (5 signes) : toux, irritations de la bouche, hypersialorrhée, sécheresse buccale et irritations de la gorge. − Système cardiovasculaire (7 signes) : douleur thoracique, arythmie, bradycardie, tachycardie, hypertension, hypotension et hypoxie/cyanose. − Système respiratoire (14 signes) : respiration irrégulière, bradypnée, polypnée, difficulté respiratoire (dyspnée), sifflements, arrêt respiratoire, irritations/brûlures, œdème pulmonaire, inconfort thoracique, congestion, toux, hémoptysie, éternuement et hypoxie/cyanose. − Système gastro-urinaire (9 signes) : douleur abdominale, distension abdominale, nausées, vomissements, hématémèse, diarrhées, incontinence urinaire, douleur/brûlure urinaire et hématurie. − Peau (14 signes) : exfoliation, prurit, sécheresse cutanée, brûlure, sudation, tuméfaction, vésications, érythème, rougeur, pâleur, ictère, cyanose, paresthésies cutanées et gelure. - Les classes de danger : inflammable, toxique, explosif, comburant, corrosif, nocif, réagissant à l’eau, toxique de guerre. - La réponse positive ou négative aux tubes de la société Dräger, soit 191 tubes qualitatifs. 213 Annexe IV Classification des phénomènes ANNEXE III CLASSIFICATION DES PHENOMENES Différents phénomènes peuvent se produire en fonction des propriétés physico-chimiques des produits, de leur conditionnement et de l’environnement : Explosions : o BLEVE (boiling liquid expanding vapour explosion) o UVCE (Unconfined Vapor Cloud Explosion) o Poussières ou vapeurs en milieu confiné o Détonation en phase condensée Incendies : o Physique o Chimiques • Feux de nappes (pool fire) - les feux de réservoir - les feux de bac - les feux de flaque • Feu de réservoir (Tank fire) • Feu torche (Jet fire) • Flash fire • Boilover (Fireball) Dispersions : o Atmosphériques • Gaz passifs • Gaz lourds • Fumées o Aquatiques o Dans les sols 214 Annexe V Outils de modélisation ANNEXE IV OUTILS DE MODELISATION Les phénomènes d’explosion, de dispersion et d’incendie sont les sujets de nombreux travaux et de modèles. Il existe différents types de modèles et les classifications varient selon les auteurs : - les modèles physiques ou numériques, - les modèles déterministes, les modèles paramétrés et les modèles empiriques, - les modèles gaussiens, les modèles intégraux, les modèles de la mécanique des fluides et les modèles statistiques. Sans éliminer trop rapidement certains types de modèles, nous pouvons déjà identifier certains paramètres qui motiveront le choix des modèles utilisables. - Le temps de calcul doit être suffisamment court pour être utilisé en situation d’urgence (les modèles de mécanique des fluides nécessitent généralement plusieurs heures à plusieurs jours de calcul). - Les ressources informatiques doivent être raisonnables : logiciel fonctionnant sur un ordinateur personnel. - Les paramètres nécessaires devront être disponibles ou évaluables. (topographie 3D du site rarement disponible) Et pour le choix des modèles il est indispensable de tenir compte du domaine de validité des différents paramètres : - Type de produit (gaz passif, gaz lourd, …) - Type de source (ponctuelle, linéaire, …) - Echelles des phénomènes atmosphériques (Micro, Meso, Macro) - Relief - Etc. Il existe de nombreuses modélisations des phénomènes pouvant se produire lors des situations d’urgence étudiées. Nous allons tout d’abord les distinguer en fonction des phénomènes simulés : explosions, dispersions et incendies. Pour chacun nous essaierons de recenser les grandes familles de modèles, puis de lister les principaux paramètres et de quantifier la sensibilité des modèles à ces paramètres. 215 Annexe V Outils de modélisation Classification des modèles Les modèles peuvent être classés en fonction de différents critères. On peut les différencier selon s’il s’agit de modèles physiques ou numériques, selon la prise en compte plus ou moins détaillée des mécanismes physiques et des méthodes mathématiques pour les simuler. La classification proposée ci-après regroupe les classifications présentées dans [Couillet, 2002], [Perkins et al., 2002] et [Chorley et al., 1967]. Figure 66 : Classification des modèles Les modèles physiques Ils sont réalisés à l’aide de modèles réduits construits avec des matériaux judicieusement choisis. Chorley (1967) propose une classification en trois groupes pour l'étude de phénomènes géomorphologiques et qui peut s’appliquer aux phénomènes de dispersions : les modèles à l’échelle, les modèles analogiques et les modèles hors échelles. Les modèles à l’échelle sont les modèles réduits construits de telle sorte que les rapports relatifs entre les quantités physiquement importantes soient les 216 Annexe V Outils de modélisation mêmes que dans la situation réelle. Ces grandeurs ou rapports relatifs sont généralement exprimés par des nombres sans dimension. Les modèles analogiques reproduisent les caractéristiques majeures des phénomènes physiques, mais à un niveau détaillé les mécanismes peuvent ne pas être identiques. Cependant avec un choix judicieux des matériaux, produits, conditions initiales, etc., les mêmes systèmes peuvent s’approcher des modèles à l’échelle. Les modèles hors échelles ne prennent pas en considération les propriétés ou les relations d’échelles et peuvent donner des résultats éloignés des valeurs à échelle réelle. Les modèles physiques nécessitent une phase de conception très longue ainsi qu’un grand nombre de données descriptives de la situation difficiles à obtenir et, par conséquent, ne présentent pas d’intérêt pour une utilisation en situations d’urgence. Les modèles numériques Il s’agit des modèles à bases d’équations résolues par ordinateur. Ces modèles intègrent un ensemble plus ou moins exhaustif de phénomènes physiques. Ils peuvent être exhaustifs lorsqu’il s’agit de la modélisation de systèmes simples dont le fonctionnement peut être décrit de manière complète et prédictive par un ensemble restreint de lois physiques. En revanche, lorsqu’il s’agit de modéliser des phénomènes plus complexes, les modèles physiques exhaustifs de la mécanique des fluides sont dans ce cas remplacés par des lois physiques paramétrées décrivant statistiquement un comportement global. Les approximations dues à l’emploi de paramètres réduisent considérablement la complexité et les temps de calcul. Et il existe également des modèles dits « empiriques » qui ne contiennent pratiquement plus de lois physiques. Les paramètres et les lois utilisés sont issus de mesures expérimentales. Ces modèles sont utilisés lorsque les mécanismes physiques sous-jacents ne sont pas compris et leur calage issu de l’expérimentation limite la généralisation. Les modèles de type gaussien ou intégral reposent sur des équations paramétrées et simplifiées. Les temps de calcul sont courts, de l’ordre de la minute et ne nécessite pas d’importantes ressources informatiques. Les modèles de la mécanique des fluides résolvent directement le système d’équations décrivant les mécanismes physiques de la dispersion. Les temps de calcul sont plus longs, de l’ordre de l’heure, voire de la journée. Ce type d’outil 217 Annexe V Outils de modélisation fonctionne généralement sur station de calcul. Ces modèles demandent aussi des données d’entrée plus nombreuses, difficiles à obtenir en situation d’urgence. Modèles gaussiens Les modèles de dispersion de type Gaussien sont les plus simples et ils sont fréquemment utilisés pour simuler rapidement la dispersion des gaz neutres ou passifs (de masse volumique très proche de celle de l’air et sans vitesse initiale). Ils reposent sur l’hypothèse que la répartition du polluant suit une loi gaussienne dont les écarts-types dépendent de la distance à la source (Pasquill, Turner, etc...) ou du temps écoulé depuis l’émission (appelé aussi temps de transfert) (Doury), ainsi que des caractéristiques de la structure de l’atmosphère. Les modèles de type gaussien s’appliquent à des dispersions passives, c'est-àdire à un produit qui n’est soumis qu’à l’action du fluide porteur (air). La densité, la température ou la concentration de ce produit ne provoquent pas de modification significative des caractéristiques de l’air et ne perturbent pas son écoulement. Ceci suppose aussi que le rejet est passif, c'est-à-dire que la vitesse du vent reste sensiblement la même avec ou sans polluant au voisinage du point d’émission (brèche). Ces modèles ne doivent être utilisés que dans certaines conditions : - Des conditions météorologiques moyennes, - En champ proche mais au-delà de 100m de la source En phase passive ou en sortie de cheminée où l’énergie cinétique est faible jusqu’à une distance de 1 à 1,5 km. - Pour des nuages ne s’éloignant pas trop du sol (cisaillements verticaux) - Sans obstacles ni relief accidenté Il s’applique à un rejet sur un terrain plat sans obstacle. Les avis sont partagés sur la taille des obstacles (surface d’obstacle équivalente à la section du nuage ou au dixième selon les experts) Souvent un paramètre de rugosité est introduit pour tenir compte partiellement du relief et de l’occupation des sols. - Vitesse de vents non nulle. Ces modèles ne sont pas adaptés à des vitesses de vents inférieures à 2 m.s-1 - Conditions météorologiques globales et constantes Sauf pour les modèles à bouffées gaussiennes. - Rejets continus en temps et en espace 218 Annexe V Outils de modélisation Des modèles permettent de prendre en compte des conditions de rejet ou des conditions météorologiques variables dans le temps et de calculer des panaches curvilignes à l’exception des modèles à bouffées gaussiennes. Le lecteur intéressé par les mécanismes de la dispersion atmosphérique et les modèles gaussiens pourra se reporter à [Couillet, 2002] Les modèles gaussiens, traitant de rejets continus sont généralement utilisables sur des ordinateurs type PC. Les temps de calculs sont en général inférieurs à la minute. Modèles analytiques gaussiens, Des modèles gaussiens « de nouvelle génération » sont capables de s’adapter au relief (et surement champs de vents irréguliers). Des recherches bibliographiques sont a effectuer. Modèles intégraux Ils permettent de simuler les gaz dont la masse volumique est sensiblement plus importante que celle de l’air. Van Ulden créa en 1974 le premier modèle de type intégral appliqué à la dispersion des gaz lourds. Ces modèles sont utilisés pour les études à cause de leur coût raisonnable de mise en œuvre tant du point de vue matériel que de celui du temps machine nécessaire. Utilisant le modèle gaussien après la transition, leur précision est de l’ordre de ce modèle. Ils présentent cependant des limitations dues à leur formulation comme la mauvaise représentation de conditions météorologiques extrêmes, l’absence de prise en compte du relief, des obstacles... Modèles 3D (dynamique des fluides) Ces modèles tridimensionnels prennent en compte l’ensemble ou une partie des phénomènes intervenant dans la dispersion en introduisant des équations décrivant ces phénomènes. Ainsi, les logiciels correspondants nécessitent un personnel qualifié et des moyens et des temps de calcul importants. o Modèles eulériens Un maillage 3D du volume de calcul est nécessaire pour discrétiser les variables. Le temps de calcul souvent très long (plusieurs heures) dépend de la résolution du maillage et du pas de temps choisi. Ces 219 Annexe V Outils de modélisation modèles permettent de tenir compte du relief (à condition de disposer de l’information, ce qui est rarement le cas en situation d’urgence). Le temps de calcul est indépendant du nombre de sources o Modèles lagrangiens • à particules • à bouffées gaussiennes Comparaison des différents types de modèles (récapitulatif) Tableau 20 : Comparaison des types de modèles de dispersion atmosphérique Modèles Gaussiens A bouffées Lagrangien Eulérien < 1 heure > 1 heure gaussiennes Temps de calcul < 1 min. Quelques minutes Distance min. 100 m - - Distance max. 1 à 1.5 km - - Vitesse de vent 2 - ? m/s - - Conditions Oui Non Non Non Rejets continus Oui Non Non Non Relief Approximation Approximation Champ de vent Champ de vent Obstacles Approximation Approximation Champ de vent Champ de vent (rugorisé) (rugorisé) Approximation Approximation Loi de paroi Loi de paroi (dépôt sec) (dépôt sec) Approximation Approximation (dépôt humide) (dépôt humide) Oui Oui météo globales Dépôt de produit Réactions chimiques Non Approximation pour la chimie simple 220 GLOSSAIRE ASN Autorité de Sûreté Nucléaire ASPC Agence de Santé Publique du Canada DDSC Direction de la Défense et de la Sécurité Civiles CANUTEC Centre canadien d'urgence transport CCOHS Canadian Centre for Occupational Health and Safety CDC Center for Diseases Control and prevention CEDRE CEntre de Documentation, de Recherche et d’Expérimentations sur les pollutions accidentelles des eaux CERCHAR Centre d'Etudes et Recherches des Charbonnages de France CMIC Cellule Mobile d’Intervention Chimique COS Commandant des Opérations de Secours COV Composé Organique Volatile DOT Departement Of Transportation DRIRE Directions Régionales de l'Industrie de la Recherche et de l'Environnement HAZMAT HAZardous MATerials (matières dangereuses) IDLH Immediately Dangerous to Life or Health IGN Institut Géographique National IHM Interface Homme-Machine INERIS Institut National de l’Environnement Industriel et des Risques INRS Institut National de Recherche et de Sécurité IRSN Institut de Radioprotection et de Sûreté Nucléaire MNT Modèle Numérique de Terrain NFPA National Fire Protection Association NIOSH National Institute for Occupational Safety and Health NLM National Library of Medicine OMS Organisation Mondiale de la Santé REX Retour d’Expérience SIG Système d’Information Géographique TMD Transport de Matières Dangereuses VME Valeurs Moyennes d’Exposition VLE Valeurs Limites d’Exposition SEI Seuil des Effets Irréversibles SEL Seuil des Effets Létaux WISER Wireless Information System for Emergency Responders 221 222 REFERENCES BIBLIOGRAPHIQUES Autorité de Sûreté Nucléaire - ASN (2006). "Protéger la population en situation d'urgence." Contrôle (Dossier 171): 83. Baradat, P. and Labbé, T. (2006). Optimisation du rééchantillonnage dans un logiciel d'Amélioration des Plantes. Conference Cari 06, 6-9 novembre 2006, Cotonou, Bénin. Bureau d’Analyse des Risques et Pollutions Industrielles - BARPI (2007). "Inventaire 2007 des accidents technologiques." MEEDDAT - BARPI: 16. Bureau d’Analyse des Risques et Pollutions Industrielles - BARPI (2008). "A.R.I.A. (Analyse, Recherche et Information sur les Accidents)." from http://aria.ecologie.gouv.fr/. Pagnon, S., Bronner, C., Fontaine, F., Baulig, A., Tymen, H., Bouteilloux, P., Breton, P. and Louvet, P. (2007). "Examen de l'utilisation du logiciel WISER en situation d'urgence - RAPPORT D’ÉTUDE: DRA-07-8608808114A." INERIS - CEB. Beasley, D., Bull, D. R. and Martin, R. R. (1993). "An Overview of Genetic Algorithms: Part 1, Fundamentals." University Computing, 15 (4): 170181. Becker, T. J. (2006). "Chemical Companion Helps First Responders." from http://www.gatech.edu/newsroom/release.html?id=928. Belson, W. A. (1959). "Matching and prediction on the principle of biological classification." Applied Statistics, 8: 65-75. Ben Mena, S. (2000). "Introduction aux méthodes multicritères d’aide à la décision." Biotechnol. Agron. Soc. Environ. 2000, 4 (2): 83–93. Bernuchon, E. and Salvi, O. (2002). "Analyse des risques et prévention des accidents majeurs (DRA-07) - Définition des Scénarios Maximum Physiquement Possible." INERIS. Bhavnani, S. K., Abraham, A., Demeniuk, C., Gebrekristos, M., Gong, A., Nainwal, S., Vallabha, G. K. and Richardson, R. J. (2007). Network Analysis of Toxic Chemicals and Symptoms: Implications for Designing First-Responder Systems. AMIA symp. 2007, Chicago (Michigan). Bissonnette, M. (2007, 24/01/2007). "Tout ce que vous avez toujours voulu savoir sur les détecteurs de gaz multiples." Retrieved 13/08/2007, from http://www.tc.gc.ca/canutec/fr/articles/documents/mgaz.htm. BIT (1993). "La maîtrise des accidents majeurs: guide pratique." Boissonnat, J.-D. and Yvinec., M. (1995). Géométrie algorithmique, Ediscience international. Paris. Bontemps, C. (2000). "Principes Mathématiques et Utilisations des Algorithmes Génétiques." INRA: 54. Bouet, R. (1999). "Ammoniac - Essais de dispersion atmosphérique à grande échelle." INERIS: 112. Breiman, L., Friedman, J. H., Olhsen, R. A. and Stone, C. J. (1984). Classification and Regression Trees. Belmont CA., Wadsworth: 368. Bronner, C., Dandrieux, A., Spinelli, R., Chapelain, J., Fontaine, F., Lacoste, A., Caron, B. and Dusserre, G. (2008). "Identification de substances 223 chimiques pures par tubes colorimétriques en situation opérationnelle." Face au Risque (soumis). Caetano, H. and Benhadjoudja, A. (2005). "Les simulateurs "risques urbains" pour la formation et l'aide à la décision dans la gestion des catastrophes Algérie." Systèmes d'information géographique et gestion des risques, 1: 101. CANUTEC (2004, 2008-01-15). "Guide des Mesures d'Urgence 2004." Retrieved 2008-04-16, from http://www.tc.gc.ca/canutec/fr/guide/guide.htm. Carluer, F. and Richard, A. (2002). L’analyse stratégique de la décision. Grenoble, PUG. Canadian Centre for Occupational Health and Safety - CCOHS (2008, Last Update Date). "IPCS INCHEM." Access 2008, from http://www.inchem.org/pages/about.html. Cdt Vert (2001). "Le SICF, outil d’aide à la décision." OBJECTIF DOCTRINE, 28: pp 40. Celle, M. and Descourriere, S. (2006). "Elaboration d’une base de données sur les produits chimiques dangereux." INERIS: 98. Cerf, R. (1994). "Une théorie asymptotique des algorithmes génétiques." Montpellier, Thèse de doctorat., Université de Montpellier II.: 200. Chamayou, R. (1997a). "Réservoirs métalliques: stockage des liquides à température ambiante". Techniques de l'ingénieur. Génie mécanique, Techniques de l'ingénieur. BM 6591: 17 Chamayou, R. (1997b). "Réservoirs métalliques: stockage des liquides à température contrôlée". Techniques de l'ingénieur. Génie mécanique, Techniques de l'ingénieur. BM 6592: 17 Chazeau, A. (2007). "Réalisation d'une matrice stockage / gravite - Rapport de stage de Master 2." Ecole Nationale Supérieure des Mines d'Alès. Chorley, R. J. and Haggett, P. (1967). Models in geography. Methuen, London, Methuen: 816. Chusseau, S., Godillon-Maquinghen, A. P., Lepoutre, F. X. and Chopin, D. (2000). "Sadepo: Remémoration de cas pour l'aide a la decision en chirurgie correctrice de la scoliose." ITBM-RBM, 21 (2): 78. Clancy, V. J. (1972). Diagnostic Features of Explosion Damage. 6 th international Meeting on Forensic Sciences, Edinburgh. Cornuéjols, A. and Miclet, L. (2002). Apprentissage artificiel. Concepts et algorithmes., Eyrolles. Paris: 591. Couillet, J. C. (2002). "Méthodes pour l’évaluation et la prévention des risques accidentels (DRA-006) Ω-12 Dispersion atmosphérique (Mécanismes et outils de calcul)." INERIS. Courtier, P. and Rabier, F., Eds. (1997). The Use of Adjoint Equations in Numerical Weather Prediction. Numerical Methods in Atmospheric and Oceanic Modelling. Canada, Charles A. Lin, René Laprise, and Harold Ritchie. Dautun, C., Bronner, C., Bony-Dandrieux, A., Tixier, J., Chapelain, J., Fontaine, F. and Dusserre, G. (2007). "Situations de crise - Comment réagir." Préventique – Sécurité, 92: 42-45. Direction de la Défense de la Sécurité Civile - DDSC (2006). "Guide National de Référence." Direction de la Défense de la Sécurité Civile: 98. Dechy, N., Le Coze, J.-C., Leprette, E. and Lim, S. (2003a). "Intervention de L’INERIS après le sinistre survenu le 27 mars 2003 sur le site de BILLYBERCLAU de la Société NITROCHIMIE." INERIS. 224 Dechy, N. and Leprette, E. (2003b). "Analyse des dommages observés à Billy Berclau (62) après le sinistre du 27 mars 2003 survenu sur le site de la société NITROCHIMIE - Rapport Annexe 3." INERIS: 63. Dechy, N. and Mouilleau, Y. (2004). Damages of the Toulouse disaster, 21st september 2001. Loss prevention and safety promotion in the process industries: proceedings of the 11th International Symposium, 31 May - 3 June 2004, Praha, Czech Republic: PetroChemEng. Demolombe, R. (1997). Uncertainty in intelligent databases. in Uncertainty Management in Information Systems. A. Motro, C. T., Kluwer: pp. 1-37. Derringer, T., Kelly, T., Folsom, D., Krile, R. and Willenberg, Z. (2006). "ChemPro 100 - Hand-Held Chemical Detector." EPA. Dobbins, J. P. and Abkowitz, M. D. (2003). "Development of a centralized inland marine hazardous materials response database." Journal of Hazardous Materials, 102 (2-3): 201. Dolladille, O. (2001). "Données disponibles concernant les produits dangereux RAPPORT PARTIEL « D’OPERATION F » - Outils d’aide à la décision pour la gestion des crises (DRA-04)." INERIS: 51. Dolladille, O. (2002). "Sollicitations de l’INERIS en situations d’urgence RAPPORT D’OPERATION « G » - Outils d’aide à la décision pour la gestion des crises (DRA-04)." INERIS: 28. Dräger, Ed. (2002). Livre de poche Tubes réactifs/CMS Dräger. Lübeck, Dräger Safety. Dräger Safety (2005, 13/08/2007). "Tubes & CMS." from http://www.draeger.com/ST/internet/FR/fr/Industries/Industrial/Appli/ER/ Tubes/er_tubes.jsp. Dreyfus, G., Martinez, J. M., Samuelides, M., Gordon, M. B., Badran, F., Thiria, S. and L., H. (2002). Réseaux de neurones. Méthodologie et applications. Paris, Eyrolles. Duda, R. O. and Hart, P. E. (1973). Pattern Classification and Scene Analysis. New York, Wiley. Efron, B. (1979). "Bootstrap methods: another look at the jackknife." Annals of Statistics, 7: 1-26. Egidi, D., Foraboschi, F. P., Spadoni, G. and Amendola, A. (1995). "The ARIPAR project: analysis of the major accident risks connected with industrial and transportation activities in the Ravenna area." Reliability Engineering & System Safety, 49 (1): 75. El Najjar, M. E., Cherfaoui, V., Bonnifait, P. and Royere, C. (2003). "Elaboration de fonctions de croyance a partir de donnees GPS et SIG: Etude de strategies de fusion pour la localisation d'un vehicule." TSI. Technique et science informatiques, 22 (7-8): 935-964. EURACHEM/CITAC (2000). Guide EURACHEM/CITAC, Quantifier l'Incertitude dans les Mesures Analytiques, 2ème édition. UK, S L R Ellison: 116 pages. Fache, S. (2003). "Mise en œuvre d’un outil de calcul de dispersion atmosphérique basé sur les méthodes inverses." INERIS: 112. Faugeras, B. (2002). "Assimilation variationnelle de données dans un modèle couplé océan-biogéochimie." Grenoble, Thèse de doctorat, Université Joseph-Fourier. Fédération Nationale des Sapeurs-Pompiers Français - FNSPF (1992a). Chapitre 3: Détection de gaz, p213-237. in Guide d'intervention face au risque chimique. F.N.S.P.F. Paris: 374. Fédération Nationale des Sapeurs-Pompiers Français - FNSPF (1992b). Guide d'intervention face au risque chimique, Paris: FNSPF: 374. 225 Forestier, R. (2004). "Développement d'une méthode d'identification de paramètres par analyse inverse couplée avec un modèle éléments finis 3D." Paris, Thèse de doctorat, Ecole des Mines de Paris: 155. Friedman, J. H. (1977). "A recursive partitioning decision rule for nonparametric classification." IEEE Transactions on Computers, C-26: 404-408. Gallad, B. and Courtois, B. (2005). "Solvants organiques dans l'atmosphère de lieux de travail. Les détecteurs portables à lecture directe. ED 952." INRS: 12. Genoux, S. and Dechy, N. (2006). "Gestion du retour d'expérience de la Cellule d'Appui aux Situations d'Urgence (C.A.S.U.)." INERIS: 79. Gérard-Varet, L. A., Prévôt, M. and Thisse, J. F. (1976). Analyse mathématique pour l'économie. Paris, Dalloz. Giacobbo, F., Marseguerra, M. and Zio, E. (2002). "Solving the inverse problem of parameter estimation by genetic algorithms: the case of a groundwater contaminant transport model." Annals of Nuclear Energy, 29 (8): 15. Giampiero E.G. Beroggi, Tanja C. Abbas, John A. Stoop and Aebi, M. (1997). "Risk Assessment in the Netherlands." Akademie für Technikfolgenabschätzung in Baden Württemberg (91). Gouvernement de l'Ontario (1990). "Emergency Management and Civil Protection Act", Chapître E.9, section 1 Grabisch, M. and Perny, P. (2003). Agrégation multi-critère. in Logique floue, principes, aides à la décision. B. Bouchon-Meunier et C. Marsala (eds). Paris, Hermès Science Publications: 81-120. Grimmer Soft (2003). "Arbres de Segmentation in Aide StatBox Version 6.2". Paris, Grimmer Soft: 129-140 Georgia Tech Research Institute - GTRI (2008). "Chemical companion." Retrieved Avril 2008, from http://www.chemicalcompanion.org/. Hadamard, J. (1932). Le Problème de Cauchy et les Équations aux Dérivées Partielles Linéaires Hyperboliques. Paris, Hermann. Holland, J. H. (1975). Adaptation in natural and artificial system, Ann Arbor: The University of Michigan Press. Institut National de Recherche et de Sécurité - INRS (1994). "Les mélanges explosifs: gaz et vapeur; poussières et solides." INRS ED355. Institut National de Recherche et de Sécurité - INRS (2008, Last Update Date). "Fiches toxicologiques." Access 20/02/2008, from http://www.inrs.fr/. Ioannidis, C., Logothetis, C., Potsiou, C., Kiranoudis, C., Christolis, M. and Markatos, N. (1999). "Spatial Information Management for Risk Assessment of Major Industrial Accidents." IPCS et CCOHSIPCS (2001a). "International Chemical Safety Cards (ICSCs): CHLORURE DE BENZYLE." Retrieved 10/09/2007, from http://www.inchem.org/documents/icsc/icsc/eics0016.htm. IPCS et CCOHSIPCS (2001b). "International Chemical Safety Cards (ICSCs): NAPHTHALENE." Retrieved 25/09/2007, from http://www.inchem.org/documents/icsc/icsc/eics0667.htm. IRSN (2006a). "Fiche Toxicologique: Diisocyanate de toluylène." Retrieved 23/08/2007, from http://www.inrs.fr/htm/ft46.pdf. IRSN (2006b). "Fiche Toxicologique: Dioxyde de soufre." Retrieved 23/08/2007, from http://www.inrs.fr/htm/ft41.pdf. Keudel av-Technik GmbH (2007). "MEMPLEX - Gefahrstoff Software für Feuerwehr und Rettungsdienst." Retrieved 2008, from http://www.memplex.com/frames/frameset.htm. 226 König, M. (2006). "Die Unterstützung durch die Analytische Task Force." Dekontamination von Verletzten: p21-24. Lacôme, J. M. and Bronner, C. (2007). "Evaluation du logiciel SAFER Systems." INERIS: 99. Lacôme, J. M., Vincent, G., Baulig, A., Kordek, M. A., Fontaine, F. and Tissot, S. (2006). "Examen de l'utilisation du logiciel ALOHA-CAMEO en situation d'urgence." INERIS. Lagadec, P. (1981). Ch V. Samedi 10 novembre 1979: Toronto. in Le risque technologique majeur: politique, risque et processus de développement. Pergamon press-Futuribles. Paris: 629. Lagadec, P. (1997). "Urgences, crises, ruptures, des théâtres de vulnérabilité en mutation." Préventique Sécurité (36): 2. Lannoy, A. (1984). "Analyse des explosions air-hydrocarbure en milieu libre." Bulletin de la direction des études et recherches (4). Le Niliot, C. (2003). L’estimation de flux et de températures pariétaux à l’aide de techniques inverses. METTI. Lebart, L., Morineau, A. and Piron, J. (1995). Statistique exploratoire multidimensionnelle, 3éme édition. Paris, Dunod: 439. Lechaudel, J. F. and Mouilleau, Y. (1995). Assessment of an accidental vapour cloud explosion - A case study: Saint Herblain, October the 7th 1991, France. Proceedings of the 8 th International Loss Prevention Symposium, Antwerp, Belgium. Lees, F. P. (2004). Lees' loss prevention in the process industries - Hazard Identification, Assessment and Control. Third edition. Sam Mannan. 2. Leland, W. (1992). Tree Structured Data Analysis: AID, CHAID and CART. Sawtooth Software Conference, Sun Valley, ID. Leonelli, P., Bonvicini, S. and Spadoni, G. (1999). "New detailed numerical procedures for calculating risk measures in hazardous materials transportation." Journal of Loss Prevention in the Process Industries, 12 (6): 507. Macé de Lépinay, A., Peudpièce, J.-B., Fournet, H., Motte, J.-C., Py, J.-L., Domenech, J. and Lannelongue, F. (2002). "Commission d'enquête interne sur l'explosion survenue le 21 septembre 2001 à l'Usine Grande Paroisse de Toulouse. Point de situation des travaux en cours à la date du 18 mars 2002 – GRANDE PAROISSE." ATOFINA. Maimon, O. and Rokach, L. (2005). Data Mining and Knowledge Discovery Handbook, Springer US: 1383. Mallet, P. and Lions, P. (2005). "Un SIG pour la gestion globale des risques majeurs de l'estuaire de la Seine - France." Systèmes d'information géographique et gestion des risques, 1: 101. Maréchal-Blanckaert, K., Moughabghab, A. V., Vinchon, F., Ferrard, G., Offinier, C. and Scocolovsky, C. (1997). "Intoxication mortelle par le bromure de méthyle. À propos d'un cas." Urgences Médicales, 16 (6): 255-256. Martel, J.-M. (1999). L'aide multicritère à la décision: méthodes et applications. CORS - SCRO 1999 ANNUAL CONFERENCE, 7-9/06/1999, WINDSOR, ONTARIO. McCulloch, W. S. and Pitts, W. (1943). "A logical calculus of the ideas immanent in nervous activity." Bulletin of Mathematical Biophysics, 5: 115-133. MEEDDAT-INERIS (2006). "Compréhension des phénomènes et modélisation: LA DISPERSION ATMOSPHERIQUE." 227 Mendoza, G. A. and Prabhu, R. (2000). "Multiple criteria decision making approaches to assessing forest sustainability using criteria and indicators: a case study." Environ. Manage, 26 (6) (26 (6)): 659-673. Merad, M. (2003). "Apport des méthodes d'aide multicritère à la décision pour l'analyse et la gestion des risques liés aux mouvements de terrains induits par les ouvrages souterrains." Paris, France, LAMSADE, Universitée ParisDauphine. Merad, M. M., Verdel, T., Roy, B. and Kouniali, S. (2004). "Use of multi-criteria decision-aids for risk zoning and management of large area subjected to mining-induced hazards." Tunnelling and Underground Space Technology, 19 (2): 125. Michaëlis, P., Hodin, A., Lechaudel, J. F., Mavrothalassitis, G. and Mejean, P. (1995). Methods applied to investigate the major UVCE that occured in the TOTAL refinery’s Fluid Catalytic Cracking Unit at La Mède, France. Proceedings of the 8 th International Loss Prevention Symposium, Antwerp, Belgium. Morgan, J. N. and Sonquist, J. A. (1963). "Problems in the analysis of survey data and a proposal." Journal of the American Statistical Association, 58: 415-434. Mouilleau, Y. and Dechy, N. (2001). "Première analyse des dommages observés à Toulouse après le sinistre du 21 septembre 2001 sur le site de AZF de la société Grande Paroisse." INERIS for IGE: 56. Mouilleau, Y. and Lechaudel, J. F. (1999). "Guide des méthodes d’évaluation des effets d’une explosion de gaz à l’air libre." INERIS: 166. National Conference of Standards Laboratories International - NCSLI (2006). International vocabulary of basic and general terms in metrology - Basic and general concepts and associated terms (VIM), 3rd edition. Geneve, NCSLI. Nemitz, B., Ammirati, C. and Jouchoux, Y. (2000). "Stratégie générale face à une intoxication chimique collective." Médecine de catastrophe urgences collectives, 3 (1): 5-12. National Library of Medicine - NLM (2004, 20/02/2008). "Fact Sheet: Wireless Information System for Emergency Responders (WISER)." Retrieved 21/03/2008, from http://www.nlm.nih.gov/pubs/factsheets/wiser.html. National Library of Medicine - NLM (2005, 12/03/2008). "Wireless Information System for Emergency Responders." Retrieved 27/03/2008, from http://wiser.nlm.nih.gov/index.html. National Oceanic & Atmospheric Administration - NOAA (1999, Last Update Date). "CAMEO Chemicals online database of hazardous materials." Access 2008, from http://cameochemicals.noaa.gov/. Noto, Aymé and Rosier (1983). "Intoxication par acide cyanhydrique." Allo 18, Dossier du mois - Mars 1983. O'Neil, M. J., Smith, A., Heckelman, E. and Budavari, S. (2004). The Merck Index: an encyclopedia of chemicals, drugs and biologicals - Thirteenth Edition, Whitehouse Station. New Jersey, Merck & Co.: 2564. Parzen, E. (1962). "On estimation of a probability density function and mode." The Annals of Mathematical Statistics, 33 (3): 1065-1076. Pasquill, F. (1974). Atmospheric Diffusion, Ellis Horwood: 442. Perkins, R., Soulhac, L. and Mejean, P. (2002). "Modélisation de la dispersion des émissions atmosphériques d'un site industriel - Vers un guide de l'utilisateur, phase 1: Etat de l'art." Ecole Centrale de Lyon. 228 Pison, I. (2005). "Modélisation inverse pour l'optimisation des sources primaires de pollution atmosphérique a l'échelle régionale." Paris, Thèse de doctorat, Université Paris XII. Presutto, F. (2005). MITRA - Monitoring and Intervention for the TRAnsportation of Dangerous Goods. International Conference on Risk and Emergency Management - Research and Policy Perspectives, 8-9 June 2005, Hannover, Germany. Pujos, C. (2006). "Estimation de la rhéologie d'un polymère dans une filière d'extrusion - Simulation d'écoulement avec transferts thermiques et Inversion de mesures." Bordeaux, université de Bordeaux I: 206. Purnomo, H., Mendoza, G. A. and Prabhu, R. (2005). "Analysis of local perspectives on sustainable forest management: an Indonesian case study." Journal of Environmental Management, 74 (2): 111. Quenouille, M. (1949). "Approximate tests of correlation in time series." Journal of the Royal Statistical Society, 11 (B): 68–84. Quinlan, J. R. (1986). "Induction of Decision Trees." Machine Learning, 1 (1): 81-106. Rakotomalala, R. (2005). "Arbres de Décision." Modulad, 33: 163-187. Rosenblatt, M. (1956). "Remarks on some non-parametric estimates of a density function." 27: 832-837. Roy, B. (1975). "Vers une méthodologie générale d'aide à la décision". Metra. 14: 459-497 S. A. Teukolsky, W. T. Vetterling and B. P. Flannery (1992). Numerical Recipes in C. 2nd Ed., W. H. Press, Cambridge Univ. Press: 444-451. Saporta, G. (2006). Segmentation, arbres de regression. in Probabilités, analyse des données et Statistique, 2ème édition. Technip: 622. Sari, M., Jennifer, S. and Dawn, P. (2000). "Étude sur le transport par camion des marchandises dangereuses – été 2000." from http://www.tc.gc.ca/tmd/bulletin/automne2000.htm. Savage, L. J. (1954). The Foundations of Statistics. New York, John Wiley & Sons. Schärlig, A. (1985). Décider sur plusieurs critères - Panorama de l’aide à la décision multicritère, Presse polythechniques et universitaires romandes. Lausanne, Suisse: 304. Service départemental d'incendie et de secours de Meurthe-et-Moselle - SDIS 54 (1999). "Plan d’intervention risque chimique - Fiches réflexes." Retrieved 2006, from http://www.sdis54.fr/article.php3?id_rubrique=285. Simpson, G. G. (1961). Principles of Animal Taxonomy. New York, Columbia University Press. Smithson, M. (1989). Ignorance and Uncertainty: Emerging Paradigms. New York, Springer Verlag. Sokal, R. R. and Sneath, P. H. A. (1974). Numerical Taxonomy: the Principles and practice of numerical Classification. San Francisco, W.H. Freeman and Company. Tran Le Tam, M. and Thibier, E. (2005). "Evaluation de la population dans les zones de bruit - France." Systèmes d'information géographique et gestion des risques, 1: 101. Tremeaud, S. (2005). "Etude des besoins des membres et des utilisateurs de la Cellule d’Appui aux Situations d’Urgence." INERIS: 35. Tukey, J. W. (1958). "Bias and confidence in not quite large samples (abstract)." Annals of Mathematical Statistics, 29: 614. 229 Us Army Chemical School (2005). Potential Military Chemical/biological Agents And Compounds, Eximdyne: 324. Vincke, P. (1989). L'aide multicritère à la décision, Ellipses et Bruxelles: Éditions de l'ULB. Paris: 179. Voiron-Canicio, C. and Olivier, F. (2005). "Anticiper à l'aide d'un SIG, les conséquences de la paralysie urbaine en temps de catastrophe: application à la ville de Nice - France." Systèmes d'information géographique et gestion des risques, 1: 101. Yohannes, Y. and Hoddinott, J. (1999a). "Classification and Regression Trees: An introduction." Technical report, International Food Policy Research Institute (IFPRI). Yohannes, Y. and Webb, P. (1999b). "Classification and Regression Trees, CART: A User Manual for Identifying Indicators of Vulnerability to Famine and Chronic Food Security." International Food Policy Research Institute (IFPRI): 50. Zoller, H. G. and Beguin, H. (1992). Aide à la décision. L'évaluation des PROJETS d'Aménagement, Economica. Paris: 310. 230 231 Ecole Nationale Supérieure des Mines de Saint-Etienne N° d’ordre : 486 SGE Prénom Nom Cyrille Bronner Titre de la thèse The use of operational data to provide decision making support in accidental situation involving dangerous substance– Application to the source term identification. Spécialité Science of Environment Mots clefs Emergency situation, decision-making support, chemical risk, source assessment, inverse method, genetic algorithm, decision tree Résumé In the event of a major chemical accident, often only uncertain and inaccurate facts are available to the fire-fighters and crisis management units, which makes a diagnosis of the situation difficult. Further, the emission source (initial conditions) is often badly known in the first instant but is however absolutely necessary to have a global view of the event and predict its development to take good decisions and to limit consequences. This research work aims at developing, for the emergency first responders, methodologies and decision-making support tools, specific to chemical accidents. This thesis addresses two problems, in one hand to identify the a priori unknown chemical substance, in the other hand to assess the source term (rate, quantity …). To identify an unknown chemical substance or, at least, the associated hazards, the developed method consists in using data collected in situ which can be descriptive data (as colour, odour) or symptoms observed on victims. On these bases, a methodology and a software have been developed to make easier the exploitation of operational data, taking into account inherent uncertainty and inaccuracy, in particular by using the probability theory. In addition to the identification of the chemical substance, consequences assessment requires to know precisely the source term. So, an inverse method has been proposed to evaluate the source term by using the observed or/and measured consequences (overpressures, concentrations …). This method is based on a genetic algorithm coupled with an analytic explosion model. The algorithm was then validated on two accidents (AZF and Nitrochimie sites) and provides good estimations of the mass of the explosive having detonated. The benefit of our method is its ability to solve problem with more than one unknown parameter, e.g. the explosive mass together with the location of the epicentre of the explosion which could not be possible with methods usually used. Ecole Nationale Supérieure des Mines de Saint-Etienne N° d’ordre : 486 SGE Prénom Nom Cyrille Bronner Titre de la thèse : Utilisation des données opérationnelles pour l’aide à la décision en situation accidentelle impliquant une substance dangereuse – Application à l’identification du terme source Spécialité Science et Génie de l’Environnement Mots clefs Situations d’urgence, aide à la décision, risque chimique, évaluation de la source, méthode inverse, algorithme génétique, arbre de décision Résumé : Lors d’un accident majeur d’origine chimique, les sapeurs-pompiers et les experts des cellules d’appui doivent faire face à des phénomènes complexes (explosions, dispersions de produits toxiques) et ne disposent souvent que d’éléments incertains et imprécis, rendant difficile le diagnostic de la situation. Dans les premiers instants qui constituent la phase d’urgence, la « source » d’émission du flux dangereux est souvent mal connue mais elle est pourtant indispensable pour avoir une vision globale de l’événement, prévoir son évolution et prendre les décisions visant à limiter les conséquences. Ces travaux de recherche ont pour objectif de développer des méthodologies et des outils d’aide à la décision destinés aux primo intervenants des situations d’urgence d’origine chimique. Ces outils doivent permettre, à partir de l’exploitation des données opérationnelles, d’accéder d’une part à la nature d’une substance a priori inconnue, d’autre part « au terme source » impliqué (débit, quantité). Pour identifier une substance inconnue ou tout au moins les dangers qu’elle présente, l’approche consiste à utiliser les données descriptives et les symptômes recueillis in situ. Une base de données a été conçue et un logiciel a été développé pour faciliter l’exploitation de ces données opérationnelles. L’incertitude et l’imprécision inhérentes à ces données ont été prises en compte, notamment à l’aide de la théorie des probabilités. L’évaluation des conséquences requiert, en plus de la nature de la substance impliquée, la connaissance précise du « terme source ». Aussi, une méthode inverse a été proposée afin d’évaluer le terme source à partir des conséquences observées et/ou mesurées (surpressions, concentrations). Elle consiste en l’utilisation d’un algorithme génétique couplé à un modèle de calcul de flux. La méthode développée a été appliquée et validée sur les explosions de solides pour lesquelles il s’agit de calculer avec précision la masse d’explosif ayant détonée. L’algorithme a ensuite été validé sur des accidents survenus sur les sites d’AZF et de Nitrochimie.