memoire CBRONNER modif sans publi - LGEI

publicité
N° d’ordre : 486 SGE
THESE
présentée par
Cyrille BRONNER
Pour obtenir le grade de Docteur
de l’Ecole Nationale Supérieure des Mines de Saint-Etienne
Spécialité : Science et Génie de l’Environnement
Utilisation des données opérationnelles pour l’aide à la décision en
situation accidentelle impliquant une substance dangereuse :
Application à l’identification du terme source
Soutenue à Alès le 30 juin 2008
Membres du jury
C. MOESCH
J-M. FLAUS
Professeur, Faculté de Pharmacie, Université de Limoges
Professeur, Université Joseph Fourier, Grenoble
Rapporteur
Rapporteur
D.GRAILLOT
D. PEARSON
Professeur, Ecole des Mines de Saint-Etienne
Professeur, Université de Saint-Etienne
Président du jury
Examinateur
G. DUSSERRE
Maître de recherche, Ecole des Mines d’Alès
Directeur de thèse
A. DANDRIEUX
Maître-assistant, Ecole des Mines d’Alès
J. CHAPELAIN
F. FONTAINE
Colonel, Ecole Nationale Supérieure des Officiers des Sapeurs-Pompiers
Responsable Sûreté, malveillance, terrorisme, INERIS
Encadrant
Invité
Invité
◘ Spécialités doctorales :
Responsables :
SCIENCES ET GENIE DES MATERIAUX
MECANIQUE ET INGENIERIE
GENIE DES PROCEDES
SCIENCES DE LA TERRE
SCIENCES ET GENIE DE L’ENVIRONNEMENT
MATHEMATIQUES APPLIQUEES
INFORMATIQUE
IMAGE, VISION, SIGNAL
GENIE INDUSTRIEL
MICROELECTRONIQUE
J. DRIVER Directeur de recherche – Centre SMS
A. VAUTRIN Professeur – Centre SMS
G. THOMAS Professeur – Centre SPIN
B. GUY Maitre de recherche – Centre SPIN
J. BOURGOIS Professeur – Centre SITE
E. TOUBOUL Ingénieur – Centre G2I
O. BOISSIER Professeur – Centre G2I
JC. PINOLI Professeur – Centre CIS
P. BURLAT Professeur – Centre G2I
Ph. COLLOT Professeur – Centre CMP
◘ Enseignants-chercheurs et chercheurs autorisés à diriger des thèses de doctorat (titulaires d’un doctorat d’Etat ou d’une HDR)
AVRIL
BATTON-HUBERT
BENABEN
BERNACHE-ASSOLANT
BIGOT
BILAL
BOISSIER
BOUCHER
BOUDAREL
BOURGOIS
BRODHAG
BURLAT
CARRARO
COLLOT
COURNIL
DAUZERE-PERES
DARRIEULAT
DECHOMETS
DESRAYAUD
DELAFOSSE
DOLGUI
DRAPIER
DRIVER
FOREST
FORMISYN
FORTUNIER
FRACZKIEWICZ
GARCIA
GIRARDOT
GOEURIOT
GOEURIOT
GRAILLOT
GROSSEAU
GRUY
GUILHOT
GUY
GUYONNET
HERRI
KLÖCKER
LAFOREST
LI
LONDICHE
MOLIMARD
MONTHEILLET
PERIER-CAMBY
PIJOLAT
PIJOLAT
PINOLI
STOLARZ
SZAFNICKI
THOMAS
VALDIVIESO
VAUTRIN
VIRICELLE
WOLSKI
XIE
Stéphane
Mireille
Patrick
Didier
Jean-Pierre
Essaïd
Olivier
Xavier
Marie-Reine
Jacques
Christian
Patrick
Laurent
Philippe
Michel
Stéphane
Michel
Roland
Christophe
David
Alexandre
Sylvain
Julian
Bernard
Pascal
Roland
Anna
Daniel
Jean-Jacques
Dominique
Patrice
Didier
Philippe
Frédéric
Bernard
Bernard
René
Jean-Michel
Helmut
Valérie
Jean-Michel
Henry
Jérôme
Frank
Laurent
Christophe
Michèle
Jean-Charles
Jacques
Konrad
Gérard
François
Alain
Jean-Paul
Krzysztof
Xiaolan
MA
MA
PR 2
PR 1
MR
DR
PR 2
MA
MA
PR 1
MR
PR 2
PR 1
PR 1
PR 1
PR 1
ICM
PR 1
MA
PR 2
PR 1
PR 2
DR
PR 1
PR 1
PR 1
MR
CR
MR
MR
MR
DR
MR
MR
DR
MR
DR
PR 2
MR
CR
EC (CCI MP)
MR
MA
DR 1 CNRS
PR1
PR 1
PR 1
PR 1
CR
CR
PR 1
MA
PR 1
MR
CR
PR 1
Glossaire :
Centres :
PR 1
Professeur 1ère catégorie
PR 2
Professeur 2ème catégorie
MA(MDC)Maître assistant
DR (DR1) Directeur de recherche
Ing.
Ingénieur
MR(DR2) Maître de recherche
CR
Chargé de recherche
EC
Enseignant-chercheur
ICM
Ingénieur en chef des mines
SMS
SPIN
SITE
G2I
CMP
CIS
Mécanique & Ingénierie
Sciences & Génie de l’Environnement
Sciences & Génie des Matériaux
Génie des Procédés
Génie des Procédés
Sciences de la Terre
Informatique
Génie Industriel
Sciences de l’inform. & com.
Sciences & Génie de l’Environnement
Sciences & Génie de l’Environnement
Génie industriel
Mathématiques Appliquées
Microélectronique
Génie des Procédés
Génie industriel
Sciences & Génie des Matériaux
Sciences & Génie de l’Environnement
Mécanique & Ingénierie
Sciences & Génie des Matériaux
Génie Industriel
Mécanique & Ingénierie
Sciences & Génie des Matériaux
Sciences & Génie des Matériaux
Sciences & Génie de l’Environnement
Sciences & Génie des Matériaux
Sciences & Génie des Matériaux
Génie des Procédés
Informatique
Sciences & Génie des Matériaux
Sciences & Génie des Matériaux
Sciences & Génie de l’Environnement
Génie des Procédés
Génie des Procédés
Génie des Procédés
Sciences de la Terre
Génie des Procédés
Génie des Procédés
Sciences & Génie des Matériaux
Sciences & Génie de l’Environnement
Microélectronique
Sciences & Génie de l’Environnement
Sciences & Génie des Matériaux
Sciences & Génie des Matériaux
Génie des Procédés
Génie des Procédés
Génie des Procédés
Image, Vision, Signal
Sciences & Génie des Matériaux
Sciences de la Terre
SITE
Génie des Procédés
Sciences & Génie des Matériaux
Mécanique & Ingénierie
Génie des procédés
Sciences & Génie des Matériaux
Génie industriel
CIS
SITE
SMS
CIS
SPIN
SPIN
G2I
G2I
DF
SITE
SITE
G2I
G2I
CMP
SPIN
CMP
SMS
SITE
SMS
SMS
G2I
CIS
SMS
CIS
SITE
CMP
SMS
SPIN
G2I
SMS
SMS
SITE
SPIN
SPIN
CIS
SPIN
SPIN
SPIN
SMS
SITE
CMP
SITE
SMS
SMS
SPIN
SPIN
SPIN
CIS
SMS
SPIN
SMS
SMS
SPIN
SMS
CIS
Sciences des Matériaux et des Structures
Sciences des Processus Industriels et Naturels
Sciences Information et Technologies pour l’Environnement
Génie Industriel et Informatique
Centre de Microélectronique de Provence
Centre Ingénierie et Santé
Remerciements
Je remercierai tout d’abord les membres du GIS AGECRIS : l’INERIS, l’ENSOSP et l’Ecole
des Mines Alès qui ont rendu possible cette thèse.
J’exprime toute ma reconnaissance à Monsieur le Professeur Didier Graillot pour m’avoir fait
l’honneur de présider ce jury, à Messieurs les Professeurs Christian Moesch et Jean-Marie
Flaus pour avoir accepté de juger ce travail en tant que rapporteurs, ainsi qu’à Monsieur le
Professeur David Pearson pour sa participation en tant que membre du jury.
J’adresse mes remerciements à Monsieur Gilles Dusserre, pour avoir assuré la direction de
ce travail, m’avoir accueilli au sein de l’équipe risques industriels et naturels et pour la liberté
qu’il m’a laissée sur la conduite de ce sujet de recherche.
J’adresse tous mes remerciements à Madame Aurélia Bony-Dandrieux pour l’encadrement
de ce travail, qui a contribué au bon déroulement de cette thèse par ses conseils avisés, son
soutien et sa gentillesse et avec qui j’ai pris beaucoup de plaisir à travailler.
Je voudrais également remercier Madame Anne Johannet pour m’avoir fait profiter de ses
connaissances sur les réseaux de neurones avec toute la pédagogie dont elle sait faire
preuve. C’est un domaine très intéressant et j’ai eu beaucoup de chance de rencontrer Anne
pour me guider dans mes travaux.
J’adresse mes remerciements à Monsieur François Fontaine pour la confiance qu’il m’a
accordée et pour l’aide qu’il m’a apportée dans les moments les plus opportuns.
Je tiens à exprimer toute ma gratitude à Monsieur le Colonel Jean Chapelain qui a su se
rendre disponible pour suivre ce travail, pour son soutien et pour les échanges constructifs
que nous avons pu avoir à propos de la thèse et sur bien d’autres sujets.
J’exprime également ma reconnaissance particulière à Monsieur le Lieutenant de Vaisseau
Alexandre Lacoste pour avoir accepté de partager une part de son savoir-faire, pour avoir
initié les travaux d’évaluation sur les matériels de détection et pour toute l’aide apportée qui
a rendue possible cette étude.
Je tiens à remercier également Monsieur Laurent Verneuil pour ses conseils, en particulier
en matière de chimie et de matériels de détection.
Je remercie les sapeurs-pompiers de la CMIC du Gard pour leur participation et plus
particulièrement à Monsieur le Lieutenant-Colonel Jean-François Roure.
Je tiens aussi à remercier Messieurs Nicolas Dechy, Stéphane Pagnon, Jean-Marc Lacome,
Denis Foisy, Christophe Gay et Marcel Welfringer pour leur aide au cours de cette thèse.
Je remercie chaleureusement l’ensemble de l’équipe risques industriels et naturels pour leur
bonne humeur et leur écoute, Rosario pour son aide à la mise en place des
expérimentations, Marc et Alexandre pour leurs corrections mais surtout pour leur complicité.
Un grand MERCI également à l’ensemble du personnel du LGEI pour ses trois années
passées en leur compagnie, et aux secrétaires, Cathy, Corinne, Dédé et Domi, Virginie et
Véronique dont l’efficacité n’a d’égale que leur gentillesse.
Enfin, je terminerai par une pensée spéciale pour ma compagne, Christine, qui m’a aidé et
m’a soutenu pendant le DEA et la thèse, ainsi qu’à ma fille, Auriane, dont la naissance a
certainement contribué aux bouleversements qui accompagnent les derniers mois de thèse
mais dont je ne garde que d’immenses joies.
TABLE DES MATIERES
Préambule
6
Introduction
7
Chapitre I
LES SITUATIONS D’URGENCE
I.1
11
Présentation des situations d’urgence
12
I.1.1
Définitions
12
I.1.2
Dimension temporelle des situations d'urgence
13
I.1.3
Les acteurs des situations d'urgence
16
I.2
Les accidents d’origine chimique
18
I.3
Récapitulatif sur les situations d'urgence
20
Chapitre II
L’AIDE A LA DECISION EN SITUATION D'URGENCE
II.1
La prise de décision
22
II.2
Les données opérationnelles
22
II.2.1 Les données utiles en situation d’urgence
23
II.2.1.1
Données relative à la source
23
II.2.1.2
II.2.1.3
II.2.1.4
II.2.1.5
Flux dangereux
Données décrivant l’environnement
Conséquences
Cibles
28
28
29
30
II.2.2 Nature des données opérationnelles
II.3
Outils d’aide à la décision pour les urgentistes
II.3.1 Guide et fiches réflexes
30
33
34
II.3.1.1
II.3.1.2
Guide National de Référence (GNR)
Fiches réflexes
34
34
II.3.1.3
II.3.1.4
Le Guide des mesures d'urgence (GMU)
Guide orange des sapeurs pompiers genevois
35
35
II.3.2 Bases de données
36
II.3.2.1
Accidentologie
36
II.3.2.2
Produits chimiques
37
II.3.3 Systèmes d’Information Géographique (SIG)
40
II.3.4 Calcul de flux dangereux
41
II.3.4.1
II.3.4.2
1
21
Estimation préétablie des distances
Outils de simulation
41
43
II.3.5 Evaluation des conséquences
44
II.4
Analyses des besoins en situation d'urgence
45
II.4.1 Identification de la substance chimique
47
II.4.2 Evaluation du terme source
49
II.4.3 Imprécision et incertitude des données opérationnelles
49
Chapitre III
LES METHODES D’AIDE A LA DECISION
50
III.1 L’aide à la décision multicritère
51
III.1.1 Généralités sur l’aide à la décision multicritère
51
III.1.2 Différentes approches
53
III.1.3 Conclusions sur les méthodes multicritères
57
III.2 Les arbres de décision
57
III.2.1 Généralités sur les arbres de décision
57
III.2.2 Développement d’un arbre binaire
59
III.2.3 Arbre binaire à variables binaires
62
III.2.4 Conditions d’arrêt et élagage
63
III.2.5 Un arbre non optimal
64
III.2.6 Conclusions sur les arbres de décision
66
Chapitre IV
IDENTIFICATION DES SUBSTANCES CHIMIQUES
IV.1 Introduction
67
68
IV.1.1 Identifier les substances chimiques : une information primordiale
68
IV.1.2 Des situations inhabituelles
69
IV.2 Les moyens de détection et d’identification existants
IV.2.1 Les matériels de détection au sein des CMIC
IV.2.1.1
IV.2.1.2
Une grande variété de matériels
Limites de la capacité à identifier une substance chimique
IV.2.2 Les logiciels d’identification des substances chimiques
IV.2.2.1
IV.2.2.2
IV.2.2.3
Présentation du logiciel WISER
Limites de la base de données du logiciel WISER
Limites du logiciel WISER à l’identification des substances
IV.3 Réalisation d’une base de données opérationnelles
71
71
71
72
77
78
82
84
85
IV.3.1 Choix des sources d’information
85
IV.3.2 Fusion des bases de données
88
IV.3.3 Renseignement des données manquantes
88
IV.3.4 Choix d’une classification des dangers
89
IV.3.4.1
IV.3.4.2
Présentation de la classification retenue
Différence de seuils des classifications européenne et NFPA
IV.3.5 Différentes versions de bases de données
89
90
94
2
IV.3.5.1
Version pour étude de faisabilité – suppression des incompatibilités
IV.3.5.2
Version intégrée au logiciel
94
96
IV.3.6 Conclusions sur la base de données
96
IV.4 Quantité d’information nécessaire à l’identification d’une subst. 96
IV.4.1 Estimation du nombre de données nécessaires à l’identification d’une
substance
IV.4.1.1
IV.4.1.2
IV.4.1.3
IV.4.1.4
IV.4.1.5
IV.4.1.6
IV.4.1.7
IV.4.1.8
97
Estimation du nombre de symptômes nécessaires
Estimation du nombre de critères descriptifs et physico-chimiques nécessaires
Estimation du nombre de données opérationnelles nécessaires à l’identification d’une substance
Imprécision du critère « couleurs »
Imprécision du critère « pH »
Imprécision du critère « odeur »
Sélection des substances à partir de critères imprécis
Récapitulatif et discussion
97
99
99
100
102
103
106
109
IV.4.2 Estimation de la précision de l’identification à l’aide de retours d’expérience110
IV.4.2.1
IV.4.2.2
IV.4.2.3
Intoxication à l’acide cyanhydrique
Intoxication au bromure de méthyle
Discussion
110
113
115
IV.5 Identification des dangers liés à une substance chimique à partir
des données opérationnelles
115
IV.5.1 Démarche
116
IV.5.2 La quantité d’information est-elle suffisante ?
116
IV.5.2.1
IV.5.2.2
Recherche des paramètres discriminants à l’aide des arbres de décision
Information utile
IV.5.3 Identification des dangers à l’aide d’arbre de décision
IV.5.3.1
IV.5.3.2
IV.5.3.3
IV.5.3.4
Formalisation du problème de discrimination
Ensemble d’apprentissage et généralisation
Evaluation de l’identification des dangers par les arbres de segmentation
Conclusions sur l’identification des dangers par les arbres de décision
IV.5.4 Conclusions sur les méthodes d’identification des dangers
117
120
123
124
125
129
136
136
IV.6 Conception d’un outil opérationnel d’identification des dangers liés
à une substance chimique
IV.6.1 Présentation du logiciel AERO
IV.6.1.1
IV.6.1.2
138
Généralités
Un outil d’aide à l’identification des substances chimiques
138
139
IV.6.2 Méthodologie d’identification d’une substance chimique
140
IV.6.2.1
Recueil d’informations et saisies des données
141
IV.6.2.2
IV.6.2.3
Sélection des substances correspondant aux données opérationnelles
Une alternative à un degré de concordance fixe
142
148
IV.6.3 L’identification des dangers
148
IV.6.3.1
Affichages des substances et des dangers
148
IV.6.3.2
Aide au recueil de données
151
IV.7 Discussion sur l’identification des substances chimiques
3
138
157
IV.7.1 Bilan
157
IV.7.2 Limites et perspectives
158
Chapitre V
ESTIMATION DU TERME SOURCE D’UN PHENOMENE DANGEREUX
V.1
L’estimation du terme source : un problème inverse
V.1.1 Généralités sur les méthodes inverses
V.1.1.1
V.1.1.2
V.1.1.3
Formalisation mathématique
Présentation des différentes méthodes inverses
Bilan sur les méthodes inverses
V.1.2 Les algorithmes génétiques
V.1.2.1
V.1.2.2
V.2
Utilisation des algorithmes génétiques pour résoudre un problème inverse
Principes généraux des algorithmes génétiques
Application aux explosions de solides
162
163
164
164
167
172
173
173
174
178
V.2.1 Données opérationnelles
179
V.2.2 Modèle retenu : l’équivalent TNT
179
V.2.2.1
V.2.2.2
Principes généraux
Modélisation de la surpression dans l’espace
179
180
V.2.2.3
Sensibilité du modèle aux erreurs d’estimation des surpressions
181
V.2.3 Paramètres de l’algorithme génétique
V.2.3.1
V.2.3.2
Terme source et paramètres
Complexité de l’algorithme et temps de calcul
V.2.4 Evaluation de la méthode inverse
182
182
183
183
V.2.4.1
V.2.4.2
V.2.4.3
Méthode de référence
Evaluation de l’algorithme à l’aide de données artificielles
Validation de la méthode à partir de retours d’expérience
183
184
188
V.2.4.4
Application aux situations opérationnelles
189
V.2.5 Prise en compte de la distribution des points de mesure
191
V.2.5.1
V.2.5.2
Principes
Le diagramme de Voronoï
191
191
V.2.5.3
V.2.5.4
V.2.5.5
V.2.5.6
Estimation de la densité
Ajustement de la pondération des points en périphérie.
Choix des positions d’estimation de la surpression
Evaluations et perspectives
193
195
197
200
V.3
Conclusions sur les méthodes inverses et perspectives
Conclusions et perspectives
201
203
4
ANNEXE I
Classification des substances chimiques
211
ANNEXE II
Critères de la base de données
213
ANNEXE III
Classification des phénomènes
214
ANNEXE IV
Outils de modélisation
215
Glossaire
221
Références bibliographiques
223
5
Introduction
Préambule
Ce travail de recherche s’inscrit dans le cadre du Groupement d’Intérêt
Scientifique d’Aide à la GEstion des CRISes (AGECRIS) mis en place entre l’École
des Mines d’Alès (EMA), l’Ecole Nationale Supérieure des Officiers SapeursPompiers (ENSOSP) et l’Institut National de l’Environnement industriel et des
RISques (INERIS), le 18 mai 2004 et rejoint par l’Institut National des Hautes
Etudes de la Sécurité (INHES) en 2007.
AGECRIS a pour objet de développer, entre autres dans les domaines du
risque technologique et naturel, une approche intégrée associant l’identification,
l’analyse, la gestion et l’organisation des secours en cas de sinistre. Ses missions
sont de conduire, d’élaborer et de coordonner des programmes de recherche et
développement, aux niveaux national et international, en vue d’améliorer les
connaissances pour répondre à la demande publique, industrielle et sociétale
dans le domaine de la gestion de crise, qui requiert la mise en œuvre de moyens
de secours.
La recherche menée au sein du GIS AGECRIS, à la fois théorique et
pratique, s’inscrit dans une démarche pluridisciplinaire alliant les sciences
humaines et sociales, les sciences de gestion et les sciences de l’ingénieur.
6
Introduction
Introduction
L’activité économique et industrielle génère des risques technologiques de
toutes natures. Les récents accidents, Feyzin (1966), Flixborough (1974), Seveso
(1976), Bhopal (1984), Toulouse (2001) rappellent la place préoccupante
qu’occupe le risque
chimique. L’importance des conséquences humaines,
économiques et environnementales justifie la préoccupation que représente la
gestion de ces risques industriels. La démarche est double ; elle consiste en une
réduction des risques par une approche préventionniste, combinée à une
amélioration de l’efficacité des moyens de secours et une réduction de
l’exposition en cas d’occurrence du risque. En particulier dans les premiers
instants où la prise de décisions appropriées est souvent déterminante sur les
conséquences de l’événement.
Face aux risques liés aux divers secteurs d'activité de l'industrie chimique,
les autorités prévoient par la circulaire ministérielle du 14 mai 1986, la création
de Cellules Mobiles d'Intervention Chimique (CMIC) afin d’améliorer le potentiel
d'intervention existant dans ce domaine. Depuis la création des CMIC, les
besoins en matière de lutte contre les risques chimiques n’ont cessé de
progresser [DDSC, 2006]. Pour répondre à des demandes de plus en plus
nombreuses d’aide à la décision durant le déroulement d’un accident, une Cellule
d’Appui aux Situations d’Urgence (CASU) est créée le 15 avril 2003. Sa position
au sein de l’INERIS et son mode d’organisation permettent de mobiliser un
réseau de compétences et de délivrer en temps réel et 24 heures sur 24 un avis
d’expert
lors
du
déroulement
d’événements
accidentels
à
caractère
technologique.
Lors d’une situation d’urgence, les sapeurs-pompiers et les experts des
cellules d’appui doivent faire face à des phénomènes complexes et incertains. Ils
doivent alors prendre les décisions appropriées afin de limiter les conséquences
potentielles de l’événement. La pression temporelle, synonyme d’urgence,
7
Introduction
l’incertitude due au manque d’information et la complexité du système affectent
considérablement le processus décisionnel [Dautun et al., 2007].
Ces
travaux
de
recherche
ont
pour
objectif
de
contribuer
au
développement de méthodologies et d’outils d’aide à la décision adaptés aux
situations d’urgence et destinés aux primo intervenants que sont les sapeurspompiers et les cellules d’appui telles que la CASU. Pour y parvenir, nous nous
sommes appuyés sur différents moyens de recherche : l’analyse bibliographique
et les entretiens avec des experts pour déterminer les besoins des sapeurspompiers et des experts des cellules d’appui en termes d’aide à la décision.
Nous nous intéressons particulièrement aux situations d'urgence d’origine
accidentelle, survenant sur un site industriel ou lors d’un transport de matières
dangereuses, provoquant ou pouvant provoquer un phénomène dangereux de
type explosion, incendie ou dispersion atmosphérique de substances toxiques.
Dans de telles situations, l’aide à la décision peut porter sur différentes
interrogations relatives notamment à la dangerosité de la substance, l’estimation
des effets potentiels, la stratégie d’intervention et le choix des matériels de
protection. Mais toutes ces informations primordiales découlent inévitablement
de la connaissance de la « source ». La « source » regroupe à la fois la substance
chimique et le « terme source » qui est un ensemble de paramètres descriptifs
de la source d’émission du flux dangereux.
La connaissance de la substance est donc indispensable à l’évaluation des
conséquences. Souvent, la signalisation, les documents de transport, les
personnels informés permettront une identification précise de la substance. Mais,
lorsque la source de la dispersion n’est pas localisée précisément (odeur
suspecte, malaise dans les personnes aux alentours, etc.) ou qu’il n’y a pas de
marquage sur un stockage (étiquette absente, plaque danger illisible ou détruite,
etc.), l’identification de la substance chimique devient complexe, nécessitant, par
exemple, l’emploi de matériels spécialisés qui ne sont pas toujours disponibles à
cause de leur nombre limité et du délai d’acheminement.
A défaut de moyens matériels suffisants à l’identification précise d’une
substance chimique, une alternative est d’utiliser les données opérationnelles
disponibles (description de la substance et effets sur l’homme) pour parvenir à
identifier la substance ou les dangers qui y sont liés. Dans cette optique, une
méthodologie de recueil des données et un logiciel d’aide à l’identification des
dangers liés aux substances chimiques ont été développés.
8
Introduction
La connaissance de la substance chimique ne suffit pas à elle seule, à
évaluer les conséquences potentielles. L’utilisation des modèles d’évaluation des
conséquences requiert la connaissance précise du « terme source » [MEEDDATINERIS, 2006]. Mais, souvent, en situation d'urgence, les paramètres du « terme
source » ne sont pas tous connus avec précision et complétude. Cependant,
d’autres données comme des mesures du flux en différents points ou une
estimation des conséquences observées, peuvent permettre d’évaluer certains
paramètres du « terme source ». Il s’agit alors de résoudre un problème inverse
puisque les conséquences observées ou mesurées sont utilisées pour remonter à
la source.
Traitant de l’identification de la source d’un phénomène dangereux en
situation d’urgence, ce mémoire est composé de cinq chapitres :
Le premier chapitre a pour but d’introduire les situations d’urgence
auxquelles sont confrontés les sapeurs-pompiers et les permanents des cellules
d’appui. Un intérêt tout particulier sera porté aux situations impliquant des
substances chimiques dont il est question tout au long de ce mémoire.
Le deuxième chapitre propose un état de l’art des outils et méthodes
d’aide à la décision à disposition des sapeurs-pompiers et des experts des
cellules d’appui lors d’interventions en présence de risques chimiques. L’étude
des moyens existants et l’avis d’experts permettent d’exprimer des besoins en
termes d’aide à la décision adaptée aux situations opérationnelles.
Le troisième chapitre est consacré à la présentation des grands principes
des méthodes d’aide à la décision. Il s’agit notamment des méthodes
multicritères
d’aide
à
la
décision,
des
méthodes
de fusion de
sources
d’information multiples et des arbres de décision.
Le quatrième chapitre s’attache à apporter une solution au premier besoin
identifié : l’identification des substances chimiques à l’aide des données
opérationnelles. A défaut de données suffisantes, la méthodologie développée
consiste à apporter une aide à l’identification des dangers liés à la substance,
fournissant ainsi un premier niveau d’information utile pour la prise de décisions.
Le cinquième chapitre traite de l’évaluation du terme source d’un
phénomène dangereux, qui est une information souvent absente en situation
d’urgence, mais nécessaire à la modélisation. Ce chapitre est divisé en deux
9
Introduction
parties :
une
présentation
des
principales
méthodes
inverses,
puis
une
application aux explosions de solides.
En conclusion, nous présenterons l’intérêt et l’apport de ce travail de
recherche ainsi que les aspects qui mériteraient d’être approfondis dans le cadre
de recherches futures.
10
Chapitre I
Les situations d’urgence
CHAPITRE I
LES SITUATIONS D’URGENCE
I.
La première partie est consacrée à définir les situations d’urgence
et plus particulièrement du point de vue des acteurs que sont les
sapeurs-pompiers et les experts des cellules d’appui.
L’accent sera mis sur les situations d’urgence survenant à la suite
d’accidents impliquant des substances chimiques. Des situations
complexes, variées et incertaines pour lesquelles la prise de
décisions est difficile.
11
Chapitre I
I.1
Les situations d’urgence
Présentation des situations d’urgence
I.1.1
Définitions
Le terme « Situation d’urgence » est employé dans de nombreux domaines
tels que ceux de la sécurité civile, de l’aéronautique, de la sûreté nucléaire ou
encore médical. Afin de donner une définition générale qui corresponde à
l’ensemble de ces domaines, on peut se référer à la Loi canadienne sur la Gestion
des Situations d’Urgence (LGSU) qui définit la situation d’urgence comme une
« situation ou situation imminente causée par un fléau naturel, un accident, un
acte intentionnel ou d’une autre façon, et qui constitue un grand danger pour la
vie ou pour les biens. » [Gouvernement de l'Ontario, 1990].
Plusieurs notions apparaissent dans cette définition :
-
La cause qui est un événement indésirable et de nature variée.
-
Les conséquences possibles ou avérées pour les individus, les biens et
l’environnement.
Il faut également y associer la dimension temporelle ; un temps limité qui
constitue une contrainte forte, d’où une liberté d’action réduite par la nécessité
d’agir vite (du latin urgere, « presser, pousser à agir ») pour limiter les
conséquences possibles. Ces aspects sont mis en avant dans la définition
adoptée par l’Autorité de Sûreté Nucléaire : « Une "situation d’urgence" est une
situation inhabituelle ou un événement qui nécessite une action rapide
principalement pour atténuer un risque ou limiter les conséquences pour la santé
humaine, la sécurité, la qualité de vie, les biens et les équipements ou
l’environnement. » [ASN, 2006]
On parle également de la phase d’urgence d’une situation accidentelle.
« La phase, caractérisée par une émission, durant laquelle des actions sont
engagées, dans l'urgence, de manière rapide et organisée, […], de façon à limiter
les conséquences d'un événement. »1
1
(JO n° 279 du 1er décembre 2005) - Directive interministérielle du 29 novembre 2005
relative
à
la
réalisation
et
au
traitement
des
mesures
de
radioactivité
dans
l'environnement en cas d'événement entraînant une situation d'urgence radiologique application de la loi relative à la modernisation de la sécurité civile
12
Chapitre I
I.1.2
Les situations d’urgence
Dimension temporelle des situations d'urgence
La phase d’urgence d’une situation accidentelle ou d’une situation à risque
est toujours la phase initiale de courte durée. Lors d’un événement de sécurité
civile, la phase d’urgence est définie comme débutant immédiatement après
l’événement, et d’une durée de quelques heures à quelques jours (Figure 1).
Figure 1 : Différentes phases d’un événement de sécurité civile
Dans le cas, d’une situation d'urgence radiologique2, la phase d’urgence
correspond à la durée de l’émission. Et dans le cadre du risque chimique, l’étude
des appuis de la CASU de l’INERIS montre une mobilisation des experts de
l’ordre de quelques heures en moyenne, même si l’intervention peut s’étendre à
plusieurs jours.
La phase d’urgence a une durée de quelques heures à quelques jours et
comprend elle-même plusieurs phases.
Une phase réflexe durant laquelle la situation est incertaine et dont le peu
-
d’information ne permet pas une prise de décision éclairée. Les sapeurspompiers s’appuient alors sur des fiches réflexes et guides. Les zonages mis
en place comportent une forte part d’a priori.
2
JO n° 279 du 1er décembre 2005
13
Chapitre I
-
Les situations d’urgence
Une phase réfléchie pour laquelle les délais permettent la mise en place de
moyens plus conséquents (prélèvements, systèmes de mesure) et la
concertation de plusieurs experts.
Au cours de la phase réflexe, les actions sont cadrées, définies par des
documents de référence et connues des sapeurs-pompiers formés à ces
interventions. Les méthodes et outils d’aide à la décision développés lors de ce
travail de thèse s’appliquent à la phase réfléchie et s’adressent particulièrement
aux sapeurs-pompiers et aux experts des cellules d’appui aux situations
d'urgence.
A la différence des phases « réflexe » et « réfléchie », une autre distinction
chronologique peut être faite en se rapportant à l’émission du flux. Nous
distinguons alors trois phases dans le déroulement de la situation (avant,
pendant et après l’émission du flux) au cours desquelles les moyens et les
besoins sont différents :
-
La phase de menace
Différents termes sont employés selon les domaines. Il s’agit de
situations non souhaitées, d’accidents mineurs, de presque accidents ou
d’incidents.
Il
s’agit
de
situations
pouvant
s’aggraver
lors
d’une
intervention visant un retour à la « normale » ou par un emballement à
cause d’un environnement peu propice. Nous préférerons le terme utilisé
dans le domaine de l'urgence radiologique, définissant la phase de menace
comme « la période liée à un événement, précédant une éventuelle
émission ; cette phase peut ne pas exister en fonction de la nature de
l'événement »3. En risque chimique, l’émission n’est pas un flux radioactif,
mais un flux thermique, mécanique ou toxique.
Il s’agit de situations où l’accident redouté n’a pas encore eu lieu, où
il est encore possible d’agir sur la source pour éviter la création d’un flux
et d’anticiper pour avoir recours à des moyens de protection du voisinage.
Il faut également inclure les incidents donnant lieu à une fuite peu
conséquente ne présentant pas de réel danger en l’état actuel, mais
pouvant s’aggraver naturellement ou par l’intervention humaine au cours
de la réparation d’une brèche par exemple. Concrètement, il peut s’agir
également d’une fuite de produits dangereux suspectée mais non avérée
ou encore de l’évacuation d’un transport de matières dangereuses
immobilisé.
3
JO n° 279 du 1er décembre 2005
14
Chapitre I
-
Les situations d’urgence
La phase d’urgence proprement dite : les situations en cours d’évolution.
Ce sont les situations pour lesquelles l’accident redouté s’est produit
et a généré un flux dangereux pour le voisinage. La phase caractérisée par
une émission durant laquelle des actions sont engagées, dans l'urgence,
de manière rapide et organisée. La différence avec les situations décrites
précédemment est l’existence d’un flux dangereux. Agir sur la source
permet d’empêcher que ce flux devienne plus conséquent (par exemple en
stoppant la fuite à l’origine d’une dispersion ou en éteignant un incendie).
Pour limiter les conséquences du flux existant, il est alors nécessaire de
mettre en place des barrières de protection ou d’évacuer les cibles
potentielles.
Pour les phénomènes en cours d’évolution, qu’il s’agisse d’incendies
chimiques, de dispersions atmosphériques ou de fuites liquides, le terme
source (nature des produits, la quantité, le débit, …) est nécessaire pour
évaluer précisément l’évolution du phénomène dans le temps et les
conséquences sur la population et son environnement.
-
La phase post-accidentelle
Il s’agit de la phase descendante où la situation est stabilisée,
pendant
laquelle
s’effectue
le
traitement
des
conséquences
de
l'événement. Cela comprend les explosions qui sont des événements
instantanés et tous les phénomènes de dispersions ou d’incendies qui se
sont achevés.
Le flux est terminé, il ne représente plus une menace directe et il
n’est alors plus possible d’agir sur la source ou les cibles pour limiter les
conséquences dues au flux. Mais il est important de connaître les
conditions initiales pour évaluer plus précisément les conséquences
difficilement observables
et
identifier
le(s)
produit(s)
pouvant être
impliqué(s). Procéder à un diagnostic de la situation permet d’avoir une
vision plus globale et apporte une aide aux décideurs dans l’organisation
des moyens de secours. Cela permet également d’identifier les zones
touchées pour évaluer les risques d’effets domino et l’impact sanitaire à
court, moyen et long terme. On s’intéressera plus particulièrement à
l’impact sanitaire à court terme, comme la contamination d’un point d’eau
potable qui nécessite une prise de décision rapide. Les impacts sanitaires à
long terme dont la gestion est moins urgente, pourront être évalués avec
plus de précision lorsque des données plus nombreuses et fiables seront
disponibles après expertise.
15
Chapitre I
I.1.3
Les situations d’urgence
Les acteurs des situations d'urgence
Lors d’une situation d’urgence, de nombreux acteurs interviennent afin de
gérer au mieux cette dernière, et ce, le plus rapidement possible afin de limiter
les dommages et de secourir les personnes impliquées. « Les rôles, les
responsabilités et les hiérarchies sont bien établis. La situation est perçue comme
gérable techniquement, économiquement et socialement. La durée est limitée.
Une simple brèche, dans un univers stable. » [Lagadec, 1997].
La gestion des accidents et des crises est partie intégrante des missions de
la Sécurité Civile qui a pour objectif la prévention des risques de toute nature,
l'information et l'alerte des populations ainsi que la protection des personnes,
des biens et de l'environnement contre les accidents, les sinistres et les
catastrophes par la préparation et la mise en œuvre de mesures et de moyens
appropriés relevant de l'Etat, des collectivités territoriales et des autres
personnes publiques ou privées.4
La direction des opérations de secours
La réponse aux situations d’urgence exige la mobilisation rapide de tous
les moyens publics et privés et leur coordination efficace sous une direction
unique. A cet égard, la France bénéficie d’une tradition juridique éprouvée et
réaffirmée par loi n°2004-811 de modernisation de la sécurité civile, qui investit
les maires et les préfets, autorités de police générale, de pouvoirs étendus en
situation d’urgence.
Ainsi, la direction des opérations de secours repose dans le cas général, le
plus fréquent, sur le maire au titre de ses pouvoirs de police (articles L. 2211-1
et L. 2212-2 du code général des collectivités territoriales). Le cas échéant, si la
gravité de l’événement tend à dépasser les capacités locales d’intervention ou
lorsque le problème concerne plusieurs communes, l’Etat, par l’intermédiaire du
préfet, prend la direction des opérations de secours. Si les conséquences peuvent
dépasser les limites ou les capacités d’un département, le représentant de l’Etat
dans le département du siège de la zone de défense, voire le Gouvernement,
interviennent dans la conduite des opérations lorsque c’est nécessaire.
Les sapeurs-pompiers : les premiers intervenants
Les sapeurs-pompiers restent les premiers intervenants, spécialistes des
risques et de l’urgence. Ainsi, les sapeurs-pompiers, en tant qu’acteurs
permanents de la sécurité civile et conformément à leurs missions générales de
protection des personnes, des biens et de l’environnement, sont appelés
quotidiennement à conduire des interventions.
4
J.O n° 190 du 17 août 2004
16
Chapitre I
Les situations d’urgence
Les accidents d’origine chimique occupent une part de plus en plus importante
des accidents technologiques [BARPI, 2008] et les interventions des sapeurspompiers englobent également ces accidents, qu’il s’agisse d’une fuite de gaz,
d’un accident routier, autoroutier ou ferroviaire d’un véhicule transportant des
matières dangereuses ou encore de pollution des eaux intérieures ou maritimes.
Pour ce faire, les services d’incendie et de secours se sont dotés de
moyens matériels allant du simple appareil de détection du niveau de risque «
explosif » aux cellules mobiles d’intervention chimique (CMIC) constituant
un moyen d’appui spécialisé destiné à compléter et à améliorer le potentiel
d'intervention existant dans ce domaine et relevant de l'autorité locale.
Le domaine de la lutte contre le risque chimique comprend différents
emplois avec des compétences et des missions spécifiques qui sont détaillés dans
[DDSC, 2006]. Leur principale mission est de déterminer le plus précisément
possible les composants du risque chimique et de guider les secours pour une
neutralisation rapide. Dotés de matériel spécialisé, les CMIC répondent aux
premiers impératifs dictés par l'urgence de la situation, à savoir la détection et la
localisation des dangers et la mise en place de contre-mesures immédiates. Ces
premières dispositions prises, l'ensemble des renseignements collectés est
transmis à la cellule d'identification départementale qui va évaluer plus
précisément les conséquences prévisibles de l'évènement et proposer les
solutions adéquates.
La CMIC joue également le rôle d’expert et a pour mission de conseiller le
Directeur des Opérations de Secours (DOS), qui peut faire appel également à
d’autres experts comme ceux de la Cellule d’Appui aux Situations d’Urgence
(CASU).
Les cellules d’experts
Il existe plusieurs cellules d’urgence avec des domaines bien définis. Pour
les domaines du nucléaire et de la radioprotection, l’IRSN (Institut de
Radioprotection et de Sûreté Nucléaire) s’est doté d’un Centre Technique de
Crises (CTC), afin de remplir les missions d’expertise au profit des personnes
publiques en cas d’urgence. Pour les pollutions marines, fluviales et lacustres, le
CEDRE (CEntre de Documentation, de Recherche et d’Expérimentations sur les
Pollutions Accidentelles des Eaux) possède une cellule d’urgence. La CASU de
l’INERIS est la principale cellule opérationnelle dans le domaine des risques
chimiques. La CASU est chargée, avant tout, de fournir dans les meilleurs délais
aux services de l’Etat (préfet, DRIRE, SIDPC par exemple), en réponse à leur
17
Chapitre I
Les situations d’urgence
demande, les informations scientifiques et techniques pour faciliter les décisions
pendant la phase accidentelle.
La CASU intervient d’une part pour les installations industrielles à risque
telles que les établissements classés Seveso et les installations soumises à la
réglementation
ICPE
qui
fabriquent,
stockent
ou
utilisent
des
matières
dangereuses. D’autre part, la CASU peut être mobilisée pour des accidents de
transport de matières dangereuses à l’exclusion des produits infectieux en
complément des instances d’appui habituelles (Transaid et CEDRE), qu’il soit
réalisés par fer, route, canalisations, voies navigables (mer et eaux intérieures).
Cela inclut le transport proprement dit, ainsi que les opérations de chargement,
déchargement et les phases de transit dans les infrastructures prévues à cet
effet (gares de triage, ports, plates-formes multi-modales…).
D’autres situations peuvent être concernées mais toujours à la condition que le
risque provienne de substances dangereuses. On peut citer l’utilisation de
substances
dangereuses
hors
installations
industrielles
à
risque
(PME,
Collectivité, particuliers) ainsi que les actes d’attentats ou de malveillance.
La CASU peut fournir les prestations suivantes [Tremeaud, 2005] :
-
transmission au demandeur des informations sur la dangerosité de la
substance ou des réactions chimiques directement incriminées (principaux
risques, propriétés physico-chimiques, etc.) ou celles qui sont susceptibles de
se former au cours de l’accident (produits de décomposition, composants des
fumées d’incendie, etc.) ;
-
fourniture des renseignements sur l’accidentologie. La connaissance
d’événements similaires antérieurs constitue en effet des points de référence
pour le décideur ;
-
estimation
des
effets
avant,
pendant
ou
après
la
survenance
du
phénomène et évaluation des effets immédiats ou différés sur l’homme, des
effets sur l’environnement (milieu naturel, bâtiments et infrastructures).
Les sapeurs-pompiers et les membres de la CASU sont amenés à
intervenir régulièrement sur des accidents d’origine chimique.
I.2
Les accidents d’origine chimique
L’activité économique et industrielle de nos jours génère des risques de
toutes natures parmi lesquels il y a lieu de considérer les risques chimiques.
L’une des causes des situations d'urgence sont les accidents chimiques et,
potentiellement, ces accidents menacent toutes les régions françaises par
18
Chapitre I
Les situations d’urgence
l’implantation des sites industriels et les transports de matières dangereuses. De
plus, ces accidents peuvent provoquer de conséquences importantes en vies
humaines comme le montre ces accidents tristement célèbres : en 1966,
l’incendie d’une industrie pétrochimique à Feyzin (Rhône) a provoqué la mort de
18 personnes. En 1974 à Flixborough (Grande-Bretagne) une explosion sur un
site industriel faisait 28 morts. En 1976, 37000 personnes sont touchées par une
fuite de dioxine à Seveso (Italie). En 1984, la fuite d’un gaz toxique à Bhopal
(Inde) était à l’origine du décès de plus de 2500 personnes. Toujours en 1984,
l’explosion de plusieurs citernes de gaz de pétrole liquéfié faisait 500 morts au
Mexique. Enfin, en 2001, l’explosion de l’usine AZF faisait 30 morts à Toulouse.
Malgré l’amélioration des méthodes d’analyse des risques, les progrès
techniques et l’emploi progressif de systèmes formalisés de gestion de la
sécurité,
les
courbes
des
accidents
mortels
relatives
à
l’ensemble
des
installations classées ou susceptibles de l’être ne semblent pas évoluer depuis 15
ans. La proportion des accidents liés à l’industrie chimique est devenue la plus
importante ces dernières années [BARPI, 2007].
Une typologie des accidents chimiques fait apparaître clairement que les
incendies et le rejet de matières dangereuses sont les évènements les plus
fréquents (Cf. Tableau 1).
Tableau 1 : Répartition des types d’accidents chimiques (22 933 accidents)
Base ARIA du BARPI.
Type d’événement
2006
1992 à 2006
Répartition (%)
Répartition (%)
Incendies
54
53
Rejets de matières dangereuses
53
50
Effets dominos
12
4
Explosions
6,6
5,8
0,3
0,2
Projections, chutes d’équipements
2,8
2,7
Irradiations
1,0
0.3
Presque accidents
3,7
2,2
dont BLEVE
Note : Un même événement peut engendrer plusieurs phénomènes. Par exemple, en
France, sur 106 explosions recensées en 2003, 60 ont été accompagnées ou résultent
d’incendies.
19
Chapitre I
I.3
Les situations d’urgence
Récapitulatif sur les situations d'urgence
Cette typologie révèle une première distinction des accidents chimiques en
fonction du type d’événement. Il n’existe pas un type de situations d’urgence,
mais une
pluralité
de situations qui se différencient par de nombreux
paramètres.
En
effet,
les
récents
événements, incendie
de
Buncefield
(2005),
Ghislenghien (2004), AZF (2001), Mexico (1984), Bhopal (1984), Seveso (1976)
montrent que les risques menaçant les populations et l’environnement sont de
plus en plus diversifiés. Diversifiés du fait d’une multitude de produits dangereux
pouvant être impliqués, par les phénomènes variés et complexes, par les cibles
impactées, etc. Les situations d’urgence font intervenir des phénomènes
complexes, mobilisant de nombreux acteurs dont le but est de limiter les
conséquences. Dans le cadre du GIS AGECRIS, nous nous intéressons plus
particulièrement aux besoins des sapeurs-pompiers et de la CASU de l’INERIS
lorsque survient un accident impliquant des substances chimiques.
Souvent, un amalgame est fait entre situation de crise, situation d’urgence
et accident. Dans certains ouvrages traitant des situations de crise, les situations
d'urgence s’en distinguent par un univers mieux « cadré » auquel s’applique une
gestion conventionnelle. « La crise c'est l'urgence plus la déstabilisation. »
[Lagadec, 1997]
Dans ce mémoire, nous nous intéresserons à la gestion de la situation
d’urgence et non de la crise. Et pour être plus précis, le mémoire portera sur
l’aide à la décision afin de faciliter la gestion de la phase d’urgence de situations
accidentelles d’origine chimique que sont amenés à gérer les sapeurs-pompiers,
en faisant éventuellement appel aux cellules d’appui.
20
Chapitre II
L’aide à la décision en situation d'urgence
CHAPITRE II
L’AIDE A LA DECISION EN SITUATION
D'URGENCE
II.
La prise de décision en situation d'urgence repose sur les données
opérationnelles et les connaissances des acteurs permettant de se
représenter la situation et son devenir.
Après une présentation des données opérationnelles, il est fait un
tour d’horizon des outils d’aide à la décision les plus répandus.
21
Chapitre II
L’aide à la décision en situation d'urgence
II.1 La prise de décision
« Gérer une situation d’urgence nécessite de prendre des décisions
rapides, adaptées et justifiées au milieu d’un flux d’informations, sous la pression
politique, médiatique, sociale et économique des acteurs de terrain, des victimes
sanitaires ou économiques, et en interaction avec de nombreux acteurs locaux,
nationaux et internationaux. » [ASN, 2006]
Apporter une aide à la décision c’est fournir des données, des outils ou des
méthodes pour progresser dans un processus de décision. Les données
véhiculent de l’information à laquelle l’expert, fort de ses connaissances, donnera
un sens afin de progresser dans le processus de décision. Nous nous
intéresserons dans la première partie, aux données opérationnelles susceptibles
d’être utilisées par les experts. Ces données ne sont pas toujours directement
exploitables et pour faciliter la prise de décision, les experts disposent outils que
nous réunirons sous le terme d’outils d’aide à la décision et qui seront présentés
dans la deuxième partie.
Enfin, après avoir dégagé les besoins des experts des situations d'urgence,
nous verrons au chapitre suivant les méthodes susceptibles d’apporter une aide à
la décision pour y répondre. Décider ne représente que l’ultime étape d’un
processus cognitif, où s’opère un choix entre diverses alternatives possibles.
Aider à la décision, c’est apporter l’information qui autorise une appréciation plus
sûre du champ des possibles et une anticipation plus correcte des résultats
susceptibles de découler des actions projetées. La décision finale restant la
responsabilité du décideur final. « Le but d’un système d’information n’est pas de
se substituer à l’homme, mais d’apporter une assistance qui doit se concrétiser
par la réduction des délais de traitement. Il n’est pas envisageable qu’une
machine ou un système de machines puisse remplacer l’esprit humain qui devra
rester le seul décideur de la conduite à tenir. » [Cdt Vert, 2001]
Les données opérationnelles sont toutes les données susceptibles d’être
disponibles en situation d'urgence et apportant de l’information utile à
l’appréhension de la situation et de son devenir et par conséquent, éclairant les
décideurs quant aux choix possibles pour gérer la situation.
II.2 Les données opérationnelles
Après avoir présenté quatre catégories de données opérationnelles, un
paragraphe est consacré à leur nature imprécise et incertaine.
22
Chapitre II
II.2.1
L’aide à la décision en situation d'urgence
Les données utiles en situation d’urgence
En situation opérationnelle, plusieurs sources d’information vont permettre
de mieux cerner le contexte. Il s’agira d’avis d’experts ou de données recueillies
sur site telles que des observations (description du produit, forme de panache,
type de stockage, personnes blessés, matériels endommagés, …) ou des
mesures. Une détection et d’éventuelles mesures de concentration pourront être
réalisées à l’aide de matériels spécialisés. Parmi les sources informatiques, il est
possible d’utiliser des outils tels que les bases de données ou les systèmes
d’information géographique. On peut également inclure toutes les informations
qu’impose le cadre réglementaire (état des stocks, document de transport,
Plaque danger, code ONU, …).
En se basant sur une approche systémique classique (source-flux-cibles)
et en ajoutant les données liées à l’environnement nécessaire à toutes
modélisations, les données permettant d’analyser les situations d’urgence ont été
réparties en quatre catégories de données relatives :
-
-
à la source,
o
substance chimique
o
terme source (quantité de produit, mode d’émission, …)
o
localisation
à l’environnement,
o
(nature du sol, occupation des sols par des obstacles, orographie, …)
o
les conditions météorologiques (champ de vent, température,…)
-
au flux,
-
et aux conséquences sur les cibles.
II.2.1.1 Données relatives à la source
II.2.1.1.1
Substance chimique
Afin d’identifier rapidement les substances chimiques et les dangers qui y
sont liés, la réglementation européenne5 impose un marquage des matières
dangereuses (code ONU sur les emballages et les transports, code danger,
pictogramme des dangers, …). En l’absence de signalisation, certaines données
renseignent sur la substance comme sa couleur, son état, sa viscosité, sa densité
lorsqu’elle peut être estimé visuellement et surtout son odeur qui se révèle un
bon indicateur pour les substances courantes (gaz de ville, ammoniac, …). Des
mesures pourront également être effectuées (pH) ou l’emploi de matériels de
5
JO du 8 mai 1994 - Arrêté du 20 avril 1994 relatif à la déclaration, la classification,
l'emballage et l'étiquetage des substances
23
Chapitre II
L’aide à la décision en situation d'urgence
détection permettra de lever le doute ou de confirmer la présence d’une
substance précisé ou d’une famille de substances.
Les produits chimiques se différencient par :
-
Les propriétés physico-chimiques qui définissent la nature des dangers
associés (toxique, explosif, inflammable, …) et vont conditionner les
précautions à prendre et les moyens d’intervention possibles. Elles
interviennent dans le calcul des distances de sécurité et sont donc
indispensables à l’évaluation des conséquences.
Les effets sur l’homme et l’environnement qui peuvent être observés.
-
Les moyens de détection, qu’il s’agisse de matériels de mesure ou
d’identification, ou de critères observables.
-
Les moyens d’intervention (utilisation de matériels, de méthodes)
-
Les produits de décomposition possibles qui peuvent entraîner des risques
importants et qui nécessitent donc de prendre certaines mesures de
protection.
-
Le mode de stockage
Le type de stockage et le conditionnement vont être déterminants sur les
scénarios possibles. Le conditionnement va définir s’il s’agit, par exemple, d’une
dispersion gazeuse, liquide ou diphasique (Tableau 2).
Tableau 2 : Scénarios possibles en fonction de l’état d’une substance
Etat / Stockage
Scénarios
Gazeux
rejet gazeux
Liquide
fuite liquide avec formation de nappe et
évaporation
Liquide sous pression
trois scénarios possibles selon la position de la
brèche : rejet liquide, gazeux ou diphasique
De même la température de stockage déterminera le comportement d’un
rejet gazeux en champ proche ; par exemple un gaz passif peut se comporter
comme un gaz lourd quand il est refroidi (ex. NH3).
II.2.1.1.2
Terme source
En amont de la modélisation de la dispersion atmosphérique d’une
substance, il convient généralement de caractériser un « terme source ». Par
extension, on peut parler de terme source pour les autres phénomènes
dangereux comme l’explosion ou l’incendie. Ce que l’on désigne alors par
« terme source » est un ensemble de paramètres descriptifs de la source d’un
24
Chapitre II
L’aide à la décision en situation d'urgence
phénomène, suffisant aux modèles pour effectuer les calculs de flux. Ces
paramètres sont tous ceux qui conditionnent la formation du flux dangereux,
c’est-à-dire les caractéristiques de la source d’émission initiale éventuellement
modifiées par le champ proche. Par exemple, dans le cas de la dispersion
atmosphérique, la source d’émission initiale est caractérisée par le type de
produit (état physique, quantité), sa pression, sa température qui conditionnent
le débit, l’état physique et la vitesse à la brèche, etc. Il faut également tenir
compte de son environnement proche ; par exemple la présence d’un mur (jet
dit « impactant »), ou d’un local de confinement qui influencent directement le
devenir du terme source initial (devenir de la fraction liquide, évaporation de
flaque, etc.) [MEEDDAT-INERIS, 2006].
Il faut souligner l’importance de la quantification du terme source. Quel
que soit l’outil de calcul utilisé, la caractérisation du terme source doit être la
meilleure possible. « la caractérisation du terme source est déterminante, parce
que les meilleurs modèles de dispersion donneront toujours des résultats erronés
si le terme source est incorrect. » [Bouet, 1999].
A partir de l’étude des modèles, des logiciels et de documents de
référence, une liste des principaux paramètres du « terme source » par
phénomènes a été réalisée (cf. Figure 2). Certains paramètres peuvent être omis
lorsqu’ils ne sont pas pris en compte par les modèles classiques.
25
Chapitre II
L’aide à la décision en situation d'urgence
Figure 2 : Paramètres importants pour la modélisation des phénomènes
dangereux
Ces paramètres peuvent être tout simplement connus (état des stocks,
surface du bassin de rétention) ou calculés à partir de données comme la
pression, la taille de la brèche, etc. Ils peuvent être observés (présence d’une
flaque, …) ou encore estimés (majoration par le volume du type de stockage,
surface de flaque, …).
26
Chapitre II
L’aide à la décision en situation d'urgence
En situation d’urgence, les données relatives au terme source sont
rarement connues avec précision ou sont manquantes
La localisation de la source pourra être connue, car le lieu de l’accident est
identifié par des témoins, par une reconnaissance des sapeurs-pompiers, par la
présence d’un nuage de fumée ou de gaz produit par un incendie ou une fuite, ou
encore par la présence d’un cratère d’une explosion. Dans d’autres cas, l’ampleur
de l’accident et le disfonctionnement des moyens de communication ne permet
pas de connaître la localisation dans les premiers instants (AZF 2001) ou la
présence d’une fuite d’un gaz incolore uniquement détectée par l’odeur,
nécessite l’emploi de matériels adaptés pour remonter à la source.
Pour une dispersion, la quantité totale rejetée peut être majorée lorsque le
volume du stockage est connu. L’identification du type de stockage ou du TMD
qui répondent à un standard permet de connaître facilement le volume. Il ne
s’agit que d’une borne maximum, car on ne connait pas le taux de remplissage
du stockage. Le type de stockage renseigne également sur la phase du produit.
Par contre, le débit est plus difficile à estimer. Bien qu’il existe des outils
de calcul de débit, la taille de la brèche et sa forme ne peuvent être estimé que
visuellement, pouvant être masquée par le jet, de la fumée, des obstacles ou un
feu. Les situations permettant de calculer précisément le débit restent rares. On
peut citer l’accident de Ghislenghien (2004) causé par la rupture d’une conduite
de gaz naturel sous haute pression. S’agissant d’une rupture guillotine, la section
de la brèche était connue, ainsi que la pression de la conduite et sa longueur. Il
était alors facile de calculer le débit, mais cela reste un cas rare.
D’une manière générale, bien qu’il existe parfois des éléments visuels
directement liés à certains paramètres du terme source, il est rarement connu
avec précision, voire totalement inconnu.
II.2.1.1.3
Site fixe ou Transport de Matières Dangereuses
Il faut aussi distinguer le site de l’accident :
-
Les sites fixes pour lesquels la population est sensibilisée à ce genre
d’accidents pouvant disposer de sources d’informations (produits, stocks, …),
être formés aux risques (formation, POI, …), voire disposer sur place de
moyens de secours (pompiers sur site) et éventuellement de réseaux de
mesures (détecteurs de gaz, capteurs de concentration, mesures de débit
dans les canalisations, …).
-
Les sites fixes disposant de plus ou moins d’informations mais dont l’activité
permet de rechercher l’information et de limiter le champ des hypothèses sur
les stocks et les produits.
27
Chapitre II
-
L’aide à la décision en situation d'urgence
Les Transports de Matières Dangereuses peuvent présenter plus de difficultés
pour obtenir les informations et survenir dans des zones de forte densité de
population ou difficile d’accès.
II.2.1.2 Flux dangereux
La modélisation des effets d’un phénomène accidentel comprend trois
composantes,
à
savoir
la
modélisation
du
« terme
source »,
de
la
« propagation » de cette source dans l’environnement et l’impact du flux
dangereux sur les « cibles » [MEEDDAT-INERIS, 2006]. Les flux dangereux sont
de plusieurs natures selon les phénomènes : flux thermique dans le cas d’une
explosion
ou
d’un
incendie,
flux
toxique
dans
le
cas
d’une
dispersion
atmosphérique, aquatique ou dans les sols, ou encore dans le cas d’émission de
fumées, flux mécanique (onde de surpression, effets dits « missiles ») dans le
cas d’une explosion.
On s’intéresse plus souvent à la modélisation du phénomène en termes de
propagation du flux. L’approche classique pour calculer un flux dangereux est de
réaliser une modélisation du phénomène. Les outils de modélisation sont
présentés en annexe IV.
II.2.1.3 Données décrivant l’environnement
II.2.1.3.1
Topographie et orographie
Il s’agit des données liées à la topographie du site, à l’occupation des sols
(bâtiments, murs de protection, …), et de la nature des sols (rugosité, …). Ces
données sont rarement disponibles avec précision car les systèmes d’information
géographique (S.I.G.) sont peu utilisés ou ne sont pas disponibles dans des
formats exploitables pouvant être utilisées directement par les outils d’évaluation
des conséquences (format électronique différents ou plus généralement plan de
site sur support papier). Lorsque les moyens sont mis en œuvre pour développer
un tel système pour couvrir une zone à risque [Mallet et al., 2005], la difficulté
est dans la mise à jour des données lorsque l’on est confronté à une occupation
des sols variables comme dans le cas du port du Havre.
De plus, ces données sont souvent ignorées parce que les outils utilisés
comme les modèles simples, n’en tiennent pas compte. Un terrain trop encombré
ou accidenté permettra uniquement d’émettre des réserves sur les résultats de
modèles et la présence d’éléments plus petits (habitations, arbres, etc.) seront
pris en compte par un paramètre de rugosité relevant d’estimations.
28
Chapitre II
II.2.1.3.2
L’aide à la décision en situation d'urgence
Conditions météorologiques
Il s’agit notamment de la direction et de la vitesse du vent, de la
température ambiante et du taux d’hygrométrie. Dans le cadre de cette étude,
ces conditions météorologiques sont considérées comme connues, soit par des
mesures effectuées par les sapeurs pompiers sur le site de l’accident, soit par la
station Météo France la plus proche.
Un autre paramètre important est la stabilité atmosphérique relevant de
processus complexes [Couillet, 2002] et souvent simplifiés par l’emploi de
classes de stabilité (classes de Pasquill par exemple [Pasquill, 1974]). La classe
de stabilité est un paramètre important, difficile à déterminer avec précision en
situation d'urgence. Il existe des outils (ALOHA et MEMPLEX par exemple)
permettant d’en faire une estimation en se servant d’élément visuel comme la
présence de nuages et la distinction jour/nuit.
II.2.1.4 Conséquences
Le flux généré par l’accident chimique et les propriétés des substances
entrainent des conséquences sur les victimes, les matériels et l’environnement.
Relatifs à la substance chimique, les symptômes développés par les victimes sont
des données aidant à l’identification à condition de disposer d’une base de
données recensant l’information. La réaction avec l’environnement comme le
dégagement de gaz au contact de l’eau ou la corrosion des métaux sont
également des données opérationnelles utiles à l’identification des dangers liés à
la substance. L’utilisation de ces données sera détaillée au chapitre III.
Enfin, les conséquences sont également le résultat du flux thermique ou
mécanique. Comme il a déjà été mentionné plus haut, la présence d’un ou
plusieurs cratères permet de localiser l’épicentre d’une explosion. L’ampleur des
dommages sur les personnes et les matériels sont signes de l’importance du flux
en un point donné. Il existe des abaques pour estimer un flux thermique ou la
surpression maximale d’une onde de surpression, mais leur emploi nécessite un
travail d’expert, un temps considérable au-delà de la durée de la situation
d’urgence et ces évaluations restent imprécises.
II.2.1.5 Cibles
L’environnement proche est primordial puisqu’il sera très souvent le
premier exposé aux flux et cela déterminera l’ampleur des conséquences. En
fonction des enjeux, le choix des actions à mener peut être complètement
différent selon les priorités : protection de la population, protection d’installation
à risque ou rétablissement de la situation (réparation).
29
Chapitre II
-
L’aide à la décision en situation d'urgence
La proximité de la population est prépondérante car le nombre de victimes
est le critère principal de l’évaluation des conséquences. Il s’agit même très
souvent de l’unique critère des évaluations des conséquences des scénarios
de danger utilisés dans les études scientifiques avec le bilan financier en post
crise.
-
La présence de sites industriels à risque dans le voisinage pouvant engendrer
des effets domino doit être prise en compte et complique la situation.
II.2.2
Nature des données opérationnelles
Les données opérationnelles présentent certaines caractéristiques qu’il faut
prendre en compte lors de leur traitement. Il s’agit d’informations :
-
Hétérogènes
o
Binaires (présence d’une fuite ou non, substance toxique ou non)
o
Numériques (mesures de concentration)
o
-
•
Continues (vitesse du vent)
•
Discrètes (classes de stabilité atmosphérique)
Symboliques (« concentrations élevées », couleurs)
Non structurées et éparses.
Ce sont des données issues de plusieurs sources d’informations dont
les supports et les formats (structures) sont différents.
-
Asynchrones
Les informations sont délivrées à des temps différents. Il faut tenir
compte que les informations fournies reflètent rarement la situation à son
commencement à l’instant t0. Et plus il y a de décalage entre le moment ou
l’information est obtenue et le moment où elle sera traitée (délai de
transmission) et moins elle reflétera la situation qui aura pu évoluer.
Les observations sur les conséquences ne sont pas le résultat d’un
phénomène instantané, mais leur évolution dans le temps jusqu’à l’arrivée
des services de secours. Les conséquences ont lieu sur un « système »
dynamique qui réagit à l’agression. Ainsi les victimes capables de se déplacer
vont s’éloigner de la source de danger, des personnes vont agir sur les cibles
pour porter secours, etc.
30
Chapitre II
-
L’aide à la décision en situation d'urgence
Indirectes
Il s’agit d’informations dont la signification n’est pas immédiate. Par
exemple, la largeur du jet à la paroi du container donne une information sur
la taille de la brèche et la pression.
-
Imparfaites
o
Données imprécises
•
Erreur de mesure
La mesure d’une grandeur physique est généralement entachée
d’une imprécision liée au système de mesure et/ou de son
utilisation.
Dans le cas de la dispersion atmosphérique, la direction du vent est
un paramètre indispensable pour déterminer l’évolution du panache,
mais qui est difficile à obtenir avec précision. Bien qu’elle puisse être
mesurée par les stations de Météo France, la mesure n’est pas
locale à l’incident et on note des écarts importants avec une mesure
trop distante. Les pompiers disposent d’appareils de mesure locale,
mais ces capteurs ne peuvent pas s’utiliser n’importent où, ils
nécessitent notamment d’être positionnés sur une zone dénuée
d’obstacles majeurs, ce qui n’est pas toujours possible d’où des
mesures faussées par une erreur de protocole.
•
Observations imprécises
Dans le cas des observations, de nombreux facteurs peuvent
entraîner des erreurs d’appréciation. Il peut s’agir tout simplement
de grandeurs difficilement évaluables ou nécessitant une certaine
habitude. Ce sont parfois des informations difficiles à restituer, à
exprimer dans des termes simples.
« Les dégâts sur la structure sont importants. » Que signifie
« important » ?
Le stress de la situation, la panique, la précipitation, le manque
d’attention peuvent amener à des erreurs d’estimation.
o
Informations incertaines
Il ne s’agit pas d’erreur sur la qualité du résultat mais sur sa
validité.
« Je crois qu’il y a une brèche à la citerne. » L’information n’est pas
sûre.
31
Chapitre II
L’aide à la décision en situation d'urgence
« La victime, après inhalation, est sujette à des nausées ». Le
symptôme est-il réellement du à l’inhalation de la substance
chimique ?
Une distinction supplémentaire peut être faite en tenant compte de
la confiance que l’on a en la source d’information. Par exemple, nous
aurons plus confiance en les dires d’un expert que dans le
témoignage d’une personne inexpérimentée ou surprise. Cette
distinction est prise en compte dans la typologie de l’incertitude de
Demolombe dans [Demolombe, 1997].
o
Informations incomplètes (Incomplétude)
Absence d’une source d’informations dans certains scénarios
« Nous n’avons pas de mesure de concentration. »
ou d’une partie de l’information.
« Il n’y a pas de mesure de vent pendant les 30 premières
minutes. »
o
Informations contradictoires (Inconsistance)
En cas de redondance des informations, il peut y avoir des
contradictions.
Nous distinguons l’imprécision et l’incertitude, réunies sous le terme
de
données
imparfaites.
Souvent
imprécision
et
incertitude
sont
confondues à tort. La notion d’incertitude est souvent assimilée à
l’incertitude de mesure qui représente l’imprécision d’une méthode de
calcul ou d’un système de mesure. Dans [NCSLI, 2006], l’incertitude de
mesure est défini comme le paramètre qui caractérise la dispersion des
valeurs attribuées à un mesurande (grandeur que l’on veut mesurer), à
partir des informations utilisées. L’erreur est alors définie comme étant la
différence entre un résultat individuel et la valeur exacte du mesurande
[EURACHEM/CITAC, 2000]. Toutefois cette définition de l’incertitude ne
correspond pas aux données opérationnelles et il est important de
distinguer incertitude et imprécision comme il est fait état dans [El Najjar
et al., 2003] : « L’incertitude sur une hypothèse représente le doute sur
son existence réelle ou sur sa validité. L’imprécision représente l’erreur
associée à une donnée fournie par une source d’information (par exemple
un capteur) par rapport à la valeur vraie idéale. Elle modélise simplement
une partie de l’imperfection du moyen de perception. On peut interpréter
l’imprécision comme une évaluation de l’aspect quantitatif de cette
32
Chapitre II
L’aide à la décision en situation d'urgence
imperfection et l’incertitude comme une représentation de l’aspect
qualitatif. »
L’incertitude ne peut pas être réduite à des probabilités subjectives
[Carluer et al., 2002] qui est un raccourci séduisant pour représenter
l’incertitude et la traiter à l’aide de méthodes probabilistes bien connues.
L’incertitude comprend également un caractère ambigu (ambiguity) et
approximatif (vagueness) que [Smithson, 1989] propose dans une
taxonomie de l’ignorance (Figure 3).
Figure 3 : Taxonomie de l’incertitude [Smithson, 1989]
Ce sont donc des données imparfaites, issues de différentes sources
d’informations qu’il faut traiter et confronter pour élaborer l’aide à la décision qui
convient à la situation et aux données disponibles.
II.3 Outils d’aide à la décision pour les urgentistes
Il existe différents types de situation d’urgence auxquels correspondent
des besoins spécifiques et donc une d’aide à la décision adaptée à chaque cas de
figure. L’aide à la décision peut se décliner en quatre catégories :
-
Informations relatives à une substance chimique (principalement les dangers
qui y sont liés).
-
33
Calcul de distances d’effets (effets létaux, effets irréversibles, …).
Chapitre II
L’aide à la décision en situation d'urgence
-
Recherche de REX comparables.
-
Evolutions possibles de la situation.
Pour une même situation, il peut être fourni à la fois des informations sur
le produit à la source (fiche toxicologique), un REX pour la méthode
d’intervention à employer et une évaluation des conséquences.
L’étude bibliographique, les mains courantes de la CASU et plusieurs
entretiens avec des urgentistes ont permis de lister différents outils d’aide à la
décision en situation d’urgence.
II.3.1
Guide et fiches réflexes
II.3.1.1 Guide National de Référence (GNR)
Rédigé à l’attention des sapeurs-pompiers et élaboré en concertation avec
les
différents
partenaires
impliqués,
le
GNR
s’appuie
sur
les
REX
des
interventions et des exercices pour préciser les méthodologies d’intervention. Il
propose également une approche théorique du risque chimique, ainsi que des
fiches "produits" et des fiches réflexes.
II.3.1.2 Fiches réflexes
En plus de sa formation, le sapeur-pompier peut se référer à des fiches
réflexes. Leur objectif est d’apporter aux premiers intervenants, un canevas
d’intervention permettant de faire face aux situations les plus couramment
rencontrées dans les interventions à caractère chimique [FNSPF, 1992b].
Il s’agit d’aides opérationnelles synthétiques indiquant la conduite à tenir
face à certaines situations identifiées par la phase de la substance chimique et
des dangers qui y sont liés (émission de gaz inflammables, émission de gaz
toxiques/corrosifs, incendie avec fumées toxiques, écoulement de liquides
inflammables, …).
Les fiches du GNR par exemple, sont toutes conçues de la même façon
avec :
-
un exemple de matière dangereuse
-
les codes "dangers" se rapportant au titre de la fiche
-
les moyens nécessaires pour l’engagement des premiers intervenants
-
l’analyse de la situation
-
les mesures immédiates préconisées.
Ces fiches réflexes peuvent être complétées et adaptées par les SDIS
notamment en fonction des moyens dont ils disposent ou des fiches de synthèse
34
Chapitre II
L’aide à la décision en situation d'urgence
sur un point particulier comme les protections individuelles ou le zonage. Des
fiches réflexes ont été réalisées par le SDIS de Meurthe et Moselle [SDIS 54,
1999].
Les sapeurs-pompiers français se servent également des guides d’autres
pays comme le GMU et le guide orange.
II.3.1.3 Le Guide des mesures d'urgence (GMU)
Le GMU élaboré conjointement par Transports Canada, le Département
aux Transports des États-Unis et le Secrétariat aux Communications et aux
Transports du Mexique est destiné aux pompiers, aux services de police et au
personnel d'autres services d'urgence qui peuvent être les premiers à arriver sur
les lieux d'un incident mettant en cause des marchandises dangereuses. Il s’agit
avant tout d’un guide pouvant aider les premiers intervenants à déterminer
rapidement les dangers précis ou généraux de la (des) matière(s) visée(s), et à
se protéger et à protéger le grand public au cours de la phase d'intervention
initiale consécutive à cet incident. [CANUTEC, 2004]
Le
GMU
est
disponible
gratuitement
en
version
électronique
par
téléchargement.
II.3.1.4 Guide orange des sapeurs pompiers genevois
Il donne le relevé précis de produits chimiques et nocifs permettant aux
sapeurs-pompiers de détecter, lors d’incidents, ces produits dans les meilleures
conditions et d’intervenir de façon appropriée pour la sécurité des intervenants et
de la population.
-
distance (d’approche, d’évacuation, …)
-
dangers secondaires (en cas d’incendie, de polymérisation, …)
-
les techniques de neutralisation
-
les matériels à employer
-
…
Le guide orange peut être considéré comme une base de données de
substances chimiques.
35
Chapitre II
II.3.2
L’aide à la décision en situation d'urgence
Bases de données
Au format numérique ou sur support papier, les bases de données font
partie des aides à disposition des sapeurs-pompiers et des permanents des
cellules d’appui.
Lors des situations d'urgence, deux types de bases de données sont
couramment utilisées :
-
Les bases de données sur les substances chimiques nécessaires aux calculs
des modèles d’évaluation des conséquences. Elles renseignent également sur
les propriétés des substances et les dangers qui y sont liés, informations
capitales aux services de secours pour conduire leur intervention.
-
Les bases de données sur l’accidentologie pour la recherche de REX
comparables.
II.3.2.1 Accidentologie
Chaque entité travaillant dans le domaine semble avoir développé sa
propre base de données (Aria du BARPI, GEIDE de l’INERIS, MHIDAS développé
par le HSE, FACTS du TNO). Une première étude a montré que les bases de
données en France n’ont que très peu d’accidents en commun et que les
paramètres recensés ne sont pas les mêmes. Certaines bases se veulent plutôt
opérationnelles avec une vision terrain, et d’autres sont plus orientées
paramètres expérimentaux destinés à la modélisation.
Les formats des bases sont hétérogènes puisqu’il peut s’agir de bases formatées
avec des champs bien définis ou de descriptions non structurées qui ne facilitent
pas la recherche par mots-clés. Le tableau fait l’inventaire des bases de données
utilisées par la CASU de l’INERIS et liste leurs principales limites (Cf. Tableau 3).
Tableau 3 : Bases de données utilisées par la CASU de l’INERIS [Tremeaud,
2005]
Nom
Adresse
Eléments intéressants
Limites
CASU
Intranet
- Liste des appuis archivés
- pas de système de
CASU
GEIDE Intranet
recherche
- EDD, analyses critiques,
- pas toujours
analyses d’accidents, rapports
opérationnel
titre IV, recherches
- Terme sources, scénarios,
distance d’effets
- Eléments sur des installations
particulières, type silos
36
Chapitre II
RAI
ARIA
L’aide à la décision en situation d'urgence
Portables
- Accidents similaires
- Peu d’accidents (47)
CASU
- Conseils à l’intervention
http://aria.ecol
- Accidents similaires (beaucoup
- Pas ou peu d’éléments
ogie.gouv.fr/
d’accidents répertoriés)
sur les méthodes
d’intervention
- Descriptif d’accidents
très concis
IMPEL
http://europa.e - enseignements tirés (mesures
- Pas d’éléments sur les
u.int
méthodes d’intervention
de prévention)
- Recherche longue
II.3.2.2 Produits chimiques
Nous pouvons faire le même constat pour les bases de données de
produits chimiques en termes de données stockées et de format. Les sources de
données sont très nombreuses ; 66 bases de données ont été recensées [Celle et
al., 2006]. Dans le domaine des risques et de la santé, de nombreux pays
mettent à disposition de telles sources via différents organismes (INERIS, INRS,
NIOSH, NFPA, USCG, EPA, CCOHS, …). A celles-là s’ajoutent les bases de
données issues de l’industrie chimique et pharmaceutique (American Chemical
Society, MERCK, …).
Les logiciels d’évaluation des conséquences intègrent également leur
propre base de données de produits chimiques (par exemple CAMEO contient
plus de 6000 produits chimiques [NOAA, 1999], ALOHA moins de 1000 [Lacôme
et al., 2006], Safer Systems rassemble environ 720 éléments chimiques [Lacôme
et al., 2007]). Il s’agit de bases de données réduites en nombre de substances
comparées à celle du Chemical Abstract Services (CAS-registry) de l’American
Chemical Society, où sont enregistrées plus de 27 millions de substances. Ces
bases de données sont spécifiques et regroupent essentiellement les données
nécessaires à la modélisation des phénomènes physiques. Quelques rares
logiciels
spécifiques
aux
services
de
secours
contiennent
aussi
des
recommandations à l’intervention (par exemple, le logiciel allemand Memplex de
la société de K.W. Keudel [Keudel av-Technik GmbH, 2007]).
Le mode de fonctionnement de ces bases de données est similaire à
n’importe quelle base de données classique. Lorsque la substance chimique est
connue selon un identifiant unique, ces bases de données permettent d’accéder
aux caractéristiques contenues et destinées à une activité spécifique (santé,
modélisation, chimie, pharmacie, …).
37
Chapitre II
L’aide à la décision en situation d'urgence
De ce fait, ces bases de données spécialisées ne contiennent qu’une partie
des données qui sont utiles, voire nécessaires en situation d’urgence. Un premier
constat est qu’il faut consulter plusieurs sources pour obtenir l’ensemble des
données nécessaires.
Les bases de données n’ont pas la même vocation et ne sont pas conçues
pour les mêmes utilisateurs. Ainsi, la nature des renseignements qu’elles
contiennent, peut largement différer de l’une à l’autre.
Une autre limite à l’utilisation de bases de données destinées à d’autres
applications est qu’elles contiennent des données inutiles en situation d’urgence
et, de ce fait, les données nécessaires sont noyées dans la masse. De plus, elles
adoptent des formats hétérogènes (html, pdf, …), formatées avec des champs
bien définis ou contenant des descriptions non structurées (par exemple des
fiches en langage naturel sans formalisme commun) qui ne facilitent pas la
recherche par mots-clés. La localisation de l’information n’est pas immédiate et
occasionne une perte de temps. Dans [Dobbins et al., 2003], les auteurs
montrent la nécessité de créer une base de données centralisées opérationnelle
dans le cas des dispersions en mer. Mais cela est également valable pour
l’ensemble des situations d’urgence d’origine chimique. Il est important de faire
une recherche unique, rapide et à l’aide d’informations disponibles sur le terrain.
Lorsque plusieurs bases de données sont consultées, des incohérences
peuvent apparaître entre les différences sources de données. Qu’il s’agisse
d’erreurs, de lacune dans les données ou de différences de référentiels, il est
indispensable de vérifier l’information.
Mode de recherche
Les bases de données comprennent des moteurs de recherches plus ou
moins évolués et complexes. La majorité des moteurs ne permettent qu’une
simple recherche par clé primaire6 ou par mots-clés comme l’outil développé
spécifiquement pour les REX de la CASU [Genoux et al., 2006]. Certaines bases
de données permettent des recherches étendues par intervalles ou listes de
valeurs
(pH ∈ [1-6],
couleur∈{ blanc, jaune, gris }).
Cependant,
pour
des
données qualitatives, la recherche de valeurs « proches » n’est pas possible ;
bien que la saisie de plusieurs valeurs possibles soit autorisée, la notion de
« degré de similitude » n’existe pas.
Recherche de REX similaires
6
Clé primaire : contrainte d'unicité qui permet d'identifier de manière unique un enregistrement dans
une table d’une base de données relationnelle.
38
Chapitre II
L’aide à la décision en situation d'urgence
Cette notion serait intéressante lors de la recherche de scénarios
d’accidents similaires pour évaluer les risques. Un retour d’expérience avec les
mêmes conditions et un produit chimique précis n’est peut-être pas disponible,
mais un scénario faisant intervenir un produit aux caractéristiques comparables
s’avérerait utile. Actuellement, il est nécessaire de faire appel à une personne
compétente, capable d’identifier les substances similaires et de faire ensuite
plusieurs recherches. Une telle recherche doit être étendue à d’autres critères. Il
faudrait pour cela s’appuyer sur une typologie de situations d’urgence pour
recenser les scénarios caractéristiques pour chaque type d’accidents, puis
développer une méthode de comparaison de scénarios à partir d’éléments flous.
Cette approche est utilisée notamment dans le domaine médical pour la
recherche automatique de cas similaires pour une aide préopératoire de cas de
scoliose [Chusseau et al., 2000].
Recherche inverse
Dans le cas des bases de données de substances chimiques, c’est une
possibilité
de
recherche
inverse
qui
s’avère
intéressante
pour
aider
à
l’identification. La quasi-totalité des bases de données nécessite de connaître la
substance chimique par son nom ou son numéro CAS ou sa formule par exemple.
Il n’est pas possible de faire une recherche inverse, une identification d’une
substance à partir des données opérationnelles. Seulement deux bases de
données ont été recensées comme disposant d’un mode recherche à partir de la
description et des propriétés du produit chimique, des symptômes observés chez
l’homme ou de la classification NFPA (si la signalisation est connue). Le
« Chemical Companion » développé par le Georgia Tech Research Institute
(GTRI) permet ce type de recherches parmi 130 substances chimiques. Le
logiciel WISER [NLM, 2005] présenté au paragraphe IV.2.2.1 offre également un
tel mode de recherche. En fonction des informations saisies (par exemple la
couleur du produit, son pH, et des effets sur la peau) WISER sélectionne tous les
produits satisfaisant à l’ensemble de ces critères.
Autres bases de données
D’autres bases de données sont utilisées par des outils d’évaluation des
conséquences et au cours d’études. Les données les plus utilisées sont les
données météorologiques de la région étudiée, l’état du trafic et des informations
sur les accidents de la route pour l’évaluation d’itinéraires, mais ces dernières
informations sont plutôt à considérer comme des SIG.
39
Chapitre II
II.3.3
L’aide à la décision en situation d'urgence
Systèmes d’Information Géographique (SIG)
Ces
l’utilisation
dernières
des
années
systèmes
ont
vu
un
d’information
développement
géographique
considérable
pour
l’étude
de
de
la
vulnérabilité et l’évaluation des conséquences. Les SIG sont sans aucun doute
une aide précieuse par la quantité d’informations centralisées, la sélection des
couches de données d’intérêt, la possibilité de croiser différents niveaux
d’informations et l’affichage spatialisé des résultats.
Cependant la collecte des informations à l’échelle d’une région est un travail
considérable. Les informations ne sont pas toujours faciles à obtenir, elles
doivent être standardisées, traitées et régulièrement actualisées car elles
peuvent varier rapidement en particulier celles touchant à la population.
Par ailleurs, ces méthodes sont souvent imprécises. Ainsi, les calculs de
densité de population à la surface de la commune ou au prorata de l’occupation
des sols ne sont pas assez précis. Dans [Tran Le Tam et al., 2005] une méthode
est utilisée pour déterminer la répartition de la population à partir de la base de
données BD TOPO de l’IGN, en utilisant le recensement général de la population
et couplé à un MNT pour déterminer la hauteur des bâtiments. Néanmoins,
l’absence de référencement de certains bâtiments (petits commerces, cinémas,
écoles, …) revient à les considérer comme des habitations et introduit des
erreurs d’évaluation de la densité de population.
Cette méthode permet d’évaluer la densité de population par habitation ;
valeur que l’on peut considérer représentative de la répartition pendant la nuit,
mais qui ne reflète pas la distribution en journée plus dense en zones
industrielles, commerciales et dans les transports. Cela n’est pas suffisant pour
l’application
à
l’évaluation
des
conséquences
d’un
accident
puisqu’il
est
nécessaire de connaître la répartition de la population à tout instant et cela
représente une difficulté majeure.
La plateforme SIBARIMAS propose une solution par le modèle PRET
(Population Réaliste dans l’Espace et le Temps) qui évalue la densité de
population dans les zones résidentielles qui peut être considérée comme une
répartition nocturne ; et diurne en déterminant la proportion de personnes qui se
déplacent et occupent les zones industrielles [Mallet et al., 2005]. Le trafic serait
représenté par un découpage des routes en tronçons accueillant une distribution
de cette proportion de population aux heures de pointes. Il n’y a plus une densité
de population, mais une série de « photographies » de la population à différentes
heures de la journée. Nous pouvons aussi citer [Caetano et al., 2005] qui adopte
la même approche consistant à définir plusieurs distributions dans le temps.
Dans [Leonelli et al., 1999] la distribution de la population suit les saisons. Il
40
Chapitre II
L’aide à la décision en situation d'urgence
existe d’autres approches essayant de modéliser dynamiquement le déplacement
de la population au sein d’une ville. Les méthodes multi-agents se prêtent bien à
ce genre de modélisation du « comportement » des individus.
Pour l’évaluation des conséquences, ces SIG doivent donc être couplés à
des modèles de calcul de flux. SIBARIMAS est une plateforme opérationnelle
combinant ces informations pour évaluer les conséquences d’un scénario
d’accident sur la population. Dans [Ioannidis et al., 1999] une plateforme
opérationnelle présente d’autres niveaux d’informations comme le réseau
hydraulique, les réseaux de transport et les types d’industries avec les stockages
de produits dangereux. La connaissance du réseau hydraulique permet d’évaluer
les conséquences d’une pollution. Les données sur les réseaux de transport sont
utilisées par un algorithme calculant en temps réel les itinéraires pour une
évacuation de la population. On peut envisager d’utiliser le même principe pour
l’acheminement des moyens de secours. On retrouve d’autres études d’utilisation
de SIG pour le calcul des voies d’accès en situation d’urgence, mais dans un but
préventif [Voiron-Canicio et al., 2005].
II.3.4
Calcul de flux dangereux
La connaissance du flux dangereux est une information des plus utiles
pour déterminer un zonage en fonction des caractéristiques de la substance
chimique (IDLH, VLE, VME, LIE, LSE, etc.).
L’approche classique pour calculer un flux dangereux est de réaliser une
modélisation du phénomène. La modélisation prédictive permet de recréer des
phénomènes réels afin de les étudier et de prévoir des résultats à partir de
l'application d'une ou plusieurs théories à un niveau d'approximation donné.
La modélisation des effets des phénomènes dangereux a deux objectifs.
Elle permet d’évaluer les distances d’effets demandées par la réglementation
dans une étude de dangers et de définir le zonage en situation d’urgence ou
encore évaluer les conséquences sur des cibles localisées. Elle permet également
de conforter des choix techniques (par exemple la conception d’un réseau de
capteurs - nombre et positionnement - d’une chaîne de détection de fuite afin
d’optimiser la cinétique de détection/réaction).
II.3.4.1 Estimation préétablie des distances
Les distances d’intérêt peuvent être déterminées au préalable pour un
nombre
limité
de
configurations
de
termes
sources,
de
conditions
météorologiques, d’environnement et de matières dangereuses. Pour chaque
41
Chapitre II
L’aide à la décision en situation d'urgence
paramètre du terme source, un nombre limité de valeurs sont retenues en
fonction de la sensibilité du modèle afin de couvrir l’ensemble des valeurs
significatives. De même, un nombre plus ou moins important de substances
chimiques représentatives sont choisies.
Les fiches réflexes donnent des distances à appliquer a priori dès le début
de l’intervention en attendant une meilleure analyse de la situation pour un
calcul mieux adapté.
•
Sans vent
•
Avec vent
•
Risque de BLEVE
R = 500 m
Figure 4 : Fiche réflexe – Distance de sécurité [SDIS 54, 1999]
Il existe d’autres alternatives comme l’utilisation de distance précalculées.
Le projet de recherche européen MITRA (Monitoring and Intervention for
the TRAnsportation of dangerous goods) qui s’articule autour des responsabilités
régionales de surveillance du transport de marchandises dangereuses en Europe
utilise des distances précalculées [Presutto, 2005]. Dans le projet MITRA, deux
valeurs sont retenues pour la vitesse du vent et trois types de couverture
nuageuse (ensoleillé, nuageux, brouillard), ainsi que la température extérieure et
les
classes
de
Pasquill,
qui
décrivent
assez
largement
les
conditions
météorologiques les plus courantes. La distinction est faite entre jour et nuit.
Chacun des cas a été simulé pour un nombre limité de neuf substances
chimiques à l’aide de modèles performants afin de déterminer les périmètres
utiles aux sapeurs-pompiers
42
Chapitre II
L’aide à la décision en situation d'urgence
Dans le projet MITRA, l’informatisation des résultats a permis de retenir un
grand nombre de situations. Dans le GMU du CANUTEC, l’approche est différente.
Le nombre de situations est limité en termes de paramètres du terme source
(deux valeurs de quantités inférieures ou supérieures à 200 litres) et la
distinction jour/nuit, mais appliqué à l’ensemble des substances chimiques de la
Base de données. La prise en compte des autres paramètres est faite par une
approche statistique. Pour chaque substance et pour chacune des quatre
configurations (jour/nuit x petit ou grand déversement) des milliers de fuites ont
été modélisées, en prenant les paramètres des données sur les incidents du
Hazardous Materials Incident Reporting System (HMIRS) du Département aux
Transports des États-Unis, de données atmosphériques réelles pour plus de 120
sites
aux
États-Unis,
au
Canada
et
au
Mexique,
afin
de
représenter
statistiquement les variations dans les quantités déversées ainsi que les
variations de conditions atmosphériques. Suite à cette analyse, les distances
résultantes ont été retenues afin de majorer 90 pourcents des incidents. En ce
qui a trait aux quantités déversées et aux taux d’émission, quatre facteurs ont
été pris en considération, à savoir :
-
la base de données du HMIRS du Département aux Transports des États-Unis,
-
le format autorisé des emballages utilisés pour le transport des marchandises
dangereuses sous le CFR 49 172.101 et 173,
-
les propriétés physicochimiques des matières impliquées
-
et les conditions atmosphériques d’une base de données historique.
II.3.4.2 Outils de simulation
Enfin, lorsque les données sur la source et l’environnement sont connues,
une modélisation plus fine peut être faite à l’aide de codes de calcul. De plus en
plus, ces codes de calcul permettant de résoudre les équations des modèles sont
intégrés à des logiciels de simulation disposant de bases de données de
substances chimiques et d’outils de visualisation pour afficher un périmètre, le
faire apparaître en surimpression sur une carte comme le proposent les logiciels
tels que CAMEO (Computer-Aided Management of Emergency Operations),
OSIRIS ou SAFER REAL-TIME (cf. Figure 5). Ce dernier disposant également d’un
SIG pour repérer les cibles potentielles.
43
Chapitre II
L’aide à la décision en situation d'urgence
Figure 5 : Trace au sol du panache – Logiciel SAFER Real Time
II.3.5
Evaluation des conséquences
L’évaluation des conséquences peut être réalisée par un rapprochement à
un REX comparable ou à un précalcul d’un scénario caractéristique ressemblant ;
mais ces informations nécessitent l’interprétation d’experts.
Plus généralement, les conséquences seront estimées en les considérant
comme le résultat de l’action d’un flux sur les cibles (humaines, matériels et
environnementales). En disposant d’un calcul du flux réalisé précédemment par
des modèles, il faut disposer en plus de la localisation et de la nature des cibles
potentielles.
Ces données sont rarement disponibles avec précision. Des études sont
réalisées en utilisant les densités de populations obtenues par extrapolation à
partir d’un découpage en zones (résidentielles, industrielles, rurales, …).
La plupart de ces études tiennent compte uniquement des cibles humaines
pour l’évaluation des conséquences.
44
Chapitre II
L’aide à la décision en situation d'urgence
II.4 Analyses des besoins en situation d'urgence
Pour identifier les besoins en termes d’aide à la décision lors d’une
situation d’urgence, nous pouvons nous référer aux études réalisées dans le
cadre de la CASU de l’INERIS. Toutes les demandes formulées auprès de la CASU
ont un objectif commun : obtenir des éléments permettant de faciliter la prise de
décision du demandeur.
La CASU fournit des prestations qui sont déclinées en trois catégories dans
la Circulaire du 15 juillet 20057 : informations sur la dangerosité de la substance,
renseignements sur l’accidentologie et estimation des effets. En tenant compte
de l’étude réalisée dans [Dolladille, 2002], lors de l’analyse des demandes
adressées à la CASU, nous aboutissons au classement suivant :
La transmission d’informations
-
Les informations demandées concernent essentiellement les substances
dangereuses (principaux risques, propriétés physico-chimiques…) et le retour
d’expérience (accidents similaires).
o
informations sur la dangerosité de la substance ou des réactions
chimiques directement incriminées (principaux risques, propriétés
physico-chimiques, etc.) ou celles qui sont susceptibles de se former au
cours de l’accident (produits de décomposition, composants des fumées
d’incendie, etc.) ;
o
renseignements
sur
l’accidentologie.
La
connaissance
d’événements similaires antérieurs qui constituent des points de
référence pour le décideur.
L’évaluation des conséquences
-
o
L’estimation des effets avant, pendant ou après la survenance du
phénomène et l’évaluation des effets immédiats ou différés sur
l’homme, des effets sur l’environnement (milieu naturel, bâtiments et
infrastructures).
Elle est demandée, dans une large majorité, pour connaître les effets
sur l’homme. Elle l’est beaucoup moins pour l’environnement mais il est
probable qu’elle devienne plus systématique dans le futur [Dolladille,
2002]. Par ailleurs, les demandes d’évaluation des risques concernent
aussi bien le domaine accidentel que chronique.
o
Le calcul de flux dangereux
Il peut être fait à l’aide de calculs numériques.
7
BOMEDD n° 05/19
45
Chapitre II
-
L’aide à la décision en situation d'urgence
Le conseil à l’intervention
Les demandes de conseil à l’intervention sont formulées pour des opérations
de lutte proprement dites, ou de mise en sécurité après un sinistre.
Lorsque l’on met en relation les demandes faites à la CASU et les moyens
existants d’aide à la décision, le manque se situe au niveau de la source dont
découle l’ensemble des aides à la décision (modélisation, évaluation des
conséquences, stratégie d’intervention, choix des matériels de protection, …).
L’évaluation des conséquences est possible en connaissant les cibles potentielles
et le flux impactant. Le calcul d’un flux généré par une explosion, une dispersion
ou un incendie fait intervenir plusieurs paramètres liés à la source du
phénomène, la nature du produit de réaction, l’environnement et la météorologie
(Cf. Figure 6).
Figure 6 : De la données à la décision
Un intérêt tout particulier est porté à l’évaluation du terme source et à
l’identification de la substance chimique car ce sont des paramètres nécessaires
à toute aide à la décision élaborée comme le calcul du flux et l’évaluation des
conséquences et que ces données peuvent manquer en situation d'urgence.
46
Chapitre II
II.4.1
L’aide à la décision en situation d'urgence
Identification de la substance chimique
La connaissance de la substance chimique est une information capitale en
situation d'urgence. Elle est nécessaire à l’utilisation des bases de données pour
obtenir différentes informations :
-
connaissance des risques associés aux produits impliqués (toxique, incendie,
explosion…),
-
connaissance des grandeurs physiques qui servent à quantifier ces risques
(seuils de toxicité, point éclair, domaine d’inflammabilité…),
-
connaissance des premières mesures à mettre en œuvre lors de l’intervention
(protection individuelle du personnel à engager, consignes de premiers
secours, règles de lutte contre le sinistre…).
Mais dans certains cas, il faudra admettre que les sources d’information se
montreront
inutilisables
formellement
la
car
substance
il
pourra
y
dangereuse.
avoir
« Si
impossibilité
dans
de
d’identifier
nombreux
cas,
l’identification de la substance chimique incriminée est aisée (réservoirs de gaz
ou de liquides, et unités de synthèse de produits chimiques soumis à la
réglementation ICPE…), dans d’autres elle se révèle plus problématique »
[Dolladille, 2001] :
-
Transport de matière dangereuse
La réglementation relative au TMD impose un certain nombre de
mesures qui permettent d’identifier les produits et leurs risques. Au niveau
du transport terrestre, le RID pour le fer et l’ADR pour la route, exigent
l’application de plaques signalétiques sur les wagons et les camions ainsi
que la présence de documents de bord. Au niveau du transport maritime le
code IMDG et MARPOL exigent des mesures similaires concernant
l’identification du vrac, des containers ou des colis.
Cependant,
il
est
fréquent,
lors
des
accidents
de
transport
de
marchandises dangereuses, que l’identification des produits impliqués ne
soit pas immédiate. Les raisons sont multiples. Parmi elles on peut citer :
o
l’absence de documents de bord,
o
le défaut de marquage,
o
la détérioration des plaques signalétiques par un incendie ou un
agent chimique,
o
l’incapacité de dialoguer avec le conducteur, soit parce qu’il est
victime de l’accident, soit parce qu’il est étranger,
o
l’impossibilité de pouvoir approcher la citerne ou le chargement
incriminé (présence d’un nuage de gaz ou de vapeur…),
o
l’effacement
des
indications
containers perdus en mer,
47
portées
sur
les
colis
ou
les
Chapitre II
-
L’aide à la décision en situation d'urgence
o
la difficulté à joindre l’armateur,
o
…
Entrepôts
Lorsque
les
entrepôts
sont
soumis
à
la
réglementation
des
installations classées, l’arrêté d’autorisation d’exploiter peut apporter des
informations sur la nature des produits stockés. De leur côté les
exploitants connaissent de façon plus ou moins précise la nature et les
quantités des marchandises entreposées dans leurs locaux. Cependant, il
est fréquent qu’en cas d’incendie, ces données soient difficiles à obtenir,
surtout pour les entrepôts qui abritent des marchandises de nature très
hétéroclite dont les rotations sont fréquentes (logistique, zone de fret et de
transit…).
-
Centres de collecte ou de traitement des déchets.
La problématique est similaire à celle des entrepôts en cas
d’incendie, mais la nature des déchets est encore plus fréquemment
méconnue, à l’exception des filières de récupération spécifiques.
La connaissance de la substance est donc indispensable à l’évaluation des
conséquences, mais cette information peut manquer dans certaines situations. Il
est donc important de définir s’il existe des méthodes ou de proposer une
méthodologie pour identifier la nature du ou des produits en réaction à partir des
données opérationnelles comme l’état, la couleur et l’odeur. « La nature du
produit : en général cette information ne pourra être donnée par l’appelant que
si lui-même est un professionnel (cadre de l’usine, chauffeur du camion,
secouriste professionnel sachant interpréter les panonceaux d’informations
apposés sur les réservoirs mobiles). Dans le cas contraire, on s’efforcera
seulement de recueillir des informations sur la couleur et l’odeur. » [Nemitz et
al., 2000].
Mais il sera très difficile identifier précisément un produit à partir
d’observations, car elles seront imprécises et en nombre faible par rapport à
l’imposante quantité de produits chimiques. Mais une telle précision n’est peutêtre pas nécessaire pour déterminer uniquement les paramètres utiles listés
précédemment : nature des risques possibles, paramètres de calcul d’effets et
réactions possibles.
48
Chapitre II
II.4.2
L’aide à la décision en situation d'urgence
Evaluation du terme source
Comme il a déjà était fait mention, le terme source doit être connu
précisément. « En effet, le phénomène physique qui en résulte (la dispersion
atmosphérique en l’occurrence) ne peut être correctement appréhendé si le
terme source n’a pas été bien évalué » [MEEDDAT-INERIS, 2006]. Cependant, en
situation d'urgence, il est rare que l’information disponible soit suffisante pour
envisager de faire un calcul de débit. On est alors dans l’impossibilité de définir le
terme source avec précision.
Cependant, pour parvenir à évaluer certains paramètres du terme source,
d’autres données peuvent se révéler utiles comme des mesures du flux en
différents points ou une estimation des conséquences observées. Cela consiste
alors, dans ce cas, à résoudre un problème inverse puisqu’il s’agit de remonter à
la source à partir des conséquences observées ou mesurées. L’évaluation du
terme source peut se révéler utile pour l’ensemble des phénomènes pouvant
survenir, qu’il s’agisse de dispersions atmosphériques, d’explosions ou de feux.
II.4.3 Imprécision et incertitude des données opérationnelles
Enfin, un des aspects importants à prendre en compte est le côté imparfait
des données opérationnelles. L’insuffisance, voire l’absence, l’imprécision et
l’inexactitude sont inhérents à la collecte et la transmission des informations en
provenance du terrain. « L’inexactitude des informations parvenant à l’INERIS
peut s’avérer aussi problématique que leur absence. La vision erronée qu’elles
donnent de la situation, à des personnes qui sont coupées du terrain, conduit à
fournir une réponse totalement inadaptée par rapport aux événements qui se
produisent réellement. » [Dolladille, 2002]
Ce côté imprécis et incertain des données opérationnelles doit être
appréhendé lors de la conception des méthodologies d’aide à la décision. Ce sera
un critère permettant de discuter l’adéquation des méthodes d’aide à la décision
à une utilisation en situation d'urgence.
49
Chapitre III
Les méthodes d’aide à la décision
CHAPITRE III
LES METHODES D’AIDE A LA DECISION
III.
Aider à la décision, c’est apporter l’information qui autorise une
appréciation plus sûre du champ des possibles et une anticipation
plus correcte des résultats susceptibles de découler des actions
projetées.
En théorie de la décision, les méthodes multicritères d’aide à la
décision apparaissent souvent comme une solution séduisante.
Permettant de donner une préférence à chaque décision possible
envisagée en tenant compte de plusieurs critères ou points de vue,
les méthodes multicritères sont adaptées à de nombreux problèmes
de décision.
Après une présentation des grands principes des méthodes
multicritères, nous nous intéresserons à une autre méthode d’aide à
la décision permettant de construire des règles de décisions à partir
de données expertisées : les arbres de décision.
50
Chapitre III
Les méthodes d’aide à la décision
III.1 L’aide à la décision multicritère
III.1.1 Généralités sur l’aide à la décision multicritère
Dans ce cadre d’étude, le système d’aide à la décision ne sert pas à
évaluer la meilleure décision ou stratégie comme c’est souvent le cas. La décision
reste du ressort du poste de commandement.
Notre objectif se situe en amont, avant la stratégie à employer, il s’agit de
caractériser la situation et de mieux identifier la source.
L’aide à la décision multicritère peut s’appliquer à l’identification du produit
chimique, à la comparaison de REX ou à l’évaluation d’hypothèses sur le terme
source. Il s’agit alors de méthodes permettant de vérifier la véracité d’un
ensemble d’hypothèses correspondant aux informations utiles aux décideurs et
aux données nécessaires aux modèles.
« L’aide multicritère à la décision vise, comme son nom l’indique, à fournir à un
décideur des outils lui permettant de progresser dans la résolution d’un problème
de décision où plusieurs points de vue, souvent contradictoires, doivent être pris
en compte. » [Vincke, 1989]
Les progrès dans le domaine de la technologie de l’information mettent à
disposition d’importantes quantités de données pouvant alimenter le processus
d’aide à la décision. Mais cela pose de nouveaux défis car il faut pouvoir traiter
ces données rapidement et efficacement en développant des outils pour
permettre des recherches, tris, affichages et autres traitements. L’aide à la
décision à ce niveau peut s’illustrer par une procédure automatique, comme les
algorithmes utilisés dans certains domaines effectuant la recherche de retour
d’expérience similaire au cas traité [Chusseau et al., 2000]. L’automatisation de
cette tâche nécessite de pouvoir comparer les cas entre eux, ce qui peut être
trop complexe, voire impossible.
Les grands principes des méthodes multicritères sont détaillés dans [Merad,
2003] avec une approche générale en trois phases :
-
la formulation du problème (description du contexte et processus
décisionnel, construction des actions, identification des situations de
décision et élaboration des critères),
-
l’exploitation qui consiste à trouver une procédure d’agrégation des
informations,
-
et la phase de recommandation comprenant une analyse de sensibilité et
de robustesse entraînant si besoin une nouvelle itération du processus.
51
Chapitre III
Les méthodes d’aide à la décision
Nous privilégierons pour l’explication des différentes méthodes, un découpage en
trois principales étapes qui s’applique à tout domaine et contexte.
-
Lister les hypothèses à vérifier (ou les actions potentielles).
-
Lister les critères à prendre en considération, ceux permettant la
comparaison des différentes hypothèses (ou actions).
-
Evaluer ces différentes possibilités à l’aide d’un ou plusieurs critères pour
proposer la ou les meilleures solutions.
La deuxième étape consistant à lister les critères peut être décomposée en deux
étapes plus explicites [Ben Mena, 2000] :
-
Dresser la liste des critères à prendre en considération.
-
Et établir le tableau des performances de ces critères pour chaque action.
Cette notion de performances est expliquée ci-dessous, dans la deuxième étape.
La première étape consistant à lister les hypothèses peut être implicite
lorsqu’il n’y a qu’une hypothèse et un résultat binaire (Cette zone est-elle à
risque ?) ou que les possibilités sont contraintes par le contexte (Choix d’un
candidat parmi les postulants). Pour des cas plus complexes, une étude est
souvent nécessaire pour définir la liste des actions possibles la plus
exhaustive et ce travail fait souvent appel à l’aide d’un ou plusieurs experts.
L’ensemble est défini en extension par énumération des actions lorsque ceci
est envisageable ; dans le cas où l’ensemble est trop grand, voire infini, il est
défini par compréhension en passant par des propriétés caractéristiques ou
des contraintes mathématiques [Vincke, 1989].
Ensuite, il s’agit de recenser les critères qui vont permettre d’évaluer les
différentes hypothèses. Ces critères sont des « indices » que l’on peut
rattacher à un ensemble restreint d’hypothèses.
Essentiellement, deux approches ont été proposées pour construire une
famille de critères :
-
L’approche descendante qui consiste à partir de l’objectif global et à le
décomposer en sous objectifs ; et ainsi de suite jusqu’à obtenir des
attributs mesurables.
-
La deuxième approche, dite du « bas vers le haut » consiste à identifier
toutes les indicateurs élémentaires et à les structurer en axes de
signification autours desquels on construit les critères.
Les méthodes multicritères nécessitent de définir un degré d’importance entre
les différents critères qu’il soit général (théorie de l’utilité multiattribut) ou
non. Cette « pondération » (hiérarchisation) peut être le résultat d’un
apprentissage
sur
un
certain
nombre
de
cas
(importance
du
retour
d’expérience) ou être définie par un groupe d’experts. Dans [Mendoza et al.,
52
Chapitre III
Les méthodes d’aide à la décision
2000] plusieurs méthodes sont comparées pour évaluer l’importance de
critères et les classer d’après des avis d’experts. [Purnomo et al., 2005]
utilisent un modèle symbolique basé sur la méthode NIAM/ORM pour
formaliser les connaissances des experts. La méthode des cartes de Simos est
utilisée dans [Merad et al., 2004] pour la fusion d’avis d’experts sur
l’importance des critères. Les « poids » ainsi calculés sont alors utilisés par la
méthode de surclassement multicritère ELECTRE-TRI.
Cette évaluation des différentes hypothèses constitue la dernière étape qui
vise à déterminer la ou les meilleures solutions compte tenu du contexte et
des informations disponibles ou encore à ordonner les différentes solutions.
Le domaine de l’aide multicritère à la décision s’est considérablement
développé depuis les années 70 et les procédures multicritères sont
nombreuses et ne conduisent pas nécessairement à la même solution.
« L’aide multicritère à la décision va de pair avec la quête non pas d’une
vérité mais d’un mode d’insertion dans un processus de décision pour y
apporter des éclairages, des éléments de réponse à des questions dont la
formulation peut être plus ou moins confuse et évolutive. » [Roy, 1975]
La méthode de sélection la plus simple consiste à ramener chaque choix
possible à un coût, à une valeur numérique facilitant la comparaison. Ce coût
peut être directement l’un des critères (nombre de victimes) ou être un
critère de synthèse qui est le résultat d’une fonction combinant l’ensemble
des critères. La difficulté réside alors dans le choix de la fonction. Il existe des
méthodes dont le mécanisme n’est pas de ramener chaque choix à un coût
comme les méthodes de surclassement.
Les méthodes peuvent aussi être différenciées par leur mode de
déroulement. Les méthodes les plus répandues fournissent un résultat issu
d’un calcul déterministe tandis que les méthodes interactives alternent les
étapes de calcul et les étapes de dialogues destinées à obtenir des nouvelles
informations de la part des décideurs en réaction aux solutions proposées.
III.1.2 Différentes approches
Ces méthodes peuvent être réparties en trois grandes familles :
1) La théorie de l’utilité multiattribut (courant anglo-saxon), qui consiste
à calculer un critère unique de synthèse permettant de comparer les
différentes décisions possibles. [Gérard-Varet et al., 1976] l’interprètent
comme la « traduction numérique de la description qualitative du choix
contenue dans la définition de la structure de préférence ». Ensuite,
l’évaluation de chaque solution (ou action) revient à maximiser une
53
Chapitre III
Les méthodes d’aide à la décision
fonction qui intègre tous les points de vue à prendre en compte. Ces
méthodes sont possibles uniquement avec l’hypothèse qu’il existe une
fonction d’utilité mettant en relation les différents critères.
La forme la plus utilisée est le modèle additif qui est le plus simple
analytiquement : la fonction d’utilité est une moyenne pondérée des
différents critères. Il existe de nombreuses méthodes qui différent
notamment par les conditions d’agrégations des critères, les formes des
fonctions d’utilité et les méthodes de construction de ces fonctions.
Dans [Zoller et al., 1992], les techniques monocritères sont divisées en
trois familles :
o
La première famille est celles des méthodes d’analyse avantages-coûts
(cost benefit analysis).
o
La
deuxième
famille
s’appuie
sur
la
théorie
de
l’utilité
multidimentionnelle.
o
Et
enfin,
il
existe
aussi
des
« techniques
de
programmation
mathématique » comme le « goal programming ».
Les principales méthodes sont : MAUT, SMART, UTA, TOPSIS, AHP et G.P.
SAATY.
Mais toutes ces méthodes reposent sur l’hypothèse forte de l’existence
d’une fonction d’utilité ce qui implique qu’il n’y a ni incomparabilité, ni
intransitivité entre les différentes solutions.
Calcul d’un coût pour l’évaluation des conséquences
Pour l’évaluation des conséquences de scénarios d’accident, aucune
méthode calculant un critère de synthèse n’a été recensée. Plusieurs
critères peuvent être calculés, mais ils ne sont pas « directement »
comparables (enjeux économiques, vies humaines, …) et ce sont aux
experts de se faire leur opinion à partir de ces valeurs, que ce soit un
critère tenant compte de l’ensemble des conséquences ou se limitant aux
cibles humaines. Comme signalé dans [Giampiero E.G. Beroggi et al.,
1997], la probabilité de décès est le paramètre le plus important dans
l’évaluation des conséquences.
[Leonelli et al., 1999] restreint les conséquences aux cibles humaines
(blessures légères, graves et létales) et le seul critère retenu au final pour
l’évaluation du risque est le nombre de décès. Dans [Egidi et al., 1995]
également, le seul critère retenu est le nombre de décès potentiel pour des
raisons de simplification.
54
Chapitre III
Les méthodes d’aide à la décision
Cela simplifie la prise de décision car l’unicité du critère rend triviale la
comparaison des différents scénarios. De plus, la cible considérée est
unique, cible humaine, ce qui diminue les calculs de modélisation
puisqu’on ne tient pas compte des effets des flux sur les matériels et
l’environnement.
L’évaluation peut être réalisée sur l’ensemble des critères avec une
acceptation uniquement si tous des critères satisfont une condition comme
une valeur seuil (utilisation dans un cadre réglementaire : détermination
d’un site à risque).
Il peut s’agir d’une comparaison monocritère avec utilisation du critère
suivant en cas d’égalité. Cela sous-entend de classer les critères par ordre
d’importance (blessure létale > blessure grave > blessure légère > … >
dégâts matériels > …).
Ces méthodes monocritères sont attrayantes car, lorsqu’il est possible de
les utiliser la prise de décisions devient triviale. En effet, si l’on suppose
l’existence d’une fonction d’utilité, le problème est dit « bien posé » et
connaître une telle fonction conduit facilement à calculer un ordre total de
l’ensemble des solutions.
Cependant bien qu’il s’agisse d’un problème « bien posé » au sens
mathématique, on ne peut affirmer qu’il est bien formulé et qu’il
correspond à la situation car il repose sur des conditions fortes :
transitivité et comparabilité de l’ensemble des critères.
Comme le mentionne J.-M. Martel : « Nombreuses sont les situations
concrètes où les conséquences sont suffisamment complexes pour qu’une
seule
fonction
objectif
(un
seul
critère)
ne
puisse
appréhender
adéquatement toute l’information nécessaire à la comparaison globale des
actions (projets, options, scénarios…). » [Martel, 1999].
Les approches monocritères ne seront pas détaillées d’avantage car elles
ne sont pas des mieux adaptées à l’analyse et l’identification de données
en situations d’urgence (terme source par exemple). En effet, les critères
disponibles en situation d’urgence ne sont pas tous comparables, il n’existe
pas d’échelle universelle permettant de comparer l’ensemble des critères.
De plus, certains critères ne peuvent être associés à une valeur
numérique.
55
Chapitre III
Les méthodes d’aide à la décision
2) Les méthodes de surclassement : Ce concept fondé par B. Roy consiste
à passer d’une relation de comparaison établie sur chaque critère à une
relation de comparaison globale.
Définition (Roy, 1974) : « Une relation de surclassement est une relation
binaire S définie dans A telle que aSb si, étant donné ce que l’on sait des
préférences du décideur et étant donné la qualité des évaluations des
actions et la nature du problème, il y a suffisamment d’arguments pour
admettre que a est au moins aussi bonne que b, sans qu’il y ait de raison
importante de refuser cette affirmation ». (A étant l’ensemble des
décisions)
En plus de définir les préférences entre les différentes solutions deux à
deux, certaines méthodes introduisent des seuils de discriminations
(préférence, indifférence) et même de veto, pour chacun des critères afin
de modéliser localement les choix du décideur.
Les principales méthodes ou familles de méthodes sont : ELECTRE,
PROMETHEE, ORESTE, QUALIFEX.
3) Les méthodes interactives ou méthodes d’agrégation locale alternent
les étapes de calcul et les étapes de dialogues avec les décideurs destinées
à obtenir une préférence locale en réaction à la solution proposée. Il ne
s’agit pas comme pour les deux autres approches, d’utiliser des règles
explicitées pour apporter une réponse synthétique globale.
L’un des intérêts de cette approche est qu’elle peut s’appliquer lorsque le
nombre de choix possibles est très grand voire infini. La technique
consiste, à partir d’une première solution aussi bonne que possible, à
étudier
itérativement
les
solutions
proches
qui
pourraient
s’avérer
meilleures. Chaque itération peut se décomposer en trois phases [Roy,
1975] :
o
Une phase de recherche au cours de laquelle il s’agit d’exploiter les
informations recueillies à l’itération précédente afin de mieux définir les
préférences du décideur.
o
Une
phase de
réinitialisation qui consiste
à utiliser toutes
les
informations disponibles pour élaborer une nouvelle proposition à
soumettre aux décideurs.
o
Une phase de réaction où le décideur émet un avis sur la dernière
proposition, fournissant ainsi de nouvelles informations pour l’itération
suivante.
Ces trois familles de méthodes sont encore appelées par B. Roy, approche du
critère de synthèse évacuant toute incomparabilité, approche du surclassement
56
Chapitre III
Les méthodes d’aide à la décision
de synthèse acceptant l’incomparabilité et approche du jugement local interactif
avec
itération
essai-erreur,
tandis
que
A. Schärlig
parle
de
méthodes
d’agrégation complètes, partielles ou locales [Schärlig, 1985].
III.1.3 Conclusions sur les méthodes multicritères
Ces méthodes, par le calcul d’un critère unique ou par des mécanismes de
comparaisons globales, permettent de sélectionner un ou plusieurs choix comme
étant les meilleurs compte tenu du contexte et des informations disponibles.
Cette hiérarchisation des choix possibles constitue en elle-même la prise de
décision. Leur intérêt apparait, en particulier, dans le cas non trivial, où les choix
possibles ne constituent pas un pré-ordre total.
La première critique à l’utilisation des méthodes multicritères en situation
d’urgence est la complexité des situations qui rend difficile les phases
d’énumération des actions potentielles et des critères à prendre en considération.
De plus, « une action envisagée est un moyen qui s’apprécie en fonction
du résultat attendu avec raison ou non par rapport aux aspects pertinents du
problème. » [Zoller et al., 1992]. La préférence est déterminée par rapport aux
conséquences espérées, pour déterminer quelles actions entreprendre. Mais en
situation d'urgence il règne une forte incertitude quant aux conséquences des
actions entreprises. La principale difficulté est de lever cette incertitude.
III.2 Les arbres de décision
III.2.1 Généralités sur les arbres de décision
Développées autour de 1960, ces méthodes ont été utilisées pour des
problématiques d’analyse discriminante [Belson, 1959; Friedman, 1977] et de
régression [Morgan et al., 1963]. « Délaissées par les statisticiens, elles ont
connu un regain d’intérêt avec les travaux de Breiman & al. (1984) qui en ont
renouvelé la problématique. Elles sont devenues un des outils les plus populaires
du data mining ou fouille de données en raison de la lisibilité des résultats. »
[Saporta, 2006]
Les arbres8 de décisions sont une technique non paramétrique capable de
déterminer, parmi un ensemble complexe de variables, celles qui sont les plus
importantes ainsi que leurs interactions pour expliquer une variable à analyser.
8
Arbre : Un graphe non-orienté G = (X,E) est un arbre s’il est connexe sans cycle. Il
comporte un sommet particulier appelé racine. Les sommets de degré égal à 1 sont
appelés feuilles. Les autres sommets sont les nœuds.
57
Chapitre III
Les méthodes d’aide à la décision
Les arbres de décision permettent, en effet, de faire intervenir un
ensemble complexe de variables descriptives (descripteurs) pour créer des
groupes homogènes d’individus en cherchant à maximiser ou à minimiser au sein
des groupes la fréquence d’une même valeur de la variable à expliquer. Ils
permettent d’identifier les variables descriptives les plus pertinentes (les plus
discriminantes).
De ces arbres, il est possible d’extraire des règles de décision permettant
de prédire la variable à expliquer.
Ces méthodes sont également capables de prédiction, calcul de valeur ou
discrimination. Après une phase d’apprentissage au cours de laquelle un arbre a
été construit à partir d’exemples supervisés, il peut être utilisé pour discriminer
de nouveaux exemples. L’arbre de segmentation utilise alors la description des
nouveaux pour lui associer une classe. Chaque nœud de l’arbre correspond à un
descripteur et les branches correspondent aux valeurs possibles. De la sorte, en
suivant une séquence de nœuds et de branches depuis la racine jusqu’à une
feuille, on affine progressivement la description des individus jusqu’à obtenir une
description
correspondant
aux
individus
d’une
classe.
Chaque
branche
correspond à une conjonction de conditions sur les descripteurs des individus.
Une classe ne correspond pas toujours à un unique chemin de la racine à une
feuille. Dans ce cas, les individus de cette classe sont ceux qui suivent au moins
l’un de ces chemins. La règle de décision prend alors la forme d’une disjonction
de conjonctions de conditions.
L’objectif de la segmentation est d’expliquer la partition connue sous forme
de K classes à l’aide de prédicteurs décrivant les objets.
Les arbres peuvent être utilisés pour prédire une variable quantitative
(arbres de régression) ou qualitative (arbres de décision, de classification, de
segmentation) à l’aide de prédicteurs quantitatifs ou qualitatifs. Le terme de
partitionnement récursif est parfois utilisé [Saporta, 2006]
A la distinction faite en fonction de la variable à expliquer s’ajoute le type
de division suivant qu’elle est binaire ou n-aire.
Graphe non-orienté : Un graphe non-orienté est un couple (X,E) où X est un ensemble
de sommets et un ensemble E d’arêtes qui est inclus dans P² (X) (ensemble des parties à
deux éléments de X).
Cycle : un cycle est une chaine fermée : une suite d’arêtes µ={x1,…xk} telles que (xi,xi+1)∈E
pour i∈{1,…,k-1} sans répétition d’arêtes et avec x1=xk
58
Chapitre III
Les méthodes d’aide à la décision
Hiérarchisation des critères
L’arbre de segmentation introduit une hiérarchisation des critères (Figure 7).
Les critères proches de la racine ont plus d’importance que ceux qui en sont
éloignés. Dans le cas des arbres de segmentation, plus un critère est proche de la
racine et plus il est discriminant vis-à-vis de la population totale.
Figure 7 : Arbre de segmentation avec hiérarchisation des critères
Hiérarchie de concepts
Ces arbres de segmentation n’introduisent pas de hiérarchie des concepts
comme il existe dans certains domaines comme la taxonomie des espèces (Figure
8).
Figure 8 : Arbre de segmentation avec hiérarchisation des concepts
III.2.2 Développement d’un arbre binaire
Formulation du problème
Soit Ω la population composée d’individus xi, pour laquelle on connait a
priori une partition en K classes Cj (K=2). Chaque individu est décrit par p
59
Chapitre III
Les méthodes d’aide à la décision
descripteurs notés yj. La valeur d’un individu xi pour le critère yj est notée yj(xi). sa
classe est notée C(xi).
Principe de l’algorithme
Le procédé consiste à la première étape à diviser l’échantillon Ω en deux
sous ensembles ΩT, ΩF à l’aide d’un des prédicteurs yj*. Ensuite, la division est
réitérée séparément dans chaque sous-ensemble et ainsi de suite. Pour chaque
variable explicative, il faut donc trouver la meilleure partition de ses valeurs ou
modalités en deux sous-ensembles selon un critère d’explication de yj*.
Il s’agit donc d’une classification descendante à but prédictif opérant par
sélection de variables : chaque classe doit être la plus homogène possible vis à
vis de yj*. Partant de l’ensemble on cherchera à le diviser en deux sousensembles d’effectifs n1 et n2 tels qu’en moyenne on améliore le plus possible
l’homogénéité des deux classes.
Algorithme récursif de construction d’un arbre de segmentation binaire
Soit
Ω : La population de X individus notés xi avec i∈[1..X]
Ψ : L’ensemble comprenant un nombre Y de descripteurs yj
Construction_Arbre_de_Segmentation ( Ω , Ψ )
1 : Recherche du meilleur descripteur yc* (au sens du critère de division - Cf.
Note 2)
Test toutes les divisions possibles ∀c∈[1.. Y] (Cf. Note 1)
2 : Calcul des deux partitions obtenues par division selon yc*
ΩT={ xi∈Ω / yc*( xi)=1 }
ΩF={ xi∈Ω / yc*( xi)=0 }
3 : La procédure est répétée sur les deux partitions obtenues pour construire les
sous-arbres
Construction_Arbre_de_Segmentation( ΩT , Ψ - yc* )
Construction_Arbre_de_Segmentation( ΩF , Ψ - yc* )
4 : Conditions d’arrêt
La construction du sous-arbre s’arrête :
- Lorsque la taille inférieure de l’effectif d’une partition est atteinte.
60
Chapitre III
Les méthodes d’aide à la décision
- Lorsque la borne inférieure du seuil de similarité d’une partition est
atteinte.
- Lorsque tous les descripteurs ont déjà servi à faire une division. Dans ce
cas, au moins un sous-ensemble final comporte des individus qui ne sont
pas homogènes.
Note 1 : Division par rapport à la valeur d’un descripteur
Le nombre de divisions en deux sous-ensembles que l’on peut réaliser à
l’aide d’un prédicteur (et que l’on doit donc examiner pour choisir la meilleure)
dépend de la nature de ce prédicteur.
-
Si x est qualitatif ordinal à m modalités et que les coupures doivent respecter
l’ordre, il n’y a m-1 dichotomies.
-
Il en est de même si x est numérique à k valeurs distinctes, il y a k-1
dichotomies ou coupures possibles entre deux valeurs.
-
Si x est qualitatif nominal à m modalités non ordonnées, il y a 2m-1 –1
dichotomies possibles. En présence d’un prédicteur qualitatif à m modalités,
une autre solution consiste à construire des arbres non binaires en découpant
en m sous ensembles. En général, cette approche n’est pas bonne car, avec m
trop grand par rapport à l’échantillon, elle conduit à des subdivisions avec
trop peu d’observations et souvent non pertinentes. L’intérêt des arbres
binaires est de pouvoir regrouper les modalités qui ne se distinguent pas vis à
vis de y.
Note 2 : Critère de division
Pour déterminer le descripteur suivant lequel sera faite la division, une
mesure d’impureté des sous-ensembles vis-à-vis des classes est réalisée. Cette
mesure doit être nulle si tous les individus appartiennent à la même classe,
maximale si les classes sont également représentées. Les mesures les plus
usuelles sont l’entropie E et l’indice de Gini G [Saporta, 2006].
E =
∑
nk .  n k . 
ln 
 n 
k =1 n
Eq. 1
G =
nk .  nk . 
1 −  , G ∈ [0;1]
n 
k =1 n 
Eq. 2
K
K
∑
S’écrivant encore : G = 1 −
K
nk .
∑( n )
2
k =1
Avec K le nombre de classes et
61
nk .
la fréquence de la classe d’indice k
n
Chapitre III
Les méthodes d’aide à la décision
Plus G est faible et plus le nœud est pur.
L’indice de Gini est utilisé dans la méthode CART (Classification And
Regression Tree) dont une vue d’ensemble théorique et méthodologique est
détaillée dans [Breiman et al., 1984]. Pour une présentation de l’algorithme de
construction d’un arbre de segmentation avec la méthode CART, complétée
d’exemples, se reporter à [Yohannes et al., 1999a; Yohannes et al., 1999b]
Il existe d’autres critères comme « Twoing » notamment utilisé dans le logiciel
Matlab et le test du χ 2 de Fisher utilisé dans la méthode CHAID (Chi-square
Automatic Interaction Detection) mise au point par Kass (1980).
n ×n 

n − k . .l 
K
L  kl
n 
χ 2 = ∑∑ 
, χ 2 ∈ [0;+∞]
n
×
n
k.
.l
k =1 l =1
n
2
Eq. 3
Le lecteur intéressé trouvera un tutorial sur la méthode CHAID dans
[Rakotomalala, 2005]. Les méthodes CHAID et CART sont implémentées dans le
logiciel StatBox Pro de Grimmer Soft. L’aide en ligne donne des indications sur
ces deux méthodes [Grimmer Soft, 2003]. A noter qu’il existe également
d’autres méthodes, notamment ID3 utilisant l’indice de Twoing [Quinlan, 1986].
L’utilisation
des
critères
de
division
en
fonction
de
l’application
(classification, régression, …) est discutée dans [Leland, 1992]. Dans la suite de
ce mémoire, les arbres de décision sont destinés au traitement de données
binaires.
III.2.3 Arbre binaire à variables binaires
Pour le cas particulier des arbres binaires dont la variable à expliquer est
binaire ainsi que les descripteurs, la construction de l’arbre s’en trouve simplifiée.
A chaque nœud, le descripteur étant binaire, la division est unique. D’une
part l’ensemble des individus vérifiant le descripteur xy*=1 (la substance chimique
flotte) et d’autre part ceux qui ne le vérifient pas xy*=0 (la substance chimique
coule).
Lorsqu’il n’y a que deux modalités en proportions p et 1-p l’indice de Gini
vaut 2p(1-p) et a un comportement très proche de l’entropie [Saporta, 2006] et
les indices de Gini et de Twoing sont équivalents [Maimon et al., 2005].
62
Chapitre III
Les méthodes d’aide à la décision
III.2.4 Conditions d’arrêt et élagage
Pour les méthodes CART, CHAID, ainsi que toutes méthodes descendantes
(en distinction des méthodes ascendantes telles que les CAH), se pose le
problème de savoir où arrêter la construction de l’arbre. Faut-il s’arrêter lorsque
chaque feuille de l’arbre constitue un groupe homogène devant y ou qu’il n’y ait
plus de critères permettant d’améliorer la segmentation ? Le nombre de nœuds
terminaux croit exponentiellement avec le niveau de l’arbre et il est nécessaire
de fixer des limites, sinon l’arbre est trop grand et inutilisable car s’ajustant trop
bien aux données d’apprentissage.
L’un des intérêts des arbres de segmentation est de proposer, au final, une
méthode de décision (ou de classification). Mais, construire un arbre « complet »
peut permettre une bonne discrimination de l’ensemble d’apprentissage (de
l’échantillon ayant servi à sa construction), mais se révéler trop spécialisé et ne
pas être capable de généraliser l’ensemble des possibles (d’être applicable à
l’ensemble des éléments hors ensemble d’apprentissage).
De même que d’autres méthodes comme les réseaux de neurones, les
arbres de décisions construits sur un ensemble d’apprentissage tendent à se
spécialiser, à apprendre par cœur et perdent de leur pouvoir de généralisation.
Pour éviter d’avoir des arbres de décision trop spécialisés, plusieurs approches
existent. La profondeur de l’arbre peut être définie arbitrairement. Mais cela ne
garantit en rien la représentativité de l’arbre. Cette limitation de l’arbre
n’intervient
que
pour
améliorer
la
lisibilité
et
la
recherche
de
critères
discriminants aux premiers étages de l’arbre. Une autre solution consiste à
ajouter un test statistique pour stopper la division de l’arbre. On parle alors de
pré-élagage. C’est la solution adoptée par la méthode CHAID qui peut
interrompre la construction de l’arbre en fonction du test d’indépendance du χ 2
utilisé pour vérifier l’homogénéité des classes. Mais ces tests statistiques
nécessitent l’emploi de seuils arbitraires d’où les nombreuses critiques à leur
égard. Avec les travaux de [Breiman et al., 1984] une nouvelle approche voit le
jour pour devenir la plus répandue. La méthode CART consiste à ne plus fixer de
seuil mais à diviser les données en deux ensembles disjoints, l’un destiné à
l’apprentissage et l’autre à la validation. En premier, l’arbre complet est construit
lors de l’apprentissage. Ensuite une phase de post-élagage est réalisée sur un
ensemble de validation pour déterminer les sous-arbres terminaux devant être
supprimés et éviter ainsi la spécialisation de la méthode d’identification.
63
Chapitre III
Les méthodes d’aide à la décision
III.2.5 Un arbre non optimal
L’algorithme de construction de l’arbre présenté en III.2.2 ne permet pas
de trouver la solution optimale en termes de complexité de l’arbre obtenu
(nombre de nœuds et nombre de critères nécessaires). La complexité du
problème étant NP-complet9, l’algorithme de construction est une heuristique de
complexité maximum O(C) = C × X × D avec
C le nombre de critères, X le
nombre d’individus et la population et D le nombre de dichotomies possibles.
Pour des critères binaires la complexité est O(C) = C × X .
Ne pouvant tester l’ensemble des solutions, l’heuristique consiste à limiter
le nombre de combinaisons en n’effectuant qu’une recherche locale des critères
discriminants.
L’exemple suivant réalisé avec des données fictives (Tableau 4), illustre ce
problème en exhibant d’une part la solution obtenue avec les méthodes
classiques (Figure 9) et d’autre part la solution optimale (Figure 10).
Le critère n°1 est le plus discriminant (plus fort χ 2 ) si l’on effectue une
recherche
locale,
cependant
les
critères
n°2
et
n°3
sont
parfaitement
complémentaires et, combinés, deviennent plus discriminants que le premier. Il
existe donc un arbre plus intéressant en nombre de critères que celui obtenu par
les méthodes classiques (CHAID, CART, …)
Tableau 4 : Exemple fictif illustrant la construction d’arbre non optimal
Individus Classe
1
2
3
4
5
6
7
8
9
10
11
χ2
9
A
A
A
A
A
B
B
B
B
B
B
Critère
Critère
Critère
n°1
n°2
n°3
1
1
0
0
1
0
1
1
0
0
0
1
1
0
1
0
1
1
1
1
1
0
1
1
1
0
0
0
0
0
0
0
0
1,45455 0,54545 0,54545
Problème NP-complet : Problème dont la recherche de la solution optimale nécessite de tester un
nombre exponentiel de solutions par rapport à la taille de l'instance.
64
Chapitre III
Les méthodes d’aide à la décision
Figure 9 : Arbre de segmentation (méthodes CHAID)
Figure 10 : Arbre de segmentation optimal
65
Chapitre III
Les méthodes d’aide à la décision
III.2.6 Conclusions sur les arbres de décision
Il existe différentes méthodes pour calculer des arbres de décision. Le
principal avantage est l’extrême lisibilité qui fait que tout utilisateur peut
comprendre et utiliser un arbre. Parmi les autres avantages figure le fait de
pouvoir utiliser des prédicteurs de toute nature, de ne faire aucune hypothèse
sur leurs distributions, de hiérarchiser et sélectionner les prédicteurs. Enfin, la
construction de la règle de décision est triviale à partir de tels arbres (binaires ou
n-aires).
Malgré cela, les inconvénients ne sont pas négligeables : les arbres sont
instables : de légères variations dans les données peuvent conduire à d’autres
choix de nœuds qui deviennent irréversibles puisque chaque division détermine
les autres [Saporta, 2006]. Les arbres ne peuvent être utilisés qu’avec de grands
échantillons de plusieurs centaines ou milliers d’observations.
66
Chapitre IV
Identification des substances chimiques
CHAPITRE IV
IDENTIFICATION DES SUBSTANCES CHIMIQUES
IV.
Guide de lecture :
Les urgentistes sont parfois confrontés à un problème de taille
lorsque la substance chimique en cause n’est pas identifiée. Et les
CMIC ne disposent pas toujours du matériel nécessaire à son
identification, alors que la connaissance de la substance chimique
apporte des informations indispensables à la bonne conduite de
l’intervention.
La première partie de ce chapitre propose un rapide tour d’horizon
des technologies utilisées par les matériels portables de détection et
d’identification des substances chimiques. La faible diffusion au
sein des CMIC de matériels de pointe tels que les spectromètres,
constitue une limite à leur capacité d’identification d’une substance
chimique. En l’absence de ces matériels, une approche logicielle est
envisageable. Elle sera étudiée dans une deuxième partie.
Lorsque les moyens matériels et logiciels ne sont plus suffisant à
l’identification précise d’une substance, la solution étudiée est
d’utiliser les données opérationnelles disponibles afin d’identifier
les dangers qui y sont liés, et fournir ainsi un premier niveau d’aide
à la décision. Dans cette optique, et tirant partie des limites
exposées, une méthodologie de recueil des données et un logiciel
d’aide à l’identification des dangers liés aux substances chimiques
ont été développés.
67
Chapitre IV
Identification des substances chimiques
IV.1 Introduction
IV.1.1 Identifier les substances chimiques : une information
primordiale
En situation d’urgence d’origine chimique, les services de secours ont
besoin de connaître les substances chimiques10 impliquées afin de définir la
stratégie d’intervention appropriée. La connaissance des substances chimiques
permet de déterminer les dangers11 qui leur sont associés, de définir le périmètre
de sécurité ou, encore, de choisir les matériels adaptés à l’intervention (emploi
d’eau ou de mousses, protections individuelles pour les substances toxiques,
pompes adaptées aux liquides corrosifs, etc.). Cette information permet
également d’utiliser les fiches réflexes des sapeurs-pompiers qui reposent
inéluctablement sur la connaissance de l’état physique de la substance (gaz,
liquide, solide, fumées) et des dangers associés (inflammable, toxique, corrosif,
…).
Afin d’identifier rapidement les substances chimiques, la réglementation
européenne impose un marquage des substances dangereuses (code ONU sur les
emballages et les transports, code danger, pictogramme des dangers, …).
Mais les services de secours n’ont pas toujours connaissance de cette
information. En effet, la source de la dispersion peut ne pas être localisée
précisément (odeur suspecte, malaise dans les personnes aux alentours) ou il
peut ne pas y avoir de marquage sur un stockage (étiquette absente, plaque
danger illisible ou détruite, …) qui rend difficile l’identification de la substance et,
par conséquent, l’intervention qui doit s’effectuer dans un climat d’incertitude.
10
Substances chimiques : Eléments chimiques et leurs composés à l’état naturel ou
tels qu’obtenus par tout procédé de production, contenant tout additif nécessaire pour
préserver la stabilité du produit et toute impureté dérivant du procédé, à l’exclusion de
tout solvant qui peut être séparé sans affecter la stabilité de la substance ni modifier sa
composition. (Directive 67/548/CE)
11
Danger : Propriété intrinsèque d’une substance dangereuse ou d’une situation
physique de pouvoir provoquer des dommages pour la santé humaine et/ou
l’environnement. (Directive 96/82/CE dite « SEVESO II »)
68
Chapitre IV
Identification des substances chimiques
Deux situations sont possibles.
1) Le produit en cause est identifié rapidement, car s’échappant d’un
conteneur fixe ou mobile dument répertorié. C’est évidemment le cas le
plus favorable. Il est alors aisé, par simple consultation des fichiers (guide
orange des sapeurs-pompiers genevois, guide de l’intervention face aux
risques chimiques de la Fédération nationale des sapeurs-pompiers, fiches
toxicologiques de l’INRS, etc.) et des banques de données existantes, de
connaitre les risques encourus par les victimes et les mesures spécifiques
a prendre pour en diminuer l’incidence, le recours a un centre antipoison
pouvant trouver ici toute son utilité. Par ailleurs, cette situation favorable
offre aussi parfois l’avantage de permettre une évaluation de la quantité
de produit susceptible d’être libérée.
2) Le produit en cause est inconnu, car s’échappant d’un conteneur détérioré,
non identifiable ou parce qu’issu de réactions chimiques mal déterminées,
comme c’est souvent le cas lorsque le dégagement du produit est
consécutif à un incendie ou à une explosion. Dans ce cas, « en l’absence
de moyens spécialisés, c’est seulement l’observation des victimes et des
troubles qu’elles présentent qui permet d’évoquer le type de produit
auquel on a à faire » [Nemitz et al., 2000].
IV.1.2 Des situations inhabituelles
Bien que de telles interventions au cours desquelles la substance chimique
n’est pas identifiée ne constituent pas le quotidien des services de secours ; elles
surviennent et font partie des cas à prendre en considération, avec leur lot de
difficultés supplémentaires pour la prise de décisions, dues au manque
d’information sur les substances chimiques impliquées.
Les entretiens avec les sapeurs-pompiers des CMIC révèlent que la
majorité des interventions où la substance chimique n’est pas connue font suite à
des appels téléphoniques de personnes remarquant une odeur suspecte
incommodante. A l’origine de ces pollutions, il s’agit souvent de composés
soufrés ou d’hydrocarbures présents dans les égouts et difficile à identifier
précisément.
69
Chapitre IV
Identification des substances chimiques
L’étude
d’expérience
des
fait
retours
apparaître
une
autre origine ; lors d’accidents de
TMD
également,
la
substance
chimique n’est pas toujours connue
dans les premiers instants. Le 7
mars
2001,
la
plaque
orange
détruite dans l’incendie, ne permet
plus
Figure 11 : Accident sur l’autoroute A9
(Midi-Libre - 7 mars 2001)
d’identifier
l’éthylène
glycol
que transporte le camion citerne
accidentée sur l’autoroute A9 .
En 1979, dans l’accident de plus grande envergure à Toronto, le contenu
de certains wagons est rendu impossible à identifier en raison des flammes et il
est alors difficile de vérifier la présence redoutée de polychlorobiphényle (PCB).
L’identification est d’autant plus complexe que plusieurs produits chimiques sont
présents. Ce REX est détaillé dans [Lagadec, 1981].
Dans un contexte différent, il y a également le cas des attentats où la
nature du produit toxique est volontairement dissimulée, masquée par un autre
produit comme dans le cas de l’attentat au sarin à Tokyo en 1995.
D’après la base de données A.R.I.A. (Analyse, Recherche et Information
sur les Accidents) du Bureau d’Analyse des Risques et Pollutions Industrielles
(BARPI) [BARPI, 2008], seulement 18 accidents avec des substances chimiques
non identifiées ont été recensés entre janvier 1987 et août 2006. Il s’agit
d’accidents pour lesquels la substance chimique reste non identifiée à ce jour,
ou, du moins, jusqu’à la réalisation du retour d’expérience. Il n’y a pas de
statistiques sur les situations où la substance n’était pas connue dans les
premiers instants et ayant nécessité l’utilisation de matériel d’identification. Dès
lors que la substance est identifiée, même postérieurement à la phase d’urgence,
le REX n’en fait pas état. Dans la base de données, la faible proportion de retours
d’expérience pour lesquels il est fait mention de l’absence d’identification est
donc inférieure au nombre réel de ces situations d’urgence.
Pour palier ce manque d’information, la CMIC doit alors effectuer une
identification qui n’est pas toujours possible avec les moyens disponibles.
70
Chapitre IV
IV.2 Les
Identification des substances chimiques
moyens
de
détection
et
d’identification
existants
IV.2.1 Les matériels de détection au sein des CMIC
IV.2.1.1 Une grande variété de matériels
Dans ces cas de figure où la substance chimique n’est pas connue, les
sapeurs-pompiers ont à leur disposition des matériels de détection pour aider à
l’identification. Il existe toute une diversité de détecteurs spécifiques ou
génériques, permettant d’identifier un liquide, un gaz ou les vapeurs émises par
un liquide ou un solide (tubes colorimétriques, capteurs électrochimiques,
détecteur par infrarouge, spectromètres de masse, …).
Aujourd’hui, certains de ces matériels équipent les CMIC afin de détecter
certaines
substances
(AP4C,
Appareil
Portable
pour
le
contrôle
de
la
Contamination Chimique, utilisé dans la détection de toxiques de guerre) et
éventuellement d’effectuer une mesure de concentration d’un produit identifié.
En l’absence d’identification, certains de ces matériels apportent également une
aide à l’identification au travers d’information comme l’explosivité, le pH ou en
indiquant la famille de produits et plus rarement une analyse qualitative et
quantitative.
Ces
données
sont
synthétisées
dans
le
tableau
ci-dessous
(Cf. Tableau 5), recensant les détecteurs portables et autonomes, ainsi que les
matériels transportables12 plus rarement disponibles en CMIC.
Toutes les CMIC ne sont pas équipées de matériels permettant une
identification fine des substances rencontrées. Certains détecteurs initialement
destinés à un usage de laboratoires (les spectromètres de masse par exemple)
sont rarement utilisés sur le terrain en raison des difficultés d’acheminement
(poids, volume, …) et de complexité de mise en œuvre et d'interprétation des
résultats. Plusieurs unités disposent tout de même de ce type de matériel (UISC
1, BMPM), D’autres détecteurs, destinés à une utilisation terrain car peu
encombrants et dont le mode d’emploi est plus simple, font partie de
l’équipement des véhicules CMIC des sapeurs-pompiers. Bien que l’équipement
varie d’une CMIC à l’autre en fonction des risques propres au département
concerné et de l’organisation et des objectifs du SDIS, chaque cellule doit
12
Matériel transportable : matériel acheminé par un véhicule dédié jusqu’au lieu de rejet de la
substance chimique prélevée pour analyse.
71
Chapitre IV
Identification des substances chimiques
disposer au minimum d’explosimètres, de papiers pH et de tubes réactifs. Ces
matériels équipent aussi bien les cellules de reconnaissance que la cellule
d’identification qui composent les CMIC [FNSPF, 1992a]. L’équipe d’intervention
doit posséder également un appareil de détection des toxiques de guerre,
conformément au Guide National de Référence (GNR) [DDSC, 2006]. Cependant,
le constat est que ces appareils ne sont pas très répandus.
Souvent, la capacité d’identification d’une CMIC repose sur l’expertise de
spécialistes RCH2 ou RCH313 formés aux risques chimiques et à l’utilisation de
matériels de détection difficilement utilisables pour l’identification. En effet, il
n’est pas toujours possible de réaliser l’identification de substances à partir de
détecteurs portables et de tubes réactifs, ces derniers n’étant pas adaptés à
l’ensemble des substances chimiques [FNSPF, 1992a].
IV.2.1.2 Limites de la capacité à identifier une substance chimique
Tous les matériels possédent des limites d’utilisation (température,
humidité, seuils de détection, …) et sont plus ou moins sensibles lorsque les
conditions d’emploi ne sont pas respectés comme peuvent l’imposer les
interventions sur le terrain.
Ensuite, les matériels ne sont pas adaptés selon l’état de la substance
chimique (gaz, vapeur, liquide). Ou encore, la technologie des détecteurs n’est
destinée qu’à certaines substances (COV, molécules pouvant être ionisées, …)
(Cf. Tableau 5).
A cela s’ajoute la sensibilité à des interférents, c'est-à-dire des substances
chimiques faussant la mesure de la substance ciblée, soit en étant détectée à sa
place (faux positif), soit en empéchant la détection de la substance (faux
négatif).
Concernant les matériels obligatoires équipant les CMIC, trois types de
détecteurs sont mentionnés par le GNR [DDSC, 2006]. Ces matériels ne
permettent pas d’identifier précisément une substance chimique :
-
Les explosimètres sont capables de détecter la présence de gaz inflammables,
mais ne permettent pas de faire de l’identification.
-
Les détecteurs de toxiques de guerre n’équipent pas toutes les CMIC et
présentent une gamme de détection spécifique et de nombreux interférants
13
RCH2 : sapeurs-pompiers formés aux risques chimiques. La formation comprend quatre niveaux.
72
Chapitre IV
Identification des substances chimiques
quelle que soit la technologie utilisée, qu’il s’agisse de la spectrométrie de
mobilité ionique IMS (ion mobility spectrometry) ou de la spectrométrie à
émission de flamme. Pour la détection par IMS utilisée par le ChemPro 100 de
la société Environics, l’étude de l’EPA [Derringer et al., 2006] fait état des
limites et liste les effets de certains interférents conduisant à des faux positifs
et à des faux négatifs qui sont plus problématiques. Un des paramètres
source d’erreur de détection est la présence d’un taux d’humidité trop fort.
Ces interférents, en partie, faussent également la détection d’autres appareils
comme les AP2C et AP4C qui utilisent la spectrométrie par émission de
flamme.
Enfin, les tubes colorimétriques très fréquemment présents dans les CMIC,
-
sont également sujets à des perturbations dues aux conditions d’utilisation
qui interviennent sur la précision des résultats [Bissonnette, 2007]. A cette
approximation s’ajoute l’erreur quantitative indiquée par le fabricant (entre
5% et 30% selon les tubes), la sensibilité à l’humidité, à la température, aux
rayons UV et à de nombreux interférents [Dräger, 2002]. L’INRS souligne
également la nécessité d’un opérateur humain pour réaliser une interprétation
visuelle pouvant être approximative du fait d’un changement de coloration
parfois peu évident [Gallad et al., 2005]. Il faut également ajouter à cela, un
nombre important de tubes colorimétriques correspondant à des familles de
substances ou spécifiques à une substance qui fait que les CMIC ne sont
équipées que d’une partie de la gamme. Généralement, il s’agit des tubes de
la dichotomie14 permettant d’orienter vers les grandes familles de substances
chimiques, complétés par des tubes spécifiques aux risques locaux.
Une évaluation de la capacité d’identification des tubes colorimétriques en
situation d’urgence a été réalisée afin de compléter les limites exposées dans les
documents existants. Cette étude portant sur neuf substances chimiques pures
montre la difficulté à identifier précisément une substance chimique simple
uniquement à l’aide de tubes colorimétriques [Bronner et al., 2008].
Au travers des études sur les équipements [Derringer et al., 2006],
[Gallad et al., 2005], [Bissonnette, 2007], [Bronner et al., 2008] et des
entretiens avec des experts (communications privées), il ressort que pour être
14
Dichotomie : méthodologie d’utilisation des tubes pour identifier une substance par des tests
successifs déterminés selon la réaction ou la non-réaction des tubes.
73
Chapitre IV
capable
de
Identification des substances chimiques
détecter
la
plupart
des
substances
chimiques
pouvant
être
rencontrées en intervention de la CMIC, il est nécessaire de disposer d’un panel
de matériels de détection. Outre leur spécialisation à un ou plusieurs états
(liquide, gaz, vapeur), ces matériels ne sont pas adaptés à l’ensemble des
substances chimiques et ils sont sensibles à des interférents. Il faut donc
disposer de matériels complémentaires et sélectifs, donc perfectionnés.
Mais le coût en termes d’investissement et de formation que représentent
certains matériels (IR et spectromètre de masse) ne permet pas d’équiper
l’ensemble des CMIC. Ces matériels couteux sont donc centralisés dans des
zones où le risque chimique est plus important, avec un rayon d’action limité par
un temps d’acheminement parfois considérable. Il en est de même dans d’autres
pays tels que le Canada ou l’Allemagne. Concernant l’Allemagne, une des
orientations est de laisser l’analyse et l’identification à une unité spécialisée (die
Analytiche Task Force) rapidement mobilisable et acheminée par hélicoptère
[König, 2006] et de spécialiser les premiers intervenants aux prélèvements de
substances.
74
Chapitre IV
Identification des substances chimiques
Tableau 5 : Matériels de détection autonomes
++++
Facilité
d’utilisation
et
d’entretien
++++
- Nombreux Interférents
++++
++++
Pas toutes
- Nombreux Interférents
++
++++
NON
OUI si déjà
identifié
++++
OUI
NON
OUI si déjà
identifié
Gaz
OUI
NON
OUI si déjà
identifié
+ Gaz inflammables
- Détection peu sensible
- Dépend du taux d’oxygène (correction
nécessaire)
- Très rapidement empoisonné en présence de
silicone ou d’un mercaptan
- Gaz de l’air (CO2, N2, O2, H2O),
- GNL
- Acides
-…
- Sensibilité variable
- Non sélectif
- Composés organiques volatiles
- Sensibilité variable
- Non sélectif
Gaz
OUI
NON
OUI si déjà
identifié
Gaz
Liquide
Solide
OUI
Certains
produits
OUI
- Nombreux Interférents
- Empoisonnement des capteurs par les
mercaptans
Utilisés en zonage et réseau de mesures
+ Méthode rapide (quelques secondes)
+ Identification de 15 000 produits
+ Quantification de nombreux produits (≈100)
Limites et avantages
Phase
75
Détc.
Ident.
Quant.
Tubes
colorimétriques
Gaz
Vapeur
OUI
NON
Plaquettes
colorimétriques
Bandelettes
colorimétriques
Explosimètre
Gaz
Vapeur
Liquide
OUI
NON
Pas tous
les tubes
Semi
quantitatif
Pas toutes
OUI
NON
Gaz
OUI
PID
(détecteur à
photo-ionisation)
Gaz
FID
(détecteur à
ionisation de
flamme)
Toximètres
(cellules
électrochimiques)
IR
(détecteur
infrarouge)
Les limites sont indiquées par un signe "-"
et les avantages par un signe "+"
- Nombreux Interférents
Dispo.
en
CMIC
++
++
+
+
+++
+++
+
+
Chapitre IV
Spectromètre à
émission de
flamme (AP2C,
AP4C)
GCMS
Gas
Chromatography
Mass Spectrometry
Identification des substances chimiques
Gaz
Liquide
Variable
OUI
OUI
Non
Mesure le
soufre et le
phosphore
OUI
Semi
quantitatif
OUI
- Mélange de plus de 3 produits
- Difficulté d’interprétation
- Limite de détection basse de l’ordre du ppm
- Détection impossible de certaines molécules
(Cl2, F2, Br2, H2 …) et de certains toxiques de
guerre.
- Impossibilité de détecter des substances
fortement diluées (Pour une concentration de
l’ordre de 10% ou moins, le spectre de l’eau
masque la réponse)
+ Détection d’hydrocarbures (C-H) et de
composés soufrés (S), phosphorés (P-H et P-C),
azotés (N) et arséniés (As).
+ Détection sensible de nombreux toxiques de
guerre
- Nombreux Interférents
Utilisation en reconnaissance et en contrôle de
décontamination
+ Identification formelle des COV
+ Excellente sensibilité
+ Analyse de mélanges complexes (fumées)
- Gaz permanents (CO, Cl2, NH3, HCN …)
• Durée d’analyse (15 min. pour le risque
chimique 30 min. pour les fumées)
++
+++
+
+
Légende :
Détc.
Capacité de détection d’une substance précise
Ident.
Capacité d’identification qualitative d’une substance
Quant.
Possibilité de faire un dosage quantitatif
Dispo. en CMIC
La disponibilité dans les CMIC est notée de un à quatre par des signes "+". Quatre indiquant les matériels courants et
un les matériels rarement présent dans les CMIC.
La facilité d’utilisation et d’entretien est également notée de un à quatre avec la même échelle.
76
Chapitre IV
IV.2.2 Les
Identification des substances chimiques
logiciels
d’identification
des
substances
chimiques
Les sapeurs-pompiers et les experts des CASU disposent de bases de
données de substances chimiques pour obtenir les informations utiles à
l’intervention. Mais pour pouvoir utiliser ces bases de données, il est nécessaire
de connaître la substance chimique.
Cependant, les bases de données contiennent des informations qui
peuvent être mises en correspondance avec les données opérationnelles
disponibles sur le terrain afin de sélectionner les substances chimiques
concordantes. C’est ce que réalisent deux logiciels : Le « Chemical Companion »
développé par le Georgia Tech Research Institute (GTRI), effectuant ce type de
recherches parmi 130 substances chimiques [Becker, 2006] et le logiciel WISER
[NLM, 2005] qui dispose d’une base de données de 412 substances. Ces logiciels,
conçus pour une utilisation opérationnelle, constitue une aide à l’identification
des substances chimiques.
Le paragraphe suivant (IV.2.2.1) présente le fonctionnement de ces deux
logiciels. Biens que les exemples soient spécifiques au logiciel WISER, les
informations sont valables également pour le « Chemical Companion » qui est
similaire dans son fonctionnement. Le choix s’est porté sur WISER, car dans sa
version évaluée par l’INERIS [Pagnon et al., 2007], il est le plus abouti en termes
de fonctionnalité et de base de données. De plus, il fait l’objet de plus de
documentations et de publications, dont l’étude de [Bhavnani et al., 2007] qui
sera complétée et qui servira de base de réflexion au paragraphe IV.4.1.
Depuis la réalisation de ce travail, des améliorations ont été apportées au
« Chemical Companion », dont une base de données enrichie contenant 2000
substances [GTRI, 2008]. Il parait nécessaire d’y porter plus d’attention est d’en
faire une étude approfondie au même titre que celle réalisée pour le logiciel
WISER [Pagnon et al., 2007]. Quant au logiciel WISER, des substances
chimiques sont ajoutées régulièrement à la base de données.
77
Chapitre IV
Identification des substances chimiques
IV.2.2.1 Présentation du logiciel WISER
IV.2.2.1.1
Une base de données avec une interface dédiée aux
situations d'urgence
WISER (Wireless Information System For Emergency Responders) est un
logiciel gratuit, entièrement et uniquement en anglais, développé par la NLM
(National Library of Medicine) et destiné aux premiers intervenants lors
d’accidents impliquant des matières dangereuses [NLM, 2004].
Comme son nom l’indique, il fonctionne en mode déconnecté sur un
ordinateur autonome et non relié à Internet. WISER est disponible sur Palm©,
Pocket PC et plateforme Microsoft Windows™. Lorsqu’une connexion Internet est
disponible, il permet d’accéder directement à des bases de données en ligne
pouvant contenir des informations complémentaires.
WISER dispose d’une base de données contenant diverses informations sur
un
certain
nombre
de
produits
chimiques
dangereux
et
d’une
aide
à
l’identification de ces produits à partir d’éléments observables (état, couleur,
odeur, …) ou mesurables (pH, …) et de symptômes observés chez l’homme
(nausées, maux de tête, irritations, …). Une fois le produit identifié, la base de
données contient également des informations pour aider à la prise de décision
lors de la phase réflexe (périmètre de sécurité/évacuation, matériels de
protection, premiers
soins, recommandations
du DOT15
(Departement Of
Transportation), réactivité et incompatibilité avec d’autres substances.
La base de données, comporte 412 substances chimiques (dans sa
dernière version), décrite par 161 critères binaires séparés en trois familles :
-
les propriétés chimiques et thermodynamiques observables ou mesurables
(état, couleur, opacité, odeur, goût, pH, densité liquide gazeuse),
-
les symptômes cliniques sur l'homme. Le logiciel WISER permet l’identification
de 89 signes différents rassemblés en 10 sous-groupes physio-pathologiques
(température,
neurologie,
oreilles,
ophtalmologie,
nez,
bouche/gorge,
système cardiovasculaire, système respiratoire, système gastro-urinaire,
peau),
-
et la codification NFPA : inflammabilité, instabilité, santé, autre.
Ces critères sont également regroupés par thème (Figure 12) et l’affichage
des informations est adapté au profil de l’utilisateur (Tableau 6). Il y a trois
15
Version américaine du guide CANUTEC
78
Chapitre IV
profils
Identification des substances chimiques
utilisateurs :
premier
intervenant,
spécialiste
HAZMAT
(HAZardous
MATerials : matières dangereuses), Médecin urgentiste.
Premier intervenant
Spécialiste HAZMAT
Médecin urgentiste
Equipements de
Propriétés physico-
traitements
protection
chimiques
Distances de sécurité
PPE
Effets sur la santé
Procédures en cas
IDLH
Information sur la toxicité
Réactivités
Limites d’inflammabilité
IDLH
traitements
Classification NFPA 704
Classification NFPA 704
d’incendie
Tableau 6 : Informations affichées pour chaque profil
Figure 12 : Informations sur le chlore triées par catégorie (logiciel WISER)
79
Chapitre IV
Identification des substances chimiques
IV.2.2.1.2
Une aide à l’identification
Afin d’identifier une substance chimique en situation d’urgence, WISER
propose un mode de recherche à partir de la description et des propriétés du
produit, des symptômes observés chez l’homme et de la classification NFPA (si la
signalisation est connue).
En fonction des informations saisies (par exemple la couleur du produit,
son pH, et des effets sur la peau) WISER sélectionne tous les produits
satisfaisant
à
l’ensemble
de
ces
critères.
La
recherche
est
effectuée
immédiatement après chaque saisie d’information et un curseur permet de
visualiser en temps réel le nombre de substances correspondant aux critères
sélectionnés.
Le mode de recherche est simple. L’ensemble des solutions de départ est
constitué de tous les produits de la base de données, et à chaque valeur de
critère saisie, les produits ne correspondant pas à la valeur saisie sont retirés de
la liste des solutions possibles.
Exemple de recherche :
Nombre de substances chimiques de l’ensemble de départ (toute la base de
données) = 407
Produits étant des liquides visqueux = 44
ET de couleur jaunâtre = 22
ET pouvant provoquer des troubles de la vision = 11
ET qui flotte sur l’eau (densité<1) = 3
Trois produits correspondent aux critères saisis : Collodion, Kérosène, n-Ethylaniline. Les
deux premiers sont très inflammables, le troisième est toxique. Pour poursuivre
l’identification, il est nécessaire de disposer d’autres critères. Par exemple, l’odeur serait un
critère discriminant supplémentaire (Figure 13).
80
Chapitre IV
Identification des substances chimiques
Figure 13 : Identification de substances chimiques avec WISER
Incontestablement, la fonction la plus intéressante de WISER par rapport
aux autres bases de données existantes est la possibilité de rechercher un
produit en fonction de sa description et des effets sur l’homme [Pagnon et al.,
2007].
Pour une utilisation en situation d'urgence, ce logiciel est intéressant en
d’autres points :
-
Son interface est simple, parfaitement adaptée à une utilisation en situation
d’urgence.
-
Le vocabulaire est également adapté aux situations d'urgence et la base de
données contient des informations utiles pour l’aide à l’intervention.
A la suite de l’étude réalisée par l’INERIS [Pagnon et al., 2007], la CASU a
retenu le principe d'utilisation de WISER. Le choix fait par l’INERIS est d’intégrer
81
Chapitre IV
Identification des substances chimiques
ce logiciel aux outils de la CASUBOX (ensemble d’outils de calcul et d’aide à la
décision destiné aux membres de la CASU lors des appuis).
Comme il est mentionné dans le rapport d’étude [Pagnon et al., 2007], il
est important d’en préciser les limites d’utilisation. Car bien que le concept du
logiciel soit très pertinent, sa mise en œuvre est jugé toutefois très délicate
(incertitude due à l’origine parfois indirecte des informations, critères du logiciel
difficilement identifiables, peu de produits, …).
Le logiciel WISER présente d’autres inconvénients [Pagnon et al., 2007] :
-
Certains critères ne sont pas renseignés ce qui peut générer des résultats
aberrants ou en très grand nombre (ex : couleur, opacité, …).
-
Certaines données ne sont pas corrélées entre elles provoquant également
des résultats incohérents (ex : couleur / état).
-
La base de données contient des erreurs.
-
Il
s’agit
d’un
logiciel
développé
pour
le
continent
Nord-Américain.
Exclusivement en anglais, il contient des données toxicologiques issues
uniquement des bases américaines qui ne tiennent pas compte des valeurs
réglementaires françaises.
-
Ce logiciel ne peut être modifié et aucune valeur ne peut être ajoutée
L’étude réalisée valide un mode de fonctionnement intéressant et utilisable
en situation opérationnelle, mais sans pouvoir juger, pour l’instant, de la qualité
des résultats obtenus, de la justesse de l’identification et de l’utilisation possible
pour les sapeurs-pompiers. Ces points sont abordés dans le paragraphe suivant.
IV.2.2.2 Limites de la base de données du logiciel WISER
Données manquantes
Dans la base de données WISER, certains produits ont des critères de
sélection qui ne sont pas renseignés (ex : pas d'indication sur la couleur du
Phenyl Isocyanate).
Mauvaise gestion des critères non renseignés
Malgré ces absences de données, les produits peuvent être sélectionnés
par WISER sur la base d'une sélection effectuée sur ces critères non renseignés.
82
Chapitre IV
Identification des substances chimiques
Par exemple, si dans WISER, une recherche est effectuée sur plusieurs couleurs :
bleu, vert et incolore, trois produits sont alors sélectionnés par WISER : Lewisite,
Phenyl Isocyanate, Delta-Hexachlorocyclohexane.
En réalité, seul la Lewisite remplit effectivement les trois conditions de
couleur (bleu, vert et incolore). Les deux autres produits (Phenyl Isocyanate,
Delta-Hexachlorocyclohexane) n'ont aucun critère de couleur renseigné dans la
base de données. De même, une recherche des produits inoffensifs (code NFPA
égal à zéro pour tous les risques) affiche une liste de 174 produits. Parmi ceux-là
on compte le sarin, l’arsenic et autres produits dangereux pour lesquels la classe
NFPA n’est pas renseignée.
Informations non corrélées entre elles
Dans l’exemple précédent, il peut paraître curieux qu’une substance
chimique ait un critère tel que la couleur associé à plusieurs valeurs possibles. En
fait, ces données sont conditionnelles à d’autres données. Par exemple, la
couleur est fonction de l’état. Mais il manque cette information, les corrélations
entre les données ne sont pas indiquées, les couleurs d’un produit ne sont pas
associées à l’état correspondant.
Par exemple, le naphtalène de formule chimique C10H8 et de numéro CAS :
91-20-3. C’est un produit blanc à l’état solide (source : base de données inchem
IPCS) et blanc à brun-jaunâtre à l’état liquide. Mais si on recherche un produit à
la fois solide ET de couleur brunâtre, ce qui n’est pas le cas du naphtalène, le
logiciel WISER affichera ce produit comme résultat de la recherche.
Informations différentes selon les catégories de critères
L’absence d’information peut également donner des résultats surprenants
lorsque qu’il s’agit de données redondantes. Par exemple, le symptôme « toux »
est à la fois présent dans les symptômes liés au système pulmonaire et dans
ceux liés à la gorge. Le manque de données fait que l’on obtient des résultats
différents selon si l’on associe la toux à un problème pulmonaire ou à une
irritation de la gorge :
-
216 substances provoquent une toux liée au système pulmonaire,
-
273 substances provoquent une toux liée à la gorge
-
et 210 substances sont communes aux deux.
83
Chapitre IV
Identification des substances chimiques
Absence de distinction entre effets immédiats et risque chronique
Dans le mode de recherche, il n’y a pas de distinction entre les effets
immédiats et les symptômes observables à long terme. Pour une utilisation en
situation d’urgence, les effets liés au risque chronique ne sont d’aucune utilité
pour identifier les produits.
IV.2.2.3 Limites du logiciel WISER à l’identification des substances
Lors de la présentation du logiciel WISER, un point fondamental a été
abordé : la méthode de recherche en base de données avec pour but une
identification précise d’une substance à partir des données opérationnelles. Mais
il n’est pas prouvé que les données opérationnelles en situation d'urgence
permettent une telle identification. Dans l’étude de l’utilisation du logiciel WISER
en situation d’urgence [Pagnon et al., 2007], il est noté que pour identifier un
produit inconnu à partir d'observations « simples », il faut disposer d’un nombre
important d’informations. Ce point n'est pas spécifique à WISER mais du à la
complexité du problème à résoudre.
En effet, les données sont peu discriminantes. Sur la base des produits
testés dans cette étude, il est estimé que les symptômes observés en situation
d'urgence seront peu efficaces pour déterminer précisément un produit. Sur les
dix produits qui ont été testés dans l’étude de WISER, six sont des suffocants à
action locale prédominante (NH3, Cl2, HF, HCl, NO2 et SO2). Les symptômes
cliniques pouvant être observés seront donc principalement des effets non
spécifiques d’irritation des voies aériennes et de troubles respiratoires qui sont
assez proches pour l'ensemble des produits testés :
-
Gorge / Bouche : toux, irritation
-
Système Respiratoire : respiration irrégulière, souffle court, arrêt respiratoire,
brûlure / irritation, œdème pulmonaire, congestion, toux / obstruction,
éternuement, hypoxie/cyanose
-
Système Cardiovasculaire : douleur, hypoxie/cyanose
Les symptômes secondaires spécifiques (conduisant à l’identification d’une
substance) ne se déclarent généralement que dans les cas d’intoxication très
importante ou d’exposition particulière. Ce constat est moins vrai pour les
toxiques à action systémique (acrylonitrile, HCN, CO et CO2) pour lesquels
certains symptômes sont spécifiques.
84
Chapitre IV
Identification des substances chimiques
Il apparait clairement que tous les symptômes ne sont pas tous
discriminants et que malheureusement, les critères spécifiques ne seront pas les
plus fréquemment observés. Il est donc nécessaire de vérifier si la quantité
d’information disponible en situation d’urgence est suffisante pour identifier une
substance chimique.
IV.3 Réalisation d’une base de données opérationnelles
L’utilité de la base de données est double. Elle doit servir à réaliser les
études de faisabilité sur l’identification d’une substance et des dangers qui sont
liés (IV.4, IV.5), puis à termes, intégrer le logiciel d’aide à l’identification (IV.6).
Il a été fait le choix de développer une base de données avec une
structure simplifiée, adaptée aux traitements de recherche de substances et de
construction d’arbres de décision. La base de données se limite à une table
principale de données, majoritairement binaires, décrivant les différentes
substances. Chaque substance chimique est associée, d’une part, aux données
opérationnelles disponibles en situation d’urgence, et d’autre part, aux classes de
danger qu’il s’agira d’identifier.
Mais pour respecter des contraintes différentes présentées ci-après, il a
été nécessaire de décliner la base de données en deux versions distinctes :
-
une base de données destinée aux études de faisabilité (IV.4, IV.5) contenant
un nombre suffisamment grand de substances.
-
Une base de données intégrée au logiciel d’aide à l’identification.
Avant de détailler les deux versions, nous allons détailler les différentes
étapes de la création de la base de données commune.
IV.3.1 Choix des sources d’information
Pour alimenter ces bases de données, une sélection de plusieurs sources
de données a été faite.
Parmi les bases de données existantes, plusieurs caractéristiques ont été
retenues
pour
effectuer
une
sélection
des
sources
à
utiliser
pour
le
développement d’une base de données opérationnelles intégrée à notre logiciel.
La base de données doit :
85
Chapitre IV
Identification des substances chimiques
-
Contenir les données opérationnelles (description, symptômes, danger, …)
-
Les informations doivent être dans une même langue pour pouvoir
fusionner plusieurs bases de données dans une même base de données
centralisée. Pour des facilités de compréhension, seules les bases de
données en anglais ou en français ont été retenues.
-
Les informations doivent pouvoir être réutilisées. Il faut donc s’orienter
vers les bases de données gratuites non protégées.
-
Enfin, la base de données est destinée à des traitements mathématiques
automatisés et doit pouvoir être accessible par des logiciels développés en
C++. De plus, la création de la base de données nécessite un énorme
travail de recherche de données, de vérification et de saisie pour
l’ensemble des produits. Ce travail fastidieux est également source
d’erreurs de saisie. Le choix a été d’effectuer en automatique ce
traitement de récupération, de formatages et de centralisation des
données.
Peu de bases de données en libre accès correspondent à l’ensemble des
critères cités précédemment. Certaines bases de données intéressantes ne sont
pas structurées pour faciliter la récupération automatique de l’information et très
peu de bases de données contiennent les données opérationnelles utilisables en
situation d’urgence et les données utiles aux services de secours.
Le tableau suivant (Tableau 7) présente une liste non exhaustive des
bases de données consultées. Certaines bases de données ont été rapidement
écartées en raison d’une inadéquation avec les propriétés recherchées. Une liste
plus complète est disponible dans [Celle et al., 2006].
86
Chapitre IV
Identification des substances chimiques
Tableau 7 : Bases de données de produits chimiques répondant en partie aux
critères de sélection
Bases de données
Nombre de
produits
TOXNET
Langue
Informations
Description
Effets
oui
oui
difficile
oui
oui
oui
ang.
Autres
Accès
auto.
http://toxnet.nlm.nih.gov/cgi-bin/sis/htmlgen?hsdbb.htm
NIOSH
≈ 900
fr., ang.,
autres
http://www.inchem.org/ et http://www.cdc.gov/niosh/ipcsnfrn/nfrnun.html
Base Biotox INRS
≈ 100
français
oui
oui
"Famille"
non
français
oui
oui
stockage
non
≈ 7000
français
non
non
UV, IR,
spectre ..
?
405
anglais
oui
oui
oui
français
oui
oui
?
oui
oui
non
/
oui
non
anglais
/
oui
?
fr., ang.
/
oui
?
français
/
oui
oui
Fiches INRS
http://www.inrs.fr/
NIST Chemistry WebBook
http://webbook.nist.gov
WISER (BD v2.2.95)
http://wiser.nlm.nih.gov/index.html
REPTOX (CSST)
http://www.reptox.csst.qc.ca/RechercheProduits.asp#resultats
Fiche tox (ATSDR)
anglais
http://www.atsdr.cdc.gov/toxprofiles
BD Toxico (INERIS)
911
http://chimie.ineris.fr/fr/lien/basededonnees/toxicologie/recherche.php
IRIS (EPA)
http://www.epa.gov/iris/subst/0405.htm
ESIS (ECB)
http://ecb.jrc.it/esis/
AGRITOX (INRA)
http://www.inra.fr/agritox/php/fiches.php
Base Dräger Voice
fr., ang.,
autre
Réaction
aux tubes
réactifs
difficile
http://www.draeger.com/voice/index.html
TELETOX
non
oui
non
oui
http://www.uvp5.univ-paris5.fr/TELETOX/TELMENU.asp
CANUTEC
3315
fr., ang.,
autre
≈ 720
anglais
≈ 6000
anglais
Logiciel ergo 2004
SAFER
Logiciel
CAMEO online database
http://cameochemicals.noaa.gov/
87
oui
Chapitre IV
Identification des substances chimiques
Le choix s’est porté sur la base de données du logiciel WISER qui
correspond à l’ensemble des critères de sélection malgré un nombre de produits
chimiques restreint puisque la version utilisée (v2.2.95) n’en comporte que 405.
Cette base de données étant incomplète, les données manquantes ont été
récupérées des « International Chemical Safety Cards (ICSC) » du NIOSH,
publiées sur internet. Les fiches ICSC ont été utilisées également pour renseigner
la classification des dangers avec la classification européenne.
La base de données du NIOSH n’a servi qu’à compléter celle de WISER car
certaines données comme les effets ou la description ne sont pas formatées, ce
qui ne facilite pas leur récupération. Mais la confrontation des différentes sources
d’information a montré des incohérences qui ont nécessité plusieurs traitements.
IV.3.2 Fusion des bases de données
La récupération des données et leurs traitements ont nécessité l’emploi
des logiciels Access et Excel de Microsoft©, ainsi que l’écriture d’un programme
en C++ en particulier pour rechercher automatiquement l’information dans la
base de données du NIOSH via le web. Ces traitements de formatage de données
et de recherche syntaxique ne seront pas développés dans ce mémoire.
En complément de ce travail, une analyse sémantique des bases de
données non formatées permettrait d’extraire des données supplémentaires.
IV.3.3 Renseignement des données manquantes
Pour plusieurs produits, il manque des données dans les bases de données
utilisées. Il peut s’agir de produits pour lesquels l’information n’existe pas,
comme la mesure du pH pour un solide, mais il peut s’agir de la couleur ou de la
classification NFPA. La base de données a été complétée à l’aide d’autres sources
d’information comme le Merck Index [O'Neil et al., 2004], la base de données de
CAMEO [NOAA, 1999] et la base de données INCHEM [CCOHS, 2008].
Lorsqu’il s’avérait impossible de trouver une substance pour compléter des
données importantes ou que l’information était exprimée de façon ambigüe, elle
était retirée de la base de données.
88
Chapitre IV
Identification des substances chimiques
IV.3.4 Choix d’une classification des dangers
La connaissance des classes de risques associées à un produit est
primordiale puisque la méthode développée vise à rechercher cette information à
partir des données opérationnelles. Il existe plusieurs classifications16 des
substances chimiques (cf. Annexe I) mais il est difficile d’en choisir une plutôt
qu’une autre comme il est expliqué dans un rapport de l’INERIS [Bernuchon et
al., 2002]. Pour notre étude, une classification simplifiée a été réalisée à partir
de la classification européenne et de celle de la NFPA. Ces deux informations
n’étant pas disponibles pour l’ensemble des substances chimiques des bases de
données utilisées, il a été nécessaire de fusionner les deux classifications pour
conserver un jeu de données suffisamment grand pour une étude statistique.
IV.3.4.1 Présentation de la classification retenue
Le choix a été de réaliser des classes de danger simplifiées en distinguant
uniquement deux valeurs pour les trois risques retenus dans cette étude (toxique
ou non, inflammable ou non, explosif ou non). Soit un recouvrement17 de trois
classes correspondant à la partition18 de huit (23) classes suivantes : "Aucun
risque",
16
"Inflammable",
Classification :
Le
"Explosif",
terme
"Toxique",
« classification »
est
"Inflammable
ambigu
et
et
peut
explosif",
avoir
deux
significations :
établir une classification en regroupant des objets d’un champ d’étude en fonction de
-
leurs similarités en un certain nombre de classes ou groupes homogènes. Simpson
[Simpson, 1961] propose une définition dans le domaine de la biologie qui fut ensuite
adaptée par [Sokal et al., 1974] « the ordering or arrangement of objects into groups
or sets on the basis of their relationships »
ou être utilisée au sens de la discrimination ou de l’identification, c'est-à-dire de
-
définir l’appartenance de chaque objet à l’un des groupes d’une classification déjà
établie. Dans les domaines connexionnistes, on parle de classification supervisée.
Parmi les méthodes de classification automatique, les centres mobiles ou les hiérarchies
sont souvent utilisées. Il existe également des méthodes issues des réseaux de neurones
comme les cartes de Kohonen.
17
Recouvrement : Un recouvrement d’un ensemble E est un ensemble de parties
P=(P1,…Pk) non vides dont la réunion forme E et tel qu’il n’y a pas d’inclusion entre les
parties.
18
Partition : Une partition d’un ensemble E est un ensemble de parties P=(P1,…Pk) non vides,
disjointes, dont la réunion forme E.
89
Chapitre IV
Identification des substances chimiques
"Inflammable et toxique", "Explosif et toxique", "Inflammable, explosif et
toxique".
L’appartenance d’un produit à une classe de risque est déterminée en
fonction de la présence du risque dans les classifications EU et NFPA.
Par exemple, un produit appartient à la classe « produits inflammables » si la
valeur pour le risque « inflammable » dans la classification NFPA est supérieure à
zéro ou si sa valeur dans le classification EU est F+, F ou l’une des phrases de
risque en rapport (R10, R11, R12, …).
Inflammable =
1 : « NFPA – Inflammable » > 0 ou EU ε {F+, F, R10, R11,
R12, R17, R15}
0 sinon
Explosif =
1 : « NFPA – Réactivité » > 0 ou EU = {E, R2, R3, R14}
0 sinon
Toxique =
1 : « NFPA – Santé » > 0 ou EU ε {T+, T, Xn, R23, R24,
R25, R39, R48, R26, R27, R28, R20, R21, R22, R40, R48,
R65, R29}
0 sinon
Note : Le choix des phrases de risque à retenir présente des difficultés. Dans
[Bernuchon et al., 2002], la classification par regroupement des phrases de
risque ne peut être utilisé tel quel, car en plus des trois classes (inflammable,
toxique, explosif), une quatrième classe est introduite « stabilité avec l’eau »
avec les phrases de risque R14, R15 et R29. Cette précision n’est pas faite dans
la classification NFPA. Deux classifications ont été testées :
-
sans tenir compte de ces trois phrases de risque,
-
puis en incluant ses phrases de risque, tel qu’il est décrit ci-dessus.
Aucune différence sensible n’a été notée entre les résultats obtenus avec l’une ou
l’autre des deux classifications.
IV.3.4.2 Différence de seuils des classifications européenne et
NFPA
En comparant les classes de danger des substances communes aux deux
bases de données (soit 350 substances chimiques), on remarque des proportions
différentes d’une base de données à l’autre pour les substances inflammables et
toxiques (cf. Tableau 8).
90
Chapitre IV
Identification des substances chimiques
Tableau 8 : Proportion de substances par classe de danger
Inflammable
Explosif
Toxique
Classification européenne
34,3%
32,3%
89,7%
Classification NFPA
59,7%
32,3
63,7
Dans le cas des substances toxiques, la différence de proportion (89,7%
ou 63,7%) s’explique par les données non renseignées. Car il y a très peu
substances avec des classifications différentes (1,4%) en ne comparant que les
données renseignées dans les deux bases de données (cf. Tableau 9). On note
également peu d’erreur dans le cas des produits explosifs (0,6%).
Tableau 9 : Proportion de substances par classe de danger
Inflammable
Explosif
Toxique
32,3%
31,7%
31,7%
Même classification
37,4%
67,7%
66,9%
Classification différente
30,3%
0,6%
1,4%
Non renseigné dans l’une
des deux classifications
Par contre, les produits inflammables présentent 30,3% de différences
entre les deux classifications. Cela s’explique par les différences des seuils
réglementaires d’affectation des classes de danger notés dans les Tableau 10 et
Tableau 11 et illustrés en Figure 14.
91
Chapitre IV
Identification des substances chimiques
Tableau 10 : Classification NFPA 704 des substances inflammables
Classe
Critères de classement des produits liquides
NFPA
4
Will rapidly or completely vaporize at normal atmospheric pressure and
temperature, or is readily dispersed in air and will burn readily (e.g., propane).
Flash point below 23°C (73°F).
3
Liquids and solids that can be ignited under almost all ambient temperature
conditions (e.g., gasoline). Flash point below 38°C (100°F) but above
23°C (73°F)
2
Must be moderately heated or exposed to relatively high ambient temperature
before ignition can occur (e.g., diesel fuel). Flash point between 38°C
(100°F) and 93°C (200°F).
1
Must be pre-heated before ignition can occur. Flash point over 93°C
(200°F).
0
Will not burn
Tableau 11 : Classification des substances inflammables :
Directives 67/548/CEE et 1999/45/CE (article R.231-53 du code du travail).
Catégorie
Phrase
Critères de classement des produits liquides
de
risque
Extrêmement inflammable
R12
F+
Pour les liquides ayant un point éclair < 0°C et
température d'ébullition < 35°C
Pour les gaz qui, à température et pression
ambiantes, sont inflammables à l'air
Facilement inflammable F
R11
Pour les solides susceptibles de s'enflammer
facilement après un bref contact avec une source
d'inflammation et qui continuent à brûler ou se
consumer après élimination de cette source
Pour les liquides ayant un point éclair < 21°C
mais qui ne sont pas extrêmement inflammable
Pour les substances qui, au contact de l'eau ou
de l'air humide dégagent des gaz extrêmement
inflammables à raison de 1 I/kg/h minimum.
Inflammable
R10
21°C < point éclair < 55°C
92
Chapitre IV
Identification des substances chimiques
Les substances chimiques enflammables mais dont le point éclair19 est
supérieur à 55°C ne sont pas répertoriées comme substances inflammables par
la réglementation européenne contrairement à la classification NFPA.
Point éclair
120°C
1
100°C
080°C
2
060°C
040°C
R10
3
020°C
F
4
000°C
-020°C
-040°C
F+
Classification Classification
Seveso
européenne
NFPA
NFPA
Figure 14 : Seuils des produits inflammables en fonction de leur point éclair
Le choix a été fait de garder une classification majorante ; une substance
est
considérée
inflammable
dès
qu’elle
apparait
dans
l’une
des
deux
classifications.
Cependant des erreurs peuvent subsister dans la base de données en
complétant les données absentes dans la classification NFPA par la classification
européenne indiquée dans les fiches du NIOSH. Une substance pouvant être
inflammable pour la législation américaine (classe NFPA-inflammable égale à un
ou deux) sans être considérée comme dangereuse pour la réglementation
européenne.
19
Point éclair : Une définition simple du point éclair pourrait être : le point éclair est la température la
plus basse où un liquide peut former un mélange inflammable à sa surface. Donc plus une substance
a un point éclair bas, plus elle sera facile à enflammer.
93
Chapitre IV
Identification des substances chimiques
IV.3.5 Différentes versions de bases de données
IV.3.5.1 Version pour étude de faisabilité – suppression des
incompatibilités
Nous avons vu précédemment que les données de la base de données de
WISER ne sont pas corrélées. Cela entraine des incompatibilités entre les
critères. Mais pour réaliser les études de faisabilité, les arbres de décisions
seront utilisés, mais leur méthode de construction ne permet pas de tenir compte
de ces incompatibilités. Par exemple, pour une substance stockée à l’état solide
ou liquide, l’information pH sera présente mais ne sera valide que pour l’état
liquide. D’un point de vue statistique, le pH peut apparaître comme un critère
discriminant mais il est bien évidemment aberrant de demander une mesure de
pH en présence d’un solide.
De même, les couleurs d’un produit ne sont pas associées à l’état
correspondant. Le naphtalène de formule chimique C10H8 et du numéro cas 9120-3, est blanc à l’état solide [IPCS, 2001b] et blanc à brun-jaunâtre à l’état
liquide. Cela présente l’énorme inconvénient suivant : lors d’une recherche d’une
substance à la fois solide ET de couleur brunâtre, le logiciel affiche le naphtalène
dans les résultats de la recherche alors qu’il ne correspond pas à cette
description.
Une solution consisterait à dupliquer les substances en fonction des
différents cas existants. Pour une substance, à chaque état correspond des
critères (pH uniquement pour les liquides par exemple) et des valeurs de critères
(pour un état correspond une ou plusieurs couleurs).
Structure actuelle :
Nom
Formule
Naphtalène C10H8
CAS
Etat
Etat
Couleur
Couleur
Couleur
pH
91-
solide
liquide
blanc
brun
jaunâtre base
20-3
Structure avec données corrélées :
Nom
Formule
CAS
Etat
Couleur
Naphtalène (solide)
C10H8
91-20-
solide
blanc
liquide
brun
Couleur
pH
X
3
Naphtalène (liquide)
C10H8
91-20-
jaunâtre base
3
94
Chapitre IV
Identification des substances chimiques
Mais cela demanderait de rechercher toutes ces informations dans d’autres
bases de données et ce traitement ne peut se faire en automatique au vu des
formats des sources d’information listées précédemment.
La solution adoptée a été de séparer les données en trois bases distinctes,
une par état (liquide, solide et gazeux) et de supprimer les champs de données
incompatibles :
Solides
-
Suppression du pH
-
Suppression de "Vapor Density"
-
Suppression de "Clarity" peu renseigné et pas significatif
-
Suppression du goût peu renseigné
-
Suppression de "Vapor Density"
-
Suppression du goût peu renseigné
-
Suppression de "Clarity" peu renseigné
-
Incomplétude pour "Specific Gravity" (7 produits retirés sur 249)
-
Suppression du pH
-
Suppression de "Specific Gravity"
-
Suppression du goût peu renseigné
-
Suppression de "Clarity" peu renseigné
-
Incomplétude pour "Vapor Density" (7 produits retirés sur 71)
Liquides
Gaz
Toutefois, cette solution ne permet pas de corréler certains champs
comme la couleur, mais ce travail nécessiterait une recherche de l’information
considérable pour compléter la base de données. La base de données du NIOSH
contient en partie cette information mais nécessite un travail de saisie ou, pour
un traitement automatique, de réaliser une analyse sémantique.
Le nombre de données est alors le suivant :
-
95
Un nombre total de 324 substances chimiques,
Chapitre IV
-
Identification des substances chimiques
242 liquides décrits par 132 critères, dont 19 substances ayant les mêmes
descripteurs et classe,
-
134 solides décrits par 110 critères, tous différents
-
et 71 gaz décrits par 120 critères, dont 2 substances ayant les mêmes
descripteurs et classe.
Certaines substances étant présentes dans la base de données sous plusieurs
états.
IV.3.5.2 Version intégrée au logiciel
Pour la version de base de données intégrée au logiciel d’aide à
l’identification des substances, le problème des données incompatibles est traité
par l’algorithme développé en conséquence.
Cette version ultérieure, plus aboutie, a été complétée avec de nouvelles
substances (les toxiques de guerre). Les classes de dangers ont été enrichies par
l’ensemble des classes de la réglementation européenne. La réponse positive ou
négative aux tubes de la société Dräger, soit 191 tubes qualitatifs, ont également
été ajoutés à la base de données.
La base de données est détaillée en annexe II.
IV.3.6 Conclusions sur la base de données
Des programmes de récupération automatique et le traitement de données
ont été développés afin de créer une base de données opérationnelles. Deux
versions distinctes de bases de données ont ensuite été construites, l’une
destinée aux études de faisabilités à l’aide d’arbres de segmentation, l’autre
intégrée au logiciel d’aide à l’identification des substances.
Disposant de données fiables, il est alors possible de déterminer la
quantité d’information nécessaire à l’identification d’une substance.
IV.4 Quantité d’information nécessaire à l’identification
d’une substance
La quantité d’information disponible en situation d'urgence n’est pas
toujours suffisante pour identifier précisément une substance chimique parmi
plus de 27 millions de substances enregistrées à ce jour sur la base de données
du Chemical Abstract Services (CAS-registry) de l’American Chemical Society.
96
Chapitre IV
Identification des substances chimiques
Bien que d’un point de vue purement combinatoire, les 140 critères binaires de la
base de données de WISER soient amplement suffisants pour distinguer
l’ensemble des substances chimiques répertoriées à ce jour, il n’est pas aussi
évident qu’une distinction soit possible en situation d'urgence : ces critères ne
seront pas tous connus en situation d'urgence et, de plus, la répartition des
produits chimiques en fonction des critères n’est pas homogène. Par exemple,
dans la base de données utilisée, il y a moins de 1% des produits qui sont des
gaz de couleur orange, alors que plus de 50% des produits sont des liquides
incolores pouvant irriter les yeux.
IV.4.1 Estimation du nombre de données nécessaires à
l’identification d’une substance
IV.4.1.1 Estimation du nombre de symptômes nécessaires
Une estimation du nombre de symptômes nécessaires à l’identification
d’une substance est faite dans [Bhavnani et al., 2007]. L’analyse faite à partir de
la base de données de WISER (version antérieure contenant 390 substances),
donne une estimation du nombre de symptômes nécessaire de 40 ou plus, pour
estimer précisément une substance chimique.
Afin de compléter ces résultats, nous avons réalisé plusieurs estimations.
Dans un premier temps, nous avons réalisé la même estimation sur une base de
données contenant moins de substances chimiques (324 substances de notre
base de données complète). De même que dans [Bhavnani et al., 2007], la
méthode utilisée est dite de Monte Carlo. Cette méthode se justifie par un
nombre de combinaisons de symptômes trop grand pour permettre de toutes les
tester.
Nombre de combinaisons de symptômes :
Ρ
∑
Ρ
C p = ∑ p=1
p =1 n
n!
p!(n − p )!
Eq. 4
Avec p le nombre de symptômes observés en même temps sur le terrain,
P le nombre maximum de symptômes observés en même temps (P = 40)
Avec n le nombre total de symptômes (79 dans la base de données)
97
Chapitre IV
Identification des substances chimiques
Figure 15 : Nombre de substances en fonction
du nombre de symptômes qu’elles provoquent
En moyenne, le nombre de substances chimiques correspondant à 40
symptômes observés est encore supérieur à un (Figure 15). Il faudrait donc un
nombre important de symptômes pour identifier précisément une substance
chimique dans une base de données réduite.
D’après [Bhavnani et al., 2007], il n’est pas nécessaire d’arriver à un
produit unique. Une liste limitée est suffisante pour permettre aux urgentistes
d’orienter leurs investigations pour identifier le produit. Avec 14 symptômes, le
nombre de substances chimiques est faible (de l’ordre de 10) et cette
information est alors utilisable par les urgentistes alors capables d’affiner
l’identification.
Mais, il faut également tenir compte que la base de données utilisée dans
l’étude de Bhavnani ne contient que 400 produits, ce qui est très réduit par
rapport au grand nombre de produits chimiques existants. En effectuant une
même recherche sur des bases de données plus conséquentes comme celle du
logiciel CAMEO (6000 produits), la liste des substances correspondant aux
critères saisies serait plus importante et, par conséquent, difficile à utiliser.
De plus, la sélection aléatoire de ces symptômes ne tient pas compte de
leur apparition en situation d’urgence. Beaucoup de symptômes observés sur le
terrain ne sont pas spécifiques [Pagnon et al., 2007], donc peu discriminants. Le
nombre de symptômes nécessaires estimé à 14 dans [Bhavnani et al., 2007] est
une sous-estimation. Indépendamment de ce fait, il est déjà rare de disposer
d’autant de symptômes en situation d’urgence.
98
Chapitre IV
Identification des substances chimiques
IV.4.1.2 Estimation du nombre de critères descriptifs et physicochimiques nécessaires
La même estimation a été réalisée en utilisant les critères descriptifs et
physico-chimiques (couleur, odeur, goût, pH, état, densité de vapeur, gravité).
La méthode est adaptée afin de tenir compte des incompatibilités de critères. Par
exemple, pour une substance à l’état de gaz, le pH n’est pas connu. Et une seule
valeur est possible par critère : une fois une couleur choisie, une autre couleur
ne peut pas être prise. Il en est de même pour toutes les catégories de critères :
Un état, une valeur de pH, une couleur, une odeur et une valeur de densité à la
fois.
Les résultats (cf. Figure 16) montrent le pouvoir discriminant des critères
descriptifs par rapport aux symptômes, puisque les sept critères physicochimiques contenus dans la base de données sont suffisants pour identifier en
moyenne une substance précise.
Figure 16 : Nombre de substances correspondantes en fonction du nombre de
critères physico-chimiques
IV.4.1.3 Estimation
du
nombre
de
données
opérationnelles
nécessaires à l’identification d’une substance
Les données disponibles en situation d'urgence sont généralement moins
précises que celles utilisées pour l’estimation précédente et difficiles à obtenir.
99
Chapitre IV
Identification des substances chimiques
Une nouvelle estimation du nombre de données nécessaires à l’estimation d’une
substance a été faite, en tenant compte de la précision et de la disponibilité en
situation d'urgence.
Pour que les données utilisées à cette évaluation soient représentatives des
données opérationnelles, plusieurs traitements ont été effectués :
-
l’état à été simplifié à « liquide », « gaz » ou « solide », sans distinction de
liquide visqueux, de solide métal ou poudre, etc.
-
Il a été fait de même pour le pH qui ne prend que trois valeurs (acide, neutre
ou base) au lieu des sept de la base de données.
-
L’information sur le goût a été supprimée car extrêmement rare en situation
d'urgence et très subjective.
-
Il a été tenu compte de l’imprécision de l’odeur, de la couleur et du pH. La
méthode probabiliste est décrite plus loin.
-
La densité a été supposée connue pour cette estimation. Bien que ce critère
reste difficile à estimer sans appareil de mesure, il a été conservé pour
disposer d’un nombre suffisant de critères et la valeur étant binaire, aucune
imprécision ne pouvait être prise en compte.
L’imprécision relative aux critères « odeur », « couleur » et « pH » est
prise en compte par l’utilisation de distributions de probabilités. Ainsi, un critère
sélectionné n’est plus traité comme une valeur sûre à 100%, mais comme un
degré de vraisemblance de plusieurs critères. Par exemple, si la couleur
orangeâtre est observée, il s’agira peut être d’une substance de couleur orange
(sans certitude), mais il pourra aussi s’agir d’une substance d’une couleur proche
de l’orange. Les substances chimiques alors retenues seront celles qui sont de
couleur orangeâtre ou rougeâtre ou jaunâtre ou brunâtre, et avec des
probabilités différentes. Ces probabilités peuvent être interprétées ensuite
comme un degré de concordance avec les critères observés/mesurés. Une
substance rouge coïncide à 100% avec la couleur rougeâtre observée, alors
qu’une substance de couleur orangeâtre ne coïncidera qu’à 50% (cf. Figure 17).
IV.4.1.4 Imprécision du critère « couleurs »
Ne disposant d’aucune donnée sur le taux d’erreur de perception des
couleurs, c'est-à-dire les probabilités de voir une couleur en présence d’une autre
couleur, une modélisation a été réalisée d’après l’avis d’experts. S’inspirant de la
logique floue, des fonctions de croyance ont été déterminées. Il ne s’agit pas, ici,
100
Chapitre IV
Identification des substances chimiques
d’une modélisation par triangle, trapèze ou autres fonctions usuelles. Ces
modélisations se prêtent bien à des données dont les degrés de similarité sont
représentables sur un axe unique, ce qui n’est pas le cas ici. Les modélisations
habituellement utilisées s’appliquent aux couleurs du spectre lumineux associées
à
une
valeur
de
longueur
d’onde
(représentation
unidimensionnelle)
ou
décomposées en triplet de couleurs primaires (rouge, vert et bleu), et ne sont
pas adaptées à la perception de couleurs soustractives des substances
chimiques.
Pour chacune des onze couleurs présentes en base de données, une
distribution de probabilité a été réalisée (Cf. Figure 17, Figure 18 et Figure 19). Il
faut les interpréter comme un indice de concordance. En prenant l’exemple d’un
sapeur-pompier du binôme de reconnaissance sous ARI (Appareil Respiratoire
Isolant) et en scaphandre limitant la visibilité lors d’une intervention de nuit, qui
rapporte avoir constaté une fuite laissant s’échapper un liquide orangeâtre, on
considérera que toutes les substances de couleur orange en base de données
correspondent à 100%. Mais il pourra s’agir d’une substance jaune avec un
indice de concordance (ou une probabilité) de 50%. Les substances rouges
auront
également
une
probabilité
de
50%
et
les
substances
marrons
correspondront à 25% (Cf. Figure 17, courbe orange).
100
80
Jaunâtre
Orangâtre
Rougeâtre
Brunâtre
%
60
40
20
0
Bleu
Vert
Violet Marron Rouge Orange Jaune Blanc
Gris
Noir Incolore
Figure 17 : Distribution de probabilité par couleur (couleurs chaudes)
101
Chapitre IV
Identification des substances chimiques
100
80
Violacé
Bleuâtre
Verdâtre
%
60
40
20
0
Bleu
Vert
Violet Marron Rouge Orange Jaune
Blanc
Gris
Noir Incolore
Figure 18 : Distribution de probabilité par couleur (couleurs froides)
100
80
Blanchâtre
Grisâtre
Noirâtre
Incolore
%
60
40
20
0
Bleu
Vert
Violet Marron Rouge Orange Jaune Blanc
Gris
Noir Incolore
Figure 19 : Distribution de probabilité par couleur (non couleurs)
Un cas particulier est la présence suspectée d’une substance incolore.
L’absence de coloration peut être due à une concentration faible d’une substance
colorée. Donc toutes les couleurs ont une probabilité non nulle.
IV.4.1.5 Imprécision du critère « pH »
Il a été fait de même pour le pH, mais ce sont des fonctions triangle qui
ont été utilisées. Il existe de telles modélisations dans la littérature, mais elles
sont adaptées à des applications précises et souvent ne s’appliquent qu’à une
plage de valeurs restreintes (acides forts par exemple). La figure ci-dessous
présente la modélisation du pH telle que :
-
Le choix a été fait d’accepter un degré d’imprécision.
-
Bien que le pH soit une grandeur continue, les valeurs portées sur l’axe des
abscisses appartiennent à un ensemble discret correspondant aux sept
intervalles de la base de données.
102
Chapitre IV
-
Identification des substances chimiques
Le pH « données opérationnelles » ne prend plus que trois valeurs, d’où les
trois courbes de distribution de probabilités.
100
80
60
%
Acide
Neutre
Base
40
20
0
1
acid (<3)
acid (3-5)
weak acid (6)
neutral (7)
pH
weak base (8-9)
base (10-12)
base (>12)
14
Figure 20 : Distribution de probabilité du critère pH
IV.4.1.6 Imprécision du critère « odeur »
Les retours d’expérience nous apprennent que les
indicateurs qui
préviennent de la présence d’une substance chimique, conduisant à alerter les
services de secours, sont l’apparition de symptômes et plus souvent la
perception d’une odeur chimique ou incommodante.
L’étude sur l’identification d’une substance chimique à l’aide des tubes
colorimétriques et de l’expertise des sapeurs-pompiers [Bronner et al., 2008] a
montré que l’odeur est un paramètre utile à l’identification, mais qui n’est pas
toujours fiable. Pope et al. (2000) soutiennent que « la science d’évaluation de
l’odeur
est
subjective
à
cause
de
ses
différentes
facettes :
caractère,
acceptabilité, intensité, caractère hédonique, etc. »
L’identification d’une substance par son odeur reste subjective et incertaine :
-
Tous les produits ne sont pas perceptibles par l’odorat humain (monoxyde de
carbone par exemple).
-
La détection et la reconnaissance d’une odeur dépendent de la concentration
de la molécule odorante. A très faible concentration, « l'image » d'activation
des centres intégrateurs n'est pas suffisamment différente du « bruit de
fond » et l'information n'est pas détectable. A une concentration supérieure,
on atteindra le seuil de détection : une odeur indéfinissable. A plus forte
concentration encore, « l'image » devient nette et peut alors être comparée à
une information déjà mémorisée.
-
Les personnes n’ont pas la même sensibilité selon le nombre et la répartition
des cellules nasales.
103
Chapitre IV
-
Identification des substances chimiques
Et la reconnaissance d’une signature olfactive dépend de l’expérience des
personnes.
-
Il faut également tenir compte de l’accoutumance d’une personne, c'est-àdire la perte de sensibilité temporaire.
-
De plus, certains produits ne sont plus perceptibles lorsque la concentration
dépasse un seuil car ils provoquent une anesthésie olfactive. Par exemple,
l’H2S dont le seuil de détection olfactive varie de 0,02 à 0,1 ppm, a un seuil
d'anesthésie olfactive égal à 150 ppm.
L’utilisation de l’odeur comme critère discriminant est sujet à discussions à
cause des risques à sentir une substance toxique. La perception de l’odeur
dépend du seuil olfactif et certains produits comme l’isopropanol, ont un seuil
olfactif supérieur à leur VLE (Valeur Limite d’Exposition). De plus, une fois
équipés des tenues de protection type scaphandre, les sapeurs-pompiers sont
isolés et ne peuvent plus sentir la substance. Mais l’odeur peut avoir été perçue
par les personnes incommodées ou lors de l’arrivée des premiers intervenants.
D’ailleurs l’odeur est mentionnée dans les fiches réflexes de reconnaissance
[SDIS 54, 1999].
L’odeur est donc un critère discriminant à utiliser si l’information est
disponible, mais, pour les raisons citées précédemment, il faut tenir compte de
son imprécision.
Ainsi, une odeur dégagée par une substance chimique (notée Oréelle) sera
perçue différemment (notée Operçue) selon les personnes, les interférents, les
concentrations, etc. La théorie des probabilités permet de calculer la probabilité
conditionnelle P (O perçue / O réelle ) de sentir une odeur Operçue (d’un ensemble fini) en
présence d’une odeur précise Oréelle.
Pour déterminer les probabilités conditionnelles à la perception d’une
odeur, des tests ont été réalisés sur 15 personnes. Aucune distinction n’a été
faite en fonction de l’expérience des personnes et de leur sensibilité car le groupe
de tests était trop restreint pour tenir compte de catégories de personnes en
fonction de leur habitude à sentir des substances chimiques (néophyte, sapeurpompier RCH, chimiste, …). Les tests ont consisté à faire déterminer la nature
des produits chimiques et à leur demander de reconnaître l’odeur perçue parmi
une liste limitée correspondant aux critères utilisés dans la base de données. Les
réponses au test permettent de calculer les distributions de probabilités (de
104
Chapitre IV
Identification des substances chimiques
sentir une odeur) conditionnelles à la présence réelle d’une odeur avérée, ou plus
précisément, à la présence d’une substance chimique associée à une odeur.
L’association odeur avérée et produit chimique est une simplification pouvant
introduire des erreurs mais nécessaire au calcul des probabilités a posteriori
P (O perçue / O réelle ) qui est l’information intéressante car elle va permettre de
sélectionner les produits possibles en fonction de l’odeur perçue en tenant
compte de l’imprécision.
P (O réelle / O perçue ) =
P (O réelle ).P (O perçue / O réelle )
P(O perçue )
Eq. 5
A partir des bases de données (WISER, NIOSH, INRS, …), une odeur Oréelle
de notre base de données a été associée à l’odeur du produit Oprod. On a donc
Oréelle = Oprod
Par exemple, le dichorométhane est associé à une odeur fruitée/sucrée
dans la base de données de WISER.
Oprod=dichorométhane = "fruitée/sucrée".
Il y a des associations triviales telles que la solution d’ammoniac qui est
associée à une odeur d’ammoniac.
Oprod=ammoniac = "ammoniac".
D’après les bases de données, certaines substances peuvent être associées
à plusieurs odeurs. Dans ce cas, chaque odeur sera associée au produit.
L’isopropanol est associé à l’odeur d’acétone et d’alcool.
Oprod=isopropanol = Oréelle="alcool"
Oprod=isopropanol = Oréelle="acétone"
Mais lors des calculs, la probabilité d’apparition P(Oréelle="alcool") sera divisée
par le nombre d’odeurs associées à un même produit, soit deux odeurs dans le
cas de l’isopropanol.
Modifications apportées aux distributions de probabilités conditionnelles
Les substances inodores
De même que pour les couleurs, l’absence de perception d’odeur ne
signifie pas qu’il s’agit uniquement d’une substance chimique inodore, mais il se
peut que la concentration est soit trop élevée, soit trop faible. Donc en l’absence
105
Chapitre IV
Identification des substances chimiques
d’odeur, une probabilité forte est associée à la présence d’une substance inodore
mais les autres odeurs ont également une probabilité (plus faible) d’être
présente.
La valeur « autre odeur » de la base de données
Dans la base de données, seulement 14 odeurs sont distinguées, plus les
substances inodores. Certaines substances chimiques n’ont pas une odeur
correspondant aux 14 de la base de données ; elles sont alors associées à la
valeur « autre odeur ». Le critère « autre odeur » rassemble trop de valeur pour
être traité comme précédemment avec des odeurs précises. Faute de données, la
distribution de probabilité associée est construite sur le même principe que pour
l’absence d’odeur. Une forte probabilité pour la valeur « autre odeur » et une
faible probabilité pour les autres valeurs excepté « inodore ».
Les odeurs qui n’ont pas été testées par notre groupe « test »
La démarche est la même pour les odeurs qui n’ont pu être testées :
fruité, ail, menthe, pomme, amende, … En l’absence d’information, la distribution
de probabilité a été choisie pour favoriser l’odeur en question et laisser une
imprécision faible pour toutes les autres odeurs.
100
80
acetone
alcohol
ammonia
chlorine
odorless
petroleum
sulfur
%
60
40
20
0
acetone alcohol almond ammonia apple
banana chlorine
fishy
fruity
garlic
minty mothball odorless other petroleum sulfur
Figure 21 : Distribution de probabilités du critère odeur
IV.4.1.7 Sélection des substances à partir de critères imprécis
La concordance de la description d’une substance chimique avec les
critères observés est le produit des probabilités conditionnelles maximums
associé à chaque critère.
Une substance S est décrite par n descripteurs binaires.
106
Chapitre IV
Identification des substances chimiques
S : [s1 ,..., sn ] ∈ {0,1}
n
Eq. 6
Et m critères décrivent la substance recherchée T définie comme :
T : [t1 ,..., t n ]∈ {0,1} et
n
∑
n
i =1 i
t =m
Eq. 7
La concordance d’une substance S avec les observations ti est :
{
}
concordance( S ) = ∀j / t j = 1, ∏ j max (P (si / t j ) , ∀i ∈ [1..n] )
Eq. 8
Exemple :
Odeur perçue = Acétone
Couleur = Orange
Une substance orange avec une odeur d’acétone a une probabilité de
(1 x 1 = 1)
Alors qu’une substance rouge qui sent l’alcool aura une probabilité de
(0,5 x 0,4 = 0,2)
Et une substance incolore avec une odeur d’acétone aura une probabilité
nulle (0 x 1) du fait que la valeur « incolore » est trop éloignée de la
valeur « orange »
Pour chaque critère observé, c’est la probabilité conditionnelle maximum
qui intervient dans le produit. En effet, pour un même critère (par exemple la
couleur), une substance peut être associée à plusieurs valeurs (rouge, orange)
de probabilités conditionnelles différentes (s’il s’agit d’une substance brunâtre,
P(rouge/brunâtre)=0,5 alors que P (orange/brunâtre)=0,25).
Chaque substance est alors associée à une valeur comprise entre 0 et 1,
qui correspond à la ressemblance de chacun de ses critères par rapport aux
critères perçus.
Un produit sera retenu si sa probabilité est supérieure à un seuil à définir.
Le graphique ci-dessous (Figure 22) représente le nombre de substances
chimiques correspondant à un nombre de critères donnés pour des seuils de
100%, 50%, 25% et 12%.
Avec les distributions de probabilités définies précédemment, un seuil à
50% revient à un degré d’écart tous critères confondus. Quel que soit le nombre
de critères observés, une substance ne sera retenue que si un seul critère est
107
Chapitre IV
Identification des substances chimiques
différent des valeurs observées d’un degré. Par exemple, une couleur rouge au
lieu d’orange, ou un pH légèrement différent : acide faible au lieu de neutre.
Une concordance de 25% autorise deux critères différents (rouge et acide
faible au lieu de orange et pH neutre) ou un critère différent mais avec un écart
plus important (pH acide (3-5) au lieu de acide faible, ou encore couleur brunâtre
au lieu d’orange).
La dernière limite à 12% permet de sélectionner toutes les substances
avec trois degrés d’écart.
300
Nombre de substances chimiques
250
200
Seuil > 12%
Seuil > 25%
Seuil > 50%
Seuil = 100%
150
100
50
0
0
1
2
3
4
Nombre de criteres physico-chimiques
5
Figure 22 : Nombre de substances correspondantes
à un nombre de critères physico-chimiques imprécis
Pour une combinaison de cinq critères physico-chimiques, le nombre de
substances correspondantes est de l’ordre de cinq. Mais en tolérant une
imprécision de trois degrés (seuil à 12%) avec les distributions de probabilités
admises, le nombre de substances est triplé. Les critères physico-chimiques
permettent, en moyenne, de cibler un petit nombre de substances chimiques,
mais dans le cas d’une petite base de données et pour six critères connus
précisément.
De plus, tous les critères ne sont pas spécifiques et le nombre de
substances correspondantes est très variable selon les critères connus. Pour
quatre critères, le nombre de substances varie de 1 à 47 pour une moyenne de
108
Chapitre IV
Identification des substances chimiques
11. L’identification est précise lorsque les critères sont spécifiques (un gaz
orange), mais d’autres critères (un liquide acide incolore et inodore) ne sont pas
discriminants et correspondent à 47 substances.
IV.4.1.8 Récapitulatif et discussion
Est-il possible d’identifier précisément une substance chimique à partir des
données opérationnelles disponibles en situation d’urgence ?
D’après notre étude et celle de Bhaynani [Bhavnani et al., 2007], il ressort
qu’en moyenne, les combinaisons de symptômes ne sont pas suffisamment
discriminantes :
plus
de
40
symptômes
sont
nécessaires
pour
identifier
précisément une substance chimique et plus de 14 symptômes pour disposer
d’une liste réduite de substances possibles. Ce nombre de symptômes est trop
important pour être disponibles en situation d’urgence. De plus, Il est parfois
difficile d’identifier un symptôme (imprécision qui n’a pas été prise en compte
dans cette étude) et que la cause d’un symptôme n’est pas toujours liée à la
présence de la substance chimique (incertitude difficile à prendre en compte).
Les critères physico-chimiques sont plus discriminants, mais doivent être
estimés avec précision, ce qui est difficile sur le terrain. Lorsque l’imprécision est
prise en compte, les critères physico-chimiques restent discriminants en
moyenne. Mais, il y a une très grande variabilité selon les critères connus et les
choix
effectués
tendent
à
minorer
l’imprécision
relative
aux
données
opérationnelles :
-
La densité est considérée connue.
-
Le seuil d’imprécision fixé arbitrairement et les distributions de probabilités
restent favorables par rapport à la réalité du terrain dans certains cas. Mais
sans expérimentation sur le terrain, il n’est pas possible de préciser le seuil
d’imprécision.
Les résultats de cette étude sont à prendre comme une borne optimiste de
la qualité de l’identification par une approche logicielle. Avec une imprécision plus
grande et en tenant compte de l’incertitude, il est légitime de penser que
l’identification en situation d’urgence conduira à une liste de substances
chimiques trop importante pour être exploitable par les urgentistes. Qui plus est,
cette étude a été réalisée sur une base de données réduite, dont le contenu n’est
peut-être pas représentatif de l’ensemble des substances chimiques pouvant être
rencontrées en situations d’urgence.
109
Chapitre IV
Identification des substances chimiques
La précision de l’identification par cette approche logicielle n’a pas été
évaluée en combinant à la fois critères physico-chimiques et symptômes. La
combinaison des deux est abordée dans le paragraphe suivant à l’aide de deux
retours d’expérience.
IV.4.2 Estimation de la précision de l’identification à l’aide
de retours d’expérience
Dans ce paragraphe, deux retours d’expérience (REX) sont utilisés pour
évaluer la précision de l’identification à l’aide des données opérationnelles. La
démarche consiste à saisir dans le logiciel WISER, les symptômes et critères
physico-chimiques mentionnés dans le REX. A chaque saisie de critère, le
nombre de substances chimiques correspondant est indiqué et une vérification de
la concordance entre les critères saisie et la substance chimique recherchée est
faite. La base de données utilisée est la version v3.0.39 contenant 416
substances.
IV.4.2.1 Intoxication à l’acide cyanhydrique
IV.4.2.1.1
Présentation du REX
Le 19 janvier 1983, dans une usine à Montreuil (France), il
se produit une intoxication collective à l’acide cyanhydrique
(n° CAS : 74-90-8) [Noto et al.].
Description :
Gaz incolore, de faible densité avec une odeur d’amende
amère décelable à la dose de 1ppm.
Symptôme :
5 personnes en arrêt cardio-respiratoire
1ère victime : nausée, maux de tête, sensation d’oppression
thoracique puis arrêt cardio-respiratoire
2ème à 5ème victime : arrêt cardio-respiratoire
6ème : incommodée, présentant des vertiges
110
Chapitre IV
IV.4.2.1.2
Identification des substances chimiques
Informations saisie dans WISER
D’après le REX, plusieurs critères descriptifs sont connus ainsi que des
symptômes.
critères descriptifs :
Etat = Gaz
75 substances
Color = Colorless
71 substances
Specific gravity < 1
43 substances
Odor = Almond
5 substances (critère très discriminant)
On supposera la densité connue, bien que ne pouvant être estimée
visuellement.
Avec ces critères, cinq substances sont identifiées comme pouvant être la
substance recherchée
Nom de la substance
N° CAS
Cyanogen
460-19-5
Cyclobutane
287-23-0
Hydrogen Cyanide
74-90-8
Neopentane
463-82-1
Vinyl Methyl Ether
107-25-5
Symptômes :
Arrêt cardio-respiratoire
4 substances : Vinyl Methyl Ether éliminé
Nausée
4 substances
Maux de tête
3 substances : Neopentane éliminé
Vertiges (Dizziness)
2 substances: Hydrogen Cyanide éliminé
Au final, l’ajout du symptôme « vertiges » conduit à supprimer la
substance chimique recherchée et conduit à une erreur d’identification.
Dans la base de données, le symptôme « vertiges » n’est pas associé au
produit recherché. Par contre, ce symptôme apparait dans la description au
format texte de l’acide cyanhydrique dans le logiciel WISER dans la section
relative aux risques chroniques "chronic exposure".
111
Chapitre IV
Identification des substances chimiques
Dans [Us Army Chemical School, 2005], les vertiges sont indiqués dans les
symptômes d’une exposition aigüe : "Inhalation of small amounts causes
giddiness".
Dans [O'Neil et al., 2004], également : "Headache, vertigo, nausea and
vomiting may occur with lesser concns."
Il s’agit d’une donnée manquante dans la base de données qui se traduit
par l’élimination de la substance recherchée. Par contre, deux substances
correspondent aux critères saisies (Cyanogen et Cyclobutane). L’absence de
données dans la base de données peut conduire à une erreur d’identification.
Après l’ajout de cette donnée manquante, la saisie se poursuit avec le
dernier symptôme constaté sur la première personne intoxiquée. Cette dernière
information conduit à une identification impossible car aucune substance ne
correspond à l’ensemble des critères.
Oppression thoracique
0 substance
Cette information n’est pas répertoriée. Dans les bases de données
consultées, l’acide cyanhydrique ne provoque pas d’oppression thoracique. D’où
plusieurs conclusions possibles :
-
cette information est manquante en base de données,
-
ou le symptôme n’est pas avéré,
-
ou il est du à une autre cause.
IV.4.2.1.3
Résultats obtenus
Les critères physico-chimiques se révèlent discriminants, en particulier
l’odeur, à condition de l’identifier clairement. Par contre, les symptômes
n’apportent que peu d’information : 80 substances chimiques correspondent aux
cinq symptômes observés contre cinq substances correspondant aux quatre
critères. De plus, deux symptômes qui ne sont pas associés à la substance
recherchée sont source d’erreur.
En situation d'urgence seule l’odeur aurait pu orienter vers la substance
recherchée car seulement huit substances sont des gaz ayant une odeur
d’amande. Les autres données n’apportent que peu information ou sont des
sources d’erreur.
112
Chapitre IV
Identification des substances chimiques
IV.4.2.2 Intoxication au bromure de méthyle
IV.4.2.2.1
Présentation du REX
Etude d’un cas d’intoxication au travail [Maréchal-Blanckaert
et al., 1997] :
Une personne, âgée de 27 ans, est hospitalisée à la suite
d’une exposition accidentelle aux vapeurs toxiques de
bromure de méthyle (N° CAS : 74-83-9) pendant environ 15
minutes, à des concentrations de 20 g/m3, soit 5 000 PPM.
Description :
« Le bromure de méthyle est un gaz incolore, inodore,
toxique et redoutable en raison de son caractère insidieux. II
est peu soluble dans l’eau, et sa densité est plus importante
que celle de l’air. »
Symptôme :
« A l’entrée, il est conscient mais présente un syndrome
cérébelleux
avec
démarche
ébrieuse,
troubles
gastro-
intestinaux (nausées, vomissements, douleurs abdominales
et diarrhée). »
IV.4.2.2.2
Informations saisie dans WISER
Description :
Gaz incolore, Inodore
24 substances
Densité > 1
21 substances
Symptômes en observation clinique :
Nausées, vomissements,
Douleurs abdominales et diarrhée
8 substances (erreur)
Dans la base de données de WISER, le bromure de méthyle n’est pas associé au
symptôme « douleurs abdominales ». Pourtant cette substance chimique est bien
référencée comme provoquant des douleurs abdominales dans la base de
données du NIOSH. La recherche est poursuivie sans ce symptôme.
113
Chapitre IV
Identification des substances chimiques
Nausées, vomissements
et diarrhée
9 substances
L’observation « d’un syndrome cérébelleux avec démarche ébrieuse » n’est pas
facile à traduire en critères proposés dans WISER. D’après un expert, cinq
symptômes pourraient correspondre, mais il n’est pas possible d’être affirmatif.
Agitation
6 substances
Confusion mentale
5 substances
Vertiges
3 substances
Céphalées
3 substances
Perte de la coordination
0
substance
Le symptôme « Perte de la coordination » est donc retiré de la saisie.
Présence d’un érythème au niveau des mains et des pieds (parties cutanées en
contact avec le toxique).
Erythème
0 substance
Le symptôme ne conduit à aucune identification. Il aurait donc induit en erreur. Il
est également retiré pour la suite.
Les lésions cutanées avaient un aspect bulleux pouvant correspondre à une
brulure de stade II.
Brûlure
2 substances
Le patient va présenter 12 heures après son admission, une crise convulsive
généralisée, suivie d’un coma profond aréactif et hypertonique, […]
Convulsions
IV.4.2.2.3
2 substances
Résultats obtenus
Cette fois encore, ce sont les critères physico-chimiques qui sont
discriminants.
Dans le meilleur des cas, l’identification conduit à deux substances :
l’hexafluorure de sélénium et le bromure de méthyle qui est la substance
recherchée.
Mais
pour
cela,
il
faut
bien
interpréter
deux
symptômes
particulièrement difficiles même pour des personnes accomplies. Certains
114
Chapitre IV
Identification des substances chimiques
symptômes qui n’apparaissent que plusieurs heures après l’incident ne seront
donc pas disponibles en phase d’urgence.
IV.4.2.3 Discussion
Sur les deux retours d’expérience ayant servi à tester la précision de
l’identification grâce au logiciel WISER, il ressort la difficulté d’identifier
précisément une substance chimique. D’une part, par la nécessité de connaître
de nombreux critères et symptômes. Pendant la phase d’urgence, tous les
critères renseignés dans le REX ne seront pas connus (densité, certains
symptômes, …). Et la prise en compte de l’imprécision et de l’incertitude ne ferait
que dégrader la précision de l’identification avec l’ajout de nombreuses
substances. D’autre part, l’utilisation de critères mal renseignés en base de
données ou mal identifiés sur le terrain conduit à des erreurs.
L’identification précise d’une substance chimique étant difficile à réaliser à
partir des données opérationnelles en faible nombre, il faut alors s’orienter vers
une autre solution : l’identification des dangers liés à la substance.
IV.5 Identification des dangers liés à une substance
chimique à partir des données opérationnelles
Indéniablement,
la
prise
de
décision
opérationnelle
repose
sur
la
connaissance de la substance chimique. Elle permet d’évaluer les conséquences
possibles et de déterminer les périmètres de sécurité. Elle renseigne également
sur son comportement dans le milieu ambiant (solubilité, réactions possibles
avec d’autres produits, produits de décomposition pouvant se former), qui va
servir aux choix des moyens à utiliser en cas d’intervention des services de
secours, ainsi que les précautions à prendre.
Mais en l’absence d’une connaissance précise de la substance chimique,
d’autres informations peuvent aider à la prise de décision. L’identification des
dangers constitue déjà un premier niveau d’aide à la décision. Par exemple, la
connaissance précise de la substance chimique n’est pas nécessaire pour
l’utilisation des fiches réflexes [FNSPF, 1992b] p287-303. Il est uniquement
nécessaire de connaître l’état du produit (gaz ou liquide) et les risques qui y sont
liés (inflammable, toxique, corrosif) ; l’état liquide ou gazeux pouvant être
115
Chapitre IV
Identification des substances chimiques
facilement connu sur le terrain. Les dangers relatifs à la substance contraignent
également le choix des protections, matériels (pompe, pinoche, …) et permettent
la sélection de périmètres par défaut.
Le choix a donc été de proposer une méthodologie d’aide à l’identification
des dangers liés à une substance chimique. L’étape préliminaire est de vérifier
que l’information disponible en situation d'urgence permet d’identifier les
dangers. Ensuite, un logiciel adapté à cette problématique a été développé sur la
base du fonctionnement du logiciel WISER.
IV.5.1 Démarche
L’objectif principal est de développer une méthode d’identification des
dangers en fonction des données opérationnelles, c'est-à-dire une fonction
capable d’associer à une substance dont on connait les descripteurs, la classe
correspondante avec un taux d’erreur acceptable.
La première étape est de constituer une base de données fiables (IV.3)
pour réaliser une étude de faisabilité d’une telle méthode. Puis il s’agit de
s’assurer que l’information disponible en situation d'urgence est suffisante à
l’identification des dangers qui sont liés aux substances chimiques.
IV.5.2 La quantité d’information est-elle suffisante ?
Les arbres de décision apportent un début de réponse en indiquant :
-
la
complexité
des
arbres
nécessaires
à
une
identification
précise
(construction d’arbres complets),
-
la qualité de l’identification pour des arbres plus restreints (construction
d’arbres limités en profondeur),
-
le nombre de critères discriminants différents pour chaque arbre.
Dans un premier temps, nous ne nous intéresserons pas à la règle de
décision produite par les arbres, mais à l’information qu’ils contiennent à travers
la hiérarchisation des critères discriminants. C’est le premier principe, celui de la
construction de l’arbre qui va permettre d’identifier cette information. Cette
recherche d’information est présentée au paragraphe suivant.
116
Chapitre IV
Identification des substances chimiques
IV.5.2.1 Recherche des paramètres discriminants à l’aide des
arbres de décision
La classification des substances selon huit classes (trois types de dangers
de valeur binaire soit 23 classes) a été séparée en trois problèmes distincts, en
identifiant séparément les trois dangers. Trois arbres sont donc construits, un
par danger.
Seuls
les résultats
obtenus sur les
liquides sont présentés, mais
l’argumentation de ce paragraphe est valable aussi pour les solides et les gaz.
La base de données contient 242 substances chimiques à l’état liquide,
décrites par 132 critères binaires. Et pour chacun des trois risques, le logiciel
StatBox Pro20 a été utilisé pour construire les arbres de décision selon deux
méthodes : la méthode CART qui repose sur l’indice de Gini pour évaluer la
dispersion et cherche à obtenir les classes les plus pures possibles ; la méthode
CHAID qui utilise, quant-à-elle, le test du χ 2 pour obtenir des divisions en
fonction du descripteur qui a le plus fort lien statistique avec la classe.
Les résultats sous forme d’arbre sont facilement lisibles. Pour chaque
nœud de l’arbre, sont indiqués :
-
l’effectif de la population
-
le pourcentage de chaque classe (non inflammable et inflammable
-
le critère le plus discriminant, celui selon lequel est partagée la population
en deux groupes
-
la valeur de χ 2 de ce critère
Un exemple d’arbre obtenu avec le logiciel StatBox est présenté en Figure
23. La construction de l’arbre a été limitée à quatre niveaux pour une question
de lisibilité.
20
StatBox Pro est un logiciel commercialisé par la société Grimmersoft et s’utilise avec Microsoft
Excel. La version de Statbox Pro qui a été utilisée est la v6.40.
117
Chapitre IV
Identification des substances chimiques
1|
Effectif : : 49,00
: 73,47%
1 : 26,53%
1|
Effectif : : 86,00
: 59,30%
1 : 40,70%
0|
Effectif : : 46,00
: 78,26%
1 : 21,74%
1|
Effectif : : 33,00
: 33,33%
1 : 66,67%
Gastro/Urinary=vomiting
0,0131
0|
Effectif : : 4,00
: 100,00%
1 : 0,00%
Respiratory=pulmonary edema
0,0475
1|
Effectif : : 7,00
: 28,57%
1 : 71,43%
Effectif : : 242,00
: 23,14%
1 : 76,86%
Temperature=shivering
0,0143
Respiratory=congestion
0,0189
0|
Effectif : : 37,00
: 40,54%
1 : 59,46%
1|
Effectif : : 114,00
: 46,49%
1 : 53,51%
1|
Effectif : : 3,00
: 0,00%
1 : 100,00%
0|
Effectif : : 28,00
: 7,14%
1 : 92,86%
Specific Gravity=sinks in water (> 1)
0,0971
Taste=other taste
0,0035
1|
Effectif : : 5,00
: 0,00%
1 : 100,00%
Eyes=impaired vision
0,0118
0|
Effectif : : 2,00
: 100,00%
1 : 0,00%
0|
Effectif : : 21,00
: 0,00%
1 : 100,00%
1|
Effectif : : 1,00
: 100,00%
1 : 0,00%
0|
Effectif : : 128,00
: 2,34%
1 : 97,66%
Skin=sweating
0,0079
0|
Effectif : : 127,00
: 1,57%
1 : 98,43%
1|
Effectif : : 1,00
: 100,00%
1 : 0,00%
Nose=bloody nose
0,0081
0|
Effectif : : 126,00
: 0,79%
1 : 99,21%
1|
Effectif : : 99,00
: 0,00%
1 : 100,00%
Neurological=lowered mental state
0,0002
0|
Effectif : : 27,00
: 3,70%
1 : 96,30%
Figure 23 : Premiers niveaux de l’arbre de décision du danger « inflammable »
des liquides (méthode CART)
118
Chapitre IV
Identification des substances chimiques
En tout, six arbres ont été construits (3 dangers x 2 méthodes) pour
chaque état. La profondeur des arbres n’a pas été limitée puisqu’il s’agit pour
l’instant de rechercher les critères discriminants et pas de déterminer une
fonction d’identification. Le tableau ci-dessous (Tableau 12) synthétise les
caractéristiques des arbres obtenus pour les substances à l’état liquide.
Tableau 12 : Comparaison des arbres construits par les méthodes CHAID et
CART (liquides)
CHAID
CART
Nombre de
Profondeur
Nombre de
Nombre de
Profondeur
Nombre de
critères
max.
nœuds
critères
max.
nœuds
INF
23
8
26
28
11
30
TOX
20
10
25
26
12
27
EXP
39
9
61
48
14
61
Les deux méthodes produisent des arbres permettant une discrimination
complète des dangers. C'est-à-dire que toutes les feuilles des arbres contiennent
des substances présentant le même danger. Cependant il faut disposer de
beaucoup de critères pour identifier les dangers de l’ensemble des substances,
en particulier pour le danger « explosif ». La profondeur maximum comprise
entre 8 et 14 selon la méthode et les dangers donne une indication du nombre
maximum de critères à connaitre pour identifier les dangers.
Un constat est que les arbres obtenus avec la méthode CHAID sont mieux
équilibrés. C'est-à-dire que les chemins (racine, feuille) sont de tailles voisines
alors qu’avec la méthode CART les arbres sont plus déséquilibrés. En dehors
d’une vérification graphique ou de la théorie des graphes (profondeur plus
grande pour un nombre de nœuds similaire), l’analyse de l’indice de Gini et du
χ 2 permet de l’expliquer : Le test de Gini effectue une comparaison des
proportions, mais l’effectif des sous-ensembles obtenus à chaque division
n’intervient pas. Cela explique qu’à certaines divisions, il sera privilégié d’extraire
un petit groupe homogène d’un ensemble, alors que la méthode CHAID tend à
créer des sous-ensembles d’effectifs proches.
•
Avec la méthode CHAID la profondeur moyenne δ moy de l’arbre est plus petite
donc il faut moins de critères, en moyenne, pour identifier la classe.
δ CART ≥ δ CHAID
119
Chapitre IV
Identification des substances chimiques
δ ≥ δ ≥ log 2 ( N ) avec N le nombre de nœud de l’arbre
Figure 24 : Arbres binaires de profondeurs différentes
•
Le nombre de critères différents nécessaires est plus petit avec la méthode
CHAID. La quantité d’information totale est donc moins importante pour
l’identification de l’ensemble des substances chimiques.
•
Le nombre de nœuds et la profondeur de l’arbre sont également plus petits
avec la méthode CHAID. Il faudra donc moins de critères pour identifier
l’ensemble des produits.
En dehors de ces différences, les arbres utilisent globalement les mêmes
critères. Il n’y a pas des arbres radicalement différents. Cela ne signifie pas qu’il
n’existe pas d’autres arbres, d’autres combinaisons de critères pour réaliser
l’identification des dangers, mais que certains critères se distinguent des autres
et apparaissent comme étant plus discriminants quelle que soit l’indice utilisé
( χ 2 , indice de Gini, …).
Dans un arbre de décision, les critères les plus discriminants sont proches
de la racine de l’arbre. L’étude des premiers niveaux des arbres en tenant
compte des tailles des groupes et du test associé au χ 2 permet d’identifier ces
critères contenant l’information utile.
IV.5.2.2 Information utile
L’identification des paramètres discriminants peut déboucher sur deux
utilisations :
1) Vérifier l’intérêt des critères à collecter pour compléter la base de
données. Cela permet un gain de temps dans la réalisation de la base de
120
Chapitre IV
Identification des substances chimiques
données, en réalisant l’étude des données utiles sur une base réduite
avant de réaliser la collecte d’information pour un plus grand nombre de
substances. La condition nécessaire est que la base de données utilisée
pour l’étude soit représentative de l’ensemble des substances chimiques
de la base de données finale.
2) Déterminer les critères opérationnels à rechercher sur le terrain en
situation d’urgence. Pour cette application, il faut limiter les critères à ceux
qui peuvent être acquis et ne pas garder des critères comme les effets sur
les victimes qui ne sont pas forcément présents ou demander d’obtenir
des critères comme le goût d’une substance.
Pour cette recherche d’information utile, les arbres ont été construits à
partir des critères descriptifs (excepté le goût) et sans utiliser les effets
potentiels sur les victimes. Les critères qui ressortent de cette étude sont
présentés ci-après.
Produits inflammables moins denses que l’eau
Pour l’identification du danger d’inflammabilité d’un liquide, la densité se
révèle être un critère très caractéristique des produits inflammables (Figure 25).
En effet, dans la base de données utilisée, plus de 50% des produits sont plus
légers que l’eau et plus de 97% de ces produits sont inflammables.
Figure 25 : Critères discriminants pour les liquides inflammables
Sur le plan opérationnel, ce critère est assimilé à un repère visuel : « estce que le produit flotte ou coule ? ». Mais c’est sans compter le fait que la fuite
n’a pas toujours lieu dans l’eau, que le produit peut être incolore dans la majorité
121
Chapitre IV
Identification des substances chimiques
des cas ou encore être miscible. Mais il existe des appareils portatifs de mesure
de densité qui pourraient être utilisés par les CMIC.
La couleur, ainsi que l’odeur avec un degré moindre, sont également des
critères discriminants selon les valeurs qu’ils prennent (critères non représentés
sur cet arbre). Un liquide incolore ou inodore n’apportera pas beaucoup
d’information, mais dans les autres cas, l’information permettra de cibler
rapidement les dangers. A noter également une corrélation entre liquides
explosifs et inflammables.
Liquides explosifs et toxiques
La
arbres
construction
de
des
segmentation
montre un lien entre les
liquides
explosifs
et
toxiques.
Cependant
le
faible
nombre de substances et la
grande majorité de toxiques
ne
permet
de
tirer
de
Figure 26 : Critères discriminants pour les
conclusions.
liquides explosifs et toxiques
Viscosité
Il ressort également que tous
les
liquides
visqueux
sont
des
substances toxiques. Mais pour la
même
raison
évoquée
précédemment, la base de données
manquant
de
substances
non
toxiques, il serait hasardeux de tirer
de conclusions.
Figure 27 : Critères discriminants
pour les liquides toxiques
122
Chapitre IV
Identification des substances chimiques
Gaz
Les gaz lourds ou odorants sont en grande majorité toxiques (Figure 28).
Il y a également un lien entre gaz inflammables et gaz explosifs.
Figure 28 : Critères discriminants pour les gaz toxiques
Bilan sur la recherche d’informations discriminantes
Les arbres de décision ont permis de montrer que les liquides moins
denses que l’eau sont majoritairement inflammables. Il s’agit d’un critère très
discriminant. En dehors de ce constat, les résultats obtenus avec les arbres ne
permettent pas de mettre en évidence des critères très discriminants qui seraient
à rechercher en priorité en situation d'urgence. Il n’y a pas de critères qui se
distinguent des autres par leur valeur de χ 2 .
IV.5.3 Identification des dangers à l’aide d’arbre de décision
Un arbre de décision combine les critères discriminants pour constituer
une de règle de décision. Dans notre cas, la règle de décision permet de
connaitre pour une substance, si elle présente ou non le danger ciblé.
Dans
le
paragraphe
IV.5.2.1,
les
arbres
obtenus
montrent
que
l’information contenue dans l’ensemble des critères était suffisante pour
permettre une identification des dangers de l’ensemble des substances avec un
123
Chapitre IV
Identification des substances chimiques
taux d’erreur nul. En effet, pour chacun des trois dangers retenus, il est possible
de construire un arbre de segmentation dont chaque feuille regroupe des
substances d’une même classe (toxique ou non, explosif ou non, …).
Mais rien de garantit qu’il ne s’agit pas d’arbres spécialisés, adaptés aux
données qui ont servies à les construire et incapables de généraliser à l’ensemble
des possibles, ne permettant pas d’obtenir une bonne identification des autres
substances chimiques. De même que d’autres méthodes comme les réseaux de
neurones par exemple, les arbres de décisions construits sur un ensemble
d’apprentissage tendent à se spécialiser, à apprendre par cœur et perdent de
leur pouvoir de généralisation.
IV.5.3.1 Formalisation du problème de discrimination
Nous disposons d’un ensemble ou population X de N = 242 substances
chimiques ou individus xi.
Données d’entrée :
Les paramètres d’entrée de la méthode sont les données opérationnelles
contenues dans la base de données réalisée. Chaque substance est décrite par
132 critères binaires.
x = { x1, x2 ,…, xd } ∈ {0,1}d (avec d=132 )
(9)
Données de sortie : classes de risques
Chaque substance est associée à trois des dangers de la classification NFPA
(inflammable, explosif, toxique).
C = {c1 , c2 ,..., c K } (avec K = 2 3 )
(10)
Méthode de discrimination
L’objectif de la méthode est de déterminer une fonction d’identification :
f :X →C
(11)
A partir d’exemple d’apprentissage, c'est-à-dire des couples ( x, c) de X × C .
Telle que la sortie de la fonction u i = f ( xi ) soit conforme à la classe ci (la valeur
de sortie espérée) avec le moins d’erreur possible. Usuellement on choisira de
calculer l’erreur moyenne quadratique.
124
Chapitre IV
Identification des substances chimiques
 f ( xi ) − ci 
E = ∑

N

i =1 
N
2
(12)
Simplification
Afin de mieux visualiser la corrélation entre les descripteurs et chacun des
dangers liés aux substances chimiques, l’identification des huit classes sera
décomposée en trois fonctions distinctes (une par danger) réalisant une décision
binaire. Cela permet également d’obtenir des fonctions moins complexes plus
faciles à obtenir lors de la phase d’apprentissage.
f danger : χ → { 0 ; 1 } avec danger ∈{inflammable, toxique, explosif}
(13)
IV.5.3.2 Ensemble d’apprentissage et généralisation
Apprentissage et généralisation vont de paire. La phase d’apprentissage
(construction de l’arbre) permet de tirer des règles à partir d’exemples. Et ces
règles doivent être généralisables à l’ensemble des cas pouvant être rencontrés.
Cela n’est possible qu’à certaines conditions sur le choix de l’ensemble
d’apprentissage :
-
être de taille suffisante pour contraindre le problème d’ajustement de la
fonction d’identification
-
et être représentatif de l’ensemble des possibles.
Le principe de la construction d’arbre de segmentation limite de lui-même
la taille de l’arbre et, par conséquent, la complexité de la fonction d’identification
(son nombre de variables). Le problème n’est donc pas sous-déterminé.
Il est possible de le vérifier par analogie avec les réseaux de neurones, les
arbres de segmentation pouvant être reproduits par des réseaux de neurones de
type perceptron multi-couches constitués de deux couches.
Une rapide présentation des réseaux de neurones et du perceptron multicouches est nécessaire avant de poursuivre.
Brève introduction aux réseaux de neurones
Les réseaux de neurones (RN) ou modèles connexionnistes sont fondés sur
« une analogie avec la physiologie de la transmission de l’information et de
l’apprentissage dans les systèmes cérébraux. » [Cornuéjols et al., 2002].
125
Chapitre IV
Identification des substances chimiques
D’un point de vue mathématique, un réseau de neurones peut être décrit
simplement comme un graphe orienté21 dont les arêtes sont pondérées par un
coefficient synaptique et dont les sommets sont les neurones. C'est-à-dire
des unités élémentaires de calcul aux possibilités relativement faibles mais dont
leurs interconnexions permettent d’effectuer des calculs globaux complexes.
Neurone formel
Un
neurone
artificiel
est
une
approximation du fonctionnement du neurone
biologique
[McCulloch
et
al.,
1943].
Cet
élément de base des RN comporte n entrées
Entrées
x1
w1
x2
w2
et une sortie et réalise une fonction non
linéaire,
paramétrée,
à
valeurs
bornées
[Dreyfus et al., 2002].
Le
neurone
effectue
y
v
wn
une
somme
pondérée de poids wi sur ses entrées xi
(variables sur lesquelles il opère), à laquelle
b
xn
Figure 29 : Neurone formel
s’ajoute un terme constant ou biais b. Le potentiel v, résultat du calcul, est
soumis à une transformation par une fonction linéaire ou non, appelée fonction
d’activation f.
v = b + ∑i =1 wi xi
n
Eq. 14
Il existe plusieurs formes de fonction d’activation (identité, seuil, sigmoïde,
…). Pour une grande majorité d’applications, la fonction d’activation est une
sigmoïde dont l'expression habituellement retenue est :
1
f (v ) =
1+ e
− ( v −θ )
T
Eq. 15
où ß représente le seuil et T contrôle la pente.
On utilise également la tangente hyperbolique d’équation :
tanh(v ) =
21
e v − e −v
e v + e −v
Eq. 16
Un graphe orienté G=(S,A) est donc la donnée d’un ensemble fini non vide de sommets S et d’une relation
binaire A définie sur S. Voir la théorie des graphes.
126
Chapitre IV
Identification des substances chimiques
Perceptron multi-couches
Un PMC est constitué de plusieurs couches (Figure 22) :
- une couche d’entrée
- une ou plusieurs couches de neurones cachées n’ayant pas d’interaction avec
l’extérieur
- une couche de neurones de sortie
Chaque neurone est relié à l’ensemble des neurones des couches voisines.
Figure 30 : Architecture du PMC
Arbres de segmentation et réseaux de neurones
Un arbre de segmentation peut être
classe qui réalise un OU des feuilles
décrit comme un Perceptron Multi-
correspondant à une même classe.
Couches (PMC) particulier à deux
couches
cachées
auxquelles
il
manque des liaisons (ou de poids
nul). Les neurones de la première
couche correspondent aux nœuds de
l’arbre (n1 et n2) ; et la deuxième
couche
qui
réalise
un
ET,
est
constituée des feuilles (f1 à f3). Il
existe
une
connexion
entre
un
neurone ni et un neurone fj s’il existe
un chemin (ni ; fj) dans l’arbre. Enfin,
la couche de sortie a un neurone par
127
Figure 31 : Arbre binaire et PMC
équivalent
Chapitre IV
Identification des substances chimiques
Taille de l’ensemble d’apprentissage
Pour un arbre binaire comportant N nœuds, le nombre de feuilles est égal
à N+1. Il faut donc un ensemble d’apprentissage de cardinal supérieur ou égal à
N+1 ; cela dans le meilleur des cas, où les exemples correspondent précisément
aux différents cas couverts par l’arbre.
Dans le pire cas, il faut un nombre d’exemples doit correspondre à
l’ensemble des cas potentiellement couverts par l’arbre. Il s’agit alors des
combinaisons possibles de critères utilisés dans l’arbre, qui est au pire égal au
nombre de nœuds. Le nombre de combinaison vaut 2N.
La transformation en réseau de neurones permet de préciser cet intervalle
[ N+1 ; 2N ] trop large pour être réellement utile.
Pour un PMC, le nombre de paramètres à calculer lors de l’apprentissage
est égal au nombre de coefficients synaptiques U. Soit un nombre minimum
d’exemples équivalent à U.
Par construction, le PMC équivalent à un arbre à un nombre de coefficients
synaptiques
-
égal au nombre de feuilles N+1 en sortie de la couche cachée
-
égal à la somme des longueurs des chemins de l’arbre en entrée de la
couche cachée.
La somme des longueurs des chemins est maximale pour un arbre dont les
nœuds sont sur un même chemin et vaut
( N + 1) × N
+ N . Elle est minimale pour
2
un arbre équilibré et vaut N × log 2 ( N ) .
En considérant le pire des cas, il est nécessaire d’avoir un ensemble
d’apprentissage d’une taille de l’ordre de
( N + 1) × N
+ N exemples.
2
Dans le cas des arbres de décision construits les bases de données de
substances chimiques, le nombre d’exemples nécessaires dépassent la taille de la
base de données. Le calcul du nombre exact d’exemples nécessaires en utilisant
les longueurs réelles de l’ensemble des chemins (racine-feuille), on obtient des
nombres légèrement inférieurs à la taille de la base de données. L’apprentissage
est possible, mais ces nombres d’exemples nécessaires proches de la taille des
bases de données indiquent que les arbres sont spécialisés.
128
Chapitre IV
Identification des substances chimiques
IV.5.3.3 Evaluation de l’identification des dangers par les arbres de
segmentation
Pour éviter d’avoir des arbres de décision trop spécialisés, la méthode
CHAID peut interrompre la construction de l’arbre (pré-élagage) en fonction du
test d’indépendance du χ 2 utilisé pour vérifier l’homogénéité des classes (pour
un problème de classification).
Une autre approche, la plus répandue, consiste à diviser les données en
deux ensembles disjoints, l’un destiné à l’apprentissage et l’autre à la validation.
Dans le cas des arbres de décision, la méthode CART construit l’arbre complet
lors de l’apprentissage. Ensuite une phase de post-élagage est réalisée sur un
ensemble de validation pour déterminer les sous-arbres terminaux devant être
supprimés et éviter ainsi la spécialisation de la méthode d’identification.
Mais ces méthodes utilisées pour la construction d’arbres de décision
reposent sur un seuil devant être fixé par un expert et ne garantissent pas que le
résultat est proche de l’optimal, ni même qu’il est suffisant. Il est donc
nécessaire d’évaluer l’efficacité de la règle de décision.
Etude des caractéristiques des arbres
L’étude des caractéristiques des arbres obtenus ne permet pas de valider
la méthode d’identification, mais donne tout de même une tendance. Cela fournit
des indices permettant une première appréciation du pouvoir de généralisation.
Les arbres de segmentation, quelle que soit la méthode, comporte un
grand nombre de feuilles (avec en moyenne 2 à 5 produits par feuilles). Sachant
qu’au final, il n’y a que deux classes à distinguer (présentant le risque en
question ou non), le nombre de feuilles et la répartition des individus par feuille
laisse à penser qu’il s’agit d’un arbre spécialisé et qu’il n’y a pas de véritable
corrélation entre les critères et les individus. Il faut souligner que la taille des
segments obtenus n’est exploitable que si on obtient au moins 20 à 30
observations au niveau des feuilles d’un arbre construit avec au moins 500
individus. Ainsi, dans le cas des liquides, les feuilles devraient contenir au moins
dix individus, ce qui est le cas pour moins de 15% d’entre elles.
Une évaluation rigoureuse peut être réalisée par validation croisée sur des
données de validation qui n’interviennent pas lors de la phase d’apprentissage.
129
Chapitre IV
Identification des substances chimiques
Evaluation par validation croisée
La méthode des échantillons-tests recommande d’effectuer l’apprentissage
sur une partie de l’échantillon disponible et de tester les règles de discrimination
sur l’autre partie.
La mesure de performance est faite sur l’échantillon de test, à partir des
pourcentages d’erreurs dans chaque classe. Le calcul peut faire intervenir un
coût de mauvais classements, en différenciant les faux positifs des faux négatifs
pour évaluer le risque d’erreur. Un faux positif, c'est-à-dire identifier un produit
inoffensif comme dangereux entrainera la mise en place de moyens superflus, ce
qui est moins dommageable qu’un faux négatif où une substance dangereuse ne
sera pas reconnue comme telle.
Qu’il s’agisse d’effectuer un calcul d’erreur ou d’utiliser un test statistique,
il est nécessaire de disposer d’un échantillon suffisamment grand pour être
représentatif de l’univers observé, de l’ensemble des substances chimiques. Avec
un échantillon de moins de 500 observations, il est plus difficile d’estimer la
stabilité des résultats de la phase d’apprentissage.
La validation croisée apporte une solution à ce problème. Généralement, la
validation croisée sera utilisée pour améliorer le calcul du taux d’erreur. Cette
méthode consiste à diviser l’ensemble de n individus en m parties égales
disjointes ; l’apprentissage sera réalisé sur m-1 parties et le taux d’erreur sera
calculé sur l’échantillon-test qui n’est autre que la partie restante. La mesure de
performance correspond au taux d’erreur moyen des m calculs d’erreur.
Lorsqu’un seul individu est retiré, il s’agit alors d’un sous-échantillonnage
exhaustif où m vaut 1 et la moyenne est donc faite sur n échantillons [Baradat et
al., 2006]. Cette technique dite « de Jackknife », proposée par [Quenouille,
1949] et reprise par [Tukey, 1958] est surtout utilisée pour l’estimation du biais
et de la variance d’estimateurs classiques [Lebart et al., 1995]. Dans les
techniques précédentes, un individu est présent, au plus, une seule fois dans un
échantillon. A l’inverse, le « Bootstrap » introduit par [Efron, 1979] est une
technique de rééchantillonnage avec remise qui génère des échantillons de taille
n et inclut la possibilité d’avoir plusieurs fois le même individu dans un
échantillon. Chaque individu a une probabilité 1/n d’être sélectionné. Certains
individus auront de e fait un poids plus important tandis que d’autres ne seront
pas représentés. Cette méthode est employée pour analyser la variabilité des
paramètres statistiques simples en produisant des intervalles de confiance.
Dans le cas des arbres de décision, un contrôle peut être effectué en
construisant plusieurs arbres à partir de sous-échantillons différents. Si les
130
Chapitre IV
Identification des substances chimiques
arbres obtenus sont presque équivalents, l’apprentissage sera considéré comme
stable. S’ils sont très différents, il faudra être prudent quant aux conclusions de
l’étude. C’est pour cette raison qu’il est préférable de disposer d’une population
suffisante.
Un premier contrôle de ce type a été réalisé, puis, en s’appuyant sur la
validation croisée, des tests ont été réalisés sur la base de données des liquides
qui est la plus complète.
Comparaison des arbres obtenus sur différents échantillons
Plusieurs arbres ont été construits à la fois à l’aide des méthodes CHAID et
CART sur des échantillons comprenant 75% des individus (m=n/4).
Ces arbres obtenus différent énormément. Pour les quatre arbres, le
critère le plus discriminant (à la racine) est le même : la densité. Ensuite, les
critères « pupilles dilatées » et « congestion » sont présents dans les trois
premiers niveaux de l’arbre pour trois arbres sur quatre. Nous retrouvons
effectivement la densité comme critère discriminant relevé au paragraphe
IV.5.2.2.
Figure 32 : Premiers niveaux de l’arbre de décision sur l’ensemble des
substances liquides
Il y a peu de ressemblances pour le reste des nœuds. Mais cela ne prouve
pas que ces arbres ne soient pas capables de généraliser à l’ensemble des
131
Chapitre IV
Identification des substances chimiques
substances chimiques. En effet, lorsque plusieurs critères ont des indices ( χ 2 ,
indice
de
Gini,
…)
très
proches,
une
faible
variation
de
l’ensemble
d’apprentissage peut conduire à de grandes modifications des arbres obtenus
[Saporta, 2006].
Afin de vérifier l’efficacité des arbres de décision obtenu, il est nécessaire
de les tester sur un ensemble n’ayant pas servi à l’apprentissage.
Ebauche d’évaluation des arbres de décision
Une
validation
croisée
rigoureuse
implique
un
nombre
important
d’apprentissages-tests ce qui n’a pas été possible du fait que le calcul des arbres
n’était pas fait par une procédure automatique. Cependant la tendance qui se
dégage d’un petit nombre de tests est parfois suffisante pour en tirer des
conclusions.
Les substances chimiques ont été séparées aléatoirement en deux sousensembles, le premier servant à construire l’arbre, l’autre à vérifier sa capacité
d’identification. Ce sont encore les liquides et le danger d’inflammabilité qui ont
servi à effectuer se travail.
Sur les 242 produits liquides en base de données, 232 ont permis la
construction de l’arbre, les 10 autres ont servi pour le test de l’arbre. Les
résultats du test de l’arbre de décision sur 10 produits chimiques sont présentés
dans le tableau suivant.
Tableau 13 : Résultats de la méthode d’identification sur dix substances
chimiques.
N°
Substances
1
2
3
4
5
6
7
8
9
10
chimiques
Hydrogen Sulfide
Sulphur Dioxide
Acrylonitrile
Toluene
Nitroglycerin
Chloroform
Carbon Monoxide
Kerosene
Phosgene
Benzyl Chloride
classe de danger
classe calculée
(inflammable = 1)
1
0
1
0
1
0
1
1
0
1
(inflammable = 1)
1
1
1
1
1
0
1
1
0
0
132
Chapitre IV
Identification des substances chimiques
Le danger « inflammable » des produits n°2, 4 et 10 est mal identifié. Le
dioxyde de soufre et le diisocyanate de toluène sont ininflammables ou peu
inflammables [IRSN, 2006a; 2006b] et ne sont donc pas classés dans les
produits inflammables (classification EU et NFPA). Mais d’après les règles de
décisions
définies
précédemment,
ces
produits
apparaissent
comme
inflammables. Et inversement, le Chlorure de Benzyle qui est inflammable
[IPCS, 2001a] n’est pas identifié comme tel dans l’arbre de décision. Une partie
de l’arbre de décision est présenté en Figure 33. Les règles de décision utilisées
pour classer les trois substances (dioxyde de soufre, diisocyanate de toluène et
Chlorure de Benzyle) sont représentées sous forme de trois chemins de couleurs
différentes (respectivement vert, bleu et fuchsia).
Sur les dix substances chimiques qui constituent l’échantillon test, trois
sont mal classées. Cette procédure a été répétée cinq fois avec des ensembles
de tests disjoints. Le nombre d’erreurs obtenu varie de une à trois substances
mal identifiées, pour une erreur moyenne de 16%.
133
Chapitre IV
Identification des substances chimiques
Figure 33 : partie de l’arbre de décision des produits chimiques liquide : risque inflammable
134
Chapitre IV
Identification des substances chimiques
Pureté des feuilles d’arbres élagués
Dans
le
cas
d’arbres
élagués,
fournissant
a
priori
une
règle
de
discrimination généralisable, la pureté des feuilles constitue un autre indicateur
de la capacité d’identification. Si les feuilles sont constituées d’individus de même
classe, la règle d’identification correspondant au chemin racine-feuille permet
une
identification
généralisable
totale
sous
les
de
ce
sous-ensemble,
hypothèses
que
et
que
l’échantillon
cette
règle
est
d’apprentissage
est
représentatif et que le seuil d’élagage de l’arbre est choisi convenablement au
problème de discrimination.
Le nombre de substances des feuilles pures des arbres obtenus après
élagage sont très différents selon les classes à identifier. Dans le cas des
substances liquides (Tableau 14), 73,6% d’entre elles peuvent être identifiées
avec certitude. Cette qualité d’identification n’est pas vraie pour les autres
dangers.
Tableau 14 : Effectif des feuilles pures d’arbres élagués (cas des liquides)
Danger
Effectifs des
Erreur
feuilles pures
d’identification
Inflammable
178
73,6%
Toxique
73
30,2%
Explosif
45
18,6%
Il est également possible d’utiliser des règles de décision conduisant à des
feuilles qui ne sont pas pures, mais cela se fait au prix d’erreurs d’identification.
Le taux d’erreur d’identification pour chaque danger est présenté ci-dessous
(Tableau 15)
Tableau 15 : Erreur d’identification par danger (cas des liquides)
Danger
Substances
Erreur
correctement
d’identification
identifiées
135
Inflammable
208
14,0%
Toxique
227
6,2%
Explosif
234
3,3%
Chapitre IV
Identification des substances chimiques
IV.5.3.4 Conclusions sur l’identification des dangers par les arbres
de décision
Les arbres de décision constituent une base de règles capable d’identifier
précisément les dangers liés à une substance chimique. L’identification ne
comporte aucune erreur dès l’instant que l’arbre a été construit sur la totalité des
exemples de la base de données. Cela signifie que l’information contenue dans
les critères est suffisante pour identifier les dangers.
Cependant, l’étude des arbres et les tests réalisés en distinguant
apprentissage et validation tendent à montrer que ces arbres ne sont pas
capables de généraliser à d’autres substances sans erreurs d’identification. La
procédure de vérification, s’effectuant aujourd’hui en manuel, nécessite d’être
automatisée pour permettre l’ensemble des tests et le calcul du taux d’erreur en
généralisation.
IV.5.4 Conclusions sur les méthodes d’identification des
dangers
Les arbres de segmentation constituent un outil adéquat pour la recherche
de critères discriminants. Appliqués à l’utilisation des données opérationnelles
pour identifier les dangers liés aux substances chimiques, les arbres de
segmentation n’ont pas révélés de critères très discriminants. En dehors de la
densité des liquides pour le danger « inflammable », il n’y a pas de critères qui
se dégagent nettement des autres. Il n’y a donc pas d’informations à rechercher
en priorité, ni de moyens à mettre en œuvre pour l’obtenir.
La recherche des critères discriminants trouvent une autre utilité dans la
création de bases de données opérationnelles. Si l’on s’intéresse cette fois aux
critères les moins discriminants, on peut détecter des données inutiles qu’il est
possible de supprimer. Cela présente un intérêt dans la création d’une base de
données opérationnelles. Cibler au préalable l’information à emmagasiner afin de
ne pas collecter des données inutiles, représente un gain de temps en
conception, mais également lors des recherches en situation d'urgence car
l’information utile n’est pas noyée dans la masse.
Si les arbres de segmentation ne se prêtent pas à la recherche des critères
peu discriminants, les réseaux de neurones peuvent apporter une solution.
L’analyse des coefficients synaptiques aux entrées permet un classement des
critères
correspondant
à
leur
« contribution
globale »
dans
la
fonction
d’identification.
136
Chapitre IV
Identification des substances chimiques
Les arbres de régression (de même que d’autres méthodes comme les
réseaux de neurones) sont capables de réaliser une fonction de discrimination
des dangers. Les résultats obtenus en apprentissage montrent que l’information
des données opérationnelles est suffisante pour identifier les dangers qui sont
liés à n’importe quelle substance avec une fiabilité de 100%. La profondeur des
arbres est une borne majorante du nombre maximum de critères qu’il est
nécessaire de connaître pour identifier un danger. Ce nombre de critères étant
au plus de dix pour l’identification des dangers quelle que soit la substance
(IV.5.2.1).
Mais le nombre de substances chimiques de la base de données comparé
au nombre de descripteurs ne permet pas de tester le pouvoir de généralisation
des arbres de décision ou de réseaux de neurones autres que des séparateurs
linéaires. Le problème n’est pas assez contraint par un nombre suffisant
d’exemples (de substances) pour permettre un calcul efficace d’arbres ou de
réseaux de neurones.
Enfin, la principale limite à l’utilisation de ces méthodes en situation
d'urgence est que certains critères sont imposés et doivent être obligatoirement
connus. Pour l’utilisation d’un réseau de neurones, tous les critères doivent être
renseignés. Même si une erreur sur la valeur des critères de poids synaptiques
très faibles ne devrait pas prêter à conséquence, il reste un nombre trop
important de critères à renseigner. Dans le cas des arbres de décision, la
procédure d’identification peut être bloquée dès la racine, si le critère demandé
n’est pas connu. Par exemple, dans le cas des liquides, l’identification du risque
« inflammable » impose en premier choix de connaître la densité du liquide. Sans
cette information l’arbre de décision n’est plus utilisable.
Ne connaissant pas à l’avance les critères qui seront disponibles en
situation d'urgence, il est impossible de réaliser un arbre de décision ou un
réseau de neurones adapté à l’ensemble des situations. Le nombre de critères
est trop important pour envisager la construction de plusieurs arbres et il n’existe
pas un ensemble limité de critères très discriminants qui serviraient à construire
un arbre de décision servant de base.
L’arbre de décision doit donc être adapté à chaque situation, en tirant
partie des critères déjà connus ou pouvant être connus. Utilisant les critères déjà
connus, il permet de déterminer le sous-ensemble de substances chimiques
correspondant et de calculer alors le ou les critères discriminants à rechercher
pour améliorer l’identification des dangers. La complexité de l’algorithme ne
137
Chapitre IV
Identification des substances chimiques
requiert qu’un temps de calcul court et permet par conséquent une application
en temps réel. Pour ces raisons, cette méthode a été retenue pour aider au
recueil d’information en situation d'urgence et a été implémenté dans le logiciel
AERO.
IV.6 Conception d’un outil opérationnel d’identification
des dangers liés à une substance chimique
A partir des études réalisées précédemment, une méthodologie d’aide à
l’identification des dangers liés à une substance chimique est proposée. Elle
repose
sur
l’exploitation
d’une
base
de
données
opérationnelles
par
l’intermédiaire du logiciel AERO développé afin de tirer profit des informations
recueillies sur le terrain et présentes en base de données.
Le but de cette méthodologie est d’aider à l’identification d’une substance
chimique. Mais lorsque l’information n’est pas suffisante pour y parvenir, elle doit
orienter la recherche d’information danger retenu, la proportion de substances
correspondantes. Il permet également orienter le recueil de données pour affiner
l’identification des dangers pour tendre vers l’absence de produit dangereux ou à
l’inverse, la certitude qu’ils sont tous dangereux. Enfin il permet de prendre en
compte l’imprécision des critères et l’incertitude des informations collectées.
Après une rapide introduction du logiciel AERO, la méthodologie d’aide à
l’identification des dangers d’une substance chimique est alors détaillée. Elle
nécessite l’utilisation d’une base de données opérationnelles qui a été réalisée en
complétant celle de l’étude précédente.
IV.6.1 Présentation du logiciel AERO
IV.6.1.1 Généralités
AERO (Aide pour l’Evaluation des Risques en situation Opérationnelle) est
un logiciel développé en langage C++ avec le compilateur Borland C++ v5.0.
Son
fonctionnement
s’inspire
de
celui
du
logiciel WISER
pour
l’aide
à
l’identification d’une substance chimique.
Pour répondre à une demande des sapeurs-pompiers, les données issues
des différentes bases de données ont été traduites en français. Le logiciel est
disponible en français et en anglais (Figure 34).
138
Chapitre IV
Identification des substances chimiques
Figure 34 : Interface du logiciel AERO
IV.6.1.2 Un outil d’aide à l’identification des substances chimiques
L’identification
d’une
substance
chimique
s’effectue
à
partir
de
la
description et des propriétés du produit, des symptômes observés chez l’homme
et de la classification des dangers et de la réaction aux tubes colorimétriques.
En fonction des informations saisies (par exemple la couleur du produit,
son pH, et des effets sur la peau), AERO sélectionne tous les produits satisfaisant
à l’ensemble de ces critères. La recherche est effectuée immédiatement après
chaque saisie d’information, avec un affichage des substances correspondant aux
critères sélectionnés et la proportion de ces substances pour chacun des huit
dangers retenus.
Cette recherche est effectuée sur une base de données comportant 333
substances chimiques, décrite par des critères binaires séparés en quatre
familles :
139
Chapitre IV
- les
Identification des substances chimiques
propriétés
chimiques
et
thermodynamiques
observables
ou
mesurables (état, couleur, opacité, odeur, goût, pH, densité liquide
gazeuse) reprises de la base de données de WISER,
- les symptômes cliniques sur l'homme, également repris de la base de
données de WISER,
- les dangers de la classification américaine NFPA et européenne issus de
la base de données du NIOSH,
- les réponses aux tubes colorimétriques Dräger. Il s’agit des réponses
attendues décrites dans le manuel de référence [Dräger, 2002],
complétées par les résultats de l’étude réalisée dans le cadre de la thèse
[Bronner et al., 2008].
IV.6.2 Méthodologie
d’identification
d’une
substance
chimique
Figure 35 : Méthodologie opérationnelle d’identification des substances chimiques
140
Chapitre IV
Identification des substances chimiques
IV.6.2.1 Recueil d’informations et saisies des données
La première phase consiste à recueillir les informations collectées par les
premiers intervenants. Il s’agit aussi bien des informations obtenues par des
témoignages, des personnes se plaignant de maux ou incommodées par des
odeurs, que de la description de la situation par des sapeurs-pompiers.
Le recueil d’information se fait en plusieurs temps. Il s’agit, dans un
premier temps (étape n°1), des témoignages des personnes sur place mais
surtout des données collectées par les premiers intervenants. Il s’agira
essentiellement d’observations. Ensuite, lors de la mise en place d’une cellule
d’identification de la CMIC, d’autres données pourront être obtenues, notamment
des mesures.
Enfin, le recueil d’information sera guidé avec l’affichage des critères
discriminants à rechercher (étape n°5). Ces critères pouvant être obtenus et
améliorant la précision de l’identification ou, dans le cas contraire, d’autres
critères seront proposés ; des critères moins discriminants mais constituant tout
de même un apport d’information.
Ces informations ne sont pas à prendre avec la même certitude selon la
nature des données et la qualification des informateurs. Pour prendre en compte
cette incertitude, l’IHM autorise deux niveaux de confiance : les critères certains
auxquels doivent correspondre les substances et les critères incertains pouvant
être omis selon le degré de concordance (IV.4.2).
L’IHM permet de saisir rapidement les critères et symptômes organisés
dans plusieurs onglets. Les critères non sélectionnés ne sont pas observés sur le
terrain. Un critère saisie apparaît en bleu, avec en gras les critères sûrs et en
italique les critères incertains (Figure 36).
Figure 36 : Saisie des critères (logiciel AERO)
Un onglet supplémentaire affiche la dichotomie adaptée d’utilisation des
tubes Dräger (Figure 37). L’IHM permet de renseigner si un tube colorimétrique
utilisé a réagi de façon positive à la substance chimique (tube affiché en rouge)
ou si le test a été négatif (tube affiché en jaune).
141
Chapitre IV
Identification des substances chimiques
Les différents tubes colorimétriques sont organisés selon la dichotomie
fournie par Dräger et modifiée à la suite de l’étude réalisée en laboratoire
[Bronner et al., 2008].
Figure 37 : IHM de saisie des réactions des tubes colorimétriques
(logiciel AERO)
La prise en compte de la fiabilité des informations lors de la sélection des
substances est décrite ci-après.
IV.6.2.2 Sélection des substances correspondant aux données
opérationnelles
Afin de sélectionner les substances chimiques correspondant aux données
collectées, une requête classique de sélection en base de données est faite. Il
s’agit du mode de fonctionnement du logiciel WISER.
Prise en compte de l’imprécision
Pour les critères imprécis (odeur, couleur et pH), la prise en compte de
l’imprécision est rendue possible par l’utilisation de probabilités d’observation de
critères « proches ». La valeur d’un critère imprécis est alors remplacée par la
distribution de probabilités élémentaires correspondantes (IV.4.1).
142
Chapitre IV
Identification des substances chimiques
L’observation de la couleur bleue se traduira par la recherche des
substances de couleur :
- bleue avec une masse de croyance de 1
- verte avec une masse de croyance de 0,5
- violette avec une masse de croyance de 0,5.
L’imprécision peut porter sur différentes valeurs possibles d’un même
critère, par le fait que l’observateur peut exprimer un doute sur l’information qu’il
fournit ou parce que l’information provient de deux sources différentes en
désaccord partiel ou total (informations incompatibles).
Lorsque plusieurs valeurs d’un même critère sont possibles, une première
approche consiste à combiner l’information en faisant le produit des probabilités
élémentaires.
k critères C1obs ,..., Ciobs ,...C kobs observés parmi N critères C1 ,..., Ci ,...C k en base de
données
La probabilité associée à chaque critère C1 est :
k
P (Ci ) = ∏ P (Ci / Cθobs )
Eq. 17
θ =1
L’observation de la couleur bleue ou verte se traduira par la
recherche des substances de couleur :
- bleue avec une masse de croyance de P(bleu/bleu) x P(bleu/vert)
= 1 x 0,25 = 0,25
- verte avec une masse de croyance de P(vert/bleu) x P(vert/vert) x
= 0,25 x 1 = 0,25
- violette avec une masse de croyance P(violet/bleu) x P(violet/vert)
x = 0,25 x 0 = 0
- brune avec une masse de croyance P(brun/bleu) x P(marron/vert)
x = 0 x 0,25 = 0
Une substance est sélectionnée si sa concordance est supérieure à un seuil
σ calculé en fonction de la meilleure concordance.
Chaque substance Sj (j∈[1..n]) est définie par les valeurs de critères,
Sj = {cj1, …, cji, …, cjk}
Sj sélectionnée ssi sa concordance Γj >σ
 k

Γ j = max ∏ c ji .P (C i )
 i =1

143
Eq. 18
Chapitre IV
Identification des substances chimiques
Incertitude liée à la véracité de l’information
Certaines informations peuvent se révéler fausses. Et les sources d’erreurs
sont nombreuses : Une personne affirme souffrir de maux de tête, mais faut-il
forcément rattacher le symptôme à la présence de la substance chimique ? La
conversion d’un diagnostic médical sous forme de symptômes proposés dans la
base de données est source d’erreur (cf. exemple en IV.4.2). L’erreur peut
provenir de la base de données qui n’est pas complète. Bien que l’erreur
provienne de l’outil et non de l‘information collectée, le problème revient au
même : une différence entre la valeur observée et la valeur en base de données.
Cela se traduit par l’élimination de substances chimiques qui sont
potentiellement des solutions recherchées et inversement, des substances qui ne
correspondent pas sont conservées à tort.
Un degré de liberté δ
peut être introduit pour limiter la suppression
radicale de solutions concordantes. Au lieu d’effectuer une sélection sur
l’ensemble des critères recensés, la recherche ne s’effectue que sur certains
critères ; le nombre de critères de sélection restant à définir. Il peut s’agir d’un
pourcentage du nombre de critères recensés. La concordance d’une substance
chimique est alors égale à la valeur maximum des concordances correspondant à
chaque combinaison de
k −δ
critères parmi les k observés, soit
C kk −δ
combinaisons.
Deux cas peuvent se présenter.
1) Une valeur de critère est incompatible avec les autres valeurs observées.
Dans l’exemple suivant deux personnes fournissent des informations
incompatibles :
La première personne a senti une odeur d’ammoniac alors que la
seconde
pense
à
une
odeur
d’acétone.
Ces
critères
sont
incompatibles :
- ∀i, P (C i / C aobs = ammoniac) × P (C bobs = / acétone) = 0
Quels que soient les autres informations fournies (liquide, incolore,
…), par la présence de ces critères incompatibles, aucune substance
ne correspond. De même que dans WISER, aucune substance n’est
sélectionnée.
Mais
en
autorisant
un
degré
de
liberté,
il
se
forme
deux
combinaisons de critères compatibles :
- liquide, incolore, … et odeur d’ammoniac
- liquide, incolore, … et odeur d’acétone
144
Chapitre IV
Identification des substances chimiques
Les autres combinaisons contenant à la fois les deux odeurs ne
correspondent toujours à aucune substance chimique.
2) L’existence d’une ou plusieurs erreurs parmi les critères observés fait
qu’aucune substance chimique ne correspond ou que la liste des
substances chimiques sélectionnées ne contient pas la bonne.
Avant de regarder ce que peut apporter la prise en compte de l’incertitude
par l’ajout d’un degré de liberté, il est intéressant d’introduire une notion
supplémentaire : la crédibilité donnée à chaque critère. Cette valeur renseigne
sur la confiance, la certitude que l’on peut avoir en l’information. Pour certains
critères, la crédibilité peut être fixée en amont par le jugement d’expert :
« Selon la concentration, il est difficile de savoir si un liquide est visqueux
-
ou non. »
« il s’agit d’un symptôme trop difficile à identifier pour être considéré
-
comme une donnée fiable, sauf si le diagnostic vient d’un médecin ». La
crédibilité dépend alors du couple (source d’information, information).
La crédibilité peut aussi être fixée lors de la saisie, selon la concordance
des sources. Si une personne est sujette à des toux, la crédibilité ne sera pas
élevée
compte
tenu
qu’il
existe
d’autres
explications
(allergie,
effets
psychosomatiques, fume trop, …). Mais si c’est la majorité des personnes
présentes qui sont sujettes à des toux, alors la crédibilité sera renforcée.
Dans ce travail, aucune crédibilité a priori n’a été fixée a priori par des
experts. Il est toutefois possible lors de la saisie des données dans AERO de
distinguer les critères sûrs des critères incertains. Devant la difficulté pour
déterminer ce qui est sûr de ce qui ne l’est pas, il n’est pas utile d’ajouter des
degrés de crédibilité (sûr, pas tout à fait sûr, …, pas sûr du tout). La crédibilité
reste binaire, avec des critères confirmés qui sont nécessaires lors de la sélection
des substances chimiques, et les critères incertains qui ne servent pas forcément
à la sélection. Une substance chimique ne sera sélectionnée que si elle
correspond à l’ensemble des critères certains et à au moins un m − δ critères
parmi les m critères incertains. δ étant déterminé en fonction du nombre k de
critères observés tels que δ = k / 3 .
Et, il faut également ajouter la prise en compte de l’imprécision comme il a
été décrit précédemment.
145
Chapitre IV
Identification des substances chimiques
Le REX sur l’intoxication au bromure de méthyle (Cf. IV.4.2) a été utilisé
comme exemple pour estimer la précision d’une identification avec prise en
compte de l’incertitude. Nous avons utilisé le logiciel AERO développé au cours
de cette thèse qui intègre les processus de prise en compte de l’imprécision et de
l’incertitude. Trois séries de résultats sont présentés :
-
Le nombre de substances correspondant aux critères saisis à l’aide du
logiciel WISER
-
Le nombre de substances correspondant aux critères saisis à l’aide du
logiciel AERO. Ces nombres sont différents entre WISER et AERO car les
logiciels n’utilisent pas la même base de données.
-
Le nombre de substances correspondant aux critères saisis à l’aide du
logiciel AERO et en tenant compte de l’imprécision et de l’incertitude. Les
critères
considérés
comme
incertains
sont
indiqués
en
italique
et
soulignés.
WISER
AERO
AERO
416
333
333
Gaz, incolore, Inodore
24
16
61
Densité > 1
21
10
51
Nombre total de substances
La densité ne pourra pas être identifiée visuellement pour un gaz incolore. Le
critère est utilisé pour comparer les résultats entre WISER et AERO, mais il est
noté comme incertain.
Nausées, vomissements,
Douleurs abdominales et diarrhée
9
2
13
Agitation
6
2
13
Confusion mentale
5
2
11
Vertiges
3
2
10
Céphalées
3
2
11
Perte de la coordination
0
1 (erreur)
10
Ces cinq critères sensés décrire un « syndrome cérébelleux avec démarche
ébrieuse »
sont
pris
avec
prudence
car
il est
difficile
de
trouver
une
correspondance entre le vocabulaire médical et les termes utilisés dans le
logiciel.
Erythème
0
0
9
Brûlure
0
0
10
0
0
10
Il est difficile de distinguer les deux.
Convulsions
146
Chapitre IV
Identification des substances chimiques
Avec la prise en compte de l’incertitude, un plus grand nombre de
substances chimiques sont retenues puisqu’il y a moins de contraintes, moins de
critères de sélection imposés en même temps.
Avec quatre critères dont deux incertains et 12 symptômes dont huit
incertains, AERO fournit une liste de dix substances chimiques contenant celle
qui est recherchée. Sur cet exemple, AERO présente l’avantage de ne pas
éliminer la substance recherchée contrairement aux logiciels existants. En contre
partie, un nombre trop important de substances chimiques possibles peut
masquer l’information recherchée.
On remarque que le nombre de substances retenues peut augmenter à la
saisie d’un nouveau critère. En fait, cette augmentation, si elle a lieu, se produit
tous les trois critères. Le nombre de critères incertains nécessaire à la sélection
des substances chimiques étant égal au tiers du nombre de critères total, tous
les trois critères, le nombre de combinaisons augmente alors que le nombre de
contraintes ne change pas. Il y a donc plus de substances chimiques qui sont
sélectionnées.
Le même travail est réalisé sur le REX de l’intoxication à l’acide
cyanhydrique (cf. IV.4.2) :
Nombre total de substances
416
333
333
Etat = Gaz
75
65
65
Couleur = incolore
71
61
61
Densité < 1
43
10
10
5
1
10
4
1
9
Odor = Almond
Symptôme :
Arrêt cardio-respiratoire
Le symptôme est considéré comme sûr car il se déclare chez plusieurs victimes.
Nausée
4
1
8
Maux de tête
3
1
8
2 erreurs
0
6
0
0
6
Vertiges
Oppression thoracique
Ces quatre symptômes ne sont présents que pour une seule victime et peuvent
être raccordés à d’autres causes.
Avec une recherche classique, l’erreur en base de données par l’absence
du symptôme « vertige » provoque l’élimination de la substance chimique
recherchée. La prise en compte de l’incertitude permet de conserver la substance
chimique dans la liste des solutions possibles.
147
Chapitre IV
Identification des substances chimiques
IV.6.2.3 Une alternative à un degré de concordance δ fixe
Pour une même valeur de δ, le nombre de substances chimiques
sélectionnées varie d’une situation d’urgence à l’autre en fonction du nombre de
critères et de leur pouvoir discriminant. Une liste trop longue n’est pas utilisable
par les urgentistes pour identifier la substance chimique. Mais à partir d’une
dizaine de substances, il est possible pour les urgentistes d’identifier plus
précisément [Bhavnani et al., 2007].
Une alternative à une degré de concordance fixe, est de le déterminer en
fonction d’un nombre maximum de substances sélectionnées. Pour ajuster la
valeur de δ, une première sélection des substances est faite avec δ=0. Puis la
valeur de δ est augmenté de 1 jusqu’à atteindre un nombre de substances
limites. Par exemple, dès que le nombre de substances est supérieure à 10, on
arrête d’incrémenter δ. Une autre condition d’arrêt peut être définie en fixant une
borne maximale telle que δ = k / 3 pour tenir compte d’un minimum de critères.
IV.6.3 L’identification des dangers
Lorsqu’il n’est pas possible d’identifier précisément la substance chimique,
pour une liste trop longue de solutions, il est préférable de s’intéresser aux
dangers qui y sont liés afin de fournir un premier niveau d’aide à la décision.
L’étape n°3 de la méthodologie consiste en l’affichage des résultats : liste
de substance et proportion de substance par danger.
L’étape n°4 a pour but de rechercher les critères permettant d’affiner
l’identification des dangers liés aux substances chimiques.
IV.6.3.1 Affichages des substances et des dangers
Selon le nombre de substances retenues, le logiciel affichera la liste de ces
substances ou, si la liste est trop longue, c’est la proportion de substances pour
chaque danger qui sera plus pertinente.
Lorsqu’une substance est identifiée précisément, il est possible de
consulter dans le logiciel, la fiche du NIOSH correspondante (Figure 38).
148
Chapitre IV
Identification des substances chimiques
Figure 38 : Fiche du toluène du NIOSH affichée dans AERO
Lorsque la substance n’est pas identifiée, il est possible de se reporter aux
dangers des substances correspondant aux critères sélectionnés. Plusieurs
options sont possibles pour afficher les dangers :
1)
Une solution consiste à indiquer, pour chaque danger, la proportion
de substances chimiques présentant ce danger, parmi les substances
correspondant à l’ensemble des critères saisis.
Pour
tenir
compte
également
des
substances
chimiques
correspondant aux critères incertains et imprécis, une proportion est
également calculée et indiquée de façon moins soutenue (Figure 39). Cette
indication permet de vérifier comment un écart relatif dans la quantité
d’information recueillie sur le terrain influe sur les dangers représentés par
les substances chimiques potentielles. Si les proportions sont similaires,
cela signifie qu’une faible erreur (observation ou mesure) dans les critères
ne change pas significativement les dangers qui sont liés aux substances.
149
Chapitre IV
Identification des substances chimiques
Proportion de
substances par
danger
Nombre de
substances
Figure 39 : Affichage des dangers (logiciel AERO)
L’aide fournie par ces indications ne présentera pas la même utilité
selon les pourcentages :
o
Savoir que la substance a une probabilité d’être inflammable (ou
toxique, explosif, …) de 50% ne présente aucun intérêt. Il faut tenir
compte du risque potentiel comme cela aurait le cas en l’absence
complète d’information.
o
Un pourcentage moins élevé donne une tendance, mais ne permet
pas d’exclure le risque.
o
Un pourcentage égal à 0%, c'est-à-dire une liste de substances
potentielles excluses de substances inflammables, permet-il de
certifier qu’il n’y a pas de risque ? Deux conditions doivent être
remplies pour exclure le risque. Il faut que les critères de sélection
ne soient pas erronés. L’incertitude et l’imprécision sont justement
prises en compte pour accorder une marge de sécurité majorante.
Et la seconde condition est que la substance chimique recherchée
soit présente dans la base de données ou que les substances de la
base
de
substances
données
soient
rencontrées
en
représentatives
situation
de
l’ensemble
d'urgence.
D’où
des
l’intérêt
d’enrichir la base de données.
2)
S’il n’est pas possible de s’appuyer sur l’exhaustivité de la base de
données, une autre indication est de suivre l’évolution de la proportion de
substances dangereuses. L’indicateur est alors l’augmentation ou la
diminution de la proportion de substances dangereuses par rapport à la
150
Chapitre IV
Identification des substances chimiques
proportion de départ, de toutes les substances présentes dans la base de
données.
Par exemple, 58% des liquides de la base de données sont
inflammables.
Connaissant
la
densité
(d<1),
on
remarque
que
le
pourcentage augmente de 38 points. On s’intéresse alors à la relation
entre les critères observés et les dangers, sans faire l’hypothèse que la
base de données contient la substance recherchée. Cependant deux
hypothèses fortes sont faites : la base de données est représentative des
substances chimiques rencontrées en situation d'urgence et, il existe un
lien fort de causalité entre les substances chimiques et les indicateurs.
Mais il a été vu au paragraphe IV.5.3.2, qu’il était difficile de
généraliser et donc d’obtenir un lien entre critères et dangers.
L’aide à la décision se limite donc à la première solution. Il faut tendre
vers une liste de substances chimiques identiques en termes de dangers et opter
pour une base de données la plus complète possible.
Dans
les
premiers
instants,
les
données
opérationnelles
collectées
n’aboutiront que très rarement à une identification des dangers sûre, avec 100%
de substances chimiques dangereuses ou non. Et afin d’affiner l’identification des
dangers, il sera nécessaire de rechercher d’autres informations et d’effectuer des
mesures. Dans le paragraphe suivant, nous allons voir comment adapter un outil
utilisé précédemment pour orienter le recueil de données.
IV.6.3.2 Aide au recueil de données
L’objectif étant de tendre vers un groupe de substances homogène en
termes de danger, par la connaissance des critères adéquats : les plus
discriminants.
Les
arbres
de
segmentation
permettent
d’identifier
une
combinaison de critères discriminants. En calculant les premiers nœuds d’un
arbre de segmentation pour un danger précis, on obtient les critères à rechercher
en priorité pour identifier la présence ou non de ce danger.
IV.6.3.2.1
Utilisation opérationnelle
Comme il a été mentionné précédemment (IV.5.4), un tel arbre ne peut
être pré-calculé. Les différences d’une situation d'urgence à l’autre constituent
trop de combinaisons pour avoir des arbres adaptés à tous les cas. Chaque nœud
d’un arbre de segmentation correspond à un critère à rechercher, et lorsque la
valeur d’un critère ne peut être connue, le reste de l’arbre devient alors inutile.
151
Chapitre IV
Identification des substances chimiques
L’arbre de segmentation doit être construit au fur et à mesure du recueil des
données.
Une autre raison pour limiter l’affichage de l’arbre de segmentation est que
le nombre de nœuds croit de façon exponentielle et devient rapidement illisible.
Le choix a été de limiter l’arbre aux trois premiers niveaux (soit sept nœuds).
Pour le premier nœud, ce sont les trois critères les plus discriminants qui sont
affichés pour laisser une marge de manœuvre par un choix plus large dans la
recherche d’informations discriminantes et également diminuer le nombre
d’interactions avec l’interface homme-machine (IHM). L’arbre construit se fait sur
la base du premier critère, le plus discriminant. Un exemple d’affichage d’un tel
arbre est présenté ci-dessous (Figure 40). A chaque nœud, le nombre de
substances est affichée, ainsi que la proportion par danger, visualisée par un
indicateur (barre rouge et verte). Dans le cas des feuilles homogènes,
l’indicateur est un carré rouge si toutes les substances présentent le danger
(inflammable dans l’exemple ci-dessous) ou un carré vert dans le cas inverse.
Figure 40 : Arbre de segmentation des substances liquides : danger
"inflammable" (logiciel AERO)
IV.6.3.2.2
Adaptation
des
arbres
de
segmentations
à
une
utilisation opérationnelle
Il faut également faire une sélection des critères de la base de données
pour ne demander la recherche que des critères possibles à obtenir. Il parait
aberrant de demander le goût d’une substance potentiellement toxique. De
même, il ne sert à rien de demander la présence de symptômes s’ils ne sont pas
constatés, car ce n’est pas parce qu’un symptôme n’est pas identifié que la
substance chimique ne peut pas le provoquer. Et il est inutile de demander de
renseigner sur des symptômes en l’absence de victime. Nous partons du principe
que toutes les informations connues, relative à la présence de symptômes,
seront renseignés sans avoir à le demander. Parmi les critères à exclure, il y a
152
Chapitre IV
Identification des substances chimiques
également ceux qui ne seront jamais demandés car leur recueil n’est pas
possible (goût par exemple) et les critères dépendant de la situation, c'est-à-dire
les critères incompatibles, à définir en fonction des informations déjà connues.
Il faut éviter la combinaison de critères incompatibles à différents nœuds
de l’arbre. Par exemple, demander s’il s’agit d’un liquide et dans le cas contraire
(gaz ou solide), demander ensuite de mesurer le pH. Ou, étant donné le codage
de la base de données permettant plusieurs valeurs pour un même critère
(couleur, odeur, …), demander une couleur, alors qu’il s’agit du sous-arbre des
substances incolores.
L’algorithme de construction des arbres de segmentation a été adapté
pour supprimer ces incohérences.
Algorithme récursif de construction d’un arbre de segmentation binaire
avec prises en compte de critères incompatibles
Soit
Ω : La population de X individus notés xi avec i∈[1..X]
Ψ : L’ensemble comprenant un nombre Y de descripteurs yj
Ι : La matrice d’incompatibilités ιj de Ψ x Ψ
Dc : L’ensemble des descripteurs connus Dc⊂Ψ
Ds : L’ensemble des descripteurs de type symptômes Ds⊂Ψ
1 : Sélection des substances correspondant aux critères connus
L’étape préalable est de restreindre la population aux individus correspondant
aux critères déjà connus.
Pour tout dj ∈ Dc
ΩT={ xi∈Ω / yj (xi)= dj }
// Construire l’arbre
Appeler la fonction Construction_Arbre_de_Segmentation ( ΩT , Ψ - Dc - D
, Ι , Dc )
153
s
Chapitre IV
Identification des substances chimiques
Construction_Arbre_de_Segmentation ( ΩT , Ψ , Ι , D )
2 : Suppression des critères incompatibles
// La matrice d’incompatibilité Ι est une matrice binaire symétrique.
// Si deux critère yi et yj sont incompatibles, Ι (yi , yj) = 1
∀ dj ∈ D
Ψ = Ψ - xi / ∀ xi∈ Ω tq Ι (yj (xi ) , dj ) = 1
3 : Recherche du meilleur descripteur Ψy* (au sens du critère de division - Cf.
Note 2)
Test toutes les divisions possibles ∀y∈[1..Y] (Cf. Note 1)
4 : Calcul des deux partitions obtenues par division selon Ψ y*
ΩT={ xi∈Ω / xy*=1 }
ΩF={ xi∈Ω / xy*=0 }
5 : La procédure est répétée sur les deux partitions obtenues pour construire les
sous-arbres
Construction_Arbre_de_Segmentation( ΩT , Ψ - Ψy* , Ι , Ψy* )
Construction_Arbre_de_Segmentation( ΩF , Ψ - Ψy* , Ι , Ψy* )
6 : Conditions d’arrêt
La construction du sous-arbre s’arrête :
- Lorsque la taille inférieure de l’effectif d’une partition est atteinte.
- Lorsque la borne inférieure du seuil de similarité d’une partition est
atteinte.
- Lorsque tous les descripteurs ont déjà servi à faire une division. Dans ce
cas, au moins un sous-ensemble final comporte des individus qui ne sont
pas homogènes.
154
Chapitre IV
Identification des substances chimiques
Plusieurs incohérences sont présentes dans les arbres de décision issus
des
d’algorithmes
classiques.
Elles
sont
supprimées
par
les
adaptations
apportées à différentes étapes de l’algorithme que nous avons développé.
Une des étapes préalables (étape n°1 de l’algorithme) est de garder
uniquement les critères pouvant être recherchés en situation d'urgence. Tous les
symptômes et le goût sont retirés des critères lors de la construction de l’arbre.
A partir de l’exemple précédent, un nouvel arbre de segmentation est obtenu
pour l’identification du danger « inflammable » dans le cas d’un liquide. Il ne fait
plus apparaître ni les symptômes, ni le goût (Figure 41).
Figure 41 : Arbre de segmentation des substances liquides avec suppressions des
symptômes et du goût : danger "inflammable" (logiciel AERO)
Dans l’arbre précédent (Figure 41), il apparait plusieurs incompatibilités.
Par exemple, le troisième critère à la racine « reste au sol » ne s’applique que
dans les cas des gaz, alors qu’il s’agit de liquides (critère sélectionné en amont).
La matrice d’incompatibilités contenant l’ensemble des incompatibilités de
critères, permet d’empêcher le choix de critères impossibles lors de la
construction de l’arbre (Figure 42).
Figure 42 : Arbre de segmentation des substances liquides avec suppressions des
symptômes et du goût et prise en compte des incompatibilités : danger
"inflammable" (logiciel AERO)
155
Chapitre IV
Identification des substances chimiques
Un autre exemple a été choisi pour illustrer les incompatibilités pouvant
apparaître dans les arbres. L’identification du danger « corrosif » sur l’ensemble
des substances chimiques, présente deux incompatibilités (Figure 43):
- Lorsqu’il ne s’agit pas d’un liquide, le sous-arbre correspondant (sous-arbre
gauche à partir de la racine) contient le critère « coule dans l’eau » qui ne
s’applique ni au gaz, ni au solide.
- Dans le sous arbre droit, une réponse positive à la question « est-ce une base
forte ? » est suivie d’une demande de renseignement du critère « base
faible ».
La matrice d’incompatibilités intégrée à l’algorithme de construction
d’arbre de segmentation permet de corriger ces défauts (Figure 44).
Figure 43 : Arbre de segmentation avec incompatibilités : danger "corrosif"
(logiciel AERO)
Figure 44 : Arbre de segmentation sans incompatibilité : danger "corrosif"
(logiciel AERO)
156
Chapitre IV
IV.6.3.2.3
Identification des substances chimiques
Conditions d’arrêt
Il s’agit d’un processus itératif qui est répété tant que l’identification peut
être affinée. Le processus de demande et saisie d’information puis de sélection
des substances s’achève lorsque les dangers ont été identifiés de façon certaine
ou idéalement lorsque la substance est identifiée. Le processus peut s’arrêter
également sur une identification imprécise lorsqu’il n’y a plus d’éléments
observables sur le terrain pouvant être collectés pour continuer la recherche
discriminante ou lorsque l’information fournie aux intervenants leur est suffisante
pour achever l’identification par d’autres moyens.
IV.6.3.2.4
Limite
Un arbre de segmentation est construit pour discriminer une seule variable
à expliquer, un danger à la fois. L’arbre affiché correspond à un critère précis
(danger inflammable, toxique ou explosif). Il n’y a pas de variable discriminante
globale, commune à l’ensemble des dangers ce qui nécessiterait la construction
de
plusieurs
arbres,
un
par
danger.
Cela
encombrerait
l’affichage
et
compliquerait le recueil de données. Il est préférable de laisser le choix du
danger à estimer, soit le plus préoccupant (danger d’explosion), soit celui qui est
mal identifié par une probabilité proche de 50%, soit celui qui parait plus rapide
à confirmer (probabilité proche de 0% ou 100%).
IV.7 Discussion
sur
l’identification
des
substances
chimiques
IV.7.1 Bilan
Lorsqu’une substance chimique n’est pas identifiée, et à défaut de
matériels d’identification performants, une recherche en base de données à partir
de données opérationnelles est envisageable. Mais il sera extrêmement rare de
parvenir à une identification précise avec le peu d’information discriminante
contenue dans les données opérationnelles disponibles.
Devant ce constat, lorsque les données opérationnelles disponibles ne sont
pas suffisantes pour une identification précise, il devient nécessaire de limiter la
recherche à un niveau d’information plus restreint. L’objectif est alors de
permettre une identification des dangers qui sont liés à la substance chimique,
pour fournir ainsi un premier niveau d’aide à la décision suffisant pour le calcul
de périmètre en phase réflexe ou pour le choix de matériels adaptés à
l’intervention.
157
Chapitre IV
Identification des substances chimiques
Pour faciliter cette recherche des dangers, une base de données a été
conçue et un logiciel a été développé pour faciliter l’exploitation des données
opérationnelles.
L’incertitude
et
l’imprécision
inhérentes
aux
données
opérationnelles ont été prises en compte, notamment à l’aide de la théorie des
probabilités.
IV.7.2 Limites et perspectives
La principale limite de cette approche est qu’elle ne s’applique que pour
une substance chimique pure, ce qui n’est pas toujours le cas. En pratique, les
« produits
chimiques »
pouvant
être
rencontrés
dans
des
stockages,
correspondent à deux types particuliers de produits : les substances et les
préparations. La définition de ces produits est donnée par l’article R.231-51 du
Code du Travail qui distingue :
-
les substances sont « les éléments chimiques et leurs composés tels qu’ils
se présentent à l’état naturel ou tels qu’ils sont obtenus par tout procédé
de production contenant éventuellement tout additif nécessaire pour
préserver la stabilité du produit et toute impureté résultant du procédé, à
l’exclusion de tout solvant pouvant être séparé sans affecter la stabilité de
la substance ni modifier sa composition » ;
-
et « les préparations, les mélanges ou solutions composés de deux
substances ou plus ».
Dans le cas de mélanges, la base de données ne permet pas de les
identifier à ce jour. Ce problème pourrait être pris en compte, mais pour cela, il
faudrait envisager d’introduire les mélanges comme nouvelles données et y
associer les valeurs des données opérationnelles.
La difficulté est plus grande dans le cas de plusieurs substances qui se
mélangeraient lors de l’accident. C’est par exemple le cas lors d’un TMD, la
substance
peut se
mélanger
à
l’essence
du
camion
ou au
liquide
de
refroidissement d’un stockage sous pression. Il s’agit d’un problème différent
d’un mélange stable, réalisé en amont et répertorié, pouvant alimenter la base
de données. Dans le cas d’un mélange se produisant à la suite d’un accident, il
devient difficile d’associer un critère à une substance précise. Et certains critères
comme l’odeur, deviennent extrêmement difficiles à percevoir.
Le mélange de substances peut également donner lieu à une réaction
chimique, produisant de nouvelles molécules, avec des effets et des critères
physico-chimiques différents. Il peut s’en suivre un recueil d’informations
concernant différentes substances, avec des données décrivant une des
substances d’origine et des symptômes dus aux produits formés lors de la
158
Chapitre IV
Identification des substances chimiques
réaction. Il en est de même dans le cas des produits de décomposition pouvant
se former suite à une combustion.
Enfin, il faut compter également avec les additifs utilisés pour le stockage
ou le transport, notamment pour stabiliser.
Pour résoudre les problèmes d’identification des mélanges faits en amont
(préparations, solutions, etc.), la base de données doit être complétée avec des
informations sur les mélanges usuels et les additifs utilisés.
L’enrichissement de la base de données ne doit pas se limiter à ces seules
informations. Nous avons vu tout au long de ce chapitre que l’identification d’une
substance ou des dangers qui y sont liés est difficile à cause du manque
d’information du à des données peu nombreuses, imprécises et incertaines. La
base de données opérationnelles développée au cours de ce travail de thèse n’est
qu’une première étape, elle doit être enrichie avec toute l’information disponible
pouvant apporter une meilleure identification des dangers liés aux substances
chimiques.
Sans vouloir faire une liste exhaustive, plusieurs sources d’information ont
été répertoriées comme potentiellement utiles à l’identification des substances ou
des dangers :
-
Il s’agit notamment de critères physico-chimiques supplémentaires comme
la solubilité. La densité est présente en base de données sous forme de
comparaison à la densité de l’eau qui sert de repère pour une observation
en situation opérationnelle. Mais il n’est pas tenu compte des liquides
miscibles.
-
Des statistiques sur les substances chimiques pouvant être présentes sur
le lieu de l’accident sont également des indicateurs pour limiter l’ensemble
des solutions potentielles. Le référencement sous forme de SIG ou d’une
liste informatisée des sites à risque et des substances chimiques stockées
constitue un critère de sélection à prendre comme une information
incertaine supplémentaire. Cette information est intéressante aussi bien
dans le cas d’accident sur un site fixe que lors d’un TMD. Les sites fixes
génèrent un flux de TMD acheminant des substances chimiques en relation
avec l’activité du site. Dans le cas particulier des TMD, des statistiques sur
les substances transitant sur l’axe ou la zone d’un accident sont également
une indication précieuse pour effectuer une sélection en base de données.
Dans le cas des grands axes comme les autoroutes, le nombre de
substances
est
trop
important
pour
apporter
une
information
discriminante. Cependant, une étude réalisée par le CANUTEC a montré
159
Chapitre IV
Identification des substances chimiques
qu’il n’y a que quelques substances qui sont très fréquentes [Sari et al.,
2000]. L’utilisation de distributions de probabilités permettrait de prendre
en compte ces statistiques.
-
L’étude des bases de données et les entretiens avec les sapeurs-pompiers
ont permis de mettre en exergue des indications pouvant s’obtenir par
l’observation de réactions chimiques se produisant ou faciles à reproduire
sur le terrain. Comme critères visuels, on peut citer la réaction
effervescente
du
calcaire
en
présence
d’acides
forts,
la
détection
d’hydrocarbure dans l’eau par le changement de couleur de dentifrice
d’une certaine marque ou encore la formation de cristaux de sel lors de la
mise en contact de l’acide fluoborique (n° CAS : 16872-11-0) avec les
métaux [O'Neil et al., 2004].
-
Le type de stockage apporte également une information. Toutes les
substances chimiques ne sont pas transportées dans les mêmes conditions
(réchauffées, réfrigérées, sous-pression, …). Il existe des repères visuels
pour caractériser les différents stockages et une relation stockages /
substances intégrée à la base de données pourrait servir de critère de
sélection
supplémentaire
[Chamayou,
1997a;
1997b;
Lees,
2004;
Chazeau, 2007].
-
Enfin,
bien
que
les
détecteurs
non
sélectifs
comme
les
tubes
colorimétriques ou les cellules électrochimiques ne permettent pas une
identification précise, ils apportent également de l’information. Les tubes
colorimétriques de marque Dräger ont été intégrés à la base de données
opérationnelles, mais il faut encore ajouter les autres types de détecteur.
Les tubes Gastec sont souvent présents dans les CMIC et certains tubes
présentent peu d’interférents et apportent une information fiable (tubes
acides notamment).
Enfin, des améliorations peuvent également être apportées pour une
meilleure prise en compte de l’imprécision. L’imprécision des critères physicochimiques
repose
sur
des
distributions
de
probabilités
empiriques
faute
d’expérimentation. Le codage du pH en base de données n’offre que peu de
liberté sur le choix des distributions de probabilités. Mais dans le cas de la
perception des couleurs et des odeurs des tests plus complets seraient
nécessaires. Des REX sur l’utilisation d’AERO lors des exercices permettraient de
réaliser des distributions de probabilités plus représentatives.
160
Chapitre IV
Identification des substances chimiques
L’imprécision pourrait également être prise en compte dans le cas des
symptômes. L’avis d’experts et les REX permettraient de déterminer les
symptômes pouvant être confondus. Dans le REX sur l’intoxication au bromure
de méthyle, il apparaît que les symptômes « érythème » et « brûlure » peuvent
être confondus. Des distributions de probabilités pourraient être déterminées à
partir d’avis d’experts pour prendre en compte cette imprécision de diagnostic.
Une
information
imprécise
serait
plus
discriminante
qu’une
information
incertaine.
Une fois la nature du produit connue, il est alors possible d’envisager de
modéliser les effets possibles en utilisant des modèles de calcul de flux. Mais un
autre problème se présente alors : Le terme source, nécessaire à l’utilisation des
modèles prédictifs, est rarement connu avec précisions en situation d'urgence.
L’évaluation du terme source à partir des données opérationnelles est
traitée au chapitre suivant.
161
Chapitre V
Estimation du terme source d’un phénomène dangereux
CHAPITRE V
ESTIMATION DU TERME SOURCE D’UN
PHENOMENE DANGEREUX
V.
Guide de lecture :
L’estimation du terme source d’un phénomène dangereux à partir
de ses conséquences mesurées est un problème inverse.
Parmi les différentes méthodes inverses présentées en première
partie, le choix se porte sur les algorithmes génétiques pour leur
capacité à s’adapter aux différents cas présents en situation
d'urgence.
Une méthode couplant algorithme génétique et modèle direct de
calcul de flux est mise au point pour traiter les cas d’explosions de
solide. Après une phase de développement et de tests à partir de
simulations numériques, la méthode est vérifiée à l’aide de deux
retours d’expérience.
162
Chapitre V
V.1
Estimation du terme source d’un phénomène dangereux
L’estimation du terme source : un problème inverse
Habituellement, en matière de risque industriel, l’étude des phénomènes
d’explosion, d’incendie et de dispersion atmosphérique d’un produit consiste à
estimer un flux dangereux (thermique, toxique ou mécanique) à partir d’un
terme
source
(produit,
quantité,
débit,
…)
et
de
données
décrivant
l’environnement proche (vent, température, topographie, obstacles, …). La
connaissance du flux calculé à l’aide de modèles mathématiques permet
notamment de déterminer les distances de sécurité pour l’aménagement du
territoire (lorsqu’il s’agit d’études de danger) ou pour les services de secours
intervenant sur des accidents chimiques (dans le cas des situations d’urgence).
Le terme source est donc primordial pour le calcul des flux mais le constat
est que les caractéristiques de la source sont souvent mal connues en situation
d’urgence. Cependant il est possible dans certaines conditions, de l’estimer à
partir des conséquences observées ou mesurées sur le terrain lorsque les
données sont suffisantes. Il s’agit alors de résoudre un problème inverse.
Le paragraphe suivant fait une description succincte de différentes
approches de méthodes inverses susceptibles de permettre d’évaluer le terme
source à partir de données opérationnelles.
Figure 45 : Méthode directe et méthode inverse
163
Chapitre V
V.1.1
Estimation du terme source d’un phénomène dangereux
Généralités sur les méthodes inverses
Le calcul du terme source d’un accident à partir de l’observation de ses
conséquences est un problème inverse, puisqu’il s’agit d’utiliser les modèles
prédictifs couramment utilisés (tels que les modèles de dispersion, de flux
thermique, …) dans le sens inverse de celui habituellement pratiqué (figure 1).
D’une manière générale, l’objectif des méthodes inverses est de déterminer des
grandeurs difficilement mesurables à partir d’observations ou de mesures. Il peut
s’agir de variables d’état, de paramètres du modèle ou de variables comme les
conditions initiales ou les conditions aux limites [Faugeras, 2002]. Et Les
domaines d’application des méthodes inverses sont nombreux (mathématiques,
hydrologie, géologie, mécanique, architecture, économie, biologie, astrophysique
…) dans le but d’améliorer les modèles, de définir un système d’observation ou
encore dans notre cas, d’identifier certains paramètres. Un certain nombre de
problèmes inverses classiques sont cités dans [Le Niliot, 2003] :
-
estimation de géométrie de domaine,
-
estimation de paramètres,
-
estimation d’un état initial (ou reconstruction d’un état initial),
-
estimation de sources
-
estimation de conditions aux limites
V.1.1.1 Formalisation mathématique
Soit e = (e1 , e2 ,..., en ) ∈ E , le vecteur constitué des variables d’entrée du
modèle direct
et s = ( s1 , s 2 ,..., s m ) ∈ S , le vecteur de sortie.
Le modèle direct peut être décrit comme une application F : E → S
Le modèle inverse consistant à déterminer e = (e1 , e2 ,..., en ) ∈ E en partie ou
dans son ensemble telle que e = F −1 (s)
On appelle dimension m du problème inverse, la taille du vecteur
d'état e = (e1 , e2 ,..., en ) qui regroupe le nombre de paramètres à estimer.
On appelle contraintes, les observations ( s1 , s 2 ,..., s m ) que les prévisions
du modèle doivent approcher au mieux. Dans le cas des phénomènes dangereux
(dispersion de gaz de toxique, explosion et incendie), il s’agit de mesures de
concentrations de gaz, de surpressions ou de flux thermique, ou bien encore
d’évaluation de ces flux à partir de leurs effets sur l’homme, l’environnement ou
les matériels. Pour comparer les valeurs des contraintes aux prévisions, on relie
164
Chapitre V
Estimation du terme source d’un phénomène dangereux
le vecteur le vecteur d'état à l'espace des observations par un opérateur
d'observation.
D’un point de vue mathématique, le problème inverse consiste à minimiser
une fonction coût (notée C ) ou fonction objectif (fitness function) représentant
la pertinence des solutions potentielles au problème. Il s’agit de l’écart entre les
résultats de la modélisation directe s et les données réelles s' mesurées ou
observées.
Avant d’essayer de résoudre un problème, il faut s’assurer qu’il est bien
posé au sens d’Hadamard.
Existence de la solution
Pour un problème direct F : E → S , il existe une solution e ∈ E au problème
inverse correspondant pour tout s ∈ S pouvant être rencontré ; le modèle F doit
être complet.
Unicité de la solution
Il existe une solution unique e ∈ E quel que soit s ∈ S . Dans le cas d’un
opérateur matriciel s = F .e , cela signifie que le déterminant de F ne doit pas être
nul. Cela incite à limiter le nombre de paramètres à estimer pour ne pas
introduire implicitement de relations inutiles [Pujos, 2006]. Dans un problème de
détermination du nombre de sources d’émission, surestimer le nombre de
sources débouche sur une surabondance de solutions.
Quasi-solutions
Les contraintes d’existence et d’unicité sont remplies dans le cas des
problèmes académiques où toutes les données sont connues avec précision. Mais
dans la réalité, les données s '∈ S issues de mesures ou d’observations sont
entachées d’un bruit inhérent à leur acquisition s ' = s + ε .
Lorsque le nombre de mesures p (par exemple des mesures de
concentrations de gaz toxique en différents points de l’espace au sein du nuage)
est suffisant pour avoir autant d’équations que d’inconnues (n paramètres du
terme source), la résolution du problème inverse conduira à une unique solution
dont l’exactitude dépendra du bruit de mesure (et de la précision du modèle à
retranscrire le phénomène physique).
Plus souvent, le nombre de mesures permet d’avoir plus d’équations que
d’inconnues p>n. Dans ce cas il n’y a pas de solution exacte du point de vue
mathématique et l’on recherche la meilleure solution au sens des moindres
165
Chapitre V
Estimation du terme source d’un phénomène dangereux
carrés [Forestier, 2004]. Le problème revient alors à minimiser la norme
quadratique.
min F (e) − s '
2
Eq. 19
e∈E
A contrario, lorsque le nombre d’équations est insuffisant, il s’agit d’un
problème mal posé22, sous-déterminé, pour lequel il existe plusieurs solutions. Il
est alors nécessaire d’employer des techniques d’optimisation et l’ajout de
contraintes. C’est le principe de la régularisation qui consiste en l’ajout
d’information a priori, d’hypothèses permettant de simplifier le problème en
évitant que le modèle s’écarte trop de la réalité physique.
Stabilité vis-à-vis des faibles variations
L’estimation par méthode inverse s’apparente à un algorithme de
minimisation sous contrainte d’une fonction. Les techniques classiques de
recherche d’un minimum (notamment les méthodes de descente de gradient)
fonctionnent bien pour une fonction convexe. Mais dans le cas des phénomènes
physiques non linéaire à plusieurs variables, la fonction à minimiser est rarement
convexe globalement, ce qui exclut souvent l’existence d’un minimum global. En
général, il s’agit tout de même de fonctions convexes au voisinage des minima
locaux. Il convient alors de choisir judicieusement l’initialisation de la recherche
du minimum (restriction de l’ensemble des possibles par l’ajout de contrainte) ou
comme nous le verrons par la suite, d’employer des méthodes stochastiques
explorant l’univers des solutions potentielles au prix de plusieurs itérations.
Problème inverse d’identification du terme source
Dans le cadre de notre étude, le problème inverse à résoudre consiste à
déterminer les conditions initiales de phénomènes physiques, linéaires ou non
dans des situations où le nombre de données sera suffisamment grand pour ne
pas être confronté à un problème sous-déterminé. A noter que les problèmes
sous-déterminés
peuvent
être
également
traités
à
l’aide
d’algorithmes
génétiques prenant en compte l’écart entre les solutions dans la phase de
sélection de celles-ci, afin d’exhiber non plus la meilleure solution, mais un
ensemble de solutions potentielles [Bontemps, 2000].
Pour résoudre des problèmes inverses, il existe plusieurs approches qui
sont présentées ci-après.
22
Problème mal posé : problème en partie sous-déterminé et en partie surdéterminé à l’inverse de la
définition de Hadamard [Hadamard, 1932] d’un problème bien posé : il existe une solution, elle est
unique et stable (elle dépend de façon continue des données pour une topologie raisonnable).
166
Chapitre V
Estimation du terme source d’un phénomène dangereux
V.1.1.2 Présentation des différentes méthodes inverses
Les problèmes inverses sont rencontrés dans de nombreux domaines et,
afin de les résoudre, deux approches se sont développées conjointement : les
méthodes inverses directes ou modélisations inverses (backward methods) et les
méthodes inverses indirectes ou itératives (forward methods). Les méthodes
inverses sont qualifiées de directes lorsqu’elles modélisent la variation du flux
des récepteurs vers la source, et elles sont dites indirectes lorsqu’elles
nécessitent plusieurs itérations d’un modèle direct, modélisant la variation de
flux de la source vers les récepteurs. D’autres distinctions des méthodes inverses
sont également faites selon leur côté déterministe ou stochastique, ou encore
selon leur faculté à résoudre des problèmes linéaires ou non linéaire.
V.1.1.2.1
Méthodes inverses directes
Contrairement aux méthodes itératives, les méthodes inverses directes
n’utilisent qu’une seule modélisation mais dans le sens inverse, en partant des
récepteurs pour remonter à la source et l’estimer.
Recherche en grille
Cette méthode de recherche en grille ou d’inversion en grille consiste à
discrétiser l’espace des paramètres en un nombre fini de solutions possibles.
Toutes ces solutions sont ensuite testées et celle qui minimise la fonction coût
est conservée. Elle explore de manière homogène l’espace des paramètres et,
par conséquent, présente l’avantage de ne pas être sujette aux minima locaux.
Mais cette méthode n’est possible que pour des problèmes de faible dimension.
Il existe des variantes itératives dichotomiques commençant avec une
grille peu détaillée pour lesquelles une sélection de la « case » contenant le
minimum est déterminée puis subdivisée jusqu’à une taille de cases définies.
Malgré ces améliorations, ces méthodes ne s’appliquent qu’à des problèmes
comportant peu de paramètres. De plus, les méthodes de sélection de la case à
affiner, n’assurent pas de trouver le minimum global.
Inversion simple – existence d’une fonction inverse
Sans vraiment parler de méthode inverse, le problème direct est parfois
modélisé par des équations mathématiques pour lesquelles il est possible de
déterminer analytiquement la fonction inverse. Il est donc possible de définir la
fonction inverse F −1 : S → E .
Une fois la fonction connue et disposant de suffisamment de données, le
problème peut alors être résolu par régression.
167
Chapitre V
Estimation du terme source d’un phénomène dangereux
Lorsque ce travail analytique d’inversion est impossible, la fonction inverse
peut être approchée, notamment par partie (par exemple le modèle de
l’équivalent TNT utilisé par l’INERIS pour les explosions de solides) ou en
réalisant un réseau de neurones dont l’apprentissage peut être effectué à partir
des données artificielles générées à l’aide du modèle direct.
Problème linéaire
Plus généralement, que la fonction soit inversable analytiquement ou non,
on parlera plutôt de résoudre un problème linéaire ou non linéaire.
Pour un problème linéaire, l’équation s = F (e) s’écrit sous forme matricielle
s = F .e et peut être résolue par la méthode des moindres carrés en minimisant la
norme du résidu r défini par :
r = F .e − s
Eq. 20
On recherche alors l’estimation ê du vecteur d’entrée e telle que :
F .eˆ − s = min r
2
2
F .eˆ − s = min F .e − s
2
Eq. 21
2
Eq. 22
Ce qui revient, par équivalence, à résoudre l’équation normale suivante :
F T F .eˆ = F T .s
Eq. 23
Selon l’existence de l’inverse de F T F , la solution des moindres carrés est la suivante :
[
eˆ = F T F
]
−1
F T .s
Eq. 24
Une application à la dispersion atmosphérique à l’aide d’un modèle gaussien est
présentée dans [Fache, 2003].
Mais, le plus souvent, le problème est non linéaire, la mise sous forme
matricielle s = F .e n’est plus possible et d’autres méthodes sont alors utilisées
comme les méthodes itératives.
V.1.1.2.2
Méthodes itératives
Le principe consiste à minimiser la différence entre l'observation (flux
dangereux caractérisé par les concentrations en gaz ou les bris de vitres suite à
une explosion) et la prévision du modèle pour une ou plusieurs variables de
sortie en modifiant les paramètres d’entrée (terme source) à estimer au cours de
plusieurs itérations. Les valeurs de départ des paramètres (ou « first-guess »),
sont choisies a priori dans l’espace d’état qui est plus ou moins vaste selon notre
connaissance du problème. En prenant l’exemple de la localisation de la source
168
Chapitre V
Estimation du terme source d’un phénomène dangereux
d’un nuage de gaz dangereux, lorsque l’expert n’a pas la connaissance de la zone
dans laquelle elle peut se situer, et qu’il dispose uniquement de mesures de
concentration, il lui faut rechercher le point de rejet sur plusieurs kilomètres à la
ronde. Mais dans certains cas, l’observation d’un panache de fumée permet de
localiser plus ou moins précisément la source d’émission et de réduire ainsi
l’espace de recherche. Ceci facilite la détermination de la source et réduit de
façon non négligeable les temps de calcul.
Dans la suite, les principales méthodes itératives sont présentées en
distinguant les méthodes déterministes et non déterministes.
Méthodes déterministes
-
Méthode de l’adjoint :
Il existe des techniques pour corriger les paramètres d’entrée en fonction
de l’écart entre les résultats du modèle et les mesures. La méthode la plus
répandue dans l’inversion de modèles par éléments finis est le calcul d’un adjoint
au modèle permettant d’ajuster les paramètres sources au vu des résultats
obtenus. Les équations adjointes permettent de calculer la variation d'un
paramètre de sortie d'un modèle en fonction de chaque paramètre d'entrée.
Ainsi, il est possible de déterminer comment modifier des paramètres d’entrée
pour minimiser la fonction coût en utilisant un algorithme de descente [Courtier
et al., 1997]. Cette méthode est intéressante car le temps de calcul est
indépendant du nombre de paramètres.
-
Méthodes de direction de descente
Ces méthodes consistent à partir d’une solution initiale et à « descendre » pas à
pas la fonction coût jusqu’à atteindre son minimum. Le calcul de la direction de
descente nécessite que la fonction coût soit différentiable par rapport à E . De
plus, il est fait l’hypothèse que la fonction coût est convexe ou que la solution
initiale est proche de la solution optimale, afin d’éviter de rester bloqué dans un
minimum local.
o
Méthode de descente de gradient
La descente s’effectue selon un pas λ , choisi de manière à minimiser la
fonction coût. Si λ est choisi trop grand, la méthode peut osciller autour de la
solution, alors que pour un λ trop petit, la convergence sera très lente.
Dans le cas d’un modèle à un paramètre, l’algorithme est donné par la
relation :
e ( i+1) = e (i ) − λ .d (C / de) e=e( i )
169
Eq. 25
Chapitre V
Estimation du terme source d’un phénomène dangereux
Avec e ( i ) le vecteur d’entrée à l’étape i
et λ le pas de descente qui est un réel strictement positif.
Lorsque le vecteur d’entrée comprend plus d’un paramètre, la descente se
fait suivant la pente la plus forte.
o
Gradient conjugué
Dans le cas du gradient conjugué, on garde en mémoire les directions de
descente précédentes. La méthode consiste à prendre une direction de descente
λn orthogonale aux n-1 directions précédentes (n étant le nombre d’inconnues
cherchées).
o
Méthode de Newton
Avec la méthode de Newton, la descente se fait selon tous les paramètres
de e à la fois. Pour cela, elle fait intervenir le hessien23 de la fonction coût.
o
Méthode Quasi-Newton
La direction de descente est calculée en utilisant une approximation du
hessien et le gradient de la fonction coût au point courant. Cette méthode est
détaillée dans [Pison, 2005].
Les algorithmes de direction de descente telles que le gradient conjugué
ou l’algorithme de Gauss-Newton sont présentées dans [Forestier, 2004].
La principale limite à ces méthodes est le risque de rester bloqué dans un
minimum local. Pour résoudre ce problème, d’autres types de méthodes ont été
proposés. Il s’agit notamment des méthodes non déterministes et des méthodes
semi-globales qui font intervenir la notion de hasard.
Méthodes non déterministes
Il s’agit de méthodes stochastiques itératives directes (forward methods)
qui consistent en des simulations de problèmes mathématiques ou physiques,
basées sur le tirage de nombres aléatoires.
-
Méthodes de Monte Carlo :
Le terme « Monte Carlo » est employé dans de nombreuses disciplines et
fait référence aux procédures où les quantités d’intérêt sont approximées en
23
Hessien : Matrice des dérivées seconde au point e(i).
170
Chapitre V
Estimation du terme source d’un phénomène dangereux
générant de nombreuses réalisations aléatoires d’un processus stochastiques
quelconque.
Dans
notre
cas,
une
simulation
Monte
Carlo
consiste
à
générer
aléatoirement un ensemble de conditions initiales choisies au hasard parmi un
ensemble borné et couvrant l’ensemble des possibles. Selon la complexité des
problèmes traités (dimension du problème et « degré » de non linéarité de la
fonction objectif), le nombre de conditions initiales devra être plus ou moins
élevé pour obtenir une solution statistiquement proche de la solution recherchée
avec la précision souhaitée.
Cette méthode peut être utilisée si le nombre de paramètres à identifier
est restreint. En effet, pour s’assurer que l’espace des possibles a été
suffisamment exploré, un très grand nombre de modélisations directes est
nécessaire. Ce type d’algorithme est donc très coûteux en temps de calcul ce qui
limite son utilisation à des problèmes ayant un nombre restreint de paramètres.
Les avantages de cette approche sont sa simplicité et sa faculté à détecter les
non-unicités de solutions.
Les méthodes hybrides ou semi-globales :
Bien qu’étant non déterministes, les méthodes hybrides se distinguent par
le fait qu’elles combinent plusieurs méthodes, en utilisant par exemple la
méthode des gradients en partant d’un grand nombre de points choisis
aléatoirement afin de déterminer tous les minima locaux de la fonction objectif.
Parmi les méthodes hybrides, le recuit simulé et les algorithmes
génétiques sont deux analogies à des mécanismes naturels présentant un mode
de
recherche
intéressant,
permettant de
retenir
« temporairement »
des
solutions moins bonnes que celles trouvées précédemment afin d’explorer le
voisinage et de ne pas rester piégé dans un minimum local.
-
Le recuit simulé :
Le recuit simulé est un algorithme qui s'inspire d'un mécanisme naturel. Il
s’agit d’une technique consistant à chauffer un matériau et à le refroidir dans
certaines conditions. Lors du refroidissement, les atomes de la matière
s'organisent entre eux de manière à ce que les configurations de plus faible
niveau d'énergie (les plus stables) soient privilégiées. Tant que le niveau
d'énergie total du matériau (sa chaleur) reste élevé, les atomes peuvent trouver
l'énergie pour changer de configuration, quitte à passer par des configurations
moins stables. Au fur et à mesure que la température baisse les atomes auront
171
Chapitre V
Estimation du terme source d’un phénomène dangereux
une ressource d'énergie plus faible pour passer dans des configurations plus
instables.
A partir d’un point initial de l’espace des possibles pouvant être choisi
aléatoirement, des déplacements aléatoires sont effectués afin d’explorer
différentes solutions voisines. Un déplacement est accepté s’il mène à une valeur
plus petite de la fonction objectif à minimiser. Sinon, il est accepté avec une
probabilité P.
P=e
−
∆f
kT
Eq. 26
Avec ∆f la variation de la fonction objectif au cours du déplacement,
T la température qui décroît au cours du temps
et k une constante à déterminer en fonction du problème traité.
Le recuit simulé est adapté aux problèmes dont la fonction à minimiser est
mal connue et sans se soucier du nombre de dimensions de l’espace de
recherche. Cette méthode n’est pas sensible à la présence de minima locaux. Elle
ne nécessite pas non plus de connaître la fonction objectif à optimiser, ni les
traitements mathématiques de dérivation ou de calcul d’adjoint [S. A. Teukolsky
et al., 1992].
-
Les algorithmes génétiques :
Les algorithmes génétiques ou algorithmes évolutionnaires utilisent quant
à eux, un processus stochastique pour générer des individus (solutions
potentielles e (i ) ) sur lesquels sont appliquées plusieurs règles issues de la théorie
de l’évolution (croisement, mutation et sélection) afin de conserver les meilleurs
individus et converger plus rapidement vers une solution proche de l’optimum.
Avant de poursuivre en détail sur les algorithmes génétiques, une
comparaison des méthodes inverses sur leurs capacités d’exploration et
exploitation de l’espace des possibles, explique
l’intérêt suscité par les
algorithmes évolutionnaires.
V.1.1.3 Bilan sur les méthodes inverses
Les méthodes purement stochastiques (Monte Carlo) permettent une
bonne exploration puisque tout point de l’espace a une probabilité identique
d’être atteint, mais il n’y a pas d’exploitation des résultats déjà obtenus. A
contrario, avec les méthodes de direction de pente (ou gradient), l’exploration
est locale mais l’exploitation des données précédentes permet une convergence
plus rapide. Enfin, les algorithmes évolutionnaires offrent un bon compromis
entre exploration et exploitation [Beasley et al., 1993].
172
Chapitre V
Estimation du terme source d’un phénomène dangereux
Les algorithmes génétiques offrent également d’autres avantages qui en
font une solution intéressante aux problèmes inverses d’évaluation du terme
source en situation d'urgence. Le paragraphe suivant leur est consacré.
V.1.2
Les algorithmes génétiques
V.1.2.1 Utilisation des algorithmes génétiques pour résoudre un
problème inverse
Les algorithmes génétiques présentent l’avantage d’être adaptables aux
différents problèmes inverses pouvant être rencontrés en situation d’urgence :
o
Un nombre variable de paramètres à identifier
En effet, selon les situations, certains paramètres du terme source seront
connus ou non.
Pour une explosion, le paramètre habituellement recherché est la quantité
de produit ayant réagi, mais dans un premier temps, la localisation de l’épicentre
peut ne pas être connue. Pour une dispersion de gaz, le terme source comprend
notamment le débit, la hauteur et la vitesse initiale du rejet.
o
La complexité et la non-linéarité des modèles mathématiques
Les modèles sont plus ou moins complexes selon le phénomène modélisé
et la précision des mécanismes physiques pris en compte (modèles gaussiens,
modèles intégraux, modèles de la mécanique des fluides). Certains modèles ne
sont pas inversibles, ne permettent pas le calcul d’un adjoint ou seront associés
à une fonction coût non convexe. De plus, l’inversion d’un modèle ou le calcul
d’un adjoint peut être un travail mathématique conséquent. Les algorithmes
génétiques ne nécessitent pas ce travail mathématique et permettent de
contourner les problèmes de non linéarité [Giacobbo et al., 2002].
o
L’existence de plusieurs solutions
Dans le cas de problèmes « mal posés » sous-déterminés, il n’existe pas
une unique solution et la méthode doit permettre d’obtenir un ensemble
représentatif de solutions possibles.
La solution retenue pour estimer le terme source, est d’utiliser un
algorithme génétique couplé à un modèle prédictif (Figure 46).
173
Chapitre V
Estimation du terme source d’un phénomène dangereux
Figure 46 : Méthode inverse par algorithme génétique
V.1.2.2 Principes généraux des algorithmes génétiques
Les algorithmes génétiques appartiennent à une famille d'algorithmes
appelés métaheuristiques dont le but est d'obtenir une solution approchée à un
problème d'optimisation en un temps de calcul acceptable [Bontemps, 2000]. Les
algorithmes génétiques utilisent la notion de sélection naturelle développée au
XIXe siècle par le scientifique Darwin et l'appliquent à une population de
solutions potentielles au problème donné.
Les premiers travaux sur les algorithmes génétiques ont commencé dans
les années cinquante lorsque plusieurs biologistes américains ont simulé des
structures biologiques sur ordinateur. Puis entre 1960 et 1970, John Holland, sur
la base des travaux précédents, développa les principes fondamentaux des
algorithmes génétiques dans le cadre de l'optimisation mathématique [Holland,
1975]. Mais les ordinateurs n’avaient pas encore une puissance de calcul
suffisante pour envisager l'utilisation des algorithmes génétiques sur des
problèmes réels de grande taille.
Avec
l’évolution
des
ordinateurs,
des
utilisations
concluantes
des
algorithmes génétiques furent obtenues sans pouvoir néanmoins démontrer
174
Chapitre V
Estimation du terme source d’un phénomène dangereux
formellement les mécanismes observés à cause de la complexité induite par ces
algorithmes. Il faut attendre 1993 pour que Raphaël Cerf établisse une
démonstration complète et rigoureuse de convergence stochastique [Cerf, 1994].
Dans la suite de ce paragraphe, nous emploierons un vocabulaire similaire
à celui de la génétique communément employé dans la littérature scientifique
relative à ces algorithmes. Ainsi, un ensemble de solutions (termes source
potentiellement solutions de problème) sera désigné comme une population
d’individus possédant des caractères héréditaires (les différents paramètres
constituant le terme source). Les principes de sélection, de croisement et de
mutation introduits dans ce cadre artificiel, s'appuient sur les processus naturels
du même nom.
Pour un problème d'optimisation donné, un individu représente un point de
l'espace d'état auquel est associée la valeur du critère à optimiser. L'algorithme
génère de façon itérative des populations d'individus sur lesquelles sont
appliqués des processus de sélection, de croisement et de mutation. La sélection
a pour but de favoriser les meilleurs éléments de la population, tandis que le
croisement et la mutation assurent une exploration efficace de l'espace d'état.
Les algorithmes génétiques comprennent plusieurs étapes illustrées en
Figure 47 et détaillées ci-dessous :
-
Le contenu de la population initiale d‘individus (solutions possibles) est
généré aléatoirement.
-
Une évaluation de chacun des individus est effectuée pour leur affecter
une note qui correspond à leur adaptation au problème. Il s’agira de l’erreur
ou de l’écart entre la solution calculée et la solution recherchée.
-
Ensuite, une sélection des solutions est réalisée. Ce processus est
analogue à celui de la sélection naturelle : les individus les plus adaptés vont
pouvoir se reproduire tandis que les moins adaptés meurent avant la
reproduction, ce qui améliore globalement l'adaptation.
Il existe plusieurs techniques de sélection. Les principales utilisées sont :
o
La sélection par rang
Cette technique de sélection choisit toujours les solutions possédant les meilleurs
scores d'adaptation, le hasard n'entre donc pas dans ce mode de sélection.
o La probabilité de sélection proportionnelle à l'adaptation (Méthode
de Monte-Carlo par exemple)
175
Chapitre V
Estimation du terme source d’un phénomène dangereux
Pour chaque solution, la probabilité d'être sélectionnée est proportionnelle à son
adaptation au problème. Afin de sélectionner une solution, on utilise le principe
de la roue de la fortune biaisée.
o La sélection par tournoi
Cette technique utilise une sélection aléatoire ou non de paires de solutions, puis
choisit pour chaque paire, la solution qui a le meilleur score d'adaptation.
o La sélection uniforme
La sélection se fait aléatoirement, uniformément et sans intervention de la valeur
d'adaptation. Chaque solution a donc une probabilité 1/N d'être sélectionnée, où
N est le nombre total de solutions dans la population. Par conséquent, cette
technique ne retient pas forcément les meilleures solutions.
-
L’intérêt
des
algorithmes
génétiques
apparaît
à
l’étape
suivante
de
génération d’une nouvelle population de solutions. Cette population est
construite à partir de règles issues de l’évolution des espèces :
o
Le crossing-over ou recombinaison
De façon analogue aux chromosomes lors de la reproduction sexuée, deux
solutions s'échangent des parties de leurs paramètres, pour donner de nouvelles
solutions. Ces crossing-over peuvent être simples ou multiples. Il existe plusieurs
méthodes pour déterminer les couples subissant une recombinaison (aléatoire,
par rang, …).
o
Les mutations
De façon aléatoire, un paramètre d'une solution peut être substitué à un autre.
La mutation sert à éviter une convergence prématurée de l'algorithme. Par
exemple lors d'une recherche d'extremum la mutation sert à éviter la
convergence vers un extremum local.
-
Tout processus itératif nécessite une condition d’arrêt. Deux approches
existent :
o
Le
nombre
d’itérations
(ou
générations)
est
fixé
a
priori
ou
empiriquement afin de limiter le temps de calcul.
o
L’algorithme s’arrête lorsque la population d’individus cesse d’évoluer
ou n’évolue plus assez rapidement.
Dans les deux cas, la solution obtenue n’est qu’une valeur approchée de
l’optimum.
176
Chapitre V
Estimation du terme source d’un phénomène dangereux
Figure 47 : fonctionnement des algorithmes génétiques
Les algorithmes génétiques peuvent s’appliquer à de nombreux problèmes
de recherche d’optimum, d’analyse de situations dynamiques complexes, ou
encore à la modélisation de comportements d’agents et de stratégies. Ils sont
donc adaptés à la résolution d’un problème inverse. Le paragraphe suivant
présente une application possible des algorithmes génétiques pour résoudre un
problème inverse d’identification du terme source d’une explosion de solides.
177
Chapitre V
V.2
Estimation du terme source d’un phénomène dangereux
Application aux explosions de solides
Les algorithmes génétiques ont été appliqués aux explosions de solides
pour lesquelles il s’agit de calculer avec précision la masse d’explosif ayant
détonnée et de déterminer la position de l’épicentre. Bien que l’épicentre puisse
être identifié visuellement en recherchant le cratère, il n’est pas toujours connu
avec précision dans les premiers instants.
La conception de l’algorithme et l’évaluation de la méthode ont été
réalisées à partir de jeux de données artificielles générées selon un processus
stochastique.
L’étude des dommages issue des retours d’expérience de l’accident d’AZF
(à Toulouse en 2001) et de l’explosion de Nitrochimie (à Billy-Berclau en 2003)
ont servi pour la validation de la méthode [Mouilleau et al., 2001; Dechy et al.,
2004].
Figure 48 : Usine AZF suite à l’explosion du 21 septembre 2001
Les explosions (qu’il s’agisse d’explosions de solides ou de nuages
gazeux), sont des phénomènes extrêmement violents et à cinématique très
rapide se caractérisant par une libération soudaine d’énergie pouvant donner lieu
à des flux mécaniques (onde de pression et projectiles) et à des flux thermiques
(boule de feu). Il existe différents types d’explosions qui se distinguent
notamment par la phase du produit à l’origine de l’explosion (par exemple un
explosif solide pouvant provoquer une déflagration ou une détonation), par les
conditions de stockages (stockage sous-pression et température extérieure par
exemple), ou encore, par le fait que l’explosion se produit en milieu confiné ou
non.
Nous nous intéresserons à une méthode destinée à évaluer le terme
source d’une détonation de produit chimique à l’état solide.
178
Chapitre V
V.2.1
Estimation du terme source d’un phénomène dangereux
Données opérationnelles
Lors d’une situation d’urgence suite à une explosion, le flux mécanique
résultant
(surpression)
n’est
pas
mesuré
car
la
cinématique
rapide
du
phénomène ne permet pas de déployer un réseau de mesures lors de
l’événement. Les informations dont disposent les services de secours et les
experts sont des observations des dommages résultants. Une fois les dommages
causés sur les structures répertoriés, il faut procéder à leur cotation pour les
convertir en valeurs de surpression. La conversion des dommages observés en
valeurs de surpression relève d’un travail d’experts et de l’utilisation de
documents de référence. Les expertises utilisées pour cette étude se sont
référées à un tableau réalisé à partir d’une synthèse des informations reportées
dans [Clancy, 1972; Lannoy, 1984; BIT, 1993; INRS, 1994] et diverses analyses
d’accident [Lechaudel et al., 1995], [Michaëlis et al., 1995]. Ce tableau est
disponible notamment dans [Dechy et al., 2003b].
Cette cotation permet d’associer à
chaque dommage observé et localisé, un
encadrement plus ou moins précis de la
valeur de surpression qui s’est exercée et
d’obtenir
des
couples
(distance
à
l’épicentre, surpression).
Par
exemple,
pour
ces
dégâts
observés sur les vitres d’un bâtiment situé
à 1300 mètres de l’épicentre (cf. Figure
Figure 49 : Bris de vitres
49),
les
experts
ont
estimé
que
la
(cité universitaire « Daniel
surpression était comprise entre 14 et 30
Faucher » à Toulouse)
mbar, surpressions correspondant à 50%
des vitres cassées.[BIT, 1993]
A partir d’une distance et d’une surpression, la masse d’équivalent TNT
peut alors être calculée à l’aide d’un modèle du phénomène d’explosion comme
celui de l’équivalent TNT.
V.2.2
Modèle retenu : l’équivalent TNT
V.2.2.1 Principes généraux
La méthode de l’équivalent TNT est incontestablement l’une des premières
utilisées pour prévoir les conséquences de tout type d’explosion. Elle repose sur
l’hypothèse qu’il doit être possible de reproduire le champ de surpression qui est
179
Chapitre V
Estimation du terme source d’un phénomène dangereux
engendré par une explosion donnée (de gaz, d’un explosif condensé, ...) en
faisant exploser du TNT considéré comme l’explosif de référence en raison des
nombreux essais réalisés avec ce produit. Ainsi, l’équivalent TNT d’une substance
explosible correspond à la masse de TNT qui en explosant engendrerait le même
champ de surpressions que celui généré par l’explosion d’un kilogramme du
produit considéré. [Mouilleau et al., 1999].
La correspondance entre l’équivalent TNT et la masse de produit mise en
jeu est faite par l’équation ci-dessous :
M produit =
Où
M TNT × ETNT
E produit
Eq. 27
M produit est la masse de produit ayant participée à l’explosion (en kg),
M TNT est la masse d’équivalent (en kg),
E TNT est est l’énergie libérée par l’explosion d’un kg de TNT soit 4690 kJ,
E produit est l’énergie libérée par l’explosion d’1 kg du produit en cause
(en kJ).
V.2.2.2 Modélisation de la surpression dans l’espace
Le modèle de l’équivalent TNT représente la décroissance en fonction de la
distance d à l’épicentre de la surpression ∆P au sol en champ libre engendrée par
la détonation d’une masse de TNT notée M.
On notera λ , la distance réduite
λ=
d
3
Eq. 28
M TNT
180
Chapitre V
Estimation du terme source d’un phénomène dangereux
Figure 50 : Courbe TNT - Abaque TM5-1300 extrapolé tiré de (Lannoy, 1984)
Le modèle retenu est celui utilisé par l’INERIS noté ( FeqTNT ) :
Si ∆P > 150,
M = 0,026 × d 3 × ∆P 1,58
sinon
M = 0,314 × d 3 × ∆P 2 ,874
V.2.2.3 Sensibilité
du
modèle
aux
Eq. 29
erreurs
d’estimation
des
surpressions
Il est important d’estimer avec précision la surpression exercée à partir
des dégâts observés, car un écart de surpression se traduit par une différence
significative de la masse calculée (entre 3,8 et 43,3 tonnes pour le premier
exemple du tableau ci-dessous). Ceci est illustré en prenant deux exemples
(points de dégât n°17 et n°1042) de l’étude des dégâts réalisée par l’INERIS
suite à l’explosion d’AZF [Mouilleau et al., 2001]. Pour chacun des deux
dommages constatés (déformation d’un calorifuge et bris de vitres) et localisés,
les experts ont réalisé une estimation de la surpression qui s’est exercée sous
forme d’un encadrement par deux valeurs exprimées en millibars. L’utilisation du
modèle de l’équivalent TNT a permis de convertir la valeur de surpression à une
distance donnée en masse d’équivalent TNT correspondante.
181
Chapitre V
Estimation du terme source d’un phénomène dangereux
Tableau 16 : Exemple de calcul de la masse d’équivalent TNT à partir de
dommages convertis en surpression.
N°
Type
Distance ∆P min.
(m)
17
Déformations du
(mbar)
Eq. TNT
∆P
Eq. TNT
min. (tonnes)
max.
max.
(mbar)
(tonnes)
660
30
3,8
70
43,3
1700
10
2,8
20
20,2
calorifuge
1042
vitres brisées
Sur ces exemples réels, issus du REX d’AZF, la surpression estimée par les
experts est imprécise et peut prendre des valeurs allant du simple au double,
pour une distance donnée. Pour ces valeurs de surpression, les masses
d’équivalent TNT correspondantes, calculées à l’aide du modèle, varient alors
d’un facteur sept à dix.
V.2.3
Paramètres de l’algorithme génétique
V.2.3.1 Terme source et paramètres
Dans le cas d’une explosion, le vecteur d’état comprend la masse M
d’équivalent TNT ayant détonné ainsi que la localisation (x ; y) de l’épicentre.
Les contraintes sont les couples
(d ,[∆P
i
i
min
)
, ∆Pi max ]
ce qui complique
l’élaboration de la fonction coût qui doit prendre en compte des intervalles dont
la précision est variable. Il est préférable de réduire l’intervalle à une valeur
unique (par exemple la moyenne), mais cela introduit un biais. La solution
adoptée est d’introduire les intervalles au vecteur d’état avec le terme source.
Lors de la génération d’une population d’individus, chaque surpression est choisie
aléatoirement dans l’intervalle correspondant, puis l’algorithme génétique permet
de produire les valeurs de surpressions constituant des solutions intéressantes
au problème de minimisation de la fonction coût. Il est alors possible de réaliser
l’évaluation des individus avec la méthode des moindres carrés.
La sélection des individus repose principalement sur la méthode de la roue
biaisée. Cette méthode permet une bonne exploration de l’ensemble des
possibles. Mais ne garantissant pas de conserver les meilleurs individus, elle
n’est utilisée que pour constituer 95% de la génération suivante. Les meilleurs
individus (5%) sont conservés pour compléter la population suivante.
Paramètres de l’algorithme :
Nombre d’individus : 200
182
Chapitre V
Estimation du terme source d’un phénomène dangereux
Gênes de chaque individu :
Masse de TNT X Y ∆P’1 … ∆P’i … ∆P’n
Nombre de générations : 30
Probabilité de mutation : 0.5%
Probabilité de croisement : 1
Sélection : roue biaisée 95% + meilleurs individus 5%
V.2.3.2 Complexité de l’algorithme et temps de calcul
Une des limites d’utilisation des algorithmes stochastiques est le temps de
calcul qui est souvent long du fait d’un grand nombre de cas à tester pour couvrir
l’espace des solutions. Bien que les algorithmes génétiques convergent plus
rapidement que d’autres méthodes purement stochastiques, il faut déterminer la
complexité de l’algorithme et estimer le temps de calcul nécessaire à l’obtention
d’un résultat acceptable.
La complexité dépend du nombre d’itérations, de la taille de la population
d’individus et du taux de sélection. Le produit de ces trois paramètres détermine
le nombre de solutions testées. Le nombre d’itérations et la taille de la population
seront d’autant plus grands que le phénomène est complexe et qu’il fait
intervenir un grand nombre de paramètres à déterminer (masse de TNT,
localisation) et également un ensemble de valeurs possibles plus grand (masse
de TNT compris entre 1 et 100 tonnes avec une précision de 100 kg par
exemple).
Le temps de calcul va dépendre (en dehors de la puissance de calcul
disponible) de la complexité de l’algorithme et du temps de calcul nécessaire
pour obtenir le résultat du modèle prédictif. Les temps de calcul pour des jeux de
données utilisés dans cette étude et comportant jusqu’à 100 relevés de
surpression sont inférieurs à une minute avec un ordinateur personnel classique
(Processeur à 2 GHz).
V.2.4
Evaluation de la méthode inverse
V.2.4.1 Méthode de référence
Les résultats de l’algorithme sont comparés à ceux d’une méthode de
référence. La méthode retenue est celle qui est utilisée par l’INERIS lors des
expertises pour estimer une masse de TNT à partir de relevés de surpression à
différentes distances de l’épicentre. Cette méthode calcule un intervalle
encadrant la masse de TNT (traits verts). Les bornes de l’intervalle sont calculées
183
Chapitre V
Estimation du terme source d’un phénomène dangereux
en faisant la moyenne arithmétique des masses de TNT correspondant aux
bornes de l’intervalle des surpressions :

 M min =

∑
N
i =1
(
FeqTNT ∆Pi min , d i
N
); M
∑
=
N
i =1
max
(
)
FeqTNT ∆Pi max , d i 

N

Eq. 30
Il faut noter que la méthode de référence comporte un biais dans le calcul
de la masse de TNT. En effet, une moyenne arithmétique est effectuée sur des
résultats issus d’un modèle non linéaire, ce qui introduit un biais. La méthode
utilisée par l’INERIS surestime la masse d’équivalent TNT.
FeqTNT ( ∆P + ε , d ) − FeqTNT ( ∆P, d ) > FeqTNT ( ∆P − ε , d ) − FeqTNT ( ∆P, d )
Eq. 31
Le biais de la méthode peut être vérifié par simulation, en introduisant un
bruit dont la distribution est centrée. Le biais est alors égal à :
∑
N
i =1
(
FeqTNT ∆Pi + ε i , d i
N
) ∑
−
N
i =1
(
FeqTNT ∆Pi , d i
N
)
avec
∑
N
i =1
εi = 0
Eq. 32
Un jeu de données de 100 mesures de surpressions avec un bruit de
mesure aléatoire compris entre -30% et +30% et de moyenne nulle. Toutes les
mesures sont à une même distance de l’épicentre afin d’éviter que les distances
relatives n’interviennent dans le calcul (cf. V.2.5).
Quelle que soit la masse d’équivalent TNT, la distance entre l’épicentre et
les mesures de surpression, le biais est toujours de +7,82%.
V.2.4.2 Evaluation de l’algorithme à l’aide de données artificielles
L’élaboration des méthodes inverses à base de modèles existants et
l’étude de sensibilité nécessitent des jeux de données représentatifs des données
disponibles en situation d’urgence. Mais actuellement, ces jeux de données ne
sont pas disponibles en nombre suffisant, ce qui contraint donc à rechercher les
données ailleurs. De plus, pour la conception de ces méthodes inverses il est
préférable
de
travailler avec
des
données
précises, complètes, et sans
incertitude, ce qui n’est pas le cas des retours d’expérience ou des campagnes de
mesures au travers d’essais. Afin de concevoir la méthode, des jeux de données
artificielles (théoriques) ont été calculés à l’aide d’un modèle de calcul de flux
(équivalent TNT) selon un processus stochastique.
Toutefois, il faut tenir compte du fait que les données disponibles en
situation d’urgence sont limitées en nombre et comportent des erreurs de
mesures ou d’estimation. Il est donc nécessaire dans une seconde étape,
d’ajouter un taux d’erreur (imprécision et biais) et réduire le nombre de données
184
Chapitre V
Estimation du terme source d’un phénomène dangereux
pour obtenir des jeux de données proches de ceux disponibles en situation
d’urgence.
Ces jeux de données bruitées ont ensuite servi à évaluer la précision de la
méthode.
Plusieurs
expertises
ont
servi
de
référence
pour
déterminer
l’imprécision des estimations des surpressions associées aux dommages. Aux
surpressions calculées par le modèle, un bruit aléatoire compris entre -30% et
+30% a été introduit. Cet intervalle a été déterminé à partir des cotations des
dégâts matériels de l’étude de l’accident d’AZF réalisée par l’INERIS. Ainsi, le
tirage aléatoire borné à 30% en valeur absolue permet d’obtenir une imprécision
moyenne (taille des encadrements des surpressions) semblable à celle des
données du REX d’AZF. Cependant, certaines valeurs extrêmes (imprécision
pouvant atteindre 50%) ne sont pas reproduites. Les données issues du REX
d’AZF ne permettent pas de déduire une distribution particulière d’imprécision.
De ce fait, le tirage aléatoire pour générer le bruit est un tirage équiprobable.
De plus, bien que les experts jugent que les estimations ne sont pas
biaisées, un biais arbitraire de 25% a été ajouté afin de dégrader l’information et
tenir compte ainsi d’éventuelles erreurs d’estimations. De sorte, les intervalles
encadrant la surpression ne sont pas centrés autour de la valeur réelle.
Enfin, le nombre de relevés de dégâts étant variable d’une situation à
l’autre, différents jeux de données ont été générés en tenant compte de cette
différence de quantité d’information.
V.2.4.2.1
Estimation de la masse d’équivalent TNT
Les premiers tests ont pour but d’évaluer l’algorithme dans le cas d’un
terme source constitué d’un seul paramètre : la masse d’équivalent TNT.
Dans les résultats présentés (Figure 51 et Figure 52), les 20 jeux de
données comportent de 5 à 100 estimations de surpressions (20 jeux de données
avec un pas de 5 estimations). Ces surpressions ont été générées afin de
correspondre à une masse d’équivalent TNT de 50 tonnes (triangle bleu). Les
résultats de l’algorithme (rond rouge) ont été comparés à la méthode de
référence utilisée par l’INERIS.
Il est délicat de comparer la précision de la méthode de référence et de
l’algorithme car les résultats obtenus ne sont pas de même nature : un intervalle
large (du simple au double) pour la méthode de référence et une valeur unique
pour l’algorithme. Il n’est pas possible de calculer une valeur à partir de
l’intervalle car la fonction est non linéaire et le calcul de la moyenne par exemple
introduirait un biais qui ne peut être réduit. Pour tous les jeux de données, ces
deux méthodes sont en accord puisque le résultat de l’algorithme est toujours
dans l’intervalle obtenu par la méthode de référence.
185
Chapitre V
Estimation du terme source d’un phénomène dangereux
100,00
90,00
M
as
se
d’
éq
ui
va
le
nt
T
N
T
● Algorithme
80,00
70,00
Méthode INERIS
- Masse min.
60,00
50,00
40,00
- Masse max.
30,00
20,00
▲ Masse réelle
10,00
(50 tonnes)
0,00
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
20 jeux de données
Figure 51 : Evaluation sur données artificielles (sans biais)
Masse d’équivalent TNT
(tonnes)
100,00
90,00
80,00
● Algorithme
70,00
Méthode INERIS
- Masse min.
- Masse max.
60,00
50,00
40,00
30,00
▲ Masse réelle
20,00
(50 tonnes)
10,00
0,00
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
20 jeux de données
Figure 52 : Evaluation sur données artificielles (biais=25%)
Lorsqu’aucun biais n’est introduit (Figure 51), l’estimation de la masse
d’équivalent TNT est très précise comparée à la méthode utilisée par l’INERIS.
Avec un biais de 25% (Figure 52), sur l’ensemble des jeux de données, on
constate une erreur moyenne de 14% dans le cas de données biaisées et une
erreur maximum de 28,2% qui est tout à fait acceptable dans l’optique d’une
utilisation opérationnelle. La figure suivante (Figure 53) présente les écarts de
calcul de distances utiles (distances de l’épicentre où l’on observe des
surpressions de 50, 140 et 200 mbar) provoqués par une erreur d’estimation de
la masse d’équivalent TNT de 28,2% en plus ou en moins de la masse réelle. En
termes de distances, l’erreur est inférieure à 10%.
186
Chapitre V
Estimation du terme source d’un phénomène dangereux
Figure 53 : Ecarts des distances à l’épicentre calculées avec une erreur de 28,2%
de la masse d’explosif.
V.2.4.2.2
Localisation de l’épicentre
Dans les premiers instants qui suivent une explosion de grande ampleur,
(dans le cas d’AZF, la première heure après l’arrivée des secours), la localisation
de l’épicentre n’est pas toujours connue avec précision. Dans ce cas, la recherche
de l’épicentre est visuelle, effectuée lors de la reconnaissance. Il existe des
moyens pour localiser l’épicentre comme l’utilisation des enregistrements de
l’onde sur des sismographes proches du lieu de l’explosion. Mais le traitement
des données nécessite plusieurs jours et la précision n’est pas suffisante. Pour
l’explosion d’AZF, les premiers résultats localisaient l’épicentre avec une erreur
de l’ordre de huit kilomètres. Les résultats finaux permettent d’avoir une
précision d’un kilomètre [Macé de Lépinay et al., 2002].
Sur les jeux de données artificielles l’erreur de localisation de l’épicentre
est comprise entre 6 m et 340 m avec une erreur moyenne de 101 mètres pour
des relevés de surpressions distants de 3,5 km à 5,5 km (Figure 54). Les calculs
effectués ont montré que la localisation de l’épicentre est d’autant meilleure que
les relevés de surpressions sont précis, nombreux, proches de l’épicentre et
uniformément répartis autour. L’ignorance de la position de l’épicentre n’introduit
pas d’erreur supplémentaire d’évaluation de la masse d’équivalent TNT. L’erreur
moyenne est de 12% et l’erreur maximum de 28,4%.
187
Estimation du terme source d’un phénomène dangereux
1000
90,00
900
80,00
800
70,00
700
60,00
600
50,00
500
40,00
400
30,00
300
20,00
200
10,00
100
Masse d’équivalent TNT
(tonnes)
100,00
0,00
● Algorithme
Distance (m)
Chapitre V
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Méthode INERIS
- Masse min.
- Masse max.
▲ Masse réelle
(50 tonnes)
♦ Décalage de
l’épicentre (m)
Figure 54 : Evaluation sur données artificielles (épicentre inconnu)
V.2.4.3 Validation de la méthode à partir de retours d’expérience
Enfin la méthode a été testée sur deux accidents faisant intervenir une
explosion de solide : AZF (2001) où une explosion de nitrate d’ammonium s’est
produite sur le site de la compagnie Grande Paroisse à Toulouse (France) et a
causé le décès de 30 personnes, plus de 2242 blessés et des dégâts matériels
considérables. Et l’accident qui s’est produit à Billy-Berclau (France) en 2003
dans un atelier de fabrication d’explosifs de la société Nitrochimie où une
explosion de « dynamite » a causé la mort de quatre employés [Dechy et al.,
2003a; Dechy et al., 2003b].
V.2.4.3.1
Estimation de la masse d’équivalent TNT
Les résultats de l’algorithme obtenus sur ces deux accidents (Tableau 17)
sont comparés à la méthode de référence utilisée par l’INERIS et également aux
résultats finaux de l’expertise se basant sur la méthode de calcul précédente à
partir de relevés de surpression, mais également sur une étude du cratère et
aussi sur des calculs à partir des effets dits « missiles ».
Tableau 17 : Résultats sur des accidents réels
AZF
Estimation des experts
Méthode de référence
Algorithme génétique
Nitrochimie
Estimation des experts
Méthode de référence
Algorithme génétique
Masse TNT (tonne)
Min.
Max.
20,00
40,00
15,50
39,41
24,29
Masse TNT (kg)
Min.
Max.
≈100
76,73
199,74
123,70
188
Chapitre V
Estimation du terme source d’un phénomène dangereux
Pour les deux accidents d’AZF et de Nitrochimie, les résultats de
l’algorithme sont concluants : ils sont en accord avec la méthode de référence et
aussi avec les résultats finaux de l’expertise.
V.2.4.3.2
Localisation de l’épicentre
La recherche de l’épicentre par l’algorithme n’a été effectuée que dans le
cas de l’accident d’AZF. L’algorithme localise l’épicentre avec une erreur de 60 m
et évalue la masse d’équivalent TNT à 28 tonnes ce qui est toujours en accord
avec les expertises. Dans le cas de l’accident de Billy-Berclau, seul les couples
(d ,[∆P
i
i
min
)
, ∆Pi max ] étaient connus. L’absence des coordonnées cartésiennes des
relevés des dégâts n’a pas permis la recherche de l’épicentre.
V.2.4.4 Application aux situations opérationnelles
Bien que la méthode fournisse des résultats précis en un temps de calcul
très court, elle nécessite un grand nombre de données obtenues par un travail
d’experts nécessitant plusieurs jours. En situation d’urgence, les relevés seront
plus localisés et en nombre plus restreint. De plus, ces relevés ne seront pas
effectués par des experts habitués à effectuer ces cotations et disposant du
temps nécessaire à leur réalisation. Cela se traduit par une imprécision plus
grande et les cotations se limitent à des types de dommages plus faciles à
estimer (par exemple, la proportion de bris de vitres d’un bâtiment).
Afin de vérifier l’efficacité de l’algorithme en situation d’urgence, nous
avons limité le nombre de relevés de dommages à dix points répartis en trois
zones distinctes car les services de secours ne peuvent quadriller toute la zone
pour obtenir une répartition homogène.
Afin de faciliter la cotation des dommages qui relève d’un travail d’expert,
nous avons limité les types de dommages aux pourcentages de bris de vitres
dont les surpressions correspondantes peuvent être déduites plus facilement en
se référant aux abaques.
Avec les tests réalisés sur les jeux de données artificielles, l’erreur
moyenne pour le calcul de la masse d’explosif est de 15% et l’erreur maximum
est de 39%. Cette précision reste acceptable pour dimensionner l’événement et
déterminer la zone à couvrir.
Par contre la localisation de l’épicentre est trop imprécise avec une erreur
moyenne de 590 m lorsque les relevés de dommages sont effectués à 4 km.
189
Chapitre V
Estimation du terme source d’un phénomène dangereux
Pour les tests réalisés d’après les données du REX d’AZF, les relevés de
dégâts se répartissent comme indiqué (Figure 55) :
•
2 zones de 4 relevés de dégâts sur des bris de vitres (points rouges),
•
1 zone de 2 relevés plus incertains (points fuchsias) qui pourraient être
obtenus par les témoignages de personnes non averties, incapables de
fournir des données d’une grande précision. La surpression serait alors
déduite, considérée comme étant comprise entre la valeur nécessaire aux
premiers bris de vitres (10 mbar) et la destruction totale des vitres
(70 mbar) .(Cf. tableau de synthèse utilisé dans [Dechy et al., 2003b]).
Figure 55 : Localisation des dommages à la suite de l’explosion d’AZF
Lorsque l’épicentre est connu, la méthode développée dans le cadre de
cette étude permet toujours d’estimer correctement la masse d’équivalent TNT
avec 100% des résultats en accord avec les expertises. Cependant, lorsque
l’épicentre doit être localisé, l’erreur moyenne de positionnement de l’épicentre
est de 370 m et 30% des tests sous-estiment la masse d’explosif.
190
Chapitre V
V.2.5
Estimation du terme source d’un phénomène dangereux
Prise en compte de la distribution des points de
mesure
V.2.5.1 Principes
La distribution des observations ou mesures de flux n’est pas homogène
dans l’espace. Cette hétérogénéité introduit un biais dans le calcul du terme
source en favorisant certaines données par rapport à d’autres.
Plusieurs facteurs interviennent :
-
par exemple, dans le cas d’une régression linéaire, les points extrêmes
interviennent plus dans le calcul.
-
D’autre part, effectuer plusieurs cotations d’un même bâtiment ou de
bâtiments voisins peut s’interpréter comme plusieurs cotations d’un même
dommage en un même endroit et, ainsi, lui donner un poids plus fort.
Plusieurs
solutions
peuvent
être
envisagées
afin
de
calculer
une
pondération des points de mesure de flux pour corriger l’hétérogénéité de la
distribution des points.
V.2.5.2 Le diagramme de Voronoï
Le poids d’un point est calculé en fonction des distances à ses voisins
déterminées par un diagramme de Voronoï [Boissonnat et al., 1995] (cf. Figure
56, diagramme en bleu). Plus un point (appelé foyer dans le diagramme de
Voronoï) est proche de ses voisins et plus la zone (ou cellule) qu’il occupe est
petite. En affectant un poids aux foyers en fonction de la taille de leur cellule
permettrait de compenser les multiples cotations en un même lieu.
Figure 56 : Diagrammes de Voronoï de surpressions relevées à Toulouse
(AZF 2001)
191
Chapitre V
Estimation du terme source d’un phénomène dangereux
Figure 57 : Diagramme de Voronoï d’un exemple fictif
Mais le diagramme de Voronoï présente deux inconvénients :
•
Si plusieurs cotations sont faites en un même lieu, il faut diminuer leur
poids mais il ne faut pas en favoriser certaines par rapport aux autres.
Leur poids doit être le même. Mais des points très proches peuvent avoir
des pondérations sensiblement différentes alors qu’ils devraient avoir le
même poids. Ce constat qui peut être fait à partir du diagramme de
Voronoï calculé sur le REX d’AZF est mis en évidence dans l’exemple
(Figure 57). Les deux foyers marqués d’un rond noir sont voisins
spatialement et devraient avoir la même pondération. Mais les cellules
associées (zones vertes et jaunes) ont des surfaces différentes (la zone
jaune fait plus du double de la zone verte).
•
Les foyers en bordure n’ont pas de cellule finie. Il est nécessaire de limiter
l’espace pour pouvoir calculer le poids des points en périphérie. Ces poids
sont alors dépendants des limites fixées arbitrairement.
L’espace est partitionné en fonction des foyers. La cellule d’un foyer est
d’autant plus petite que ses voisins directs sont proches. Une autre approche
classique est d’évaluer la densité de points et de pondérer chaque point
inversement à sa densité. Le fonctionnement de l’estimation de la densité diffère
du diagramme de Voronoï sur la prise en compte des voisins qui ne se limitent
pas aux voisins directs de chaque côté.
192
Chapitre V
Estimation du terme source d’un phénomène dangereux
V.2.5.3 Estimation de la densité
V.2.5.3.1
Présentation des méthodes d’estimation de la densité
La densité peut être estimée par différentes méthodes, notamment des
estimateurs dits « naïfs » à volume fixe ou la méthode des K plus proches voisins
(Fix & Hodges,1951; Cover & Hart,1967).
L'idée la plus naturelle pour évaluer la densité L au point x consiste à
compter le nombre d'observations η contenues dans un certain voisinage υ de x.
L’estimation de la densité L(xi) en un point xi se définit par le rapport
suivant :
L( xi ) =
ηi
nVi
Eq. 33
Vi étant le volume du voisinage υi centrée en Xi,
ηi, le nombre de sommets contenus dans υi
et n la taille de l’échantillon.
o
Volume fixé
Pour calculer la densité, une première solution consiste à fixer la « forme »
du voisinage et ses dimensions. Le voisinage sera centré sur le point où est
estimée la densité et il sera de forme régulière dans une métrique choisie.
Le choix du volume est déterminant pour la précision des estimations. Il
intervient dans les calculs en effectuant un lissage des densités [Duda et al.,
1973]. Un volume trop grand provoque un nivellement des variations de L(xi), par
contre si le volume est trop petit, L(xi) présentera de nombreuses discontinuités.
•
Hyper cube
La forme du voisinage peut être choisie comme un intervalle dans chacune
des dimensions. Le voisinage υ correspond à l’hyper cube en d dimensions, centré
en xi, orienté suivant les axes du repère orthonormé et de volume Vcube = hd.
•
Hyper sphère
Dans cette variante, le calcul de la densité en un point xi s’effectue en
comptant tous les points à une distance de xi inférieure ou égale à r. Ce sont tous
les points contenus dans la sphère de rayon r et centrée en xi.
•
Estimation de la densité par noyau
L’estimation de la densité utilisant un voisinage de forme hypercube est la
forme élémentaire des fenêtres de Parzen. Il s’agit d’une simplification de
l’estimation par noyau [Rosenblatt, 1956; Parzen, 1962] qui consiste à pondérer
193
Chapitre V
Estimation du terme source d’un phénomène dangereux
les observations en fonction de leur distance au point estimé. Chaque individu
n’est plus une observation élémentaire de poids égal à un, mais une distribution
dans l’espace observé. La distribution suit une fonction d’intégrale égale à un,
symétrique et centrée en zéro.
o
k plus proches voisins (KPPV)
L’inconvénient de la méthode précédente est que le volume V du voisinage
υ est fixe quelle que soit la densité à estimer. Nous savons que la taille du
voisinage joue un rôle important dans le calcul de la densité et il est difficile de le
fixer a priori [Lebart et al., 1995].
La méthode des k plus proches voisins offre une alternative à cette
difficulté. Le volume V du voisinage υ n’est pas fixé a priori, mais choisi en
fonction de sa capacité à contenir un nombre fixe d’éléments. Le volume υ est
choisi en fonction d’une valeur a priori k de voisins de xi appartenant à υ. L’espace
observé étant muni de la mesure de distance Euclidienne, le voisinage υ se
définit comme la sphère de rayon minimum, centrée en xi et contenant k
éléments.
Avec cette méthode, il n’est plus besoin de fixer le volume, mais la
difficulté réside dans le choix du nombre de voisins.
V.2.5.3.2
Utilisation de la méthode des K plus proches voisins
La méthode des K plus proches voisins a été utilisée pour pondérer chaque
mesure de surpression. Plus un point (mesure de surpression) est dans une zone
dense en nombre de mesures et plus son poids sera faible.
La fonction coût comprend alors une pondération de chaque estimation du
flux :
((
)
C = ∑i Fxi (e) − s ' xi × P( xi )
N
)
2
xi un des N points de l’espace,
où une estimation s ' xi du flux a été réalisé
ainsi qu’un calcul du flux Fxi (e) à l’aide d’un modèle prédictif
Mais, tout comme le diagramme de Voronoï, la méthode des K plus
proches voisins donne un poids plus important aux points en périphérie.
194
Chapitre V
Estimation du terme source d’un phénomène dangereux
V.2.5.4 Ajustement de la pondération des points en périphérie.
Une étude de sensibilité a été réalisée pour déterminer l’influence des
points en périphérie et définir s’il faut leur accorder un poids important ou non.
Plusieurs simulations numériques ont permis de déterminer l’importance
de facteurs comme la distance des mesures de surpression à l’épicentre. Tous les
paramètres sont fixés (terme source, nombre de mesures, configurations : grille,
points équidistants, …) à l’exception de la distance x des mesures à l’épicentre
(Figure 58). Pour chaque position, une valeur de surpression est associée,
correspondant au flux mesuré avec précision à cet emplacement (carrés jaunes).
Pour certaines valeur, une erreur a été introduite (carré rouge). Ces valeurs
erronées sont minoritaires. Pour une configuration simple avec quatre points,
une seule valeur de surpression est bruitée.
x
x
Figure 58 : Configuration avec une distance x variable
Lorsque la distance x de l’ensemble des points à l’épicentre varie, l’erreur
d’estimation de la masse d’équivalent TNT reste la même.
D’autres simulations numériques ont consisté à faire varier la distance
relative d’une mesure erronée par rapport aux autres relevés de surpression dont
la valeur est exacte. Cette fois encore, plusieurs configurations ont été testées.
Les résultats sont similaires, qu’elle que soit la configuration utilisée. Seuls les
résultats d’une configuration en croix avec quatre mesures de surpression sont
présentés (Figure 59). Trois mesures de surpression effectuées à une distance x
de l’épicentre sont exactes (carrés jaunes) et pour la quatrième à une distance
variable y, une erreur a été introduite (carré rouge).
195
Chapitre V
Estimation du terme source d’un phénomène dangereux
y
x
x
x
Figure 59 : Configuration en croix
Les résultats (Figure 60) montrent l’influence de la distance d’un point
erroné par rapport aux autres points. Plus un point de mesure sera éloigné de
l’épicentre relativement aux autres points et plus l’erreur (mesure/calcul par le
modèle) sera prise en compte dans l’évaluation du terme source.
180%
160%
140%
% Erreur TNT
120%
100%
80%
60%
40%
20%
0%
0
10 000
20 000
30 000
40 000
50 000
60 000
Distance (point de m esure avec 50% d'erreur)
erreur TNT 750m
erreur TNT 1500m
Figure 60 : Erreur de calcul de la masse de TNT
en fonction de la distance relevés / épicentre
Il en est de même pour la localisation de l’épicentre.
196
Chapitre V
Estimation du terme source d’un phénomène dangereux
y
épicentre
calculé
x
épicentre
x
x
réel
Figure 61 : Configuration avec une distance x variable
1 200
180%
160%
1 000
800
120%
100%
600
80%
400
60%
% Erreur (TNT)
Distance (épicentre)
140%
40%
200
20%
0
0
10 000
20 000
30 000
40 000
50 000
0%
60 000
Distance (point de m esure avec 50% d'erreur)
distance épicentre
erreur TNT
Figure 62 : Erreur de calcul masse de TNT et position de l’épicentre
en fonction de la distance relevés / épicentre
V.2.5.5 Choix des positions d’estimation de la surpression
La configuration idéale serait de supprimer les points très éloignés
relativement aux autres, voire d’avoir des estimations de surpression à une
même distance de l’épicentre. Mais les évaluations de surpression sont
effectuées à l’endroit des dommages et ne sont pas en nombre suffisant pour
effectuer une sélection drastique.
De plus, la nature des dommages est à prendre en compte, certaines
cotations étant plus précises ou plus facile à réaliser donc moins incertaines. Et la
197
Chapitre V
Estimation du terme source d’un phénomène dangereux
validité du modèle est également à prendre en compte. En champ lointain le
modèle est extrapolé, ce qui demande une certaine prudence lors de l’utilisation
des faibles surpressions. Ces données sont également sujettes à critique de la
part d’experts car elles correspondent majoritairement aux bris de vitres pour
lesquels l’évaluation de la surpression ne prend pas en compte le type de vitre
(verre, double vitrage, châssis, etc.) et l’orientation par rapport au flux. Enfin,
ces données obtenues en champ lointain correspondent à une onde de
surpression modifiée par la présence d’obstacles de toutes natures.
Malgré plusieurs arguments contre la prise en compte des données en
champ lointain, on observe dans le cas du REX d’AZF que ces données sont en
accord avec les résultats de l’expertise qui donnent une masse d’équivalent TNT
comprise entre 20 et 40 tonnes. Les résultats suivants (Tableau 18) sont les
masses de TNT calculées à partir de plusieurs ensembles disjoints de valeurs de
surpression. Le jeu de données complet est constitué de 107 intervalles de
surpressions. Ces données sont divisées en trois sous-ensembles correspondant
aux données :
-
en champ lointain, constituées des dommages sur les vitres et les toitures en
tôles,
-
en champ proche, d’une surpression supérieure à 70 mBar,
-
du reste des données, hors champ proche et autres que bris de vitres et
déformation de tôles.
Tableau 18 : Masse de TNT calculée pour plusieurs ensembles de données
(REX d’AZF)
Nombre de
mesures de
surpression
Jeu de données complet
Vitres et tôles
Champ proche
Zone intermédiaire
107
32
31
44
Méthode de
l’INERIS
Min.
15,50
15,05
16,61
15,04
Max.
39,41
32,51
24,43
54,99
A.G.
24,29
21,45
20,18
29,26
Les résultats obtenus avec les données en champ lointain sont compris
dans ceux des autres jeux de données. On ne peut pas conclure de l’imprécision
des données en champ lointain. Toutes les valeurs de surpression doivent être
conservées.
Quelle que soit la méthode d’estimation de la densité utilisée (KPPV , etc.),
les points en périphérie, étant dans une zone moins dense, se trouvent
prépondérant dans le calcul du terme source, car la surface associée lors du
calcul de la densité est plus grande (Figure 63). De plus ces points en périphérie
198
Chapitre V
Estimation du terme source d’un phénomène dangereux
sont statistiquement plus éloignés de l’épicentre. Plus un point est éloigné de
l’épicentre par rapport aux autres points et plus il intervient dans le calcul du
terme source.
Afin de limiter la surface de la cellule associée à chaque point dans les
zones périphériques, une limite a été introduite. Chaque zone sphérique calculée
par la méthode des KPPV est limitée afin de ne pas dépasser l’enveloppe convexe
de l’ensemble des points (Figure 64).
Figure 63 : Surfaces calculées par la méthode des KPPV (K=7).
Figure 64 : Surfaces calculées par la méthode des KPPV (K=7), bornées à
l’enveloppe convexe.
199
Chapitre V
Estimation du terme source d’un phénomène dangereux
V.2.5.6 Evaluations et perspectives
Plusieurs simulations numériques ont été réalisées pour tester l’apport
d’une pondération des relevés de surpression. La pondération est calculée par un
calcul de densité par la méthode des K plus proches voisins ajustée par
l’enveloppe convexe pour la prise en compte des points périphériques.
Lors de ces simulations, plusieurs valeurs de k, le nombre de voisins
recherchés, ont été testées.
Les résultats obtenus montrent l’inefficacité de cette pondération à évaluer
plus
précisément
la
masse
d’équivalent
TNT
du
terme
source.
Aucune
amélioration n’est constatée.
V.2.5.6.1
Discussion
La pondération mise en place permet de lisser les contributions de chaque
point dans le calcul du terme source. Ainsi, les points introduisant une erreur
importante, isolés ou situés en périphérie, faussent moins les calculs. Cependant,
il en est de même lorsque ces points sont justes, ils contribuent moins au calcul.
La bonne pondération serait celle qui donne plus de poids aux évaluations
de surpression qui sont justes, ce que l’on ne peut connaître a priori.
V.2.5.6.2
Perspectives
Bien que la justesse des évaluations de surpression ne puisse être connue
a priori, les écarts de surpressions entre points voisins peuvent être détectés.
Sous l’hypothèse que pour un groupe de points voisins, la majorité des
évaluations seront justes, il est possible de donner une pondération plus faible
aux points en désaccord.
La comparaison des points est possible par la masse d’équivalent TNT
correspondante. La distance à l’épicentre est connue (position réelle de épicentre
ou supposée lors de la phase de génération ou mutation de l’algorithme
génétique). La masse de TNT se calcule alors à l’aide du modèle de l’équivalent
TNT avec la distance et la valeur de surpression.
La taille du voisinage et le choix de la fonction de pondération reste à
définir à l’aide de simulation numérique. Pour ces simulations, le bruit introduit
doit être gaussien pour justifier l’hypothèse précédente.
200
Chapitre V
V.3
Conclusions
Estimation du terme source d’un phénomène dangereux
sur
les
méthodes
inverses
et
perspectives
Les méthodes permettant de résoudre des problèmes inverses sont
nombreuses. Dans le cas des situations d'urgence, l’hétérogénéité des problèmes
pouvant être rencontrés, en particulier un nombre variable de paramètres et les
différents types de modèles a conduit à choisir les algorithmes génétiques pour
évaluer le terme source. Nous avons donc proposé une méthodologie basée sur
un algorithme génétique couplé à un modèle prédictif classique permettant de
calculer rapidement et précisément un terme source à partir d’estimations du
flux. Sa validation a été réalisée dans le cas des explosions de solides et peut
être adaptée à tous types d’explosions en changeant le modèle de calcul de flux.
Cette méthode peut être utilisée lors des expertises, en particulier pour les
situations complexes pour lesquelles plusieurs variables sont à identifier.
Pour une utilisation en situation d'urgence, l’étude à partir du retour
d’expérience de l’accident d’AZF montre que la méthode est également efficace
pour le calcul de la masse d’équivalent TNT avec un nombre réduit d’évaluations
de la surpression dont la précision peut être obtenue sur le terrain. Il est
néanmoins nécessaire d’appliquer la méthode à d’autres retours d’expérience
pour confirmer sa précision en situation d’urgence. Un nombre de données réduit
se traduit par une plus grande imprécision et rend difficile l’évaluation de termes
sources comprenant plusieurs paramètres (masse de TNT et localisation de
l’épicentre par exemple).
Les phénomènes de dispersions atmosphériques en particulier, ont un
terme source qui comporte plusieurs paramètres pouvant être inconnus. Une
étude particulière doit être réalisée dans le cas des dispersions atmosphériques
de gaz toxiques car cette complexité plus grande amène des difficultés
supplémentaires :
-
la non-unicité possible des solutions due à un problème sous-déterminé,
-
un nombre d’itérations (taille de population, nombre de générations) plus
important, qui nécessite un temps de calcul plus long.
En cas de non-unicité des solutions, les algorithmes génétiques peuvent
être adaptés afin d’exhiber non plus la meilleure solution, mais un ensemble de
solutions potentielles. Cette adaptation est nécessaire lorsque l’on veut estimer
l’ensemble des minima locaux ou lorsque dans le cas des problèmes sousdéterminés, il existe plusieurs minima équivalents, dépendant de plusieurs
paramètres.
Le partage (ou « sharing ») consiste à répartir les individus en modifiant la
fonction « coût » par la prise en compte du voisinage de chaque individu. Plus un
201
Chapitre V
Estimation du terme source d’un phénomène dangereux
individu sera entouré et plus sa probabilité de reproduction sera faible. La
difficulté réside dans l’ajustement de la fonction « coût » par la notion de
voisinage faisant intervenir un calcul de densité non paramétrique abordé
précédemment (V.2.5). Une variante consiste à distinguer des bouquets
d’individus avant de réaliser la sélection. Le principe de l’algorithme est détaillé
dans [Bontemps, 2000].
Afin de réduire le temps de calcul, le nombre d’itérations peut être diminué
en couplant les algorithmes génétiques à une méthode de descente de gradient
comme le recuit simulé. L’étude de la convergence de ces deux méthodes montre
une convergence plus rapide des algorithmes génétiques dans les premières
itérations (meilleure exploration de l’espace des solutions). Mais au voisinage de
la solution, les algorithmes génétiques convergent lentement, souvent par le
mécanisme de mutation, alors que la méthode du recuit simulé atteint
rapidement le minimum. Les deux méthodes peuvent être couplées, en
commençant la recherche par un algorithme génétique avec moins d’itérations
(au prix d’une perte de précision) et en poursuivant par recuit simulé à partir des
meilleures solutions. Une autre solution est d’alterner les deux méthodes à
chaque itération [Bontemps, 2000].
202
Conclusions et perspectives
Conclusions et perspectives
Les travaux de recherche menés dans le cadre de cette thèse avaient pour
objectif d’apporter une aide à la décision aux sapeurs-pompiers et aux experts
des cellules d’appui lors des situations d'urgence impliquant des substances
chimiques. Compte tenu des impératifs de temps très forts pour réagir lors de
ces situations, l’aide à la décision à apporter est destinée aux premiers instants,
lors de la phase réfléchie d’une situation d'urgence et en utilisant au mieux
l’information disponible au travers des données opérationnelles.
L’étude des moyens existants et des demandes formulées à la CASU de
l’INERIS a permis de mettre en exergue plusieurs besoins, dont deux ont été
définis comme prioritaires et ont été abordés dans le cadre de cette thèse. Il
s’agissait d’apporter une aide la décision au travers d’informations sur la source
d’un phénomène dangereux potentiel ou avéré. En effet, lors du processus
décisionnel, il est nécessaire de se représenter la situation actuelle et son
devenir, d’évaluer les conséquences possibles pour déterminer au mieux les
actions
à
entreprendre
pour
protéger
les
populations,
les
biens
et
l’environnement. L’évaluation des conséquences n’est réalisée qu’au prix de
plusieurs étapes, qui débutent avec la connaissance de la source du phénomène
dangereux. Nous avons défini la source en deux parties : une substance
chimique potentiellement dangereuse car toxique, inflammable ou explosive ; et
le terme source regroupant les paramètres relatifs à la source d’un phénomène
dangereux, nécessaires à sa modélisation.
Il est peu commun que les sapeurs-pompiers soient en présence d’une
substance chimique non identifiée par une plaque signalétique (ex : plaque
orange) ou un document de transport. Mais lorsque cela se présente à eux, les
aides à la décision à leur disposition sont inadaptées et il est alors nécessaire de
prendre le maximum de précautions en prenant en compte l’ensemble des
risques possibles.
L’identification d’une substance chimique sans matériel de détection dédié,
en utilisant uniquement les données opérationnelles, est très difficile compte
tenu du peu d’information disponible en comparaison du nombre impressionnant
de substances chimiques existantes. Même en se limitant à un nombre restreint
de substances chimiques les plus courantes, l’identification peut difficilement être
203
Conclusions et perspectives
précise. Des logiciels ont vu le jour pour aider à l’identification précise d’une
substance chimique. Mais ils reposent sur une démarche visant à un résultat
précis, ce qui s’avère optimiste, comme nous l’avons démontré.
En l’absence d’information suffisante, il est préférable d’identifier les
dangers qui sont liés à la substance chimique en cause et de fournir ainsi, un
premier niveau d’aide à la décision. Pour cela, nous avons proposé une
méthodologie d’identification des dangers et une aide au recueil de l’information,
reposant sur une base de données opérationnelles et un logiciel, tous deux
développés dans cette optique.
Tirant partie des bases de données existantes, la base de données
opérationnelles conçue lors de cette thèse doit être enrichie avec toutes données
apportant une information supplémentaire, même minime. Elle a été complétée
avec les données relatives à l’utilisation de matériels de détection que sont les
tubes colorimétrique du fabricant Dräger et d’autres sources d’information
potentiellement intéressantes ont été citées.
Le côté imparfait des données opérationnelles a été également souligné.
Le logiciel AERO dédié à l’exploitation des données opérationnelles prend en
compte leur imprécision et leur incertitude. Cependant, les distributions de
probabilités utilisées pour traiter de l’imprécision ne sont pas achevées et
mériteraient des études approfondies pour être affinées et mieux adaptées aux
situations d'urgence.
Bien que l’outil développé présente des possibilités supplémentaires par
rapport aux logiciels existants (base de données plus fiable, aide au recueil de
données, affichage des dangers, source d’information supplémentaire), les
performances n’offrent qu’une aide relative en situation d'urgence. L’information
fournie reste encore trop imprécise pour permettre une prise de décision sûre,
tant que la base de données ne sera pas enrichie. Et il s’avère difficile de l’utiliser
dans le cas de mélanges de plusieurs substances chimiques.
En l’état actuel, la solution à privilégier est de faire appel à des moyens
d’identification performants comme les spectromètres lorsque la localisation
correspond au rayon d’action des CMIC qui en sont équipées. Pour augmenter
leur rayon d’action, les sapeurs-pompiers allemands ont su se doter de moyens
pour héliporter les matériels d’analyse. En France, une première étape serait
peut-être de faire appel plus souvent aux moyens existants.
Ensuite, une seconde solution à privilégier, serait de faciliter l’identification
de la substance à la source, plutôt que d’essayer de la retrouver ensuite. C’est
déjà la raison d’être des marquages imposés par la réglementation tels que les
codes dangers et les numéros d’identification. Mais nous avons vu que ces
marquages peuvent être détruits lors d’un accident. D’autres solutions se
développent pour transmettre ces informations primordiales lors d’un accident.
204
Conclusions et perspectives
C’est notamment le cas du projet européen MITRA dont le principe est d’équiper
les transports de matières dangereuses de balises transmettant la nature des
produits transportés, mais également des données relatives au terme source des
phénomènes dangereux potentiels qui est le deuxième point traité dans cette
thèse.
Le terme source est indispensable à la modélisation des phénomènes
dangereux pouvant survenir lors d’une situation d'urgence. Mais il est rarement
connu avec précision, d’où l’intérêt de l’estimer à l’aide des données disponibles :
des mesures de flux ou, au pire, des estimations du flux au travers des
conséquences sur les personnes, les matériels et l’environnement.
L’évaluation du terme source dans ces conditions consiste à résoudre un
problème inverse. Dans le cas des situations d'urgence, l’hétérogénéité des
problèmes pouvant être rencontrés, en particulier un nombre variable de
paramètres et les différents types de modèle, a conduit à choisir les algorithmes
génétiques. Une méthodologie basée sur un algorithme génétique couplé à un
modèle prédictif classique a été développée. Sa validation a été réalisée dans le
cas des explosions de solides et elle permet de calculer rapidement et
précisément un terme source à partir d’estimations du flux. Cette méthode peut
être utilisée lors des expertises, en particulier pour les situations complexes pour
lesquelles plusieurs variables sont à identifier.
Pour une utilisation en situation d'urgence, l’étude à partir du retour
d’expérience de l’accident d’AZF montre que la méthode est également efficace
mais en limitant la complexité du problème par un nombre réduit de paramètres
du terme source. Il est néanmoins nécessaire d’appliquer la méthode à d’autres
retours d’expérience pour confirmer sa précision en situation d’urgence.
Un nombre de données réduit se traduit par une plus grande imprécision
et rend difficile l’évaluation de termes sources comprenant plusieurs paramètres.
Il est donc indispensable de l’adapter et de la tester dans le cas des phénomènes
de dispersions atmosphériques dont le terme source comporte un plus grand
nombre de paramètres pouvant être inconnus.
Mais pour l’instant, le problème majeur à l’évaluation du terme source d’un
phénomène de type dispersion atmosphérique est l’obtention de mesures de flux
précises et en nombre suffisant. L’évaluation des conséquences comme dans le
cas des explosions ne serait pas suffisamment précise et disponible rapidement
pour être utilisée. Il faut se tourner vers la mise en place de réseaux de capteurs
qui posent des problèmes en termes de disponibilité et de délai d’installation, ou
l’utilisation de drones de mesures. Des solutions existent déjà dans le cas des
dispersions aquatiques, notamment au sein du CEDRE.
205
Conclusions et perspectives
Le déploiement d’un réseau de capteurs ou l’utilisation d’un drone
soulèvent de nombreuses questions quant à la stratégie de mesure à employer.
Combien de mesures sont nécessaires (intervalle de temps entre deux mesures,
durée de l’acquisition et nombre de capteurs) ? Où faut-il faire les mesures ? Et
quelle doit-être la sensibilité des capteurs ?
Les travaux menés lors de cette thèse ont permis d’étudier des solutions
potentielles à l’apport d’aides à la décision en situation d'urgence. Les études
réalisées
ont
conduit
au
développement
d’outils
utilisant
les
données
opérationnelles pour apporter une aide à la décision au travers d’informations
supplémentaires. Et même si des pistes ont été proposées pour améliorer ces
outils, ils n’ont pas vocation à remplacer le décideur final ou les experts appelés
lors
des
situations
d'urgence.
Aujourd’hui,
l’élaboration
d’une
stratégie
d’intervention reste trop complexe au vu de l’information disponible pour être
réalisée par une intelligence artificielle et la décision finale relève de la
responsabilité du commandant des opérations de secours.
206
TABLE DES FIGURES
Figure 1 : Différentes phases d’un événement de sécurité civile ..........................................13
Figure 2 : Paramètres importants pour la modélisation des phénomènes dangereux ...........26
Figure 3 : Taxonomie de l’incertitude [Smithson, 1989] ........................................................33
Figure 4 : Fiche réflexe – Distance de sécurité [SDIS 54, 1999] ...........................................42
Figure 5 : Trace au sol du panache – Logiciel SAFER Real Time ........................................44
Figure 6 : De la données à la décision..................................................................................46
Figure 7 : Arbre de segmentation avec hiérarchisation des critères......................................59
Figure 8 : Arbre de segmentation avec hiérarchisation des concepts ...................................59
Figure 9 : Arbre de segmentation (méthodes CHAID) ..........................................................65
Figure 10 : Arbre de segmentation optimal ...........................................................................65
Figure 11 : Accident sur l’autoroute A9 (Midi-Libre - 7 mars 2001) .......................................70
Figure 12 : Informations sur le chlore triées par catégorie (logiciel WISER)..........................79
Figure 13 : Identification de substances chimiques avec WISER..........................................81
Figure 14 : Seuils des produits inflammables en fonction de leur point éclair .......................93
Figure 15 : Nombre de substances en fonction du nombre de symptômes qu’elles
provoquent ...........................................................................................................................98
Figure 16 : Nombre de substances correspondantes en fonction du nombre de critères
physico-chimiques................................................................................................................99
Figure 17 : Distribution de probabilité par couleur (couleurs chaudes)................................101
Figure 18 : Distribution de probabilité par couleur (couleurs froides) ..................................102
Figure 19 : Distribution de probabilité par couleur (non couleurs) .......................................102
Figure 20 : Distribution de probabilité du critère pH ............................................................103
Figure 21 : Distribution de probabilités du critère odeur......................................................106
Figure 22 : Nombre de substances correspondantes à un nombre de critères physicochimiques imprécis.............................................................................................................108
Figure 23 : Premiers niveaux de l’arbre de décision du danger « inflammable » des liquides
(méthode CART) ................................................................................................................118
Figure 24 : Arbres binaires de profondeurs différentes .......................................................120
Figure 25 : Critères discriminants pour les liquides inflammables.......................................121
Figure 26 : Critères discriminants pour les liquides explosifs et toxiques............................122
Figure 27 : Critères discriminants pour les liquides toxiques ..............................................122
Figure 28 : Critères discriminants pour les gaz toxiques.....................................................123
Figure 29 : Neurone formel.................................................................................................126
Figure 30 : Architecture du PMC ........................................................................................127
Figure 31 : Arbre binaire et PMC équivalent .......................................................................127
207
Figure 32 : Premiers niveaux de l’arbre de décision sur l’ensemble des substances liquides
...........................................................................................................................................131
Figure 33 : partie de l’arbre de décision des produits chimiques liquide : risque inflammable
...........................................................................................................................................134
Figure 34 : Interface du logiciel AERO................................................................................139
Figure 35 : Méthodologie opérationnelle d’identification des substances chimiques ...........140
Figure 36 : Saisie des critères (logiciel AERO) ...................................................................141
Figure 37 : IHM de saisie des réactions des tubes colorimétriques (logiciel AERO) ...........142
Figure 38 : Fiche du toluène du NIOSH affichée dans AERO .............................................149
Figure 39 : Affichage des dangers (logiciel AERO).............................................................150
Figure 40 : Arbre de segmentation des substances liquides : danger "inflammable" (logiciel
AERO)................................................................................................................................152
Figure 41 : Arbre de segmentation des substances liquides avec suppressions des
symptômes et du goût : danger "inflammable" (logiciel AERO)...........................................155
Figure 42 : Arbre de segmentation des substances liquides avec suppressions des
symptômes et du goût et prise en compte des incompatibilités : danger "inflammable"
(logiciel AERO)...................................................................................................................155
Figure 43 : Arbre de segmentation avec incompatibilités : danger "corrosif" (logiciel AERO)
...........................................................................................................................................156
Figure 44 : Arbre de segmentation sans incompatibilité : danger "corrosif" (logiciel AERO)156
Figure 45 : Méthode directe et méthode inverse.................................................................163
Figure 46 : Méthode inverse par algorithme génétique.......................................................174
Figure 47 : fonctionnement des algorithmes génétiques.....................................................177
Figure 48 : Usine AZF suite à l’explosion du 21 septembre 2001 .......................................178
Figure 49 : Bris de vitres (cité universitaire « Daniel Faucher » à Toulouse)......................179
Figure 50 : Courbe TNT - Abaque TM5-1300 extrapolé tiré de (Lannoy, 1984) ..................181
Figure 51 : Evaluation sur données artificielles (sans biais)................................................186
Figure 52 : Evaluation sur données artificielles (biais=25%) ...............................................186
Figure 53 : Ecarts des distances à l’épicentre calculées avec une erreur de 28,2% de la
masse d’explosif.................................................................................................................187
Figure 54 : Evaluation sur données artificielles (épicentre inconnu)....................................188
Figure 55 : Localisation des dommages à la suite de l’explosion d’AZF .............................190
Figure 56 : Diagrammes de Voronoï de surpressions relevées à Toulouse (AZF 2001) ....191
Figure 57 : Diagramme de Voronoï d’un exemple fictif .......................................................192
Figure 58 : Configuration avec une distance x variable.......................................................195
Figure 59 : Configuration en croix.......................................................................................196
Figure 60 : Erreur de calcul de la masse de TNT en fonction de la distance relevés /
épicentre ............................................................................................................................196
Figure 61 : Configuration avec une distance x variable.......................................................197
208
Figure 62 : Erreur de calcul masse de TNT et position de l’épicentre en fonction de la
distance relevés / épicentre................................................................................................197
Figure 63 : Surfaces calculées par la méthode des KPPV (K=7). .......................................199
Figure 64 : Surfaces calculées par la méthode des KPPV (K=7), bornées à l’enveloppe
convexe..............................................................................................................................199
Figure 65 : Classification NFPA..........................................................................................211
Figure 66 : Classification des modèles ...............................................................................216
209
LISTE DES TABLEAUX
Tableau 1 : Répartition des types d’accidents chimiques (22 933 accidents) Base ARIA du
BARPI. .................................................................................................................................19
Tableau 2 : Scénarios possibles en fonction de l’état d’une substance.................................24
Tableau 3 : Bases de données utilisées par la CASU de l’INERIS [Tremeaud, 2005]...........36
Tableau 4 : Exemple fictif illustrant la construction d’arbre non optimal ................................64
Tableau 5 : Matériels de détection autonomes .....................................................................75
Tableau 6 : Informations affichées pour chaque profil ..........................................................79
Tableau 7 : Bases de données de produits chimiques répondant en partie aux critères de
sélection...............................................................................................................................87
Tableau 8 : Proportion de substances par classe de danger ................................................91
Tableau 9 : Proportion de substances par classe de danger ................................................91
Tableau 10 : Classification NFPA 704 des substances inflammables ...................................92
Tableau 11 : Classification des substances inflammables : Directives 67/548/CEE et
1999/45/CE (article R.231-53 du code du travail). ................................................................92
Tableau 12 : Comparaison des arbres construits par les méthodes CHAID et CART (liquides)
...........................................................................................................................................119
Tableau 13 : Résultats de la méthode d’identification sur dix substances chimiques..........132
Tableau 14 : Effectif des feuilles pures d’arbres élagués (cas des liquides)........................135
Tableau 15 : Erreur d’identification par danger (cas des liquides).......................................135
Tableau 16 : Exemple de calcul de la masse d’équivalent TNT à partir de dommages
convertis en surpression.....................................................................................................182
Tableau 17 : Résultats sur des accidents réels ..................................................................188
Tableau 18 : Masse de TNT calculée pour plusieurs ensembles de données (REX d’AZF)
...........................................................................................................................................198
Tableau 19 : Niveaux de danger de la classification NFPA.................................................211
Tableau 20 : Comparaison des types de modèles de dispersion atmosphérique................220
210
Annexe I
Classification des substances chimiques
ANNEXE I
CLASSIFICATION DES SUBSTANCES CHIMIQUES
Classification NFPA
La classification NFPA comprend quatre natures de danger (inflammable, toxique,
explosif, divers) et cinq niveaux de gravité numérotés de 0 à 4.
Specific Hazard (White)
OXY - Oxidizer
ACID - Acid
ALK - Alkali
COR - Corrosive
W (W/Slash - Use No Water
Radiation Symbol - Radiation Hazard
Figure 65 : Classification NFPA
Tableau 19 : Niveaux de danger de la classification NFPA
Health Hazard (Blue)
Fire Hazard/Flash Point (Red)
0 - Normal Material
0 - Will Not Burn
0 - Stable
1 - Slightly Hazardous
1 - Above 200 Degrees F
1 - Unstable If Heated
2 - Hazardous
2 - Below 200 Degrees F
2 - Violent Chemical Change
3 - Extreme Danger
3 - Below 100 Degrees F
3 - Shock
Detonate
4 - Deadly
4 - Below 73 Degrees F
4 - May Detonate
211
Reactivity(Yellow)
&
Heat
May
Annexe I
Classification des substances chimiques
Directive SEVESO II
La classification vise à identifier toutes les propriétés physico-chimiques,
toxicologiques et écotoxicologiques des substances ou préparations, pouvant
constituer un risque lors de la manipulation ou de l'utilisation normales de ces
substances ou préparations. Après identification de chaque propriété dangereuse,
la substance ou la préparation doit être étiquetée de manière à indiquer le ou les
dangers, afin de protéger l'utilisateur, le public et l'environnement.
Les différentes catégories de dangers sont les suivantes :
- Explosif ........................................ E
- Comburant.................................... O
- Extrêmement inflammable .............. F+
- Facilement inflammable .................. F
- Inflammable.................................. R 10
- Très toxique.................................. T+
- Toxique ........................................ T
- Nocif ............................................ Xn
- Corrosif ........................................ C
- Irritant ......................................... Xi
- Sensibilisant.................................. R 42 et/ou R 43
- Cancérogène ................................. Carc. Cat (1)
- Mutagène ..................................... Mut. Cat. (1)
- Toxique pour la reproduction........... Repr. Cat. (1)
- Dangereux pour l'environnement ..... N et/ou R.52, R.53, R.59.
212
Annexe II
Classification des substances chimiques
ANNEXE II
CRITERES DE LA BASE DE DONNEES
Il existe quatre familles de critères discriminants :
-
Les propriétés chimiques et thermodynamiques observables ou mesurables :
état, couleur, opacité, odeur, goût, pH, densité liquide gazeuse.
-
Les symptômes cliniques sur l'homme : 89 signes différents rassemblés en 10
sous-groupes physio-pathologiques :
− Température (4 signes) : hypothermie, hyperthermie, état fébrile et
frissons.
− Neurologie (12 signes) : agitation, confusion mentale, troubles de la
sensibilité, somnolence, asthénie, vertiges, céphalées, troubles de la
parole, engourdissement/fourmillement, perte de la coordination ,
spasmes/convulsions et paralysie.
− Oreilles (2 signes) : perte de l’audition et acouphène.
− Ophtalmologie (8 signes) : irritations oculaires/rougeurs, tuméfaction,
photophobie, myosis, mydriase, larmoiement, troubles de la vision et
cécité.
− Nez (4 signes) : épistaxis, rhinorrhée, irritations nasales et éternuement.
− Bouche/gorge
(5
signes) :
toux,
irritations
de
la
bouche,
hypersialorrhée, sécheresse buccale et irritations de la gorge.
− Système cardiovasculaire (7 signes) : douleur thoracique, arythmie,
bradycardie, tachycardie, hypertension, hypotension et hypoxie/cyanose.
− Système respiratoire (14 signes) : respiration irrégulière, bradypnée,
polypnée, difficulté respiratoire (dyspnée), sifflements, arrêt respiratoire,
irritations/brûlures, œdème pulmonaire, inconfort thoracique, congestion,
toux, hémoptysie, éternuement et hypoxie/cyanose.
− Système gastro-urinaire (9 signes) : douleur abdominale, distension
abdominale,
nausées,
vomissements,
hématémèse,
diarrhées,
incontinence urinaire, douleur/brûlure urinaire et hématurie.
− Peau (14 signes) : exfoliation, prurit, sécheresse cutanée, brûlure,
sudation, tuméfaction, vésications, érythème, rougeur, pâleur, ictère,
cyanose, paresthésies cutanées et gelure.
-
Les classes de danger : inflammable, toxique, explosif, comburant, corrosif,
nocif, réagissant à l’eau, toxique de guerre.
-
La réponse positive ou négative aux tubes de la société Dräger, soit 191 tubes
qualitatifs.
213
Annexe IV
Classification des phénomènes
ANNEXE III
CLASSIFICATION DES PHENOMENES
Différents phénomènes peuvent se produire en fonction des propriétés
physico-chimiques des produits, de leur conditionnement et de l’environnement :
Explosions :
o
BLEVE (boiling liquid expanding vapour explosion)
o
UVCE (Unconfined Vapor Cloud Explosion)
o
Poussières ou vapeurs en milieu confiné
o
Détonation en phase condensée
Incendies :
o
Physique
o
Chimiques
•
Feux de nappes (pool fire)
-
les feux de réservoir
-
les feux de bac
-
les feux de flaque
•
Feu de réservoir (Tank fire)
•
Feu torche (Jet fire)
•
Flash fire
•
Boilover (Fireball)
Dispersions :
o
Atmosphériques
•
Gaz passifs
•
Gaz lourds
•
Fumées
o
Aquatiques
o
Dans les sols
214
Annexe V
Outils de modélisation
ANNEXE IV
OUTILS DE MODELISATION
Les phénomènes d’explosion, de dispersion et d’incendie sont les sujets de
nombreux travaux et de modèles.
Il existe différents types de modèles et les classifications varient selon les
auteurs :
-
les modèles physiques ou numériques,
-
les modèles déterministes, les modèles paramétrés et les modèles
empiriques,
-
les modèles gaussiens, les modèles intégraux, les modèles de la
mécanique des fluides et les modèles statistiques.
Sans éliminer trop rapidement certains types de modèles, nous pouvons déjà
identifier certains paramètres qui motiveront le choix des modèles utilisables.
-
Le temps de calcul doit être suffisamment court pour être utilisé en
situation d’urgence (les modèles de mécanique des fluides nécessitent
généralement plusieurs heures à plusieurs jours de calcul).
-
Les
ressources
informatiques
doivent
être
raisonnables :
logiciel
fonctionnant sur un ordinateur personnel.
-
Les paramètres nécessaires devront être disponibles ou évaluables.
(topographie 3D du site rarement disponible)
Et pour le choix des modèles il est indispensable de tenir compte du domaine de
validité des différents paramètres :
-
Type de produit (gaz passif, gaz lourd, …)
-
Type de source (ponctuelle, linéaire, …)
-
Echelles des phénomènes atmosphériques (Micro, Meso, Macro)
-
Relief
-
Etc.
Il existe de nombreuses modélisations des phénomènes pouvant se produire lors
des situations d’urgence étudiées. Nous allons tout d’abord les distinguer en
fonction des phénomènes simulés : explosions, dispersions et incendies. Pour
chacun nous essaierons de recenser les grandes familles de modèles, puis de
lister les principaux paramètres et de quantifier la sensibilité des modèles à ces
paramètres.
215
Annexe V
Outils de modélisation
Classification des modèles
Les modèles peuvent être classés en fonction de différents critères. On peut les
différencier selon s’il s’agit de modèles physiques ou numériques, selon la prise
en compte plus ou moins détaillée des mécanismes physiques et des méthodes
mathématiques pour les simuler.
La classification proposée ci-après regroupe les classifications présentées dans
[Couillet, 2002], [Perkins et al., 2002] et [Chorley et al., 1967].
Figure 66 : Classification des modèles
Les modèles physiques
Ils sont réalisés à l’aide de modèles réduits construits avec des matériaux
judicieusement choisis. Chorley (1967) propose une classification en trois
groupes pour l'étude de phénomènes géomorphologiques et qui peut s’appliquer
aux
phénomènes
de
dispersions :
les
modèles
à
l’échelle,
les
modèles
analogiques et les modèles hors échelles.
Les modèles à l’échelle sont les modèles réduits construits de telle sorte que
les rapports relatifs entre les quantités physiquement importantes soient les
216
Annexe V
Outils de modélisation
mêmes que dans la situation réelle. Ces grandeurs ou rapports relatifs sont
généralement exprimés par des nombres sans dimension.
Les modèles analogiques reproduisent les caractéristiques majeures des
phénomènes physiques, mais à un niveau détaillé les mécanismes peuvent ne
pas être identiques. Cependant avec un choix judicieux des matériaux, produits,
conditions initiales, etc., les mêmes systèmes peuvent s’approcher des modèles
à l’échelle.
Les modèles hors échelles ne prennent pas en considération les propriétés ou
les relations d’échelles et peuvent donner des résultats éloignés des valeurs à
échelle réelle.
Les modèles physiques nécessitent une phase de conception très longue ainsi
qu’un grand nombre de données descriptives de la situation difficiles à obtenir et,
par conséquent, ne présentent pas d’intérêt pour une utilisation en situations
d’urgence.
Les modèles numériques
Il s’agit des modèles à bases d’équations résolues par ordinateur. Ces modèles
intègrent un ensemble plus ou moins exhaustif de phénomènes physiques. Ils
peuvent être exhaustifs lorsqu’il s’agit de la modélisation de systèmes simples
dont le fonctionnement peut être décrit de manière complète et prédictive par un
ensemble restreint de lois physiques. En revanche, lorsqu’il s’agit de modéliser
des phénomènes plus complexes, les modèles physiques exhaustifs de la
mécanique des fluides sont dans ce cas remplacés par des lois physiques
paramétrées
décrivant
statistiquement
un
comportement
global.
Les
approximations dues à l’emploi de paramètres réduisent considérablement la
complexité et les temps de calcul. Et il existe également des modèles dits
« empiriques » qui ne contiennent pratiquement plus de lois physiques. Les
paramètres et les lois utilisés sont issus de mesures expérimentales. Ces
modèles sont utilisés lorsque les mécanismes physiques sous-jacents ne sont pas
compris et leur calage issu de l’expérimentation limite la généralisation.
Les modèles de type gaussien ou intégral reposent sur des équations
paramétrées et simplifiées. Les temps de calcul sont courts, de l’ordre de la
minute et ne nécessite pas d’importantes ressources informatiques.
Les modèles de la mécanique des fluides résolvent directement le système
d’équations décrivant les mécanismes physiques de la dispersion. Les temps de
calcul sont plus longs, de l’ordre de l’heure, voire de la journée. Ce type d’outil
217
Annexe V
Outils de modélisation
fonctionne généralement sur station de calcul. Ces modèles demandent aussi des
données d’entrée plus nombreuses, difficiles à obtenir en situation d’urgence.
Modèles gaussiens
Les modèles de dispersion de type Gaussien sont les plus simples et ils sont
fréquemment utilisés pour simuler rapidement la dispersion des gaz neutres ou
passifs (de masse volumique très proche de celle de l’air et sans vitesse initiale).
Ils reposent sur l’hypothèse que la répartition du polluant suit une loi gaussienne
dont les écarts-types dépendent de la distance à la source (Pasquill, Turner,
etc...) ou du temps écoulé depuis l’émission (appelé aussi temps de transfert)
(Doury), ainsi que des caractéristiques de la structure de l’atmosphère.
Les modèles de type gaussien s’appliquent à des dispersions passives, c'est-àdire à un produit qui n’est soumis qu’à l’action du fluide porteur (air). La densité,
la température ou la concentration de ce produit ne provoquent pas de
modification significative des caractéristiques de l’air et ne perturbent pas son
écoulement. Ceci suppose aussi que le rejet est passif, c'est-à-dire que la vitesse
du vent reste sensiblement la même avec ou sans polluant au voisinage du point
d’émission (brèche).
Ces modèles ne doivent être utilisés que dans certaines conditions :
-
Des conditions météorologiques moyennes,
-
En champ proche mais au-delà de 100m de la source
En phase passive ou en sortie de cheminée où l’énergie cinétique est faible
jusqu’à une distance de 1 à 1,5 km.
-
Pour des nuages ne s’éloignant pas trop du sol (cisaillements verticaux)
-
Sans obstacles ni relief accidenté
Il s’applique à un rejet sur un terrain plat sans obstacle. Les avis sont partagés
sur la taille des obstacles (surface d’obstacle équivalente à la section du nuage
ou au dixième selon les experts)
Souvent un paramètre de rugosité est introduit pour tenir compte partiellement
du relief et de l’occupation des sols.
-
Vitesse de vents non nulle.
Ces modèles ne sont pas adaptés à des vitesses de vents inférieures à 2 m.s-1
-
Conditions météorologiques globales et constantes
Sauf pour les modèles à bouffées gaussiennes.
-
Rejets continus en temps et en espace
218
Annexe V
Outils de modélisation
Des modèles permettent de prendre en compte des conditions de rejet ou des
conditions météorologiques variables dans le temps et de calculer des panaches
curvilignes à l’exception des modèles à bouffées gaussiennes.
Le lecteur intéressé par les mécanismes de la dispersion atmosphérique et les
modèles gaussiens pourra se reporter à [Couillet, 2002]
Les modèles gaussiens, traitant de rejets continus sont généralement utilisables
sur des ordinateurs type PC. Les temps de calculs sont en général inférieurs à la
minute.
Modèles analytiques gaussiens,
Des modèles gaussiens « de nouvelle génération » sont capables de s’adapter au
relief (et surement champs de vents irréguliers). Des recherches bibliographiques
sont a effectuer.
Modèles intégraux
Ils permettent de simuler les gaz dont la masse volumique est sensiblement plus
importante que celle de l’air. Van Ulden créa en 1974 le premier modèle de type
intégral appliqué à la dispersion des gaz lourds.
Ces modèles sont utilisés pour les études à cause de leur coût raisonnable de
mise en œuvre tant du point de vue matériel que de celui du temps machine
nécessaire.
Utilisant le modèle gaussien après la transition, leur précision est de l’ordre de ce
modèle. Ils présentent cependant des limitations dues à leur formulation comme
la mauvaise représentation de conditions météorologiques extrêmes, l’absence
de prise en compte du relief, des obstacles...
Modèles 3D (dynamique des fluides)
Ces modèles tridimensionnels prennent en compte l’ensemble ou une partie des
phénomènes intervenant dans la dispersion en introduisant des équations
décrivant ces phénomènes. Ainsi, les logiciels correspondants nécessitent un
personnel qualifié et des moyens et des temps de calcul importants.
o
Modèles eulériens
Un maillage 3D du volume de calcul est nécessaire pour discrétiser les
variables. Le temps de calcul souvent très long (plusieurs heures)
dépend de la résolution du maillage et du pas de temps choisi. Ces
219
Annexe V
Outils de modélisation
modèles permettent de tenir compte du relief (à condition de disposer
de l’information, ce qui est rarement le cas en situation d’urgence). Le
temps de calcul est indépendant du nombre de sources
o
Modèles lagrangiens
•
à particules
•
à bouffées gaussiennes
Comparaison des différents types de modèles (récapitulatif)
Tableau 20 : Comparaison des types de modèles de dispersion atmosphérique
Modèles
Gaussiens
A bouffées
Lagrangien
Eulérien
< 1 heure
> 1 heure
gaussiennes
Temps de calcul
< 1 min.
Quelques
minutes
Distance min.
100 m
-
-
Distance max.
1 à 1.5 km
-
-
Vitesse de vent
2 - ? m/s
-
-
Conditions
Oui
Non
Non
Non
Rejets continus
Oui
Non
Non
Non
Relief
Approximation
Approximation
Champ de vent
Champ de vent
Obstacles
Approximation
Approximation
Champ de vent
Champ de vent
(rugorisé)
(rugorisé)
Approximation
Approximation
Loi de paroi
Loi de paroi
(dépôt sec)
(dépôt sec)
Approximation
Approximation
(dépôt humide)
(dépôt humide)
Oui
Oui
météo globales
Dépôt de produit
Réactions
chimiques
Non
Approximation
pour la chimie
simple
220
GLOSSAIRE
ASN
Autorité de Sûreté Nucléaire
ASPC
Agence de Santé Publique du Canada
DDSC
Direction de la Défense et de la Sécurité Civiles
CANUTEC
Centre canadien d'urgence transport
CCOHS
Canadian Centre for Occupational Health and Safety
CDC
Center for Diseases Control and prevention
CEDRE
CEntre de Documentation, de Recherche et d’Expérimentations
sur les pollutions accidentelles des eaux
CERCHAR
Centre d'Etudes et Recherches des Charbonnages de France
CMIC
Cellule Mobile d’Intervention Chimique
COS
Commandant des Opérations de Secours
COV
Composé Organique Volatile
DOT
Departement Of Transportation
DRIRE
Directions Régionales de l'Industrie de la Recherche et de
l'Environnement
HAZMAT
HAZardous MATerials (matières dangereuses)
IDLH
Immediately Dangerous to Life or Health
IGN
Institut Géographique National
IHM
Interface Homme-Machine
INERIS
Institut National de l’Environnement Industriel et des Risques
INRS
Institut National de Recherche et de Sécurité
IRSN
Institut de Radioprotection et de Sûreté Nucléaire
MNT
Modèle Numérique de Terrain
NFPA
National Fire Protection Association
NIOSH
National Institute for Occupational Safety and Health
NLM
National Library of Medicine
OMS
Organisation Mondiale de la Santé
REX
Retour d’Expérience
SIG
Système d’Information Géographique
TMD
Transport de Matières Dangereuses
VME
Valeurs Moyennes d’Exposition
VLE
Valeurs Limites d’Exposition
SEI
Seuil des Effets Irréversibles
SEL
Seuil des Effets Létaux
WISER
Wireless Information System for Emergency Responders
221
222
REFERENCES BIBLIOGRAPHIQUES
Autorité de Sûreté Nucléaire - ASN (2006). "Protéger la population en situation
d'urgence." Contrôle (Dossier 171): 83.
Baradat, P. and Labbé, T. (2006). Optimisation du rééchantillonnage dans un
logiciel d'Amélioration des Plantes. Conference Cari 06, 6-9 novembre
2006, Cotonou, Bénin.
Bureau d’Analyse des Risques et Pollutions Industrielles - BARPI (2007).
"Inventaire 2007 des accidents technologiques." MEEDDAT - BARPI: 16.
Bureau d’Analyse des Risques et Pollutions Industrielles - BARPI (2008).
"A.R.I.A. (Analyse, Recherche et Information sur les Accidents)." from
http://aria.ecologie.gouv.fr/.
Pagnon, S., Bronner, C., Fontaine, F., Baulig, A., Tymen, H., Bouteilloux, P.,
Breton, P. and Louvet, P. (2007). "Examen de l'utilisation du logiciel
WISER en situation d'urgence - RAPPORT D’ÉTUDE: DRA-07-8608808114A." INERIS - CEB.
Beasley, D., Bull, D. R. and Martin, R. R. (1993). "An Overview of Genetic
Algorithms: Part 1, Fundamentals." University Computing, 15 (4): 170181.
Becker, T. J. (2006). "Chemical Companion Helps First Responders." from
http://www.gatech.edu/newsroom/release.html?id=928.
Belson, W. A. (1959). "Matching and prediction on the principle of biological
classification." Applied Statistics, 8: 65-75.
Ben Mena, S. (2000). "Introduction aux méthodes multicritères d’aide à la
décision." Biotechnol. Agron. Soc. Environ. 2000, 4 (2): 83–93.
Bernuchon, E. and Salvi, O. (2002). "Analyse des risques et prévention des
accidents majeurs (DRA-07) - Définition des Scénarios Maximum
Physiquement Possible." INERIS.
Bhavnani, S. K., Abraham, A., Demeniuk, C., Gebrekristos, M., Gong, A.,
Nainwal, S., Vallabha, G. K. and Richardson, R. J. (2007). Network
Analysis of Toxic Chemicals and Symptoms: Implications for Designing
First-Responder Systems. AMIA symp. 2007, Chicago (Michigan).
Bissonnette, M. (2007, 24/01/2007). "Tout ce que vous avez toujours voulu
savoir sur les détecteurs de gaz multiples." Retrieved 13/08/2007, from
http://www.tc.gc.ca/canutec/fr/articles/documents/mgaz.htm.
BIT (1993). "La maîtrise des accidents majeurs: guide pratique."
Boissonnat, J.-D. and Yvinec., M. (1995). Géométrie algorithmique, Ediscience
international. Paris.
Bontemps, C. (2000). "Principes Mathématiques et Utilisations des Algorithmes
Génétiques." INRA: 54.
Bouet, R. (1999). "Ammoniac - Essais de dispersion atmosphérique à grande
échelle." INERIS: 112.
Breiman, L., Friedman, J. H., Olhsen, R. A. and Stone, C. J. (1984). Classification
and Regression Trees. Belmont CA., Wadsworth: 368.
Bronner, C., Dandrieux, A., Spinelli, R., Chapelain, J., Fontaine, F., Lacoste, A.,
Caron, B. and Dusserre, G. (2008). "Identification de substances
223
chimiques pures par tubes colorimétriques en situation opérationnelle."
Face au Risque (soumis).
Caetano, H. and Benhadjoudja, A. (2005). "Les simulateurs "risques urbains"
pour la formation et l'aide à la décision dans la gestion des catastrophes Algérie." Systèmes d'information géographique et gestion des risques, 1:
101.
CANUTEC (2004, 2008-01-15). "Guide des Mesures d'Urgence 2004." Retrieved
2008-04-16, from http://www.tc.gc.ca/canutec/fr/guide/guide.htm.
Carluer, F. and Richard, A. (2002). L’analyse stratégique de la décision.
Grenoble, PUG.
Canadian Centre for Occupational Health and Safety - CCOHS (2008, Last Update
Date).
"IPCS
INCHEM."
Access
2008,
from
http://www.inchem.org/pages/about.html.
Cdt Vert (2001). "Le SICF, outil d’aide à la décision." OBJECTIF DOCTRINE, 28:
pp 40.
Celle, M. and Descourriere, S. (2006). "Elaboration d’une base de données sur
les produits chimiques dangereux." INERIS: 98.
Cerf, R. (1994). "Une théorie asymptotique des algorithmes génétiques."
Montpellier, Thèse de doctorat., Université de Montpellier II.: 200.
Chamayou, R. (1997a). "Réservoirs métalliques: stockage des liquides à
température ambiante". Techniques de l'ingénieur. Génie mécanique,
Techniques de l'ingénieur. BM 6591: 17
Chamayou, R. (1997b). "Réservoirs métalliques: stockage des liquides à
température contrôlée". Techniques de l'ingénieur. Génie mécanique,
Techniques de l'ingénieur. BM 6592: 17
Chazeau, A. (2007). "Réalisation d'une matrice stockage / gravite - Rapport de
stage de Master 2." Ecole Nationale Supérieure des Mines d'Alès.
Chorley, R. J. and Haggett, P. (1967). Models in geography. Methuen, London,
Methuen: 816.
Chusseau, S., Godillon-Maquinghen, A. P., Lepoutre, F. X. and Chopin, D.
(2000). "Sadepo: Remémoration de cas pour l'aide a la decision en
chirurgie correctrice de la scoliose." ITBM-RBM, 21 (2): 78.
Clancy, V. J. (1972). Diagnostic Features of Explosion Damage. 6 th international
Meeting on Forensic Sciences, Edinburgh.
Cornuéjols, A. and Miclet, L. (2002). Apprentissage artificiel. Concepts et
algorithmes., Eyrolles. Paris: 591.
Couillet, J. C. (2002). "Méthodes pour l’évaluation et la prévention des risques
accidentels (DRA-006) Ω-12 Dispersion atmosphérique (Mécanismes et
outils de calcul)." INERIS.
Courtier, P. and Rabier, F., Eds. (1997). The Use of Adjoint Equations in
Numerical Weather Prediction. Numerical Methods in Atmospheric and
Oceanic Modelling. Canada, Charles A. Lin, René Laprise, and Harold
Ritchie.
Dautun, C., Bronner, C., Bony-Dandrieux, A., Tixier, J., Chapelain, J., Fontaine,
F. and Dusserre, G. (2007). "Situations de crise - Comment réagir."
Préventique – Sécurité, 92: 42-45.
Direction de la Défense de la Sécurité Civile - DDSC (2006). "Guide National de
Référence." Direction de la Défense de la Sécurité Civile: 98.
Dechy, N., Le Coze, J.-C., Leprette, E. and Lim, S. (2003a). "Intervention de
L’INERIS après le sinistre survenu le 27 mars 2003 sur le site de BILLYBERCLAU de la Société NITROCHIMIE." INERIS.
224
Dechy, N. and Leprette, E. (2003b). "Analyse des dommages observés à Billy
Berclau (62) après le sinistre du 27 mars 2003 survenu sur le site de la
société NITROCHIMIE - Rapport Annexe 3." INERIS: 63.
Dechy, N. and Mouilleau, Y. (2004). Damages of the Toulouse disaster, 21st
september 2001. Loss prevention and safety promotion in the process
industries: proceedings of the 11th International Symposium, 31 May - 3
June 2004, Praha, Czech Republic: PetroChemEng.
Demolombe, R. (1997). Uncertainty in intelligent databases. in Uncertainty
Management in Information Systems. A. Motro, C. T., Kluwer: pp. 1-37.
Derringer, T., Kelly, T., Folsom, D., Krile, R. and Willenberg, Z. (2006).
"ChemPro 100 - Hand-Held Chemical Detector." EPA.
Dobbins, J. P. and Abkowitz, M. D. (2003). "Development of a centralized inland
marine hazardous materials response database." Journal of Hazardous
Materials, 102 (2-3): 201.
Dolladille, O. (2001). "Données disponibles concernant les produits dangereux RAPPORT PARTIEL « D’OPERATION F » - Outils d’aide à la décision pour la
gestion des crises (DRA-04)." INERIS: 51.
Dolladille, O. (2002). "Sollicitations de l’INERIS en situations d’urgence RAPPORT D’OPERATION « G » - Outils d’aide à la décision pour la gestion
des crises (DRA-04)." INERIS: 28.
Dräger, Ed. (2002). Livre de poche Tubes réactifs/CMS Dräger. Lübeck, Dräger
Safety.
Dräger
Safety
(2005,
13/08/2007).
"Tubes
&
CMS."
from
http://www.draeger.com/ST/internet/FR/fr/Industries/Industrial/Appli/ER/
Tubes/er_tubes.jsp.
Dreyfus, G., Martinez, J. M., Samuelides, M., Gordon, M. B., Badran, F., Thiria, S.
and L., H. (2002). Réseaux de neurones. Méthodologie et applications.
Paris, Eyrolles.
Duda, R. O. and Hart, P. E. (1973). Pattern Classification and Scene Analysis.
New York, Wiley.
Efron, B. (1979). "Bootstrap methods: another look at the jackknife." Annals of
Statistics, 7: 1-26.
Egidi, D., Foraboschi, F. P., Spadoni, G. and Amendola, A. (1995). "The ARIPAR
project: analysis of the major accident risks connected with industrial and
transportation activities in the Ravenna area." Reliability Engineering &
System Safety, 49 (1): 75.
El Najjar, M. E., Cherfaoui, V., Bonnifait, P. and Royere, C. (2003). "Elaboration
de fonctions de croyance a partir de donnees GPS et SIG: Etude de
strategies de fusion pour la localisation d'un vehicule." TSI. Technique et
science informatiques, 22 (7-8): 935-964.
EURACHEM/CITAC (2000). Guide EURACHEM/CITAC, Quantifier l'Incertitude dans
les Mesures Analytiques, 2ème édition. UK, S L R Ellison: 116 pages.
Fache, S. (2003). "Mise en œuvre d’un outil de calcul de dispersion
atmosphérique basé sur les méthodes inverses." INERIS: 112.
Faugeras, B. (2002). "Assimilation variationnelle de données dans un modèle
couplé océan-biogéochimie." Grenoble, Thèse de doctorat, Université
Joseph-Fourier.
Fédération Nationale des Sapeurs-Pompiers Français - FNSPF (1992a). Chapitre
3: Détection de gaz, p213-237. in Guide d'intervention face au risque
chimique. F.N.S.P.F. Paris: 374.
Fédération Nationale des Sapeurs-Pompiers Français - FNSPF (1992b). Guide
d'intervention face au risque chimique, Paris: FNSPF: 374.
225
Forestier, R. (2004). "Développement d'une méthode d'identification de
paramètres par analyse inverse couplée avec un modèle éléments finis
3D." Paris, Thèse de doctorat, Ecole des Mines de Paris: 155.
Friedman, J. H. (1977). "A recursive partitioning decision rule for nonparametric
classification." IEEE Transactions on Computers, C-26: 404-408.
Gallad, B. and Courtois, B. (2005). "Solvants organiques dans l'atmosphère de
lieux de travail. Les détecteurs portables à lecture directe. ED 952." INRS:
12.
Genoux, S. and Dechy, N. (2006). "Gestion du retour d'expérience de la Cellule
d'Appui aux Situations d'Urgence (C.A.S.U.)." INERIS: 79.
Gérard-Varet, L. A., Prévôt, M. and Thisse, J. F. (1976). Analyse mathématique
pour l'économie. Paris, Dalloz.
Giacobbo, F., Marseguerra, M. and Zio, E. (2002). "Solving the inverse problem
of parameter estimation by genetic algorithms: the case of a groundwater
contaminant transport model." Annals of Nuclear Energy, 29 (8): 15.
Giampiero E.G. Beroggi, Tanja C. Abbas, John A. Stoop and Aebi, M. (1997).
"Risk
Assessment
in
the
Netherlands."
Akademie
für
Technikfolgenabschätzung in Baden Württemberg (91).
Gouvernement de l'Ontario (1990). "Emergency Management and Civil Protection
Act", Chapître E.9, section 1
Grabisch, M. and Perny, P. (2003). Agrégation multi-critère. in Logique floue,
principes, aides à la décision. B. Bouchon-Meunier et C. Marsala (eds).
Paris, Hermès Science Publications: 81-120.
Grimmer Soft (2003). "Arbres de Segmentation in Aide StatBox Version 6.2".
Paris, Grimmer Soft: 129-140
Georgia Tech Research Institute - GTRI (2008). "Chemical companion."
Retrieved Avril 2008, from http://www.chemicalcompanion.org/.
Hadamard, J. (1932). Le Problème de Cauchy et les Équations aux Dérivées
Partielles Linéaires Hyperboliques. Paris, Hermann.
Holland, J. H. (1975). Adaptation in natural and artificial system, Ann Arbor: The
University of Michigan Press.
Institut National de Recherche et de Sécurité - INRS (1994). "Les mélanges
explosifs: gaz et vapeur; poussières et solides." INRS ED355.
Institut National de Recherche et de Sécurité - INRS (2008, Last Update Date).
"Fiches toxicologiques." Access 20/02/2008, from http://www.inrs.fr/.
Ioannidis, C., Logothetis, C., Potsiou, C., Kiranoudis, C., Christolis, M. and
Markatos, N. (1999). "Spatial Information Management for Risk
Assessment of Major Industrial Accidents."
IPCS et CCOHSIPCS (2001a). "International Chemical Safety Cards (ICSCs):
CHLORURE
DE
BENZYLE."
Retrieved
10/09/2007,
from
http://www.inchem.org/documents/icsc/icsc/eics0016.htm.
IPCS et CCOHSIPCS (2001b). "International Chemical Safety Cards (ICSCs):
NAPHTHALENE."
Retrieved
25/09/2007,
from
http://www.inchem.org/documents/icsc/icsc/eics0667.htm.
IRSN (2006a). "Fiche Toxicologique: Diisocyanate de toluylène."
Retrieved
23/08/2007, from http://www.inrs.fr/htm/ft46.pdf.
IRSN (2006b). "Fiche Toxicologique: Dioxyde de soufre." Retrieved 23/08/2007,
from http://www.inrs.fr/htm/ft41.pdf.
Keudel av-Technik GmbH (2007). "MEMPLEX - Gefahrstoff Software für
Feuerwehr
und
Rettungsdienst."
Retrieved
2008,
from
http://www.memplex.com/frames/frameset.htm.
226
König, M. (2006). "Die Unterstützung durch die Analytische Task Force."
Dekontamination von Verletzten: p21-24.
Lacôme, J. M. and Bronner, C. (2007). "Evaluation du logiciel SAFER Systems."
INERIS: 99.
Lacôme, J. M., Vincent, G., Baulig, A., Kordek, M. A., Fontaine, F. and Tissot, S.
(2006). "Examen de l'utilisation du logiciel ALOHA-CAMEO en situation
d'urgence." INERIS.
Lagadec, P. (1981). Ch V. Samedi 10 novembre 1979: Toronto. in Le risque
technologique majeur: politique, risque et processus de développement.
Pergamon press-Futuribles. Paris: 629.
Lagadec, P. (1997). "Urgences, crises, ruptures, des théâtres de vulnérabilité en
mutation." Préventique Sécurité (36): 2.
Lannoy, A. (1984). "Analyse des explosions air-hydrocarbure en milieu libre."
Bulletin de la direction des études et recherches (4).
Le Niliot, C. (2003). L’estimation de flux et de températures pariétaux à l’aide de
techniques inverses. METTI.
Lebart, L., Morineau, A. and Piron, J. (1995). Statistique exploratoire
multidimensionnelle, 3éme édition. Paris, Dunod: 439.
Lechaudel, J. F. and Mouilleau, Y. (1995). Assessment of an accidental vapour
cloud explosion - A case study: Saint Herblain, October
the 7th 1991, France. Proceedings of the 8 th International Loss Prevention
Symposium, Antwerp, Belgium.
Lees, F. P. (2004). Lees' loss prevention in the process industries - Hazard
Identification, Assessment and Control. Third edition. Sam Mannan. 2.
Leland, W. (1992). Tree Structured Data Analysis: AID, CHAID and CART.
Sawtooth Software Conference, Sun Valley, ID.
Leonelli, P., Bonvicini, S. and Spadoni, G. (1999). "New detailed numerical
procedures for calculating risk measures in hazardous materials
transportation." Journal of Loss Prevention in the Process Industries, 12
(6): 507.
Macé de Lépinay, A., Peudpièce, J.-B., Fournet, H., Motte, J.-C., Py, J.-L.,
Domenech, J. and Lannelongue, F. (2002). "Commission d'enquête interne
sur l'explosion survenue le 21 septembre 2001 à l'Usine Grande Paroisse
de Toulouse. Point de situation des travaux en cours à la date du 18 mars
2002 – GRANDE PAROISSE." ATOFINA.
Maimon, O. and Rokach, L. (2005). Data Mining and Knowledge Discovery
Handbook, Springer US: 1383.
Mallet, P. and Lions, P. (2005). "Un SIG pour la gestion globale des risques
majeurs de l'estuaire de la Seine - France." Systèmes d'information
géographique et gestion des risques, 1: 101.
Maréchal-Blanckaert, K., Moughabghab, A. V., Vinchon, F., Ferrard, G., Offinier,
C. and Scocolovsky, C. (1997). "Intoxication mortelle par le bromure de
méthyle. À propos d'un cas." Urgences Médicales, 16 (6): 255-256.
Martel, J.-M. (1999). L'aide multicritère à la décision: méthodes et applications.
CORS - SCRO 1999 ANNUAL CONFERENCE, 7-9/06/1999, WINDSOR,
ONTARIO.
McCulloch, W. S. and Pitts, W. (1943). "A logical calculus of the ideas immanent
in nervous activity." Bulletin of Mathematical Biophysics, 5: 115-133.
MEEDDAT-INERIS (2006). "Compréhension des phénomènes et modélisation: LA
DISPERSION ATMOSPHERIQUE."
227
Mendoza, G. A. and Prabhu, R. (2000). "Multiple criteria decision making
approaches to assessing forest sustainability using criteria and indicators:
a case study." Environ. Manage, 26 (6) (26 (6)): 659-673.
Merad, M. (2003). "Apport des méthodes d'aide multicritère à la décision pour
l'analyse et la gestion des risques liés aux mouvements de terrains induits
par les ouvrages souterrains." Paris, France, LAMSADE, Universitée ParisDauphine.
Merad, M. M., Verdel, T., Roy, B. and Kouniali, S. (2004). "Use of multi-criteria
decision-aids for risk zoning and management of large area subjected to
mining-induced hazards." Tunnelling and Underground Space Technology,
19 (2): 125.
Michaëlis, P., Hodin, A., Lechaudel, J. F., Mavrothalassitis, G. and Mejean, P.
(1995). Methods applied to investigate the major UVCE that occured in the
TOTAL refinery’s Fluid Catalytic Cracking Unit at La Mède, France.
Proceedings of the 8 th International Loss Prevention Symposium,
Antwerp, Belgium.
Morgan, J. N. and Sonquist, J. A. (1963). "Problems in the analysis of survey
data and a proposal." Journal of the American Statistical Association, 58:
415-434.
Mouilleau, Y. and Dechy, N. (2001). "Première analyse des dommages observés
à Toulouse après le sinistre du 21 septembre 2001 sur le site de AZF de la
société Grande Paroisse." INERIS for IGE: 56.
Mouilleau, Y. and Lechaudel, J. F. (1999). "Guide des méthodes d’évaluation des
effets d’une explosion de gaz à l’air libre." INERIS: 166.
National Conference of Standards Laboratories International - NCSLI (2006).
International vocabulary of basic and general terms in metrology - Basic
and general concepts and associated terms (VIM), 3rd edition. Geneve,
NCSLI.
Nemitz, B., Ammirati, C. and Jouchoux, Y. (2000). "Stratégie générale face à une
intoxication chimique collective." Médecine de catastrophe urgences
collectives, 3 (1): 5-12.
National Library of Medicine - NLM (2004, 20/02/2008). "Fact Sheet: Wireless
Information System for Emergency Responders (WISER)."
Retrieved
21/03/2008, from http://www.nlm.nih.gov/pubs/factsheets/wiser.html.
National Library of Medicine - NLM (2005, 12/03/2008). "Wireless Information
System for Emergency Responders."
Retrieved 27/03/2008, from
http://wiser.nlm.nih.gov/index.html.
National Oceanic & Atmospheric Administration - NOAA (1999, Last Update
Date). "CAMEO Chemicals online database of hazardous materials." Access
2008, from http://cameochemicals.noaa.gov/.
Noto, Aymé and Rosier (1983). "Intoxication par acide cyanhydrique." Allo 18,
Dossier du mois - Mars 1983.
O'Neil, M. J., Smith, A., Heckelman, E. and Budavari, S. (2004). The Merck
Index: an encyclopedia of chemicals, drugs and biologicals - Thirteenth
Edition, Whitehouse Station. New Jersey, Merck & Co.: 2564.
Parzen, E. (1962). "On estimation of a probability density function and mode."
The Annals of Mathematical Statistics, 33 (3): 1065-1076.
Pasquill, F. (1974). Atmospheric Diffusion, Ellis Horwood: 442.
Perkins, R., Soulhac, L. and Mejean, P. (2002). "Modélisation de la dispersion des
émissions atmosphériques d'un site industriel - Vers un guide de
l'utilisateur, phase 1: Etat de l'art." Ecole Centrale de Lyon.
228
Pison, I. (2005). "Modélisation inverse pour l'optimisation des sources primaires
de pollution atmosphérique a l'échelle régionale." Paris, Thèse de doctorat,
Université Paris XII.
Presutto, F. (2005). MITRA - Monitoring and Intervention for the TRAnsportation
of Dangerous Goods. International Conference on Risk and Emergency
Management - Research and Policy Perspectives, 8-9 June 2005,
Hannover, Germany.
Pujos, C. (2006). "Estimation de la rhéologie d'un polymère dans une filière
d'extrusion - Simulation d'écoulement avec transferts thermiques et
Inversion de mesures." Bordeaux, université de Bordeaux I: 206.
Purnomo, H., Mendoza, G. A. and Prabhu, R. (2005). "Analysis of local
perspectives on sustainable forest management: an Indonesian case
study." Journal of Environmental Management, 74 (2): 111.
Quenouille, M. (1949). "Approximate tests of correlation in time series." Journal
of the Royal Statistical Society, 11 (B): 68–84.
Quinlan, J. R. (1986). "Induction of Decision Trees." Machine Learning, 1 (1):
81-106.
Rakotomalala, R. (2005). "Arbres de Décision." Modulad, 33: 163-187.
Rosenblatt, M. (1956). "Remarks on some non-parametric estimates of a density
function." 27: 832-837.
Roy, B. (1975). "Vers une méthodologie générale d'aide à la décision". Metra.
14: 459-497
S. A. Teukolsky, W. T. Vetterling and B. P. Flannery (1992). Numerical Recipes in
C. 2nd Ed., W. H. Press, Cambridge Univ. Press: 444-451.
Saporta, G. (2006). Segmentation, arbres de regression. in Probabilités, analyse
des données et Statistique, 2ème édition. Technip: 622.
Sari, M., Jennifer, S. and Dawn, P. (2000). "Étude sur le transport par camion
des
marchandises
dangereuses
–
été
2000."
from
http://www.tc.gc.ca/tmd/bulletin/automne2000.htm.
Savage, L. J. (1954). The Foundations of Statistics. New York, John Wiley &
Sons.
Schärlig, A. (1985). Décider sur plusieurs critères - Panorama de l’aide à la
décision multicritère, Presse polythechniques et universitaires romandes.
Lausanne, Suisse: 304.
Service départemental d'incendie et de secours de Meurthe-et-Moselle - SDIS 54
(1999). "Plan d’intervention risque chimique - Fiches réflexes." Retrieved
2006, from http://www.sdis54.fr/article.php3?id_rubrique=285.
Simpson, G. G. (1961). Principles of Animal Taxonomy. New York, Columbia
University Press.
Smithson, M. (1989). Ignorance and Uncertainty: Emerging Paradigms. New
York, Springer Verlag.
Sokal, R. R. and Sneath, P. H. A. (1974). Numerical Taxonomy: the Principles
and practice of numerical Classification. San Francisco, W.H. Freeman and
Company.
Tran Le Tam, M. and Thibier, E. (2005). "Evaluation de la population dans les
zones de bruit - France." Systèmes d'information géographique et gestion
des risques, 1: 101.
Tremeaud, S. (2005). "Etude des besoins des membres et des utilisateurs de la
Cellule d’Appui aux Situations d’Urgence." INERIS: 35.
Tukey, J. W. (1958). "Bias and confidence in not quite large samples (abstract)."
Annals of Mathematical Statistics, 29: 614.
229
Us Army Chemical School (2005). Potential Military Chemical/biological Agents
And Compounds, Eximdyne: 324.
Vincke, P. (1989). L'aide multicritère à la décision, Ellipses et Bruxelles: Éditions
de l'ULB. Paris: 179.
Voiron-Canicio, C. and Olivier, F. (2005). "Anticiper à l'aide d'un SIG, les
conséquences de la paralysie urbaine en temps de catastrophe: application
à la ville de Nice - France." Systèmes d'information géographique et
gestion des risques, 1: 101.
Yohannes, Y. and Hoddinott, J. (1999a). "Classification and Regression Trees: An
introduction." Technical report, International Food Policy Research
Institute (IFPRI).
Yohannes, Y. and Webb, P. (1999b). "Classification and Regression Trees, CART:
A User Manual for Identifying Indicators of Vulnerability to Famine and
Chronic Food Security." International Food Policy Research Institute
(IFPRI): 50.
Zoller, H. G. and Beguin, H. (1992). Aide à la décision. L'évaluation des PROJETS
d'Aménagement, Economica. Paris: 310.
230
231
Ecole Nationale Supérieure des Mines
de Saint-Etienne
N° d’ordre : 486 SGE
Prénom Nom
Cyrille Bronner
Titre de la thèse
The use of operational data to provide decision making support in accidental situation
involving dangerous substance– Application to the source term identification.
Spécialité
Science of Environment
Mots clefs
Emergency situation, decision-making support, chemical risk, source assessment,
inverse method, genetic algorithm, decision tree
Résumé
In the event of a major chemical accident, often only uncertain and inaccurate facts
are available to the fire-fighters and crisis management units, which makes a
diagnosis of the situation difficult.
Further, the emission source (initial conditions) is often badly known in the first
instant but is however absolutely necessary to have a global view of the event and
predict its development to take good decisions and to limit consequences.
This research work aims at developing, for the emergency first responders,
methodologies and decision-making support tools, specific to chemical accidents. This
thesis addresses two problems, in one hand to identify the a priori unknown chemical
substance, in the other hand to assess the source term (rate, quantity …).
To identify an unknown chemical substance or, at least, the associated hazards, the
developed method consists in using data collected in situ which can be descriptive
data (as colour, odour) or symptoms observed on victims. On these bases, a
methodology and a software have been developed to make easier the exploitation of
operational data, taking into account inherent uncertainty and inaccuracy, in
particular by using the probability theory.
In addition to the identification of the chemical substance, consequences assessment
requires to know precisely the source term. So, an inverse method has been proposed
to evaluate the source term by using the observed or/and measured consequences
(overpressures, concentrations …). This method is based on a genetic algorithm
coupled with an analytic explosion model. The algorithm was then validated on two
accidents (AZF and Nitrochimie sites) and provides good estimations of the mass of
the explosive having detonated.
The benefit of our method is its ability to solve problem with more than one unknown
parameter, e.g. the explosive mass together with the location of the epicentre of the
explosion which could not be possible with methods usually used.
Ecole Nationale Supérieure des Mines
de Saint-Etienne
N° d’ordre : 486 SGE
Prénom Nom
Cyrille Bronner
Titre de la thèse :
Utilisation des données opérationnelles pour l’aide à la décision en situation
accidentelle impliquant une substance dangereuse – Application à l’identification du
terme source
Spécialité
Science et Génie de l’Environnement
Mots clefs
Situations d’urgence, aide à la décision, risque chimique, évaluation de la source,
méthode inverse, algorithme génétique, arbre de décision
Résumé :
Lors d’un accident majeur d’origine chimique, les sapeurs-pompiers et les experts des
cellules d’appui doivent faire face à des phénomènes complexes (explosions,
dispersions de produits toxiques) et ne disposent souvent que d’éléments incertains et
imprécis, rendant difficile le diagnostic de la situation. Dans les premiers instants qui
constituent la phase d’urgence, la « source » d’émission du flux dangereux est
souvent mal connue mais elle est pourtant indispensable pour avoir une vision globale
de l’événement, prévoir son évolution et prendre les décisions visant à limiter les
conséquences.
Ces travaux de recherche ont pour objectif de développer des méthodologies et des
outils d’aide à la décision destinés aux primo intervenants des situations d’urgence
d’origine chimique. Ces outils doivent permettre, à partir de l’exploitation des données
opérationnelles, d’accéder d’une part à la nature d’une substance a priori inconnue,
d’autre part « au terme source » impliqué (débit, quantité).
Pour identifier une substance inconnue ou tout au moins les dangers qu’elle présente,
l’approche consiste à utiliser les données descriptives et les symptômes recueillis in
situ. Une base de données a été conçue et un logiciel a été développé pour faciliter
l’exploitation de ces données opérationnelles. L’incertitude et l’imprécision inhérentes
à ces données ont été prises en compte, notamment à l’aide de la théorie des
probabilités.
L’évaluation des conséquences requiert, en plus de la nature de la substance
impliquée, la connaissance précise du « terme source ». Aussi, une méthode inverse a
été proposée afin d’évaluer le terme source à partir des conséquences observées
et/ou mesurées (surpressions, concentrations). Elle consiste en l’utilisation d’un
algorithme génétique couplé à un modèle de calcul de flux. La méthode développée a
été appliquée et validée sur les explosions de solides pour lesquelles il s’agit de
calculer avec précision la masse d’explosif ayant détonée. L’algorithme a ensuite été
validé sur des accidents survenus sur les sites d’AZF et de Nitrochimie.
Téléchargement