APPEL A IDEES 2007 dans le domaine des Systèmes Complexes Formulaire de demande de soutien financier DESCRIPTION DU PROJET Titre du projet Approches Statistiques de la Dynamique des Systèmes Microbiologiques Complexes Application à la Maîtrise des Risques Alimentaires Titre court ou acronyme : Microbiologie Prévisionnelle Statistique (MPS) Nature de la proposition (projet ou événement) : Projet (et événement) Mots-clés : Microbiologie prévisionnelle ; Risque Alimentaire ; Systèmes Dynamiques Microbiologiques ; Filtrage non linéaire particulaire ; Systèmes Complexes. Secteurs disciplinaires : Microbiologie ; Analyse de Risque ; Statistique des Systèmes Dynamiques ; Modélisation prévisionnelle. Coordinateur du projet : Nom : VILA Prénom : Jean-Pierre Institution : INRA Laboratoire/Equipe : UMR Analyse des Systèmes et Biométrie e-mail : [email protected] Tél : 04 99 61 22 77 Adresse : UMR ASB – INRA/ENSAM - 2 Place P. Viala - 34060 Montpellier Noms des principaux participants au projet Nom Prénom Institution Laboratoire/Equipe e-mail COROLLER (MC) Louis Univ. Bretagne Occid. – Quimper LUMAQ (Microbiologie) [email protected] DEL MORAL Pierre (DR) INRIA IMB – Univ. Bordeaux I (Mathématiques-Probabilités) Pierre.Del-Moral @math.u-bordeaux1.fr GAUCHI (CR) Jean-Pierre INRA Lab. Biométrie Jouy-en-Josas (Statistique) [email protected] VILA (DR) Jean-Pierre INRA UMR ASB Montpellier (Statistique des Systèmes Dynamiques) [email protected] Nombre de personnes impliquées dans ce projet : 8 Chercheurs et enseignants-chercheurs : 4 Post-doctorant(s) : 0 Doctorant(s) ou Stagiaires Master Rech. : 2 Ingénieurs et techniciens : 2 Date de début du projet : 1er janvier 2008 Autres demandes de soutien envisagées pour le projet : aucune pour l’instant. Remarque importante : Cette proposition est fondamentalement de type Projet de Recherche. Toutefois il est envisagé l’organisation d’un séminaire de transfert à destination d’un public microbiologiste à l’issue de ces premiers travaux, de manière à susciter un deuxième cercle de collaborateurs expérimentalistes et ainsi l’extension des applications à la microbiologie prévisionnelle, dès que les premiers résultats de modélisation prédictive auront été obtenus (fin 2008). Dans le même ordre d’idée, cette proposition peut être considérée comme un pré-projet de démarrage, qui sera après ces premiers résultats, étendu en un projet plus général (autres pathogènes, autres modèles), impliquant des équipes avec lesquelles nous sommes actuellement en relation (cadre : projet européen) : Laboratoire de Microbiologie de l’Ecole Vétérinaire d’Alfort (coord. : J.C. Augustin). Department of BioTeC-Bioprocess Technology and Control – Katholieke Univers. Leuven (Pr. J. Van Impe). Institute of Food Research, Norwich, UK. (Coord. : Pr. J. Baranyi). PROJET DE RECHERCHE MPS Approches Statistiques de la Dynamique des Systèmes Microbiologiques Complexes Application à la Maîtrise des Risques Alimentaires 1. Question de recherche et contexte scientifique Les systèmes biologiques considérés dans ce projet concernent les systèmes de type alimentaire constitués de colonies bactériennes en interaction, hôtes souhaités ou non, des aliments en cours de fabrication ou de conservation. Ils correspondent en particulier aux systèmes pathogènes pour le consommateur (e.g. Listeria, pathogène cible de ce projet). La « complexité » de ces systèmes est à la fois de nature structurelle (écosystèmes) et de nature fonctionnelle, conséquence de la distribution de leur dynamique selon au moins trois niveaux hiérarchiques que l’on peut approximativement résumer par un niveau externe, seul accessible aux mesures (comptages en milieu de culture après prélèvement et séries de dilutions). un niveau intermédiaire, correspondant aux dynamiques de croissances ou décroissances bactériennes proprement dites, non mesurables dans le substrat alimentaire considéré, mais a priori modélisables sous forme de modèles stochastiques dits primaires. un niveau plus profond, caractérisé par des variables cinétiques qui conditionnent les dynamiques précédentes, et elles-mêmes résultats d’interactions de différents facteurs biotiques et abiotiques (conditions de milieux). Ces éléments cinétiques peuvent quelques fois être modélisables sous forme de modèles stochastiques dits secondaires. Ces caractéristiques fonctionnelles rendent toute modélisation prédictive de ces dynamiques bactériennes par les approches classiques (e.g. moindres carrés non linéaires), particulièrement difficile sinon impossible. L’objectif de ce projet à moyen terme est d’étudier le développement d’approches statistiques originales de ces systèmes dynamiques complexes, permettant leur identification paramétrique et l’estimation des densités prédictives de l’évolution des concentrations bactériennes dans le substrat d’intérêt. Et ce, dans un but de supervision, de détection et de prévention des risques de prolifération critique des agents pathogènes. En s’appuyant sur ces premiers résultats, et à plus long terme, ce projet devrait se prolonger par la caractérisation et la formalisation des hiérarchies d’interactions dynamiques complexes (inhibitions, synergies, régulations et auto-régulations) entre espèces bactériennes co-existantes dans le substrat considéré, du point de vue de leur pathogénéicité. Ce projet associe étroitement dimension statistique et dimension microbiologique, notamment dans l’étude et l’optimisation des procédures de recueil de mesures (comptages). 2. Etat de l’art Aujourd’hui, les microbiologistes appartenant au domaine de la microbiologie prévisionnelle, font face à des difficultés importantes d’appréhension des grandeurs d’intérêt (typiquement les vrais effectifs des bactéries en bouillon de culture ou dans un aliment véritable) d’une part, et d’estimation des paramètres cruciaux (typiquement les températures et les pH, minima, optima et maxima) conditionnant la croissance ou la non croissance bactérienne, d’autre part. Ces difficultés les contraignent à se concentrer sur des approches de modélisation largement incomplètes et insuffisantes pour expliquer et prédire l’évolution des populations bactériennes. Ainsi, l’aspect dynamique est pris en compte uniquement quand on observe l’évolution d’une population bactérienne à une température fixée, un pH fixé, une activité de l’eau fixée, etc…et non pas quand ces précédents facteurs, dits environnementaux, varient dans le temps. On peut facilement imaginer que considérer la variation dans le temps du facteur température peut améliorer grandement la qualité de la prévision d’un modèle de l’évolution de la population bactérienne. Un autre objectif des microbiologistes est l’estimation des paramètres des modèles dits secondaires, les variables de ces modèles étant elles-mêmes des « paramètres » des modèles dits primaires décrivant l’évolution d’une population bactérienne, et fonctions d’autres facteurs biotiques et abiotiques. Pour donner une idée des dimensions des espaces paramétriques à traiter, on rappelle qu’un modèle secondaire très populaire (Rosso, 1995) comprend 10 paramètres à estimer, et le modèle primaire le plus populaire (Baranyi & Roberts, 1994, 1995) contient au moins quatre « paramètres » dont deux sont déjà des fonctions d’autres paramètres et d’autres facteurs. Actuellement, ces estimations se font (difficilement) en deux temps en « oubliant » de nombreuses sources de variabilité, notamment la variabilité des fonctions « paramètres » et la variabilité de tous les processus de comptage et dilutions. Un souhait émis par les microbiologistes serait de faire l’estimation des 10 paramètres (ainsi que celle de leurs variances, voire l’estimation des densités marginales des estimateurs) en une seule étape, sans passer par l’étape « modèle secondaire ». 3. Méthodologies et objectifs à moyen terme Les innovations méthodologiques envisagées concernent les trois étapes successives de l’observation, de la modélisation et de l’analyse statistique prévisionnelle de ces systèmes microbiologiques complexes. a. Acquisition statistique des données : Les procédures actuelles consistent à dénombrer dans des prélèvements, les unités formant colonies (UFC) sur des boîtes de Pétri et à en déduire l’effectif de bactéries présentes dans la solution initiale par simple extrapolation à partir des facteurs de dilutions successives. Cette approche déterministe très approximative est éminemment perfectible. Sous des hypothèses de répartitions spatiales à valider expérimentalement (distributions poissonniennes, distributions agrégatives), des caractérisations probabilistes de ces comptages (fonction des effectifs initiaux), peuvent être envisagées, tirant parti des possibilités de répétitions (dilutions successives de Fisher). b. Estimation de densités conditionnelles d’effectifs bactériens : C’est à ce niveau que la structure hiérarchique complexe décrite précédemment pourrait être prise en compte, dans des procédures conduisant à des estimations de densités conditionnelles d’effectifs bactériens, en fonction des conditions initiales, des chroniques de comptages et des évolutions des variables de milieu. En effet, sous un formalisme de modélisation stochastique adéquat (modèles d’état auto-régressifs) la théorie du Filtrage Non linéaire devrait permettre l’estimation convergente des densités des variables d’état non observées (effectifs bactériens) à un instant donné, ou de façon prédictive sur tout un horizon, et ce en intégrant l’évolution des facteurs cinétiques du plus profond niveau. Les paramètres conditionnant les dynamiques de ces différents niveaux pourront eux-mêmes être estimés de façon convergente lors de ces opérations de filtrage. Nous utiliserons pour cela les filtres les plus puissants, de type filtre particulaire à interaction et filtre à convolution de particules. Cette approche devrait permettre également une certaine inférence statistique (paramétrique et fonctionnelle) sur ces modèles, malgré la non disponibilité des fonctions de vraisemblance. c. Supervision et détection statistique d’évolution critique : Plusieurs approches sont envisageables selon la formalisation de l’évolution critique à détecter, c’est à dire selon le maintien ou non de la représentativité de la modélisation initiale (modèles primaires + secondaires) dans les phases critiques : - si cette représentativité est maintenue, la criticité à détecter correspond au franchissement de certains seuils par les effectifs estimés par le modèle général du système. Les lois conditionnelles d’effectifs estimées par les filtres, permettront la construction d’intervalles de confiance dynamiques pour ces effectifs, et donc le déclenchement statistique d’alertes, à niveaux de risque fixés a priori. - si la criticité à détecter ou à prédire correspond en fait à une rupture de modèle (paramétrique ou fonctionnelle) correspondant par exemple à un dysfonctionnement progressif ou soudain d’un dispositif de conditionnement (température ou autre, représenté dans le modèle), les approches statistiques de détection s’appuieront sur des généralisations de procédures classiques de surveillance statistique de processus (tests CUSUM) que nous avons développées dans d’autres contextes pour des séries dynamiques non stationnaires et observées indirectement (filtrage-détection). - Enfin, dans les deux cas précédents il sera important d’analyser les conditions d’évolution du système vers des zones critiques. Nous utiliserons pour cela, des techniques de simulation particulaire d’évènements rares, analogues aux méthodes de filtrage évoquées ci-dessus. Les formalismes correspondants sont fondés sur l’élaboration d’arbres généalogiques, représentant les divers conditionnements conduisant à l’événement rare. Ceci devrait permettre d’estimer la fiabilité des dispositifs de fabrication et de conservation et d’ouvrir la voie vers les problématiques de contrôle correspondantes. 4. Retombées attendues dans le domaine des Systèmes Complexes Elles sont de deux ordres : méthodologique : estimation prédictive (densités de probabilités) de processus complexes non observables et à structure hiérarchique cachée et incertaine. applicative : modélisation prédictive de dynamiques d’éco-systèmes complexes pour l’analyse de risque alimentaire. 5. Position du projet Cette proposition est fondamentalement de type Projet de Recherche. Toutefois il est envisagé l’organisation d’un séminaire de transfert à destination d’un public microbiologiste à l’issue de ces premiers travaux de manière à susciter un deuxième cercle de collaborateurs expérimentalistes et ainsi, l’extension des applications à la microbiologie prévisionnelle (autres pathogènes), dès que les premiers résultats de modélisations prédictives auront été obtenus (fin 2008). Dans le même ordre d’idée, cette proposition peut être considérée comme un pré-projet de démarrage, qui sera après ces premiers résultats, étendu en un projet plus général (autres pathogènes, autres modèles, interactions hiérarchiques), impliquant des équipes avec lesquelles nous sommes actuellement en relation (cadre probable : projet européen) : Laboratoire de Microbiologie de l’Ecole Vétérinaire d’Alfort (coord. : J.C. Augustin) Department of BioTeC-Bioprocess Technology and Control – Katholieke Universiteit Leuven (Pr. J. Van Impe). Institute of Food Research, Norwich, UK. (coord. : Pr. J. Baranyi). 6. Références bibliographiques 6.1 Etat de l’art Baranyi, J. & Roberts, T.A. (1994). A dynamic approach to predicting bacterial growth in food. International Journal of Food Microbiology, 23,277-294. Baranyi, J. & Roberts, T.A. (1995). Mathematics of predictive food microbiology. International Journal of Food Microbiology, 26, 199-218. Coroller L., Leguerinel I., Mettler E., Savy N. and Mafart P. (2006). A general model for fitting various shapes of microbial inactivation curves. Applied Environmental Microbiology, 72, 6493-6502. Rosso, L., Lobry, J.R., Bajard, S. (1995). Convenient model to describe the combined effects of temperature and pH on microbial growth. Applied and Environmental Microbiology, 61, 2, 610-616. Rosso, L., Lobry, J.R., Flandrois, J.P. (1995). An unexpected correlation between cardinal temperatures of microbial growth highlighted by a new model. J. of Theor. Biol., 162, 447463. 6.2 Cinq publications en rapport avec le projet des participants Del Moral, P. (2004). Feynman-Kac formulae. Genealogical and interacting particle systems with applications, Springer New York, Series Probability and its applications. Gauchi, J.P. (2007). Use of Optimal Designs for the Accurate Estimation of the Parameters of a Growth Rate Model for Listeria monocytogenes. Submitted to J. of Applied Statistics. Gauchi, J.P., Vila, J.P., Coroller, L. (2007). New prediction confidence intervals and band in the nonlinear regression model: Application to the predictive modelling in food. Submitted to Communications in Statistics-Simulation and Computation. Gauchi, J.P. & Pazman, A. (2006). Designs in nonlinear regression by stochastic minimization of functionals of the mean square error matrix. J. of Statist. Plann. and Inference, 136, 3, 1135-1152. Rossi, V. & Vila, J.P. (2006). Nonlinear filtering in discrete time : a particle convolution approach. Inst. Stat. Univ. Paris, 3, 71-102. Vila, J.P. & Gauchi, J.P. (2007). Optimal designs based on exact confidence regions for parameter estimation of a nonlinear regression model. J. of Statist. Plann. and Inference, 137, 2935-2953.