Résumé
Le traitement des données biologiques est indispensable en recherches médicales et sciences de la vie. En
effet, les données biologiques sont de différents types, et souvent complexes, ce qui a induit une recherche
soutenue de nouveaux procédés d’exploitation parce que ceux existant ne suffisent plus ou ne sont plus
adaptés. Une nouvelle approche : l’Extraction de Connaissances à partir des Données biologiques est de
plus en plus envisagée. De là, notre étude qui porte sur la fouille de données biologiques sur un terrain
expérimental : une épidémie.
Le présent travail de recherche se situe dans le cadre de l’ECD Biologiques, à travers une étude
comparatives des outils existants et la proposition d’une nouvelle approche pour l’extraction des règles
d’association à partir de données biologiques, leur gestion et l’alimentation d’un système d’aide à la
décision.
D’où, la problématique abordée par notre étude qui est la fouille de données biologiques assistée par une
modélisation booléenne des résultats obtenus.
Nous proposons un processus d’extraction de motifs assez novateur pour générer des règles
d’association profitable et exploitable à deux niveaux :
•
Profitable au spécialiste du domaine, en particulier à travers les règles d’association qui aident à
mieux interpréter les données.
•
Le résultat de la fouille de données est optimisé par une modélisation booléenne des règles
d’association extraites. Cette amélioration se fait par la machine BRI (Boolean Rules Induction ).
En premier lieu nous présenterons un état de l’art, s’ensuit une étude comparative des différents outils et
méthodes existants afin d’en tirer bénéfice, et on continuera par exposer notre démarche et les résultats
obtenus.
Mots clés: Automate cellulaire, Fouille de données biologiques, Induction de règles, Règle d’association,
modélisation booléenne.