DEPARTEMENT D’INFORMATIQUE
MEMOIRE
Présenté par
Melle Fyad Houda
En vue de l’obtention du
DIPLÔME DE MAGISTER
Spécialité Informatique
Option : Informatique et Automatique
Intitulé
Technique de Bio-Mining pour la représentation, la gestion et l’extraction des
informations associées aux séquences d’ADN
Soutenu le / / devant le jury composé de :
2010-2011
Président :
Mr Beldjilali. B
Professeur
Université d’Oran
Examinateur :
Mr Belalem. G
Maître de Conférences
Université d’Oran
Examinateur :
Mr .Senouci .M
Maître de Conférences
Université d’Oran
Rapporteur :
Mr. Bouamrane. K
Maître de Conférences
Université d’Oran
Rapporteur :
Mr. Atmani. B
Maître de Conférences
Université d’Oran
Dédicaces
mes très chers parents qui ont toujours été pour moi, et qui
m'ont donné un magnifique modèle de labeur et de
persévérance. J'espère qu'ils trouveront dans ce travail toute ma
reconnaissance et tout mon amour.
mon cher frère Samir Mounir.
tous mes ami(e)s
je les remercie pour leur dévouement et leur
amitié sans faille.
Remerciements
Au terme de ce travail, qu’il me soit permis d’exprimer mes plus vifs remerciements à :
Mr Bouamrane K. Maître de Conférences et Chef du Département d’Informatique à
l’Université d’Oran pour avoir accepté de diriger ce travail et avoir bien voulu y consacrer son
temps. Ses conseils, sa disponibili et sa précieuse aide qui m’ont guidé tout le long de la
conduite de cette étude.
Mr Atmani B. Maître de Conférences à l’Université d’Oran pour avoir accepté également de
m’encadrer. Ses orientations, ses précieux conseils m’ont permis d’avancer dans mes
recherches.
Mr Beldjilali B. Professeur à l’Université d’Oran pour m’avoir accueilli dans son équipe
Informatique & Automatique et pour m’avoir fait l’honneur de présider ce jury. Qu’il trouve
ici l’expression de mon profond respect.
Mr Belalem G. Maître de Conférences à l’Université d’Oran pour avoir accepté d’examiner ce
travail, qu’il trouve ici l’expression de ma reconnaissance.
Mr Senouci M. Maître de Conférences à l’Université d’Oran pour avoir accepté de juger ce
travail, qu’il trouve ici le témoignage de ma reconnaissance.
Je tiens à remercier aussi toutes les personnes qui ont contribué de près ou de loin à la
réalisation de ce travail.
Liste des figures
Figure 1.1 Architecture type d’un système d’E.C.D
10
Figure 1.2 Chaîne de traitement dans un processus E.C.T
11
Figure 2.1 Composants des ontologies
28
Figure 2.2 Classification des ontologies selon l’objet à modéliser
30
Figure 2.3 Typologie des ontologies selon le type de connaissances à modéliser
31
Figure 3.1 Cycle de vie des ontologies
55
Figure 4.1 Schématisation de l’approche
58
Figure 4.2 Exemple d’une entrée de fiche d’ESTs
61
Figure 4.3 Processus d’apprentissage et d’extraction de K.E.A
68
Figure 4.4 Extrait du résultat obtenu pour 100 fiches d’ESTs (Phase de test).
77
Figure 4.5 Format des données manipulées
81
Figure 4.6 Importation du fichier CH.arff sous TANAGRA
82
Figure 4.7 Chargement des données sous TANAGRA
82
Figure 4.8 Définition des données sous TANAGRA
83
Figure 4.9 Définition de la méthode du Clustering sous TANAGRA
84
Figure 4.10 Nombres de clusters construits par la méthode du Clustering
84
Figure 4.11 Résultat du Clustering
85
Figure 4.12 Résultat des corrélations du Clustering
86
Figure 4.13 Résultat de la variation des clusters
87
Figure 4.14 Résultat du dendrogramme
88
Figure 4.15 Ontologie « Etapes du cycle cellulaire des champignons »
95
Figure 4.16 Ontologie « Tissus cellulaire des champignons »
98
Figure 4.17 Ontologie « Caractéristiques des souches des champignons »
100
Figure 4.18 Ontologie « Conditions de culture des champignons »
103
Figure 4.19 Architecture générale de l’application
108
Figure 4.20 Cas d’utilisation de tous les utilisateurs
110
Figure 4.21 Cas d’utilisation de l’expert du domaine
110
Figure 4.22 Cas d’utilisation de l’administrateur
111
Figure 4.23 Architecture du module consultation
112
Figure 4.25 Architecture du module exploitation
113
Figure 4.26 Architecture du module enrichissement
113
Figure 4.24 Diagramme de séquence de la recherche d’information par mots-clés
114
Figure 4.27 Diagramme de séquence de la mise à jour de l’ontologie via la BDD
114
Figure 5.1 Interface principale de l’application
120
Figure 5.2 Menu Fichier
121
Figure 5.3 Menu Recherche
121
Figure 5.4 Menu Mise à jour
122
Figure 5.5 Interface de l’ontologie biologique du domaine
123
Figure 5.6 Interface de la recherche par mots-clés
124
Figure 5.7 Prétraitement des fiches d’ESTs
125
Figure 5.8 Calcul de TF*IDF des termes des fiches d’ESTs
126
Figure 5.9 Résultat du clustering des termes des fiches d’ESTs
126
Figure 5.10 Connexion à la base de données
127
Figure 5.11 Mise à jour dite « locale » de l’ontologie biologique du domaine
128
Figure 5.12 Ajout d’un concept de l’ontologie « Cellular cycle steps.OBO »
129
Figure 5.13 La table ontologie avant la mise à jour
129
Figure 5.14 La table ontologie avant et après la mise à jour (au niveau d’EasyPHP)
130
Figure 5.15 La table ontologie après la mise à jour
130
Figure A.1 Cycle de vie de N.crassa
146
Figure A.2 Cycle de vie de P.anserina
147
Figure B.1 Procédé d’obtention des ESTs
151
Figure D.1 Résultats de l’extraction automatique des deux métriques pour un échantillon
d’apprentissage =500 fiches d’ESTs (Neurospora crassa)
157
1 / 181 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !