Définition d`un système générique de partage de données entre

N° d’ordre 2005-ISAL-00125 Année 2005
Thèse
Définition d'un système générique de
partage de données entre systèmes
existants
Présentée devant
L’institut national des sciences appliquées de Lyon
Pour obtenir
Le grade de docteur
Formation doctorale :
Documents multimédia, Images et Systèmes
d’Information Communicants (DISIC)
École doctorale : École doctorale Informatique et Information pour la société
(EDIIS)
Par
Mohamed Salah BOUMEDIENE
(Ingénieur)
Soutenue le 17 Décembre 2005 devant la Commission d’examen
Jury MM.
Rapporteur M. COLLARD Chef d’unité à l’ONERA (ONERA-DMSC)
Directeur A. FLORY Professeur (INSA de Lyon)
Examinateur M.HACID Professeur (Université Claude Bernard)
Co-directrice F. LAFOREST Maître de conférences (INSA de Lyon)
Rapporteur M. SIMONET HDR (Université Joseph Fourier Grenoble)
Examinateur G. ZURFLUH Professeur (Université Toulouse II)
i
SOMMAIRE
SOMMAIRE......................................................................................................i
Table des figures..............................................................................................vi
Liste des tableaux...........................................................................................viii
Résumé.............................................................................................................ix
Abstract............................................................................................................. x
Chapitre I : Introduction ................................................................................... 1
1 Position du problème ................................................................................ 1
2 Contexte de la thèse : Le projet SICOM................................................... 2
3 Objectif ..................................................................................................... 4
4 Organisation de la thèse............................................................................ 4
Chapitre II : ETAT de l’art ............................................................................... 7
1 Introduction............................................................................................... 8
2 Les différentes approches d’intégration de bases de données .................. 9
2.1 Bases de données fédérées................................................................ 9
2.1.1 Les principaux systèmes fédérés............................................... 9
2.1.1.1 Information Manifold ........................................................... 9
2.1.1.2 InfoMaster........................................................................... 10
2.1.1.3 L’approche de Florescu ...................................................... 10
2.1.1.4 GARLIC.............................................................................. 10
2.1.1.5 Intégrateur de données biologiques .................................... 11
2.2 Les Médiateurs................................................................................ 12
2.2.1 Classification des approches de médiation ............................. 13
2.2.2 Les principaux systèmes de médiation ................................... 14
2.2.2.1 E-XMLMEDIA................................................................... 14
2.2.2.2 MIX..................................................................................... 15
2.2.2.3 PICSEL ............................................................................... 16
2.2.2.4 SIMS ................................................................................... 17
2.2.2.5 OBSERVER........................................................................ 18
2.2.2.6 DISCO ................................................................................ 19
2.2.2.7 TSIMMIS............................................................................ 21
2.2.2.8 EDC .................................................................................... 23
2.2.2.9 MOMIS............................................................................... 23
2.3 Conclusion ...................................................................................... 24
3 Construction d’une vue unifiée à partir de schémas de sources .............27
3.1 Introduction..................................................................................... 27
3.2 L'opération de « matching »............................................................27
3.3 Différents types de matching .......................................................... 28
3.4 Les principales approches de matching .......................................... 30
3.4.1 TranScm.................................................................................. 30
3.4.2 LSD (Learning Source Descriptions for Data Integration)..... 31
3.4.3 SemInt..................................................................................... 32
ii
3.4.4 Vues globales.......................................................................... 33
3.4.5 ARTEMIS............................................................................... 34
3.4.6 Cupid....................................................................................... 35
3.4.7 Clio (IBM Almaden et Univ. de Toronto) .............................. 36
3.5 Conclusion ...................................................................................... 36
4 Les ontologies......................................................................................... 38
4.1 Introduction..................................................................................... 38
4.2 Définition de l’ontologie................................................................. 38
4.2.1 Définition philosophique ........................................................ 38
4.2.2 Les ontologies dans le cadre de la science informatique........ 39
4.3 Les ontologies en médecine............................................................ 39
4.3.1 Les principales ontologies médicales ..................................... 39
4.3.1.1 ON9..................................................................................... 39
4.3.1.2 GALEN............................................................................... 40
4.3.2 UMLS ..................................................................................... 40
4.3.3 Nautilus................................................................................... 40
4.3.4 MED........................................................................................ 41
4.3.4.1 Ontologie du cancer du sein................................................ 41
4.3.4.2 MENELAS.......................................................................... 42
4.4 Conclusion ...................................................................................... 42
5 Contrôle de données................................................................................ 43
5.1 Les différentes approches de contrôle de données.......................... 43
5.1.1 L’approche de Damiani .......................................................... 43
5.1.2 L’approche de Bertino ............................................................ 43
5.1.3 La première approche de Gabillon.......................................... 44
5.1.4 La deuxième approche de Gabillon ........................................ 44
5.1.5 L’approche de Michiharu........................................................ 45
5.2 Conclusion ...................................................................................... 46
6 Le système DRUID................................................................................. 47
6.1 Introduction..................................................................................... 47
6.2 Principe de DRUID......................................................................... 47
6.3 Fonctionnement de DRUID............................................................ 48
6.3.1 Saisie des données ..................................................................48
6.3.2 Consultation des données........................................................ 49
6.4 L’analyseur de DRUID................................................................... 50
7 Conclusion du chapitre ........................................................................... 51
Chapitre III : Création d’une vue unifiée........................................................ 53
1 Introduction............................................................................................. 53
2 Vue unifiée.............................................................................................. 55
2.1 Introduction..................................................................................... 55
2.2 Les ontologies................................................................................. 57
2.2.1 L’ontologie de structure.......................................................... 57
2.2.2 L’ontologie de valeurs ............................................................ 58
2.3 Description XML d’une base de données à l’aide des ontologies.. 59
2.3.1 Le document XML décrivant la base de données................... 59
iii
2.3.2 Règles de description.............................................................. 61
2.3.3 Etape 1 : Description des relations .........................................63
2.3.4 Etape 2 : Description des attributs .......................................... 65
2.3.5 Etape 3 : Description des liens entre les relations ..................66
2.3.6 Conclusion .............................................................................. 67
2.4 Le schéma médiateur ...................................................................... 68
2.4.1 Le document XML contenant le schéma médiateur ............... 68
2.4.2 Le document XML contenant les règles de mapping ............. 68
2.4.2.1 Les types des règles de mapping......................................... 69
2.4.2.2 Les cardinalités de règles de mapping ................................ 70
2.4.2.3 Fonction de conversion....................................................... 71
2.4.3 Règles de génération du schéma médiateur............................ 71
2.4.4 Génération du schéma médiateur............................................ 74
2.4.4.1 Génération des relations du schéma médiateur................... 75
2.4.4.2 Génération des attributs du schéma médiateur ................... 77
2.4.4.3 Insertion des clés primaires des relations du schéma
médiateur ............................................................................................ 78
2.4.4.4 Optimisation du schéma médiateur..................................... 78
2.4.4.5 Traitement des liens entre les relations du schéma médiateur
............................................................................................ 79
2.4.4.6 Conclusion .......................................................................... 80
2.5 Modification du schéma médiateur................................................. 81
2.5.1 Processus d’insertion .............................................................. 81
2.5.1.1 Ajout d’une relation dans un schéma source ...................... 81
2.5.1.2 Ajout d’un attribut dans une relation du schéma source..... 82
2.5.1.3 Ajout d’une clé primaire dans une relation du schéma source
............................................................................................ 83
2.5.2 Processus de suppression........................................................ 84
2.5.2.1 Suppression d’une relation dans un schéma source............ 84
2.5.2.2 Suppression d’un attribut dans un schéma source .............. 85
3 Conclusion du chapitre ........................................................................... 86
Chapitre IV : Médiation et protection............................................................. 88
1 Introduction............................................................................................. 89
2 Médiateur................................................................................................ 89
2.1 Introduction..................................................................................... 89
2.2 Architecture logicielle..................................................................... 89
2.3 Traitement des requêtes .................................................................. 91
2.3.1 Décomposition des requêtes ................................................... 91
2.3.2 Traduction de la requête .........................................................91
2.3.3 Exécution d’une requête ......................................................... 91
2.3.4 Interaction médiateur – ontologie de valeurs.......................... 92
2.4 Algorithme de traitement de la requête........................................... 93
2.5 Conclusion ...................................................................................... 97
3 Contrôle de données................................................................................ 98
3.1 Introduction..................................................................................... 98
iv
3.2 Utilisation de DRUID comme système d’entrée pour le médiateur98
3.2.1 Saisie des données avec DRUID ............................................99
3.2.2 Consultation des données avec DRUID................................ 100
3.3 Génération des DTDs.................................................................... 102
3.3.1 Génération des DTD SSD..................................................... 102
3.3.1.1 Présentation des DTDs SSD ............................................. 102
3.3.1.2 Le processus de génération des DTDs SSD...................... 104
3.3.1.3 L’algorithme de génération des DTD SSD:..................... 106
3.3.2 Génération des DTD WSD ................................................... 109
3.3.2.1 Présentation des DTDs WSD............................................ 109
3.3.2.2 Le processus de génération des DTDs WSD.................... 110
3.3.2.3 L’algorithme de génération de la DTD WSD................... 111
3.3.3 Filtrage des DTDs................................................................. 111
3.3.3.1 Problématique ................................................................... 111
3.3.3.2 Proposition........................................................................ 112
3.3.3.3 Algorithme de filtrage des DTDs...................................... 113
3.3.4 Modification du document.................................................... 115
3.3.4.1 Filtrage d’un document en consultation............................ 115
3.3.4.2 Algorithme de filtrage....................................................... 116
3.4 Conclusion .................................................................................... 118
4 Conclusion du chapitre ......................................................................... 119
Chapitre V : Prototypes................................................................................. 120
1 Introduction........................................................................................... 121
2 Architecture globale.............................................................................. 122
2.1.1 Générateur de schéma médiateur.......................................... 123
2.1.2 Médiateur.............................................................................. 123
2.1.3 Contrôle de données.............................................................. 123
2.1.4 DRUID.................................................................................. 124
3 Vue unifiée............................................................................................ 124
3.1 Introduction................................................................................... 124
3.2 L’ontologie de structure................................................................ 125
3.3 L’ontologie de valeurs .................................................................. 127
3.4 Présentation du prototype 1 : Descripteur de bases de données ... 129
3.4.1 Diagramme des classes du descripteur de base de données.. 129
3.4.2 Diagramme de séquence du processus de description.......... 131
3.4.2.1 Description de la relation.................................................. 131
3.4.2.2 Description d’un attribut................................................... 132
3.4.3 Exemple: Description d’une relation .................................... 133
3.5 Présentation du prototype 2 : Générateur de schéma médiateur... 135
3.5.1 Diagramme des classes du générateur de schéma médiateur 135
3.5.2 Diagramme des séquences : Génération des relations.......... 137
3.5.3 Diagramme de séquence : Génération des attributs.............. 138
3.5.4 Exemple: Génération du schéma médiateur ......................... 138
4 Médiateur.............................................................................................. 141
4.1 Présentation du prototype 3 : Médiateur....................................... 141
1 / 267 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !