Telechargé par abir oumghar

support cours 2ème partie 2021

publicité
14/01/2021
Construction de Thésaurus et
Ontologies
2ème CI
2020-2021
Mme EL YAMANI
Signe selon Peirce
Ontologie ou Ontologies
Nom féminin.
Origine étymologique : du grec
Ontos = être
Logia = discours (langage+raison)
Point de vue sémiotique sur l’ontologie : avec ses trois dimensions (syntaxe,
sémantique, et pragmatique)
Sémiotique : étudie le processus de signification c'est-à-dire la production,
la codification et la communication de signes.
La sémiotique se fonde sur le concept de signe, qui se distingue selon différents niveaux
de perception du plus vague au plus distingué, priméité, secondéité, tercéité
respectivement nommés représentamen, objet, et interprétant.
Ontologie : définition
• Le terme Ontologie est emprunté à la philosophie.
• Il est défini par Aristote par « la science de l'être ». La discipline
analyse et représente les propriétés des êtres et leur existence.
• Non seulement le sens du terme a évolué dans le domaine de
la philosophie, d'autres sciences se le sont par ailleurs
approprié : logique, informatique, sciences du langage, sciences
de l'information, etc.
• Il est actuellement fortement corrélé au web sémantique qui
manipule des concepts ou toutes sortes de données
informatiques structurées.
1
14/01/2021
Ontologie : définition
Ontologie
Une ontologie (en informatique, ne pas confondre avec le concept
philosophique) est :
 une taxinomie ou un thésaurus
 plus une représentation dans un langage formalisé doté d'une sémantique
formelle, permettant de faire des inférences sur les termes
• La définition informatique est très fréquemment associée à Gruber qui affirme :
« Une ontologie est une spécification explicite d’une conceptualisation ».
• Une Ontologie est une spécification formelle et explicite d’une
conceptualisation partagée d’un domaine de connaissance
 Conceptualisation : une certaine vue du monde par rapport à un domaine,
souvent conçue comme un ensemble de concepts, leur définition, leurs
interrelations. Choix quand à la manière de décrire un domaine.
 Explicite : définition explicite des types de concepts utilisés et des contraintes
sur leur usage.
 Formelle : compréhension par la machine.
 Partagée : consensus, connaissances acceptées par un groupe.
Ontologie : définition
Dameron propose une définition de l'ontologie en quatre points :
 Ontologie comme étude de ce qui est : « nature et organisation de la
réalité » ;
 Ontologie comme (représentation d'une) conceptualisation :
conceptualisation des objets, de leurs propriétés et des relations qu'ils
entretiennent ainsi que conceptualisation relative à un consensus ;
 Ontologie formelle : nécessitant une représentation rigoureuse, selon des
standards de description ;
 Différents niveaux d'ontologie : ontologie d'application, de domaine,
générales et supérieures.
O
Ontologie : définition
La définition d’ontologie se trouve à l’interface entre la philosophie et
l’informatique :
Pour la première il s’agit de la science de ce qui est en tout domaine de la
réalité et de ce qui pourrait être.
Pour la seconde, il s’agit d’une spécification de la conceptualisation d’un
domaine donné.
Dans les systèmes d’information, l’ontologie est fondée sur trois éléments
fondamentaux :
• entités (choses ou objets),
• attributs (caractéristiques des objets) et
• relations (d’une part entre objet et attributs, d’autre part entre objets de même
nature ou de nature différentes et entre attributs).
2
14/01/2021
Ontologie : définition
Ontologie : définition
• En informatique, l'ontologie s'inscrit dans le cadre de
l'intelligence artificielle où les raisonnements humains sont
simulés par une machine.
• Le terme ontologie emprunte à la philosophie la démarche de
définition, de formalisation, d'identification ou encore de
représentation des connaissances.
• Notons qu'en philosophie les ontologies se veulent absolues
alors qu'en informatique elles dépendent d'un consensus.
Plus simplement, la définition du dictionnaire de l’information (Colin, 2e
éd, 2006) stipule est que :
« une ontologie est la représentation des connaissances terminologiques
relatives à un domaine, agréée par une communauté de personnes et
sensée en faciliter le partage. Une ontologie a une taxonomie et un
ensemble de règles d’inférence (raffinement, décomposition, prédication,
relativité, similarité) ».
Les ontologies s’inscrivent dans la continuité des travaux sur la
représentation des connaissances, comme les réseaux sémantiques ou les
cartes conceptuelles.
10
Composantes d’une Ontologie
Objectifs d’une Ontologie
Les composantes d’une ontologie sont :
une ou plusieurs taxinomies ordonnées en classes et sous-classes,
composées d’instances représentant les individus ou les objets (projets,
personnes, produits,…) ;
les types d’attributs ou propriétés qui peuvent être attachés à ces objets ;
les types de relations entre les concepts d’une taxinomie (est employé par, se
situe sur, …) ;
des axiomes ou des règles d’inférence permettant de définir les propriétés de
ces relations (références, description, adresse, taille, …).
Une ontologie est donc une conceptualisation calculable d'un domaine,
qui vise deux objectifs :
Expliciter une compréhension commune de notions ou concepts d'un
domaine par les hommes (expression d'un consensus dans une communauté,
ce sur quoi tout le monde est d'accord);
 Permettre une opérationnalisation des concepts par les machines
(formalisation permettant des inférences conformes à la sémantique des
concepts)
11
3
14/01/2021
Réseaux sémantiques ?
Exemple de réseaux sémantiques
ontologie :
Exemple
réseau de transport
transporter
transporter
personne
transporter
est_un(e)
Véhicule
est_un(e)
périssable
voiture
marchandise
est
camion
transporter
comporte
non
périssable
transporter
4
14/01/2021
Relations sémantiques
Concept_source
Relation_sem
Concept_cible
véhicule
est-un(e)
voiture
À expliciter une relation sémantique
Relation_sem
Primitive
Objectif
est-un(e)
Is_a(X)
X
Interprétation
Définition
véhicule
est-un(e)
camion
voiture
transporter
personne
transporter
Trans(X,Y)
X, Y
Relation binaire
camion
transporter
voiture
comporte
Comp(X,Y)
X, Y
Relation
d’appartenance
camion
transporter
personne
camion
transporter
marchandise
camion
transporter
camion
marchandise
est-un(e)
périssable
marchandise
est-un(e)
non périssable
Inférence …
• On peut également expliciter : primitive, objectif, interprétation
ou
• Compléter par des règles programmées
Inférence?
• L'inférence désigne les actions de mise en relation d'un ensemble de
propositions, aboutissant à une démonstration de vérité, de fausseté ou de
probabilité, sous la forme d'une proposition appelée conclusion.
On distingue notamment les inférences déductives, inductives et abductives
Une manière simple de comprendre ce que sont la déduction, l’induction et
l’abduction comme formes de raisonnement est de reprendre les exemples
donnés par Peirce.
5
14/01/2021
Editeurs d’ontologies : exemple
Outils/Langages
• KIF : Knowledge Interchange Format
• Ontolingua
• Logiques de description (orientée classification)
• Graphe conceptuel (support)
• RDF Schema
• DAML OIL
• OWL
Exemples
Web sémantique
• Ontolingua : www-ksl.stanford.edu/sns.html
• WordNet : Ontologie de la langue naturelle
• Enterprise Ontology
• Kactus : ingénierie
• UMLS : Unified Medical Language System
• Cyc
• EngMath, PhysSys
• O’Comma
6
14/01/2021
Le Web sémantique
Relation Web Sémantique /
Ontologies
Web sémantique vs web actuel
Le web sémantique : un langage pour les
machines
7
14/01/2021
Le processus de tagging sémantique
Les couches du web sémantique
Ontologies et OWL
Ontologies et OWL
• Hiérarchie des classes
« Camion » sous-classe de « moyen transport »
• Hiérarchie des
8
14/01/2021
Ontologies et OWL
Ontologies et OWL
Ontologies et OWL
9
14/01/2021
Base de connaissances en OWL
Règles
Exemple Linked Open Data : LOD
Plusieurs Applications
Linked Open Data (LOD)
 GoodRelations
 Open Graph Protocol (Facebook)
 Drupal 7
 FOAF
 BBC
10
14/01/2021
Concepts à retenir
Concept/ Intensions et extensions
• Le terme «ontologie» est un emprunt à la philosophie.
• Il désigne (Petit ROBERT, 1979) : la partie de la métaphysique qui
s’applique à l’être en tant qu’être, indépendamment de ses déterminations.
Notion : Toute entité de pensée; utilisée pour structurer la connaissance et la
perception du monde extérieur et n’est pas forcément exprimée.
Concept : Notion exprimée en général par un terme ou par un symbole littéral ou
autre. Le concept représente un ensemble d’objets, d’êtres, et leurs propriétés
communes.
Extension d’un concept : ensemble des êtres qu’un concept englobe.
Compréhension/intension d’un concept :
L’ensemble des attributs, propriétés communes, êtres qu’un concept englobe
Le Concept
Donnée / Information / Connaissance
• Donnée (data)
Un concept est une entité structurée. Il peut se définie comme une
entité composée de trois éléments distinctifs :
 Le(s) terme(s) exprimant le concept en langue
 La signification du concept, appelé également « notion » ou « intension » du concept
 Le(s) objet(s) dénotés par le concept, appelé(s) également « réalisation » ou
« extension » du concept.
Elément fondamental servant de base à un raisonnement, à une recherche. (ex : _ _ _)
• Information (information)
Elément de connaissance susceptible d'être codé pour être conservé, traité ou
communiqué.
Représentation conventionnelle d'un information sous une forme convenant à son
traitement par ordinateur. (ex: SOS)
• Connaissance (Knowledge)
Ce que l'on a appris par l'étude ou la pratique. (ex : En cas d'alerte, ...).
la connaissance inclut la généralisation et l'abstraction d'un grand volume de données
[Wiederhold, 1986].
[Wiederhold, 1986]: "Knowledge versus data". In "On knowledge base management systems". Springer-Verlag. Pp 77-82. 1986.
11
14/01/2021
Connaissance / Raisonnement
• Connaissance :

de donnée et information.
 Nouvelles connaissances peuvent être créées depuis des
connaissances à l’aide des raisonnements.
• Raisonnement :
 Penser de manière cohérente et logique
 Inférence logique
 Le processus de création de connaissances implicites depuis des
connaissances explicites.
Les types d’ontologies
Exemple de connaissances
Heure = 8h32 + RDV à 8h30 + 8h32 > 8h30 =
" J'ai un rendez vous prévu à 8h30. Je suis en
retard. Il faut que je cours. "
Façon dont sont utilisées les données et
informations
Connaissances = informations assimilée et
interprétées+ possibilité de mise en action de
l'information interprétée.
Les Types d’Ontologies
12
14/01/2021
Les Types d’Ontologies
• Les ontologies du domaine : elles sont appelées de la sorte parce qu’elles
expriment des conceptualisations spécifiques à un domaine. Elles rendent
compte du vocabulaire d’un domaine spécifique au travers de concepts et de
relations qui modélisent les principales activités, les théories et les principes
de base du domaine en question. La plupart des ontologies existantes sont
des ontologies du domaine, elles sont réutilisables pour plusieurs
applications concernant le domaine pour lequel elles ont été créées car elles
ont été conçues de façon aussi indépendante que possible du type de
manipulations qui vont être opérées sur ces connaissances.
Les Types d’Ontologies
• Les ontologies génériques ou ontologies de haut niveau (upper ontology) :
Elles expriment des conceptualisations valables dans différents domaines de
valeur relativement générale comme les notions d’objets, de propriété, de
valeur, d’état, ou encore des concepts de temps, d’espace d’événements, elles
sont prévues pour être utilisées dans des situations diverses, et pour servir
une large communauté d’utilisateurs.
Les Types d’Ontologies
• Les ontologies applicatives (ou ontologies d’application) : Sont les
ontologies les plus spécifiques, elles contiennent les connaissances requises
pour une application particulière et ne sont pas réutilisables. Elles peuvent
en outre inclure une ontologie de domaine.
Les Types d’Ontologies
• Les ontologies de représentation : Ce type d’ontologies regroupe les
concepts utilisés pour formaliser les connaissances. Parmi les ontologies de
représentation, on trouve des ontologies qui vont décrire les notions
utilisées dans toutes les ontologies pour spécifier les connaissances, telles
que les substances, les concepts, les relations etc. Par exemple, la « FrameOntology » est une ontologie de représentation. Elle définit de manière
formelle les concepts utilisés principalement dans les langages à base de
frames : classes, sous-classes, attributs, valeurs, relations et axiomes. Les
ontologies de représentation sont indépendantes des différents domaines
de connaissances, puisqu’elles décrivent des primitives cognitives
communes aux différents domaines.
13
14/01/2021
Classification des ontologies
Guarino propose une classification des ontologies selon quatre niveaux :
 les ontologies de haut niveau pour décrire des concepts très généraux,
 les ontologies de domaine qui décrivent le vocabulaire relatif à un domaine
générique.
 les ontologies de tâches qui décrivent le vocabulaire concernant une tâche
générique (ex. : enseigner, diagnostiquer…), notamment en spécialisant les
concepts d’une ontologie de haut niveau. On parle aussi d’ « ontologie du
domaine de la tâche », et
 les ontologies d’application pour décrire des concepts dépendants à la fois
d’un domaine et d’une activité.
Classification des ontologies : Exp le domaine
médicale
Classification des Ontologies
Ces concepts correspondent souvent aux rôles joués par les
entités du domaine lors de l’exécution d’une certaine activité. Il s’agit
donc ici de mettre en relation les concepts d’un domaine et les
concepts liés à une tâche particulière, de manière à en décrire
l’exécution (ex. : apprendre les statistiques, effectuer des recherches
dans le domaine de l’astronomie, enseigner la médecine, etc.).
Classification des Ontologies
Une ontologie est classiquement découpée en 3 niveaux :
1) la « top-ontologie », que l’on devrait plus précisément appeler « ontologie
formelle » pour reprendre l’appellation des philosophes (Bachimont, 2004). C’est le
niveau le plus abstrait structurant les connaissances de haut niveau avec des
catégories dont l’organisation dépend de réflexions philosophiques. La question de
l’unicité ou non de cette ontologie est un débat que nous n’évoquerons pas ;
2) la core-ontologie, fournissant les concepts structurant du domaine et décrivant les
relations entre ces concepts – en médecine, on y trouve des concepts de diagnostic,
signe, structure anatomique et des relations comme celles liées à la localisation
d’une pathologie sur une structure anatomique ;
3) l’ontologie du domaine, c’est-à-dire les concepts du domaine tels qu’ils sont
manipulés par les professionnels – ici de santé. Le troisième et dernier niveau est
celui que l’on construit avec les outils de TAL puisque l’on analyse les documents
produits en activité avec ceux-ci. Le second niveau correspond ici à la façon dont est
décrite la médecine
14
14/01/2021
Rôles des ontologies
Les rôles et avantages d’une
ontologie
Définir /Fournir une sémantique formelle (descriptive) pour
l’information permettant son exploitation par un ordinateur ;
 Définir /Fournir une sémantique interprétative d’un monde réel
fondée sur un consensus et permettant de lier le contenu
exploitable par la machine à sa signification pour les humains.
Cycle de vie d’une Ontologie
Avantages des Ontologies
 Réutilisation :
 Créer et conserver des bases de connaissances réutilisables ;
 Assembler des bases de connaissances à partir de modules
réutilisables.
Standardisation
Possibilité de promouvoir une nouvelle approche de
conception des systèmes d’information … ; Traduction …
 Partage de la connaissance et communication
 Assurer l’interopérabilité entre les systèmes ;
 Permettre l’échange entre les systèmes.
15
14/01/2021
Cycle de vie d’une Ontologie
Le cycle de vie des ontologies est inspiré du génie logiciel. Il comprend plusieurs
étapes :
une étape initiale d’évaluation des besoins,
une étape de construction,
une étape de diffusion,
et une étape d’utilisation.
Après chaque utilisation significative, l’ontologie et les besoins sont réévalués et
l’ontologie peut être étendue et, si nécessaire, en partie reconstruite.
La phase de construction peut être décomposée en 3 étapes :
 La conceptualisation,
 L’ontologisation,
 et opérationnalisation.
Cycle de vie d’une Ontologie
L’étape d’ontologisation peut être complétée d’une étape d’intégration au cours de
laquelle une ou plusieurs ontologies vont être importées dans l’ontologie à construire.
La conceptualisation : identification des connaissances contenues dans un
corpus représentatif du domaine. ce travail doit être mené par un expert
du domaine, assisté par un ingénieur de la connaissance.
L’ontologisation : formalisation, autant que possible, du modèle
conceptuel obtenu à l’étape précédente. Ce travail doit être mené par
l’ingénieur de la connaissance assisté de l’expert du domaine.
L’opérationnalisation : transcription de l’ontologie dans un langage formel
et opérationnel de représentation de connaissances. Ce travail doit être
mené par l’ingénieur de la connaissance.
Cycle de vie d’une Ontologie
• Il est à noter que ce processus n’est pas linéaire et que de nombreux allers retours sont nécessaires pour bâtir une ontologie opérationnelle adaptée
aux besoins.
• Ce modèle de construction d’ontologie est ascendant, c’est -à-dire que l’on
part des connaissances à représenter, pour obtenir à une représentation
formelle .
• Une construction descendante est possible, qui consiste à choisir un modèle
opérationnel de représentation, en fonction de l’objectif d’utilisation de
l’ontologie, puis à instancier ce modèle avec les connaissances du domaine.
16
14/01/2021
Composantes d’une ontologie
La connaissance dans les ontologies est principalement formalisée en utilisant
les cinq types de composants :
Concepts (ou classes) : appelés également termes ou classe de l’ontologie,
correspondent aux abstractions pertinentes d’un segment de la réalité (le domaine du
problème) retenus en fonction des objectifs qu’on se donne et de l’application
envisagée pour l’ontologie ;
Relations (ou propriétés) : Les relations traduisent les associations (pertinentes)
existant entre les concepts présents dans le segment analysé de la réalité. Ces
relations incluent les associations suivantes :
o Sous classes de (généralisation-spécialisation) ;
o Partie de (agrégation ou composition) ;
o Associe à ;
o Instance de, etc.
Composantes d’une ontologie
• La plupart des ontologies sont structurées au moyen de la relation “est un” de
subsomption, ou de généralisation entre concepts. La relation Tout-Parties
“est composé de” est également utilisée.
• Certaines ontologies sont denses, contenant de nombreux axiomes
contraignant le sens des termes. D’autres se résument à une taxinomie de
concepts donnés sans définition.
• La taille des ontologies varie de quelques dizaines de concepts à plusieurs
dizaines de milliers de concepts.
• Les ontologies peuvent être informelles, formelles ou opérationnelles. Dans ce
dernier cas, elles sont spécifiées dans un langage de programmation.
Composantes d’une ontologie
Fonctions : Les fonctions constituent des cas particuliers de relations, dans laquelle
un élément de la relation, (le nième) est défini en fonction des N-1 éléments
précédents ;
Axiomes (ou règles) : Les axiomes constituent des assertions, acceptées
comme vraies, à propos des abstractions du domaine traduites par
l’ontologie ;
 Instances (ou individus) : Les instances constituant la définition extensionnelle
de l’ontologie ; ces objets véhiculent les connaissances (statiques, factuelles) à propos
du domaine du problème.
Introduction/Conclusion
• Les outils d’accès à l’information, Thésaurus et Ontologies suivent les
mêmes méthodes et optent pour les mêmes techniques.
• Les Ontologies peuvent aller plus loin et permettent d’être plus précis dans
la description des objets des domaines de connaissances abordées.
• Leur spécificité est aussi de pouvoir définir des règles interprétables par des
machines. Ce qui les rend opérationnelles de manière transparente pour
l’utilisateur.
• Dans un environnement donné, l’ontologie permet de gérer la terminologie
métier de manière très spécifique à chaque activité même le jargon
technique (métier) y est représenté. On est très libre du moment que l’on
est cohérent et que l’on répond aux besoins des utilisateurs.
17
14/01/2021
Classes (Concepts)
Instances individuelles des classes constituent une
base de connaissances
18
Téléchargement