14/01/2021 Construction de Thésaurus et Ontologies 2ème CI 2020-2021 Mme EL YAMANI Signe selon Peirce Ontologie ou Ontologies Nom féminin. Origine étymologique : du grec Ontos = être Logia = discours (langage+raison) Point de vue sémiotique sur l’ontologie : avec ses trois dimensions (syntaxe, sémantique, et pragmatique) Sémiotique : étudie le processus de signification c'est-à-dire la production, la codification et la communication de signes. La sémiotique se fonde sur le concept de signe, qui se distingue selon différents niveaux de perception du plus vague au plus distingué, priméité, secondéité, tercéité respectivement nommés représentamen, objet, et interprétant. Ontologie : définition • Le terme Ontologie est emprunté à la philosophie. • Il est défini par Aristote par « la science de l'être ». La discipline analyse et représente les propriétés des êtres et leur existence. • Non seulement le sens du terme a évolué dans le domaine de la philosophie, d'autres sciences se le sont par ailleurs approprié : logique, informatique, sciences du langage, sciences de l'information, etc. • Il est actuellement fortement corrélé au web sémantique qui manipule des concepts ou toutes sortes de données informatiques structurées. 1 14/01/2021 Ontologie : définition Ontologie Une ontologie (en informatique, ne pas confondre avec le concept philosophique) est : une taxinomie ou un thésaurus plus une représentation dans un langage formalisé doté d'une sémantique formelle, permettant de faire des inférences sur les termes • La définition informatique est très fréquemment associée à Gruber qui affirme : « Une ontologie est une spécification explicite d’une conceptualisation ». • Une Ontologie est une spécification formelle et explicite d’une conceptualisation partagée d’un domaine de connaissance Conceptualisation : une certaine vue du monde par rapport à un domaine, souvent conçue comme un ensemble de concepts, leur définition, leurs interrelations. Choix quand à la manière de décrire un domaine. Explicite : définition explicite des types de concepts utilisés et des contraintes sur leur usage. Formelle : compréhension par la machine. Partagée : consensus, connaissances acceptées par un groupe. Ontologie : définition Dameron propose une définition de l'ontologie en quatre points : Ontologie comme étude de ce qui est : « nature et organisation de la réalité » ; Ontologie comme (représentation d'une) conceptualisation : conceptualisation des objets, de leurs propriétés et des relations qu'ils entretiennent ainsi que conceptualisation relative à un consensus ; Ontologie formelle : nécessitant une représentation rigoureuse, selon des standards de description ; Différents niveaux d'ontologie : ontologie d'application, de domaine, générales et supérieures. O Ontologie : définition La définition d’ontologie se trouve à l’interface entre la philosophie et l’informatique : Pour la première il s’agit de la science de ce qui est en tout domaine de la réalité et de ce qui pourrait être. Pour la seconde, il s’agit d’une spécification de la conceptualisation d’un domaine donné. Dans les systèmes d’information, l’ontologie est fondée sur trois éléments fondamentaux : • entités (choses ou objets), • attributs (caractéristiques des objets) et • relations (d’une part entre objet et attributs, d’autre part entre objets de même nature ou de nature différentes et entre attributs). 2 14/01/2021 Ontologie : définition Ontologie : définition • En informatique, l'ontologie s'inscrit dans le cadre de l'intelligence artificielle où les raisonnements humains sont simulés par une machine. • Le terme ontologie emprunte à la philosophie la démarche de définition, de formalisation, d'identification ou encore de représentation des connaissances. • Notons qu'en philosophie les ontologies se veulent absolues alors qu'en informatique elles dépendent d'un consensus. Plus simplement, la définition du dictionnaire de l’information (Colin, 2e éd, 2006) stipule est que : « une ontologie est la représentation des connaissances terminologiques relatives à un domaine, agréée par une communauté de personnes et sensée en faciliter le partage. Une ontologie a une taxonomie et un ensemble de règles d’inférence (raffinement, décomposition, prédication, relativité, similarité) ». Les ontologies s’inscrivent dans la continuité des travaux sur la représentation des connaissances, comme les réseaux sémantiques ou les cartes conceptuelles. 10 Composantes d’une Ontologie Objectifs d’une Ontologie Les composantes d’une ontologie sont : une ou plusieurs taxinomies ordonnées en classes et sous-classes, composées d’instances représentant les individus ou les objets (projets, personnes, produits,…) ; les types d’attributs ou propriétés qui peuvent être attachés à ces objets ; les types de relations entre les concepts d’une taxinomie (est employé par, se situe sur, …) ; des axiomes ou des règles d’inférence permettant de définir les propriétés de ces relations (références, description, adresse, taille, …). Une ontologie est donc une conceptualisation calculable d'un domaine, qui vise deux objectifs : Expliciter une compréhension commune de notions ou concepts d'un domaine par les hommes (expression d'un consensus dans une communauté, ce sur quoi tout le monde est d'accord); Permettre une opérationnalisation des concepts par les machines (formalisation permettant des inférences conformes à la sémantique des concepts) 11 3 14/01/2021 Réseaux sémantiques ? Exemple de réseaux sémantiques ontologie : Exemple réseau de transport transporter transporter personne transporter est_un(e) Véhicule est_un(e) périssable voiture marchandise est camion transporter comporte non périssable transporter 4 14/01/2021 Relations sémantiques Concept_source Relation_sem Concept_cible véhicule est-un(e) voiture À expliciter une relation sémantique Relation_sem Primitive Objectif est-un(e) Is_a(X) X Interprétation Définition véhicule est-un(e) camion voiture transporter personne transporter Trans(X,Y) X, Y Relation binaire camion transporter voiture comporte Comp(X,Y) X, Y Relation d’appartenance camion transporter personne camion transporter marchandise camion transporter camion marchandise est-un(e) périssable marchandise est-un(e) non périssable Inférence … • On peut également expliciter : primitive, objectif, interprétation ou • Compléter par des règles programmées Inférence? • L'inférence désigne les actions de mise en relation d'un ensemble de propositions, aboutissant à une démonstration de vérité, de fausseté ou de probabilité, sous la forme d'une proposition appelée conclusion. On distingue notamment les inférences déductives, inductives et abductives Une manière simple de comprendre ce que sont la déduction, l’induction et l’abduction comme formes de raisonnement est de reprendre les exemples donnés par Peirce. 5 14/01/2021 Editeurs d’ontologies : exemple Outils/Langages • KIF : Knowledge Interchange Format • Ontolingua • Logiques de description (orientée classification) • Graphe conceptuel (support) • RDF Schema • DAML OIL • OWL Exemples Web sémantique • Ontolingua : www-ksl.stanford.edu/sns.html • WordNet : Ontologie de la langue naturelle • Enterprise Ontology • Kactus : ingénierie • UMLS : Unified Medical Language System • Cyc • EngMath, PhysSys • O’Comma 6 14/01/2021 Le Web sémantique Relation Web Sémantique / Ontologies Web sémantique vs web actuel Le web sémantique : un langage pour les machines 7 14/01/2021 Le processus de tagging sémantique Les couches du web sémantique Ontologies et OWL Ontologies et OWL • Hiérarchie des classes « Camion » sous-classe de « moyen transport » • Hiérarchie des 8 14/01/2021 Ontologies et OWL Ontologies et OWL Ontologies et OWL 9 14/01/2021 Base de connaissances en OWL Règles Exemple Linked Open Data : LOD Plusieurs Applications Linked Open Data (LOD) GoodRelations Open Graph Protocol (Facebook) Drupal 7 FOAF BBC 10 14/01/2021 Concepts à retenir Concept/ Intensions et extensions • Le terme «ontologie» est un emprunt à la philosophie. • Il désigne (Petit ROBERT, 1979) : la partie de la métaphysique qui s’applique à l’être en tant qu’être, indépendamment de ses déterminations. Notion : Toute entité de pensée; utilisée pour structurer la connaissance et la perception du monde extérieur et n’est pas forcément exprimée. Concept : Notion exprimée en général par un terme ou par un symbole littéral ou autre. Le concept représente un ensemble d’objets, d’êtres, et leurs propriétés communes. Extension d’un concept : ensemble des êtres qu’un concept englobe. Compréhension/intension d’un concept : L’ensemble des attributs, propriétés communes, êtres qu’un concept englobe Le Concept Donnée / Information / Connaissance • Donnée (data) Un concept est une entité structurée. Il peut se définie comme une entité composée de trois éléments distinctifs : Le(s) terme(s) exprimant le concept en langue La signification du concept, appelé également « notion » ou « intension » du concept Le(s) objet(s) dénotés par le concept, appelé(s) également « réalisation » ou « extension » du concept. Elément fondamental servant de base à un raisonnement, à une recherche. (ex : _ _ _) • Information (information) Elément de connaissance susceptible d'être codé pour être conservé, traité ou communiqué. Représentation conventionnelle d'un information sous une forme convenant à son traitement par ordinateur. (ex: SOS) • Connaissance (Knowledge) Ce que l'on a appris par l'étude ou la pratique. (ex : En cas d'alerte, ...). la connaissance inclut la généralisation et l'abstraction d'un grand volume de données [Wiederhold, 1986]. [Wiederhold, 1986]: "Knowledge versus data". In "On knowledge base management systems". Springer-Verlag. Pp 77-82. 1986. 11 14/01/2021 Connaissance / Raisonnement • Connaissance : de donnée et information. Nouvelles connaissances peuvent être créées depuis des connaissances à l’aide des raisonnements. • Raisonnement : Penser de manière cohérente et logique Inférence logique Le processus de création de connaissances implicites depuis des connaissances explicites. Les types d’ontologies Exemple de connaissances Heure = 8h32 + RDV à 8h30 + 8h32 > 8h30 = " J'ai un rendez vous prévu à 8h30. Je suis en retard. Il faut que je cours. " Façon dont sont utilisées les données et informations Connaissances = informations assimilée et interprétées+ possibilité de mise en action de l'information interprétée. Les Types d’Ontologies 12 14/01/2021 Les Types d’Ontologies • Les ontologies du domaine : elles sont appelées de la sorte parce qu’elles expriment des conceptualisations spécifiques à un domaine. Elles rendent compte du vocabulaire d’un domaine spécifique au travers de concepts et de relations qui modélisent les principales activités, les théories et les principes de base du domaine en question. La plupart des ontologies existantes sont des ontologies du domaine, elles sont réutilisables pour plusieurs applications concernant le domaine pour lequel elles ont été créées car elles ont été conçues de façon aussi indépendante que possible du type de manipulations qui vont être opérées sur ces connaissances. Les Types d’Ontologies • Les ontologies génériques ou ontologies de haut niveau (upper ontology) : Elles expriment des conceptualisations valables dans différents domaines de valeur relativement générale comme les notions d’objets, de propriété, de valeur, d’état, ou encore des concepts de temps, d’espace d’événements, elles sont prévues pour être utilisées dans des situations diverses, et pour servir une large communauté d’utilisateurs. Les Types d’Ontologies • Les ontologies applicatives (ou ontologies d’application) : Sont les ontologies les plus spécifiques, elles contiennent les connaissances requises pour une application particulière et ne sont pas réutilisables. Elles peuvent en outre inclure une ontologie de domaine. Les Types d’Ontologies • Les ontologies de représentation : Ce type d’ontologies regroupe les concepts utilisés pour formaliser les connaissances. Parmi les ontologies de représentation, on trouve des ontologies qui vont décrire les notions utilisées dans toutes les ontologies pour spécifier les connaissances, telles que les substances, les concepts, les relations etc. Par exemple, la « FrameOntology » est une ontologie de représentation. Elle définit de manière formelle les concepts utilisés principalement dans les langages à base de frames : classes, sous-classes, attributs, valeurs, relations et axiomes. Les ontologies de représentation sont indépendantes des différents domaines de connaissances, puisqu’elles décrivent des primitives cognitives communes aux différents domaines. 13 14/01/2021 Classification des ontologies Guarino propose une classification des ontologies selon quatre niveaux : les ontologies de haut niveau pour décrire des concepts très généraux, les ontologies de domaine qui décrivent le vocabulaire relatif à un domaine générique. les ontologies de tâches qui décrivent le vocabulaire concernant une tâche générique (ex. : enseigner, diagnostiquer…), notamment en spécialisant les concepts d’une ontologie de haut niveau. On parle aussi d’ « ontologie du domaine de la tâche », et les ontologies d’application pour décrire des concepts dépendants à la fois d’un domaine et d’une activité. Classification des ontologies : Exp le domaine médicale Classification des Ontologies Ces concepts correspondent souvent aux rôles joués par les entités du domaine lors de l’exécution d’une certaine activité. Il s’agit donc ici de mettre en relation les concepts d’un domaine et les concepts liés à une tâche particulière, de manière à en décrire l’exécution (ex. : apprendre les statistiques, effectuer des recherches dans le domaine de l’astronomie, enseigner la médecine, etc.). Classification des Ontologies Une ontologie est classiquement découpée en 3 niveaux : 1) la « top-ontologie », que l’on devrait plus précisément appeler « ontologie formelle » pour reprendre l’appellation des philosophes (Bachimont, 2004). C’est le niveau le plus abstrait structurant les connaissances de haut niveau avec des catégories dont l’organisation dépend de réflexions philosophiques. La question de l’unicité ou non de cette ontologie est un débat que nous n’évoquerons pas ; 2) la core-ontologie, fournissant les concepts structurant du domaine et décrivant les relations entre ces concepts – en médecine, on y trouve des concepts de diagnostic, signe, structure anatomique et des relations comme celles liées à la localisation d’une pathologie sur une structure anatomique ; 3) l’ontologie du domaine, c’est-à-dire les concepts du domaine tels qu’ils sont manipulés par les professionnels – ici de santé. Le troisième et dernier niveau est celui que l’on construit avec les outils de TAL puisque l’on analyse les documents produits en activité avec ceux-ci. Le second niveau correspond ici à la façon dont est décrite la médecine 14 14/01/2021 Rôles des ontologies Les rôles et avantages d’une ontologie Définir /Fournir une sémantique formelle (descriptive) pour l’information permettant son exploitation par un ordinateur ; Définir /Fournir une sémantique interprétative d’un monde réel fondée sur un consensus et permettant de lier le contenu exploitable par la machine à sa signification pour les humains. Cycle de vie d’une Ontologie Avantages des Ontologies Réutilisation : Créer et conserver des bases de connaissances réutilisables ; Assembler des bases de connaissances à partir de modules réutilisables. Standardisation Possibilité de promouvoir une nouvelle approche de conception des systèmes d’information … ; Traduction … Partage de la connaissance et communication Assurer l’interopérabilité entre les systèmes ; Permettre l’échange entre les systèmes. 15 14/01/2021 Cycle de vie d’une Ontologie Le cycle de vie des ontologies est inspiré du génie logiciel. Il comprend plusieurs étapes : une étape initiale d’évaluation des besoins, une étape de construction, une étape de diffusion, et une étape d’utilisation. Après chaque utilisation significative, l’ontologie et les besoins sont réévalués et l’ontologie peut être étendue et, si nécessaire, en partie reconstruite. La phase de construction peut être décomposée en 3 étapes : La conceptualisation, L’ontologisation, et opérationnalisation. Cycle de vie d’une Ontologie L’étape d’ontologisation peut être complétée d’une étape d’intégration au cours de laquelle une ou plusieurs ontologies vont être importées dans l’ontologie à construire. La conceptualisation : identification des connaissances contenues dans un corpus représentatif du domaine. ce travail doit être mené par un expert du domaine, assisté par un ingénieur de la connaissance. L’ontologisation : formalisation, autant que possible, du modèle conceptuel obtenu à l’étape précédente. Ce travail doit être mené par l’ingénieur de la connaissance assisté de l’expert du domaine. L’opérationnalisation : transcription de l’ontologie dans un langage formel et opérationnel de représentation de connaissances. Ce travail doit être mené par l’ingénieur de la connaissance. Cycle de vie d’une Ontologie • Il est à noter que ce processus n’est pas linéaire et que de nombreux allers retours sont nécessaires pour bâtir une ontologie opérationnelle adaptée aux besoins. • Ce modèle de construction d’ontologie est ascendant, c’est -à-dire que l’on part des connaissances à représenter, pour obtenir à une représentation formelle . • Une construction descendante est possible, qui consiste à choisir un modèle opérationnel de représentation, en fonction de l’objectif d’utilisation de l’ontologie, puis à instancier ce modèle avec les connaissances du domaine. 16 14/01/2021 Composantes d’une ontologie La connaissance dans les ontologies est principalement formalisée en utilisant les cinq types de composants : Concepts (ou classes) : appelés également termes ou classe de l’ontologie, correspondent aux abstractions pertinentes d’un segment de la réalité (le domaine du problème) retenus en fonction des objectifs qu’on se donne et de l’application envisagée pour l’ontologie ; Relations (ou propriétés) : Les relations traduisent les associations (pertinentes) existant entre les concepts présents dans le segment analysé de la réalité. Ces relations incluent les associations suivantes : o Sous classes de (généralisation-spécialisation) ; o Partie de (agrégation ou composition) ; o Associe à ; o Instance de, etc. Composantes d’une ontologie • La plupart des ontologies sont structurées au moyen de la relation “est un” de subsomption, ou de généralisation entre concepts. La relation Tout-Parties “est composé de” est également utilisée. • Certaines ontologies sont denses, contenant de nombreux axiomes contraignant le sens des termes. D’autres se résument à une taxinomie de concepts donnés sans définition. • La taille des ontologies varie de quelques dizaines de concepts à plusieurs dizaines de milliers de concepts. • Les ontologies peuvent être informelles, formelles ou opérationnelles. Dans ce dernier cas, elles sont spécifiées dans un langage de programmation. Composantes d’une ontologie Fonctions : Les fonctions constituent des cas particuliers de relations, dans laquelle un élément de la relation, (le nième) est défini en fonction des N-1 éléments précédents ; Axiomes (ou règles) : Les axiomes constituent des assertions, acceptées comme vraies, à propos des abstractions du domaine traduites par l’ontologie ; Instances (ou individus) : Les instances constituant la définition extensionnelle de l’ontologie ; ces objets véhiculent les connaissances (statiques, factuelles) à propos du domaine du problème. Introduction/Conclusion • Les outils d’accès à l’information, Thésaurus et Ontologies suivent les mêmes méthodes et optent pour les mêmes techniques. • Les Ontologies peuvent aller plus loin et permettent d’être plus précis dans la description des objets des domaines de connaissances abordées. • Leur spécificité est aussi de pouvoir définir des règles interprétables par des machines. Ce qui les rend opérationnelles de manière transparente pour l’utilisateur. • Dans un environnement donné, l’ontologie permet de gérer la terminologie métier de manière très spécifique à chaque activité même le jargon technique (métier) y est représenté. On est très libre du moment que l’on est cohérent et que l’on répond aux besoins des utilisateurs. 17 14/01/2021 Classes (Concepts) Instances individuelles des classes constituent une base de connaissances 18