Le protocole OAI et ses usages en bibliothèque
Qu’est-ce que le protocole OAI ?
L'OAI-PMH (Open Archives Initiative’s Protocol for Metadata Harvesting) ou
protocole OAI facilite l’échange de données entre des fournisseurs de données (par
exemple des bibliothèques ou des musées...) et un fournisseur de service (qui peut être
aussi une bibliothèque, un centre de documentation, un portail thématique ou local
désirant rassembler des données).
Ce protocole d’échange permet de créer, d’alimenter et de tenir à jour, par des
procédures automatisées, des réservoirs d’enregistrements qui signalent, décrivent et
rendent accessibles des documents, sans les dupliquer ni modifier leur localisation
d’origine.
Grâce au protocole OAI, une bibliothèque agissant en tant que fournisseur de
données a la possibilité d’offrir une visibilité accrue à ses documents, notamment à ses
publications électroniques ou à ses fonds spécialisés.
Réciproquement, en tant que fournisseur de service, une bibliothèque peut réaliser
une base de données ou un portail documentaire dans son domaine de spécialité ou sur
un thème quelconque, en collectant les données descriptives de ressources et documents
de tous types, accessibles sur l’Internet dans des entrepôts OAI.
Enfin, le protocole OAI permet de faire communiquer entre elles des bases de
données diverses et hétérogènes, et donc de réaliser des partenariats entre plusieurs
établissements que rapprochent leurs collections (complémentarité des fonds) ou leurs
publics (services culturels d’une même collectivité).
Sommaire
1) Un protocole simple et interopérable pour le partage des données..................................2
1.1 Histoire et objectif du protocole OAI............................................................................2
1.2 Principes fondamentaux du protocole OAI .................................................................2
1.2.1 Concepts mis en oeuvre.......................................................................................2
1.2.2 Principes organisationnels ..................................................................................3
1.2.3 Aspects techniques de la communication entre moissonneur et entrepôt...........5
2) Concevoir des services OAI en bibliothèque.....................................................................6
2.1 L’entrepôt OAI..............................................................................................................6
2.1.1 Quelques exemples d’entrepôts OAI...................................................................6
2.1.2 Le choix du format d’exposition des données......................................................7
2.1.3 Exposer en Dublin Core des données nativement structurées en format de
catalogage.....................................................................................................................8
2.1.4 La fourniture de données.....................................................................................8
2.2 Le moissonneur OAI....................................................................................................9
2.2.1 Quelques exemples de moissonneurs.................................................................9
2.2.2 Une moisson pour alimenter une base XML......................................................10
2.2.3 Implémenter un moissonneur OAI.....................................................................10
Conclusion............................................................................................................................11
Documents et liens utiles.....................................................................................................11
Réactions et comptes-rendus..............................................................................................12
Glossaire..............................................................................................................................13
1) Un protocole simple et interopérable pour le partage des
données
1.1 Histoire et objectif du protocole OAI
L’OAI-PMH a été élaboré par l’Open Archive Initiative l’issue de la Convention de
Santa Fe , 1999) pour faciliter la description et la diffusion des métadonnées d’articles
scientifiques disponibles en accès ouvert sur Internet, notamment dans des répertoires
de pré-publications. Il s’est vite révélé très adapté au partage de métadonnées de
documents scientifiques ou culturels, présentes dans des ensembles de ressources
homogènes ou hétérogènes, plus ou moins réparties. Après une phase d’expérimentation,
le protocole a atteint une certaine stabilité depuis juin 2002, avec sa version 2, considérée
comme la spécification définitive.
Ce protocole permet :
d’abattre des barrières du " web invisible " en rendant possible le signalement de
ressources non accessibles aux moteurs de recherche ;
de faciliter l’interopérabilité des ressources documentaires culturelles, sans
duplication ni déchargement des documents numériques primaires ;
de mettre à jour simplement et automatiquement des métadonnées collectées et
des liens, en répercutant les dernières modifications des réservoirs sources, sans
copier à nouveau l’intégralité des données (la charge n’en étant que plus légère
pour les serveurs) ;
d’encourager l’utilisation d’un format de description assez générique pour les
besoins transdisciplinaires, même les plus simples, sans interdire des spécifications
adaptées à des besoins plus spécialisés ;
d'intégrer, de ce fait, des ressources d’origine diverses, dans des traditions
descriptives propres, sans empêcher le maintien parallèle de ces traditions pour
d’autres usages.
1.2 Principes fondamentaux du protocole OAI
On trouvera les spécifications complètes du protocole sur le site de l’OAI, à l’adresse
suivante : http://www.openarchives.org/OAI/2.0/openarchivesprotocol.htm
1.2.1 Concepts mis en oeuvre
Le protocole OAI s’appuie sur quelques concepts documentaires simples :
la ressource, qui est le document-objet décrit, réel (exemple : un livre) ou virtuel
(une image numérique, un texte électronique) ;
l’item, qui est la fiche ou la notice informatique décrivant cet objet (exemple : une
notice bibliographique en format UNIMARC), et qui contient ou génère des
métadonnées échangeables pour le protocole OAI, à la seule condition qu’un
identifiant unique, construit selon les recommandations de l’Open Archive
Initiative, puisse être attribué à l’item dans la base qui le contient ;
l’enregistrement (record), qui est un ensemble de métadonnées extraites d’un item
dans un format XML, et qui fait l’objet de l’échange entre l’entrepôt et le
moissonneur (exemple : la description du livre en format BiblioML ou Dublin Core) ;
il y a autant d’enregistrements possibles par item que de formats dans lesquels
l’entrepôt est moissonnable ;
de manière optionnelle, chacun des items peut relever d’un ou de plusieurs
ensembles ou lots (sets), définis par le producteur de l’entrepôt pour permettre une
moisson " en bloc " de la totalité des items relatifs à un type de support ou à un
thème particulier (par exemple les périodiques, l'Histoire de l'Alsace ou la division
320-Sciences politiques de la classification Dewey).
Principes conceptuels de l'OAI-PMH
1.2.2 Principes organisationnels
Dans ce contexte, le protocole définit le langage par lequel communiquent le
fournisseur de données (entrepôt) et le fournisseur de services (agrégateur), qui
rassemble des données collectées par un moissonneur.
Pour alimenter l'agrégateur, le moissonneur visite plusieurs entrepôts, qu'il doit
interroger massivement une seule fois ou en plusieurs étapes, pour extraire les
enregistrements des items qui l'intéressent.
Après la collecte, le moissonneur dépose les données dans une base que le
fournisseur de services rend accessible à ses clients. L'interrogation de cette base est
directe et ne sollicite pas les entrepôts d'origine. En effet, l'utilisateur final interroge
uniquement le réservoir de notices, constitué par moisson, du fournisseur de service, qui
lui retourne en réponse la liste des notices pertinents.
Ces notices proposent notamment un lien hypertexte vers le document primaire,
seulement accessible sur le serveur du fournisseur de données : en activant ce lien,
l'utilisateur arrive sur le site et dans l'environnement graphique de l’institution productrice,
dont le serveur n'est finalement sollicité que pour la fourniture de ce seul document.
Architecture fonctionnelle de services OAI
1.2.3 Aspects techniques de la communication entre moissonneur et
entrepôt
Le moissonneur soumet des requêtes XML aux entrepôts en recourant aux
protocoles http et url, universellement répandus, pour une interopérabilité optimale ; les
réponses qu'il reçoit sont également en syntaxe XML.
Les requêtes, dites " verbes" ou " commandes", auxquelles correspondent un
ensemble de réponses standardisées, sont au nombre de six. Elles permettent au
moissonneur :
de vérifier si le service désigné est un répertoire OAI (Identify) ;
de demander la liste des formats de métadonnées que l’entrepôt est capable de
fournir (ListMetadataformats) ;
d’obtenir, le cas échéant, la liste des ensembles (par exemple thématiques) formés
par le fournisseur de données (ListSets) ;
d’obtenir la liste des identifiants et des dates de dernière modification des items
disponibles dans la base (ListIdentifiers) ;
de collecter l’information d’un item spécifique (GetRecord) ;
de récupérer en bloc l’ensemble des items d’un répertoire (ListRecords).
Ces requêtes permettent de définir les caractéristiques de l’exploitation que
chaque moissonneur fait d’un entrepôt : une fois qu’un entrepôt et son offre documentaire
sont identifiés, il appartient au responsable du moissonneur (ou au moissonneur lui-même,
automatiquement, selon des critères prédéfinis) de choisir les lots (" sets ") ou la liste des
données à collecter, puis la fréquence des visites du moissonneur, qui donneront lieu à
des collectes ciblées après chaque mise à jour des données cibles de la collecte.
L’OAI-PMH et la norme Z39-50
Au contraire de portails fédérateurs de ressources ou de catalogues collectifs
reposant sur la norme d’interrogation Z39-50, une base de donnée constituée par
moissons OAI permet au fournisseur de service de rendre accessibles des données
descriptives de documents sans faire peser une lourde charge sur le serveur de
chaque fournisseur de données ; de plus, le temps de réponse au client final dépend
du seul serveur du fournisseur de service (et non du serveur le moins performant de
l’ensemble des fournisseurs de données, comme c’est le cas dans une architecture Z39-
50).
En revanche, les données exploitées par le fournisseur de service sont le reflet
d’un état figé des données collectées, en date du dernier passage du moissonneur,
alors qu’une interrogation simultanée de plusieurs bases par transfert Z39-50 permet
d’afficher les données en temps réel. Par conséquent, l’OAI-PMH n’est pas toujours la
solution organisationnelle et technique la plus pertinente pour des entrepôts dont une part
importante du contenu est soumis à des modifications très fréquentes, par exemple
quotidiennes (actualités, œuvres vivantes…).
1 / 15 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !