Dublin Core le format de métadonnées requis par le protocole OAI-PMH
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Formation « Le protocole OAI-PMH » Formation pour les Pôles associés de la Bibliothèque nationale de France BnF, 21 juin 2013 Dublin Core le format de métadonnées requis par le protocole OAI-PMH Françoise Leresche Bibliothèque nationale de France Département de l’Information bibliographique et numérique Pôle Modélisation fonctionnelle
Qu’est-ce que le Dublin Core ? Schéma de métadonnées généraliste définit un noyau minimal de métadonnées Créé en 1995 à Dublin, Ohio par OCLC et NCSA (National Center for Supercomputing Applications) Maintenance assurée par la DCMI DCMI = Dublin Core Metadata Initiative http://dublincore.org/ Devenu une norme ISO en 2003 ISO 15836 agence de maintenance : DCMI
La DCMI Une organisation internationale pour le développement de métadonnées interopérables regroupant des bibliothèques et des organismes travaillant dans les sciences de l’information Site : http://dublincore.org/ Structure de travail : Communautés Groupes de travail (Task groups) Conférence internationale annuelle Présentation de réalisations et d’initiatives liées au Dublin Core aux métadonnées en général et à leurs différents usages
Objectifs du Dublin Core Améliorer la recherche de ressources sur le web Définir un ensemble de métadonnées communes à diverses communautés suffisamment simples pour que des non-spécialistes créateur, propriétaire, éditeur, gestionnaire, utilisateur,… puissent les créer à n’importe quel point du cycle de vie de la ressource mais suffisamment structurées pour qu’elles puissent rendre les moteurs de recherche plus performants
Les Dublin Core Dublin Core simple 15 éléments tous facultatifs tous répétables norme ISO 15836 (2003) format obligatoire dans le protocole OAI-PMH Dublin Core qualifié 18 éléments + des qualificatifs elements refinements encoding schemes définition de profils pour des communautés particulières DC Library Application Profile pour les bibliothèques
Le Dublin Core simple Les 15 éléments Contenu Propriété Instanciation intellectuelle Title Creator Date Subject Contributor Type Description Publisher Format Source Rights Identifier Language Relation Coverage
Éléments décrivant le contenu Title [Titre] définition nom donné à la ressource commentaire le titre est généralement le nom formel sous lequel la ressource est connue Subject [Sujet ou mots-clés] définition thème du contenu de la ressource commentaire généralement, le sujet est exprimé sous forme de mots-clés ou par des indices de classification décrivant un thème de la ressource. La pratique recommandée est d’utiliser un vocabulaire contrôlé ou une classification de référence
Éléments décrivant le contenu Description [Description] définition présentation du contenu de la ressource commentaire la description peut prendre la forme d’un résumé, d’une table des matières, d’un exposé du contenu en texte libre Source [Source] définition référence à une ressource dont la ressource décrite est dérivée (en totalité ou en partie) commentaire la pratique recommandée est d’identifier la ressource mentionnée dans l’élément Source par une dénomination formelle (URI) ou un identifiant normalisé
Éléments décrivant le contenu Language [Langue] définition langue du contenu de la ressource commentaire la pratique recommandée est d’utiliser un code de langue (norme ISO 639) Relation [Relation] définition référence à une ressource apparentée commentaire la pratique recommandée est d’identifier la ressource apparentée par une dénomination formelle (URI) ou un identifiant normalisé
Éléments décrivant le contenu Coverage [Couverture] définition périmètre ou domaine d’application du contenu de la ressource commentaire généralement cet élément correspond à une localisation dans l’espace : nom de lieu ou coordonnées géographiques une période de temps : nom de période, date ou intervalle de dates une juridiction : nom d’une entité administrative
Éléments relatifs à la propriété intellectuelle Creator [Créateur] définition entité principalement responsable de la création du contenu de la ressource commentaire ce peut être une personne, une organisation ou un service. Généralement, cette entité est désignée par son nom Contributor [Contributeur] définition entité responsable de contributions au contenu de la ressource commentaire ce peut être une personne, une organisation ou un service. Généralement, cette entité est désignée par son nom
Éléments relatifs à la propriété intellectuelle Publisher [Éditeur] définition entité responsable de la mise à disposition de la ressource commentaire ce peut être une personne, une organisation ou un service. Généralement, cette entité est désignée par son nom Rights [Gestion des droits] définition informations sur les droits associés à la ressource commentaire ce peut être une mention de copyright ou une référence au service fournissant ces informations. L’absence de cet élément ne présume pas que la ressource est libre de droits
Éléments relatifs à l’instanciation Date [Date] définition date d ’un événement dans le cycle de vie de la ressource commentaire la date est généralement associée à la création ou à la mise à disposition de la ressource Type [Type de ressource] définition nature ou genre du contenu de la ressource commentaire généralement, le type correspond à des catégories, des fonctions, des genres ou des niveaux d’agrégation de contenu. La pratique recommandée est d’utiliser le vocabulaire contrôlé DCMIType
Types DCMI http://dublincore.org/documents/dcmi-type-vocabulary/ Collection Dataset Agrégation de documents Ensemble de données formant un tout organisée selon une structure appropriée au traitement Image par ordinateur StillImage InteractiveResource MovingImage Ressource qui demande Sound une interaction de l’utilisateur Text Service Entité qui rend des services PhysicalObject à l’utilisateur Tout objet matériel Software Event Un logiciel d’ordinateur Un événement
Éléments relatifs à l’instanciation Format [Format] définition manifestation physique ou numérique de la ressource commentaire le format inclut généralement le type de médium ou les dimensions de la ressource (taille, durée). On peut préciser le logiciel ou le matériel nécessaire pour utiliser la ressource. La pratique recommandée est d’utiliser un vocabulaire contrôlé : MIME ou IMT Identifier [Identifiant de la ressource] définition référence univoque à la ressource commentaire la pratique recommandée est d’identifier la ressource par une dénomination formelle (URI) ou un identifiant normalisé (ISBN, ISSN, etc.)
Exemple (DC simple) Title De l’angoisse à la méthode dans les sciences du comportement From anxiety to méthod in the behavioral sciences Creator Devereux, Georges (1908-1985) Contributor La Barre, Weston (1911-….) Sinaceur, Hourya (1940-….) Subject Sciences du comportement -- Méthodologie Scientifiques -- Psychologie Type Texte Language Français Publisher Flammarion Date 1980 Format 474 p. ; 22 cm Identifier ISBN 2-08-211125-3 Relation ISSN 0768-1011 = Nouvelle bibliothèque scientifique
Exemple (DC simple) Title Angelo Bilbao, April 24 1920 Creator Sigler, Harold R. Description A portrait of Angelo Bilbao, a Basque resident of Boise, Idaho. The portrait was taken by R. Harold Sigler, who worked as a photographer in Boise for nearly 50 years. Among his photographs include a number of ethnic residents living in Boise, Idaho. For more information on the Sigler Collection at the Idaho State Historical Society click on the URL address located in the Collection field. 8 in. x 10 in. Date 1920 Subject Basque Americans Boise (Idaho); Ada County Portraits Bilbao, Angelo Coverage United States--Idaho (State)--Ada--Boise Type Photographs Source Sigler Photograph Collection Identifier http://content.wsulibs.wsu.edu/u?/imls_3,392 Format Original images were scanned as 300 dpi TIFF files on a Microtek 9600XL scanner. 72 dpi JPEG files were then added to the CONTENT database at the WSU Libraries. Rights To obtain a copy of this item, or request permission to publish, contact the Idaho State Historical Society Library and Archives, 2205 Old Penitentiary Road, Boise,ID. 83712-8250, 208-334-3356.
Exemple (DC simple)
Le Dublin Core qualifié 3 éléments supplémentaires Audience [public visé ou recommandé pour la ressource] Provenance [propriétaire de la ressource] Rightsholder [titulaire de droits sur la ressource] 2 types de qualificatifs raffinements qui restreignent et précisent la portée d’un élément schémas d’encodage qui associent l’élément à un vocabulaire contrôlé ou à un format de données
Exemples de raffinements Description Title tableOfContents alternative abstract Relation Coverage isVersionOf / spatial hasVersion temporal isReplacedBy / replaces Date isRequiredBy / requires created isPartOf / hasPart valid isReferencedBy / issued references modified isFormatOf / hasFormat conformsTo
Schémas d’encodage Subject LCSH = Library of Congress Subject Haedings MESH = Medical Subject Haedings DDC = Dewey Decimal Classification Language ISO639-2 = code de langue à 3 lettres RFC1766 = code de langue à 2 lettres, avec suffixe du pays Coverage.spatial point = identifié par ses coordonnées géographiques ISO3166 = code de pays à 2 lettres
Exemple (DC qualifié) Title De l’angoisse à la méthode dans les sciences du comportement From anxiety to méthod in the behavioral sciences Creator Devereux, Georges (1908-1985) Contributor La Barre, Weston (1911-….) Sinaceur, Hourya (1940-….) Subject Sciences du comportement -- Méthodologie scheme=RAMEAU Scientifiques -- Psychologie Type Texte Language fre scheme=ISO639-2 Publisher Flammarion Date 1980 issued Format 474 p. ; 22 cm Identifier ISBN 2-08-211125-3 Relation ISSN 0768-1011 = Nouvelle bibliothèque scientifique is part of
Exemple (DC qualifié)
Exemple (Dublin Core qualifié)
Le profil DC « Bibliothèque » DC Library Application Profile Une déclinaison spécialisée du Dublin Core qui donne des recommandations spécifiques dans l’usage des éléments des qualificatifs de référentiels liste des codes de fonction MARC identifiants : ISBN, ISSN, etc.
Le profil DC « Bibliothèque » Objectifs Utiliser le Dublin Core comme format d’échange entre plusieurs systèmes utilisant des formats de métadonnées différents Permettre la création simple de notices de catalogues dans une grande variété de systèmes Exposer à d’autres communautés des notices MARC (en les convertissant en DC sans trop les appauvrir) Collecter des métadonnées à partir de sources externes au domaine des bibliothèques
Le profil DC « Bibliothèque » Il définit Les éléments obligatoires Les éléments et les qualificatifs permis Les valeurs et les référentiels permis Les éléments issus de formats autres que le DC utilisés dans le domaine des bibliothèques (MODS) Les éléments ou qualificatifs supplémentaires issus d’autres profils Ex : DC-Education:Audience Des précisions par rapport aux définitions du DC
Le profil « TEL-AP » Défini pour les besoins de TEL TEL = The European Library À partir du DC Library Application Profile 2 applications : TEL Application Profile for Objects description de ressources utilisé pour collecter les notices des bibliothèques partenaires avec le protocole OAI-PMH → catalogue collectif européen TEL Application Profile for Collection descriptions description d’ensembles de ressources constitués et conservés par les bibliothèques partenaires
Exemples d’utilisation Métadonnées des pages web
Exemples d’utilisation Protocole OAI-PMH
Exemples d’utilisation Initiatives utilisant le Dublin Core OAI : Open Archives Initiative – Protocol for metadata harvesting → diffusion et partage de métadonnées descriptives TEL : The European Library → portail des bibliothèques nationales européennes EULER → portail de publications dans le domaine des mathématiques, issu d’un projet européen (1998-2000) MusicBrainz → description collaborative de morceaux de musique Biblink → projet européen (1996-2000) visant à favoriser l’échange de données entre les éditeurs de publications électroniques et les agences bibliographiques nationales
Intérêt du Dublin Core Atouts Généricité permet de décrire des ressources numériques ou physiques utilisable par de nombreuses communautés Simplicité Grande souplesse Utilisation internationale Limites Faiblesse des informations techniques Valeurs des éléments non normalisées
Merci de votre attention
Vous pouvez aussi lire