Dublin Core le format de métadonnées requis par le protocole OAI-PMH

La page est créée Emma Barbier
 
CONTINUER À LIRE
Dublin Core le format de métadonnées requis par le protocole OAI-PMH
Formation « Le protocole OAI-PMH »
Formation pour les Pôles associés de la Bibliothèque nationale de France
                                                       BnF, 21 juin 2013

                                               Dublin Core
                      le format de métadonnées
                requis par le protocole OAI-PMH

                                                     Françoise Leresche
                                               Bibliothèque nationale de France
                      Département de l’Information bibliographique et numérique
                                                 Pôle Modélisation fonctionnelle
Dublin Core le format de métadonnées requis par le protocole OAI-PMH
Qu’est-ce que le Dublin Core ?
 Schéma de métadonnées généraliste
  définit un noyau minimal de métadonnées
 Créé en 1995 à Dublin, Ohio par OCLC et NCSA
  (National Center for Supercomputing Applications)
 Maintenance assurée par la DCMI
  DCMI = Dublin Core Metadata Initiative
  http://dublincore.org/

 Devenu une norme ISO en 2003
  ISO 15836
  agence de maintenance : DCMI
Dublin Core le format de métadonnées requis par le protocole OAI-PMH
La DCMI
 Une organisation internationale
   pour le développement de métadonnées interopérables
   regroupant des bibliothèques et des organismes travaillant
    dans les sciences de l’information
 Site : http://dublincore.org/
 Structure de travail :
   Communautés
   Groupes de travail (Task groups)
 Conférence internationale annuelle
   Présentation de réalisations et d’initiatives liées
       au Dublin Core
       aux métadonnées en général et à leurs différents usages
Dublin Core le format de métadonnées requis par le protocole OAI-PMH
Objectifs du Dublin Core
 Améliorer la recherche de ressources sur le web

 Définir un ensemble de métadonnées communes à
  diverses communautés
  suffisamment simples pour que des non-spécialistes
    créateur, propriétaire, éditeur, gestionnaire, utilisateur,…
   puissent les créer à n’importe quel point du cycle de vie de
   la ressource
  mais suffisamment structurées pour qu’elles puissent
   rendre les moteurs de recherche plus performants
Les Dublin Core
 Dublin Core simple
  15 éléments
      tous facultatifs
      tous répétables
  norme ISO 15836 (2003)
  format obligatoire dans le protocole OAI-PMH
 Dublin Core qualifié
  18 éléments + des qualificatifs
      elements refinements
      encoding schemes
  définition de profils pour des communautés particulières
      DC Library Application Profile pour les bibliothèques
Le Dublin Core simple

 Les 15 éléments
 Contenu            Propriété        Instanciation
                    intellectuelle
 Title              Creator          Date
 Subject            Contributor      Type
 Description        Publisher        Format
 Source             Rights           Identifier
 Language
 Relation
 Coverage
Éléments décrivant le contenu
Title                   [Titre]
  définition nom donné à la ressource
  commentaire     le titre est généralement le nom
    formel sous lequel la ressource est connue

Subject                 [Sujet ou mots-clés]
  définition thème du contenu de la ressource
  commentaire      généralement, le sujet est exprimé
    sous forme de mots-clés ou par des indices de
    classification décrivant un thème de la ressource. La
    pratique recommandée est d’utiliser un vocabulaire
    contrôlé ou une classification de référence
Éléments décrivant le contenu
Description             [Description]
  définition présentation du contenu de la ressource
  commentaire      la description peut prendre la forme
   d’un résumé, d’une table des matières, d’un exposé du
   contenu en texte libre

Source                  [Source]
  définition    référence à une ressource dont la
   ressource décrite est dérivée (en totalité ou en partie)
  commentaire             la pratique recommandée est
   d’identifier la ressource mentionnée dans l’élément
   Source par une dénomination formelle (URI) ou un
   identifiant normalisé
Éléments décrivant le contenu
Language               [Langue]
  définition langue du contenu de la ressource
  commentaire      la pratique recommandée est
   d’utiliser un code de langue (norme ISO 639)

Relation                      [Relation]
  définition référence à une ressource apparentée
  commentaire       la pratique recommandée est
   d’identifier la ressource apparentée par une
   dénomination formelle (URI) ou un identifiant normalisé
Éléments décrivant le contenu
Coverage                [Couverture]
  définition      périmètre ou domaine d’application du
   contenu de la ressource
  commentaire            généralement cet élément
   correspond à
    une localisation dans l’espace : nom de lieu ou
      coordonnées géographiques
    une période de temps : nom de période, date ou
      intervalle de dates
    une juridiction : nom d’une entité administrative
Éléments relatifs à
la propriété intellectuelle
Creator                 [Créateur]
  définition    entité principalement responsable de la
   création du contenu de la ressource
  commentaire          ce peut être une personne, une
   organisation ou un service. Généralement, cette entité
   est désignée par son nom

Contributor             [Contributeur]
  définition      entité responsable de contributions au
    contenu de la ressource
  commentaire           ce peut être une personne, une
    organisation ou un service. Généralement, cette entité
    est désignée par son nom
Éléments relatifs à
la propriété intellectuelle
Publisher               [Éditeur]
  définition      entité responsable de la mise à
   disposition de la ressource
  commentaire             ce peut être une personne, une
   organisation ou un service. Généralement, cette entité
   est désignée par son nom
Rights                  [Gestion des droits]
  définition     informations sur les droits associés à la
    ressource
  commentaire            ce peut être une mention de
    copyright ou une référence au service fournissant ces
    informations. L’absence de cet élément ne présume pas
    que la ressource est libre de droits
Éléments relatifs à l’instanciation
Date                    [Date]
  définition     date d ’un événement dans le cycle de vie
    de la ressource
  commentaire             la date est généralement associée
    à la création ou à la mise à disposition de la ressource

Type                    [Type de ressource]
  définition nature ou genre du contenu de la ressource
  commentaire       généralement, le type correspond à
    des catégories, des fonctions, des genres ou des niveaux
    d’agrégation de contenu. La pratique recommandée est
    d’utiliser le vocabulaire contrôlé DCMIType
Types DCMI
http://dublincore.org/documents/dcmi-type-vocabulary/

 Collection                         Dataset
    Agrégation de documents             Ensemble de données
     formant un tout                      organisée selon une structure
                                          appropriée au traitement
 Image
                                          par ordinateur
   StillImage
                                     InteractiveResource
   MovingImage                          Ressource qui demande
 Sound                                   une interaction de l’utilisateur
 Text                               Service
                                         Entité qui rend des services
 PhysicalObject                          à l’utilisateur
    Tout objet matériel
                                     Software
 Event                                  Un logiciel d’ordinateur
    Un événement
Éléments relatifs à l’instanciation
Format                    [Format]
  définition       manifestation physique ou numérique de la
    ressource
  commentaire             le format inclut généralement
    le type de médium ou les dimensions de la ressource
    (taille, durée). On peut préciser le logiciel ou le matériel
    nécessaire pour utiliser la ressource.
    La pratique recommandée est d’utiliser un vocabulaire
    contrôlé : MIME ou IMT
Identifier                [Identifiant de la ressource]
  définition référence univoque à la ressource
  commentaire       la pratique recommandée est
    d’identifier la ressource par une dénomination formelle
    (URI) ou un identifiant normalisé (ISBN, ISSN, etc.)
Exemple (DC simple)
Title       De l’angoisse à la méthode dans les sciences du
            comportement
            From anxiety to méthod in the behavioral sciences
Creator     Devereux, Georges (1908-1985)
Contributor La Barre, Weston (1911-….)
            Sinaceur, Hourya (1940-….)
Subject     Sciences du comportement -- Méthodologie
            Scientifiques -- Psychologie
Type        Texte
Language Français
Publisher Flammarion
Date        1980
Format      474 p. ; 22 cm
Identifier  ISBN 2-08-211125-3
Relation    ISSN 0768-1011 = Nouvelle bibliothèque scientifique
Exemple (DC simple)
Title         Angelo Bilbao, April 24 1920
Creator       Sigler, Harold R.
Description   A portrait of Angelo Bilbao, a Basque resident of Boise, Idaho. The portrait was taken by R.
              Harold Sigler, who worked as a photographer in Boise for nearly 50 years. Among his
              photographs include a number of ethnic residents living in Boise, Idaho. For more information on
              the Sigler Collection at the Idaho State Historical Society click on the URL address located in the
              Collection field.
              8 in. x 10 in.
Date          1920
Subject       Basque Americans
              Boise (Idaho); Ada County
              Portraits
              Bilbao, Angelo
Coverage      United States--Idaho (State)--Ada--Boise
Type          Photographs
Source        Sigler Photograph Collection
Identifier    http://content.wsulibs.wsu.edu/u?/imls_3,392
Format        Original images were scanned as 300 dpi TIFF files on a Microtek 9600XL scanner. 72 dpi JPEG
              files were then added to the CONTENT database at the WSU Libraries.
Rights        To obtain a copy of this item, or request permission to publish, contact the Idaho State Historical
              Society Library and Archives, 2205 Old Penitentiary Road, Boise,ID. 83712-8250, 208-334-3356.
Exemple (DC simple)
Le Dublin Core qualifié
 3 éléments supplémentaires
   Audience              [public visé ou recommandé
                           pour la ressource]
   Provenance            [propriétaire de la ressource]
   Rightsholder          [titulaire de droits sur la
                           ressource]
 2 types de qualificatifs
   raffinements qui restreignent et précisent la portée d’un
    élément
   schémas d’encodage qui associent l’élément à un
    vocabulaire contrôlé ou à un format de données
Exemples de raffinements
 Description           Title
    tableOfContents      alternative
    abstract           Relation
 Coverage                isVersionOf /
    spatial               hasVersion
    temporal             isReplacedBy / replaces
 Date                    isRequiredBy / requires
    created              isPartOf / hasPart
    valid                isReferencedBy /
    issued                references
    modified             isFormatOf / hasFormat
                          conformsTo
Schémas d’encodage
 Subject
  LCSH = Library of Congress Subject Haedings
  MESH = Medical Subject Haedings
  DDC = Dewey Decimal Classification
 Language
  ISO639-2 = code de langue à 3 lettres
  RFC1766 = code de langue à 2 lettres, avec suffixe du
   pays
 Coverage.spatial
  point = identifié par ses coordonnées géographiques
  ISO3166 = code de pays à 2 lettres
Exemple (DC qualifié)
Title             De l’angoisse à la méthode dans les sciences du
                  comportement
                  From anxiety to méthod in the behavioral sciences
Creator           Devereux, Georges (1908-1985)
Contributor       La Barre, Weston (1911-….)
                  Sinaceur, Hourya (1940-….)
Subject           Sciences du comportement -- Méthodologie
scheme=RAMEAU     Scientifiques -- Psychologie
Type              Texte
Language          fre
scheme=ISO639-2
Publisher         Flammarion
Date              1980
issued
Format            474 p. ; 22 cm
Identifier        ISBN 2-08-211125-3
Relation          ISSN 0768-1011 = Nouvelle bibliothèque scientifique
is part of
Exemple (DC qualifié)
Exemple (Dublin Core qualifié)
Le profil DC « Bibliothèque »
DC Library Application Profile
Une déclinaison spécialisée du Dublin Core
 qui donne des recommandations spécifiques
 dans l’usage
  des éléments
  des qualificatifs
  de référentiels
     liste des codes de fonction MARC
     identifiants : ISBN, ISSN, etc.
Le profil DC « Bibliothèque »
Objectifs
  Utiliser le Dublin Core comme format d’échange
   entre plusieurs systèmes utilisant des formats de
   métadonnées différents
  Permettre la création simple de notices de
   catalogues dans une grande variété de systèmes
  Exposer à d’autres communautés des notices
   MARC (en les convertissant en DC sans trop les
   appauvrir)
  Collecter des métadonnées à partir de sources
   externes au domaine des bibliothèques
Le profil DC « Bibliothèque »
Il définit
  Les éléments obligatoires
  Les éléments et les qualificatifs permis
  Les valeurs et les référentiels permis
  Les éléments issus de formats autres que le DC
   utilisés dans le domaine des bibliothèques
   (MODS)
  Les éléments ou qualificatifs supplémentaires
   issus d’autres profils
    Ex : DC-Education:Audience
  Des précisions par rapport aux définitions du DC
Le profil « TEL-AP »
Défini pour les besoins de TEL
 TEL = The European Library
À partir du DC Library Application Profile
2 applications :
  TEL Application Profile for Objects
     description de ressources
     utilisé pour collecter les notices des bibliothèques
      partenaires avec le protocole OAI-PMH
      → catalogue collectif européen
  TEL Application Profile for Collection descriptions
     description d’ensembles de ressources constitués et
      conservés par les bibliothèques partenaires
Exemples d’utilisation
Métadonnées des pages web
Exemples d’utilisation
Protocole OAI-PMH
Exemples d’utilisation
Initiatives utilisant le Dublin Core
  OAI : Open Archives Initiative – Protocol for metadata
   harvesting
    → diffusion et partage de métadonnées descriptives
  TEL : The European Library
    → portail des bibliothèques nationales européennes
  EULER
    → portail de publications dans le domaine des mathématiques,
    issu d’un projet européen (1998-2000)
  MusicBrainz
    → description collaborative de morceaux de musique
  Biblink
    → projet européen (1996-2000) visant à favoriser l’échange de
    données entre les éditeurs de publications électroniques et les
    agences bibliographiques nationales
Intérêt du Dublin Core
Atouts
  Généricité
     permet de décrire des ressources numériques ou
      physiques
     utilisable par de nombreuses communautés
  Simplicité
  Grande souplesse
  Utilisation internationale

Limites
  Faiblesse des informations techniques
  Valeurs des éléments non normalisées
Merci
de votre attention
Vous pouvez aussi lire