Identification des ressources sur Internet et métadonnées : diversité des standards Identification of Ressources on the Internet and Metadata: A ...

La page est créée Virginie Leduc
 
CONTINUER À LIRE
Document generated on 07/14/2022 12:47 a.m.

Documentation et bibliothèques

Identification des ressources sur Internet et métadonnées :
diversité des standards
Identification of Ressources on the Internet and Metadata: A
Diversity of Standards
Identificación de los recursos en Internet y metadatos:
diversidad de normas
Catherine Lupovici

Volume 45, Number 4, October–December 1999                                          Article abstract
Édition électronique                                                                Internet Electronic ressources identification and metadata creation for their
                                                                                    discovery and their management are deeply modifying traditional standards
URI: https://id.erudit.org/iderudit/1032722ar                                       for international numbering and bibliographic description. The new emerging
DOI: https://doi.org/10.7202/1032722ar                                              standards are continuously evolving. They are more generic and developed in
                                                                                    an object-oriented approach. They are at the same time building on the existing
                                                                                    ones and the information and documentation community is actively
See table of contents
                                                                                    contributing to their elaboration within the new enlarged community involved
                                                                                    in this standardization process.

Publisher(s)
Association pour l'avancement des sciences et des techniques de la
documentation (ASTED)

ISSN
0315-2340 (print)
2291-8949 (digital)

Explore this journal

Cite this article
Lupovici, C. (1999). Identification des ressources sur Internet et métadonnées :
diversité des standards. Documentation et bibliothèques, 45(4), 191–194.
https://doi.org/10.7202/1032722ar

Tous droits réservés © Association pour l'avancement des sciences et des           This document is protected by copyright law. Use of the services of Érudit
techniques de la documentation (ASTED), 1999                                       (including reproduction) is subject to its terms and conditions, which can be
                                                                                   viewed online.
                                                                                   https://apropos.erudit.org/en/users/policy-on-use/

                                                                                   This article is disseminated and preserved by Érudit.
                                                                                   Érudit is a non-profit inter-university consortium of the Université de Montréal,
                                                                                   Université Laval, and the Université du Québec à Montréal. Its mission is to
                                                                                   promote and disseminate research.
                                                                                   https://www.erudit.org/en/
Documentation et bibliothèques

Identification des ressources sur Internet et métadonnées
diversité des standards

Catherine Lupovicî
Directrice
Département de la bibliothèque numérique
Bibliothèque nationale de France
catherine.lupovici @ bnf.fr

L'identification des ressources électroniques disponibles sur Internet, ainsi que les métadonnées créées pour permettre leur découverte
et leur gestion, ont profondément modifié les standards traditionnels de numérotation normalisée et de description bibliographique et do-
cumentaire. Les nouveaux standards en évolution permanente sont désormais très génériques et proches de la modélisation objet. Ils
n'ignorent cependant pas l'existant et sont élaborés par une communauté beaucoup plus large que celle de l'information et de la docu-
mentation qui y apporte une contribution active.

Identification of Ressources on the Internet and Metadata : A           Identificaciôn de los recursos en Internet y metadatos: diver-
Diversity of Standards                                                  sidad de normas
Internet Electronic ressources identification and metadata crea-        La identificaciôn de los recursos electrônicos disponibles en Inter-
tion for their discovery and their management are deeply modi-          net, asfcomo los metadatos creados para permitir que se descu-
fying traditional standards for international numbering and biblio-     brieran y administraran, modificaron profundamente las normas
graphic description. The new emerging standards are continuous-         tradicionales de numeraciôn normaiizada y de descripcion bi-
ly evolving. They are more generic and developed in an object-          bliogrâfica y documentai. Las nuevas normas, que evolucionan
oriented approach. They are at the same time building on the exis-      en forma permanente, son por el momento muy générales y se
ting ones and the information and documentation community is ac-        acercan a la enfoque centrado en el objeto. No obstante, no igno-
tively contributing to their elaboration within the new enlarged com-   ran lo existente y han sido elaboradas por una comunidad mucho
munity involved in this standardization process.                        mas grande que la de la informaciôn y la de la documentaciôn,
                                                                        que aporta una contribuciôn muy activa a elia.

      Le terme de métadonnées désigne           Le contexte Internet                           comme un tout et relativement à un
de manière générique les données créées                                                        contexte défini d'utilisation. Ainsi le terme
pour fournir des informations sur des res-           Dans le contexte classique de docu-       de ressource pourra aussi bien s'appli-
sources électroniques d'information. Les        ments primaires décrits dans des banques       quer à un site complet ou à une page Web
métadonnées peuvent remplir différentes         de données bibliographiques et/ou docu-        que bientôt -conséquence de l'évolution
fonctions, telles que la gestion des ressour-   mentaires, on avait affaire à deux mondes      que le passage du codage HTML au co-
ces décrites (par exemple, le suivi du cycle    distincts ayant chacun leurs propres tech-     dage XML va imposer au Web - à une por-
de vie d'un document) ; la gestion des infor-   niques et donc leurs propres standards.        tion de page dès lors qu'elle sera autosuffi-
mations décrivant le contenu d'un docu-         L'émergence de documents électroni-            sante par rapport à une utilisation particu-
ment ou d'une ressource pour en faciliter       ques, tout d'abord sur des supports hors       lière.
la découverte ou la localisation, puis l'ac-    ligne comme le cédérom, puis sur Inter-              Les métadonnées, quant à elles, peu-
cès ; ou celle encore des informations rela-    net, a considérablement modifié la situa-      vent désormais être exprimées dans le for-
tives aux droits d'accès aux ressources.        tion de ces deux mondes dont les techni-       mat technique de codage de la ressource
Le concept de métadonnées est une exten-        ques se sont rapprochées, avec des             qu'elles accompagnent et être disponibles
sion à l'environnement des ressources           conséquences directes sur les standards        en même temps qu'elle. Cette simultanéité
électroniques - et essentiellement, à           techniques utilisés par chacun.                peut être offerte par le biais de l'applica-
l'heure actuelle, à celui des services Web           Tout d'abord la notion même de docu-      tion qui rapproche deux sources différen-
de l'Internet - du concept d'information se-    ment et la typologie des documents ont         tes en offrant à l'utilisateur une interface
condaire décrivant une ressource pri-           évolué. On parle davantage aujourd'hui,        unique de recherche et de consultation
maire.                                          dans le monde du document électronique         pour les deux types de données ; elle peut
                                                en ligne, de ressource: celle-ci devient un    aussi provenir de ce que les métadonnées
                                                concept générique désignant un en-             et le document sont traités dans un même
                                                semble de données pouvant être utilisé         fichier informatique dès lors qu'ils sont

octobre-décembre 1999                                                                                                                 191
Documentation et bibliothèques

encodes dans le même format et gérés               d'adoption, comprend le modèle et une           le lien à partir duquel on pourra y accéder.
par les mêmes logiciels.                           syntaxe en XML (Extended Markup Lan-            Les formats USMÂRC et UNIMÂRC ont
      Enfin, on considère qu'une même res-         guage). Le modèle est générique et peut         défini le champ 856 à cet effet.
source peut être utilisée dans tel contexte        être exploité avec une autre syntaxe que
comme un ensemble de données sur des               XML. Ce dispositif comprend également
données, et comme une ressource dans               des spécifications de schémas regroupant        Standards pour le mode
tel autre contexte. Il ne s'agit plus seule-       des classes de types de ressources.             «embedded »
ment de créer a priori l'information secon-              RDF est défini par des groupes d'utili-
daire qui sera ultérieurement exploitée            sateurs très divers comme les acteurs de              Deux standards principaux ont été dé-
pour trouver la ressource : c'est lors de l'uti-   la normalisation relative à Internet, les bi-   finis, l'un par la communauté des docu-
lisation et grâce à un outil approprié de trai-    bliothèques, les spécialistes de la structu-    ments structurés, l'autre par celle de la nor-
tement intelligent que les informations de         ration des documents (XML/SGML) et              malisation Internet.
base seront interprétées pour donner ac-           ceux de la représentation du savoir. Il béné-
cès à cette ressource.                             ficie aussi d'une forte contribution tech-
                                                                                                   Le projet TEI
      Les différents acteurs qui souhaitent        nique provenant des communautés de la
exploiter Internet font par ailleurs pression      programmation orientée objet, des langa-             La Text Encoding Initiative (TEI) a été
pour accélérer sa normalisation technique          ges de modélisation et des systèmes de          développée dès le début de la mise en
afin de faciliter la découverte d'information      gestion de bases de données.                    oeuvre de SGML (Standard Generalized
grâce à des moteurs de recherche plus in-                RDF est une modélisation des diffé-       Markup Language, ISO 8879) par un
telligents, et de mettre en œuvre la gestion       rentes façons de gérer des métadonnées          groupe de chercheurs en sciences humai-
des droits d'utilisation des ressources.           qui intègre celles qui existent déjà dans la    nes, littérature et linguistique s'intéressant
                                                   documentation et dans la gestion des res-       à l'utilisation de l'informatique. Le projet
                                                   sources électroniques des différentes com-      TEI s'est concrétisé par une DTD (Défini-
Le Resource Description                            munautés participant à son élaboration. Il      tion de Type de Document) SGML accom-
                                                   existe donc déjà des standards de méta-         pagnée de recommandations pour le co-
Framework (RDF)                                    données qui appartiennent à l'un ou à           dage de structure et l'échange des textes.
                                                   l'autre mode d'association de métadon-          La DTD TEI s'applique à chaque docu-
      C'est pour faciliter cette normalisation
                                                   nées et de ressource et qui sont décrits        ment électronique encode selon la DTD et
technique que le W3Consortium, qui est
                                                   dans le modèle RDF. Voici quelques exem-        définit pour chaque unité documentaire
responsable des évolutions techniques
                                                   ples de l'intégration dans le modèle RDF        électronique un en-tête obligatoire com-
d'Internet, a proposé dès octobre 1997 un
                                                   de standards de la documentation ou des         portant les métadonnées.
cadre général pour la description des res-
                                                   bibliothèques.                                       La sémantique de ces métadonnées
sources dé l'Internet : le Resource Descrip-
tion Framework. Son objectif était de faire                                                        peut être régie selon des règles de descrip-
                                                                                                   tion standardisées ou propriétaires. Dans
passer le Web du niveau de machine-rea-            Standards pour le mode                          le cadre d'une application telle que le pro-
dable à celui de machine-understandable.
      Le modèle RDF ne prend en compte
                                                   « service bureau »                              jet American Memory de la Bibliothèque
que les métadonnées créées dans une                                                                du Congrès, une DTD TEI a été déve-
                                                        Ces standards concernent la descrip-       loppée et les métadonnées sont rédigées
mention spécifique identifiée en tant que
                                                   tion bibliographique ou documentaire. Ils       selon les AACR2 (Anglo-American Catalo-
telle. Cette mention de métadonnées peut
                                                   recouvrent :                                    ging Rules 2).
être associée à la ressource de quatre ma-
                                                         • les règles de description, c'est-à-
nières différentes :
                                                   dire la définition des éléments de descrip-
      » les métadonnées sont encapsu-                                                              La syntaxe meta HTML
                                                   tion et les règles à observer pour créer ces
lées dans la ressource: c'est le mode em-
                                                   descriptifs à partir des informations figu-           La DTD HTML (Hypertext Markup Lan-
bedded;
                                                   rant dans les ressources que l'on décrit;       guage) qui a été définie pour la structura-
      • les métadonnées sont externes à la
                                                         • les formats de description, c'est-à-    tion des pages Web de l'Internet comporte
ressource mais seront fournies avec elle
                                                   dire le codage en machine permettant de         une codification  et une syntaxe
dans le mécanisme de transfert de la ré-
                                                   structurer les données en vue de leur exploi-   pour l'écriture des métadonnées dans les
ponse à une recherche d'information:
                                                   tation dans des systèmes d'interrogation.       pages Web. Ces tags  ne sont pas
c'est le mode along-with;
                                                         Certains d'entre eux se sont déjà         affichés par les navigateurs, mais ils sont
      « les métadonnées seront utilisées
                                                   adaptés au contexte des ressources élec-        utilisés par certains moteurs de recherche
séparément de la ressource pour une re-
                                                   troniques en étendant les règles de des-        sur Internet de manière pondérée par rap-
cherche d'information, éventuellement
                                                   cription et les formats aux besoins de re-      port au reste du texte des pages Web.
dans des bases de données différentes :
                                                   cherche et d'accès direct aux ressources              Dans le cadre de cette standardisa-
c'est le mode service bureau;
                                                   électroniques. C'est ainsi que les formats      tion Internet, certaines communautés d'uti-
      • la ressource est encapsulée dans
                                                   MARC (Machine Readable Cataloging) of-          lisateurs, dont les bibliothèques et les pro-
les métadonnées qui la décrivent: c'est le
                                                   frent désormais la possibilité d'indiquer la    ducteurs de banques de données, ont tra-
mode wrapped.
                                                   localisation de la ressource électronique,      vaillé à la standardisation des types de mé-
      Le dispositif RDF, qui est en cours
                                                   ses caractéristiques techniques ainsi que       tadonnées. C'est ainsi qu'est né le Dublin

192                                                                                                                  octobre-décembre 1999
Documentation et bibliothèques

Core qui définit un ensemble de quinze mé-        cation des documents ont été créés de-             net du terme) unique et persistant: il dé-
tadonnées réparties en trois grands types :       puis une trentaine d'années pour diffé-            signe une ressource qui pourra être pré-
      • des métadonnées relatives au              rents types de documents. L'ISBN (Interna-         sente sur plusieurs sites comme autant
contenu intellectuel de la page Web ;             tionalStandard Book Number) pour le livre          d'exemplaires. Ce numéro est résolu -
      a des métadonnées relatives à la pro-       et l'ISSN (International Standard Serial           c'est-à-dire qu'il indique le ou les URL du
priété intellectuelle et en particulier aux in-   Numbei) pour les publications en série,            ou des sites où l'on peut consulter la res-
formations sur la gestion des droits d'utili-     sont les plus anciens et ont acquis le statut      source - par une agence où il est enregis-
sation de la page Web ;                           de normes internationales ISO. L'organisa-         tré et qui maintient la validité des URL.
      m des métadonnées relatives à la res-       tion de ces systèmes de numérotation re-           Cette agence s'appelle une agence de ré-
source elle-même et en particulier l'identi-      pose sur un réseau international d'agen-           solution du nom.
fiant de la ressource, si possible unique et      ces d'attribution et d'enregistrement des               m L'URL (Uniform Resource Locatoi)
persistant. Voir le tableau 1 du texte « La       numéros. Ces identifiants sont utilisés à la       est l'adresse du site où se trouve la res-
publication électronique des thèses » des         fois par les éditeurs pour la gestion de la        source. On se connecte à ceJle-ci en cli-
auteurs Boulétreau, Gauvin et Ducasse,            commercialisation et par les bibliothèques         quant sur ce lien qui n'est pas persistant et
page 187.                                         et centres de documentation pour la ges-           dont la validité n'est pas garantie.
      Le succès du Dublin Core a été tel          tion des commandes et l'identification bi-              u L'URC (Uniform Resource Charac-
que les éléments de description qui y sont        bliographique et documentaire des ouvra-           teristic) contient des métadonnées sur la
définis sont retenus comme sémantique             ges et périodiques.                                ressource et en particulier les modalités
de métadonnées en dehors de la syntaxe                  Ce système de codes d'identification         d'accès et la gestion des droits. Ces méta-
 HTML ; ils ont déjà été repris dans        a ensuite été étendu aux unités logiques           données peuvent être stockées dans une
les premières spécifications de XML, dans         composant un document, par exemple l'ar-           banque de données d'enregistrement des
un schéma minimum de base.                        ticle dans un fascicule de périodique.             URN maintenue par l'agence d'enregistre-
                                                  Dans la décennie quatre-vingt-dix, cette           ment et de résolution. Elles peuvent égale-
                                                  extension a été adaptée aux besoins de la          ment se trouver sur un site différent et
Standards pour le mode                            gestion, puis de la distribution de docu-          liées aux URN.
«wrapped»                                         ments sous forme électronique.
                                                        Alors que le concept de ressource
      Ce mode considère les métadonnées           prend le pas sur celui de publication, une         Le système DOI
comme l'élément englobant pour la res-            réflexion est actuellement conduite sur
source. La DTD EAD (Encoding Archival             l'identification des ressources. Envisagée               Le système DOI (Digital Object Identi-
Description) a été développée dans le             dans le contexte du Web, cette identifica-         fie/) est une application du système URI
continent nord-américain pour la structura-       tion s'accompagne d'une dimension dyna-            mise en œuvre par une fédération d'édi-
tion et l'encodage en XML des instru-             mique, car il est devenu nécessaire que le         teurs commerciaux par l'intermédiaire de
ments de recherche décrivant des collec-          système d'identification, non content              la Fondation DOI.
tions spécialisées telles que les archives        d'identifier et de localiser une ressource, y            Cette Fondation s'est constituée
ou les collections de papiers. Ces instru-        donne également accès. L'identifiant de-           comme agence d'enregistrement des iden-
ments de recherche sont, par exemple,             vient actif et «cliquable».                        tifiants DOI des publications. Le numéro
des inventaires d'archives publiques ou pri-                                                         DOI est un URN au sens Internet et il en a
vées ou des catalogues de collections de                                                             la structure, composée d'un préfixe attri-
documents manuscrits.                             Le système URI                                     bué à l'éditeur et d'un suffixe qui est le nu-
      Cette DTD autorise une structuration                                                           méro de la ressource chez l'éditeur ou le
de l'instrument de recherche en douze ni-               L'Internet Engineering Task Force            détenteur des droits. L'attribution de ce nu-
veaux hiérarchiques et permet d'attacher          (IETF), qui développe les standards Inter-         méro relève de la responsabilité de l'édi-
la ressource électronique à sa description.       net, a lancé un travail de standardisation         teur ou du détenteur des droits. Il peut être
      Elle est déjà utilisée dans des projets     pour un système générique d'identifica-            un identifiant issu des systèmes existants,
coopératifs de collections de ressources          tion des ressources du réseau, dont le prin-       tels l'ISBN ou l'ISSN. L'attribution d'un
électroniques. L'arborescence de l'instru-        cipe est que l'identifiant peut à la fois repré-   préfixe est conditionnée au paiement d'un
ment de recherche peut servir de support          senter la ressource et permettre d'y accé-         droit par l'éditeur et elle comporte une
à la navigation dans une telle collection.        der: c'est le système URI (Uniform Re-             clause sur le respect du copyright et l'enga-
      La DTD EAD émane de la communau-            source Identifie/). Il s'agit de proposer un       gement de mettre à jour, en cas de modifi-
té des archives et des bibliothèques, mais        cadre et des règles pour permettre à des           cation, les URL servant à la résolution des
elle est aussi expérimentée par des mu-           organismes d'enregistrement de décrire             DOI.
sées d'Amérique du Nord.                          des ressources et d'en assurer la disponi-               Les éditeurs entretiennent des bases
                                                  bilité de manière à ce qu'elles soient finale-     d'information sur les ressources qu'ils gè-
                                                  ment accessibles dans un ou plusieurs              rent: elles contiennent des URC, et c'est
L'identification des                              sites via leurs URL. Ce cadre d'identifica-        sur celles-ci que pointent les numéros DOI
ressources                                        tion s'appuie sur le dispositif suivant.           de la base d'enregistrement. Un utilisateur
                                                        a L'URN (Uniform Resource Name)              effectuant une recherche par numéro
     Des numéros ou des codes d'identifi-         de la ressource est son nom (au sens Inter-        URN aura ainsi accès à la base URC

octobre-décembre 1999                                                                                                                        193
Documentation et bibliothèques

associée à ce numéro et aura connais-           formation peut être très important. Un
sance des conditions d'accès à la res-          exemple frappant en est le cas du Dublin
source (accès gratuit, paiement à l'acte,       Core.
conditions d'abonnement, etc.).
      Les publications électroniques sur
Internet utilisent et utiliseront de plus en    Sources consultées
plus souvent des données multimédias
avec des droits complexes et entrelacés.        Digital libraries : cataloging and indexing of electronic
De plus révolution programmée de la                   resources. Bibliography. In : IFLA electronic col-
                                                      lections. 
structure des pages Web, qui verra le pas-
                                                Digital libraries: metadata resources. In: IFLA electro-
sage du codage HTML au codage XML,
                                                      nic collections. 
des ressources et aux moyens de mettre
en œuvre les métadonnées associées aux
identifiants dans le contexte de l'édition
électronique sur le Web.
      Les tendances présentes sont l'identi-
fication d'un document ou d'une ressource
et de ses inscriptions dans des publica-
tions papier, électronique hors ligne, élec-
tronique en ligne, une des difficultés étant
que cette diversification des types de mani-
festations d'une œuvre fait éclater les typo-
logies classiques et, en particulier, la no-
tion de publication en série, avec tout l'ap-
                                                                                 >s
pareil d'identification qui l'accompagnait.
À cet égard, l'un des thèmes de réflexion
                                                                                  ^HnadianaJ&ï, La bibliographie nationale
actuellement le plus important - et directe-                                                      The National Bibliography
ment lié à l'identification et aux métadon-                                  Canadîana sur cédérom comprend 1,8 million de notices et
nées - est la mise en œuvre de la gestion                                    notamment :
des droits d'accès aux ressources par navi-                                  •    toutes les notices contenues dans les versions antérieures du
gation a partir des citations dans les arti-                                      cédérom Canadîana
cles.                                                                        •    les notices bibliographiques et d'autorités ajoutées ou modifiées
                                                                                  par la Bibliothèque nationale en 1999
                                                                             •    les notices de Carto-Canad/ana ajoutées ou modifiées par les
De nouveaux                                                                       Archives nationales en 1999
partenaires                                                                  •    les notices de Canadîana anciens microfilmées et publiées en
                                                                                  1999 par l'Institut canadien de microreproductions historiques
      Les publications sur Internet ne                                            (ICMH).
peuvent être gérées à l'aide des standards                                   Pour plus d'information, visitez notre site Web à :
des publications classiques. On assiste ac-                                  http://www.nlc-bnc.ca/canadiana/
tuellement à un grand mouvement de ré-                                       ou téléphonez au : (819) 994-6921, Courriel :
flexion et de modélisation conceptuelle qui                                  canadiana@nlc-bnc.ca
englobe les publications classiques et les                                   Pour commander, veuillez communiquer avec : Les Editions du
ressources électroniques. Cette modélisa-                                    gouvernement du Canada, ou téléphonez au : 1 -800-635-7943
tion s'accompagne de standards plus gé-                                      ou (819) 956-4800 ou Télécopieur : 1-800-565-7757 ou
nériques que ceux que nous avons                                             (819) 994-1498, site Web : http://publications.pwgsc.gc.ca
connus pour les publications traditionnel-
les. Leur élaboration se fait en collabora-
                                                                            1^*1          Bibliothèque nationale      National Library
tion avec de nouveaux partenaires pour
lesquels l'apport des professionnels de l'in-                               • • •         du Canada                   of Canada          Canada

194                                                                                                                                octobre-décembre 1999
Vous pouvez aussi lire