Identification des ressources sur Internet et métadonnées : diversité des standards Identification of Ressources on the Internet and Metadata: A ...
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Document generated on 07/14/2022 12:47 a.m. Documentation et bibliothèques Identification des ressources sur Internet et métadonnées : diversité des standards Identification of Ressources on the Internet and Metadata: A Diversity of Standards Identificación de los recursos en Internet y metadatos: diversidad de normas Catherine Lupovici Volume 45, Number 4, October–December 1999 Article abstract Édition électronique Internet Electronic ressources identification and metadata creation for their discovery and their management are deeply modifying traditional standards URI: https://id.erudit.org/iderudit/1032722ar for international numbering and bibliographic description. The new emerging DOI: https://doi.org/10.7202/1032722ar standards are continuously evolving. They are more generic and developed in an object-oriented approach. They are at the same time building on the existing ones and the information and documentation community is actively See table of contents contributing to their elaboration within the new enlarged community involved in this standardization process. Publisher(s) Association pour l'avancement des sciences et des techniques de la documentation (ASTED) ISSN 0315-2340 (print) 2291-8949 (digital) Explore this journal Cite this article Lupovici, C. (1999). Identification des ressources sur Internet et métadonnées : diversité des standards. Documentation et bibliothèques, 45(4), 191–194. https://doi.org/10.7202/1032722ar Tous droits réservés © Association pour l'avancement des sciences et des This document is protected by copyright law. Use of the services of Érudit techniques de la documentation (ASTED), 1999 (including reproduction) is subject to its terms and conditions, which can be viewed online. https://apropos.erudit.org/en/users/policy-on-use/ This article is disseminated and preserved by Érudit. Érudit is a non-profit inter-university consortium of the Université de Montréal, Université Laval, and the Université du Québec à Montréal. Its mission is to promote and disseminate research. https://www.erudit.org/en/
Documentation et bibliothèques Identification des ressources sur Internet et métadonnées diversité des standards Catherine Lupovicî Directrice Département de la bibliothèque numérique Bibliothèque nationale de France catherine.lupovici @ bnf.fr L'identification des ressources électroniques disponibles sur Internet, ainsi que les métadonnées créées pour permettre leur découverte et leur gestion, ont profondément modifié les standards traditionnels de numérotation normalisée et de description bibliographique et do- cumentaire. Les nouveaux standards en évolution permanente sont désormais très génériques et proches de la modélisation objet. Ils n'ignorent cependant pas l'existant et sont élaborés par une communauté beaucoup plus large que celle de l'information et de la docu- mentation qui y apporte une contribution active. Identification of Ressources on the Internet and Metadata : A Identificaciôn de los recursos en Internet y metadatos: diver- Diversity of Standards sidad de normas Internet Electronic ressources identification and metadata crea- La identificaciôn de los recursos electrônicos disponibles en Inter- tion for their discovery and their management are deeply modi- net, asfcomo los metadatos creados para permitir que se descu- fying traditional standards for international numbering and biblio- brieran y administraran, modificaron profundamente las normas graphic description. The new emerging standards are continuous- tradicionales de numeraciôn normaiizada y de descripcion bi- ly evolving. They are more generic and developed in an object- bliogrâfica y documentai. Las nuevas normas, que evolucionan oriented approach. They are at the same time building on the exis- en forma permanente, son por el momento muy générales y se ting ones and the information and documentation community is ac- acercan a la enfoque centrado en el objeto. No obstante, no igno- tively contributing to their elaboration within the new enlarged com- ran lo existente y han sido elaboradas por una comunidad mucho munity involved in this standardization process. mas grande que la de la informaciôn y la de la documentaciôn, que aporta una contribuciôn muy activa a elia. Le terme de métadonnées désigne Le contexte Internet comme un tout et relativement à un de manière générique les données créées contexte défini d'utilisation. Ainsi le terme pour fournir des informations sur des res- Dans le contexte classique de docu- de ressource pourra aussi bien s'appli- sources électroniques d'information. Les ments primaires décrits dans des banques quer à un site complet ou à une page Web métadonnées peuvent remplir différentes de données bibliographiques et/ou docu- que bientôt -conséquence de l'évolution fonctions, telles que la gestion des ressour- mentaires, on avait affaire à deux mondes que le passage du codage HTML au co- ces décrites (par exemple, le suivi du cycle distincts ayant chacun leurs propres tech- dage XML va imposer au Web - à une por- de vie d'un document) ; la gestion des infor- niques et donc leurs propres standards. tion de page dès lors qu'elle sera autosuffi- mations décrivant le contenu d'un docu- L'émergence de documents électroni- sante par rapport à une utilisation particu- ment ou d'une ressource pour en faciliter ques, tout d'abord sur des supports hors lière. la découverte ou la localisation, puis l'ac- ligne comme le cédérom, puis sur Inter- Les métadonnées, quant à elles, peu- cès ; ou celle encore des informations rela- net, a considérablement modifié la situa- vent désormais être exprimées dans le for- tives aux droits d'accès aux ressources. tion de ces deux mondes dont les techni- mat technique de codage de la ressource Le concept de métadonnées est une exten- ques se sont rapprochées, avec des qu'elles accompagnent et être disponibles sion à l'environnement des ressources conséquences directes sur les standards en même temps qu'elle. Cette simultanéité électroniques - et essentiellement, à techniques utilisés par chacun. peut être offerte par le biais de l'applica- l'heure actuelle, à celui des services Web Tout d'abord la notion même de docu- tion qui rapproche deux sources différen- de l'Internet - du concept d'information se- ment et la typologie des documents ont tes en offrant à l'utilisateur une interface condaire décrivant une ressource pri- évolué. On parle davantage aujourd'hui, unique de recherche et de consultation maire. dans le monde du document électronique pour les deux types de données ; elle peut en ligne, de ressource: celle-ci devient un aussi provenir de ce que les métadonnées concept générique désignant un en- et le document sont traités dans un même semble de données pouvant être utilisé fichier informatique dès lors qu'ils sont octobre-décembre 1999 191
Documentation et bibliothèques encodes dans le même format et gérés d'adoption, comprend le modèle et une le lien à partir duquel on pourra y accéder. par les mêmes logiciels. syntaxe en XML (Extended Markup Lan- Les formats USMÂRC et UNIMÂRC ont Enfin, on considère qu'une même res- guage). Le modèle est générique et peut défini le champ 856 à cet effet. source peut être utilisée dans tel contexte être exploité avec une autre syntaxe que comme un ensemble de données sur des XML. Ce dispositif comprend également données, et comme une ressource dans des spécifications de schémas regroupant Standards pour le mode tel autre contexte. Il ne s'agit plus seule- des classes de types de ressources. «embedded » ment de créer a priori l'information secon- RDF est défini par des groupes d'utili- daire qui sera ultérieurement exploitée sateurs très divers comme les acteurs de Deux standards principaux ont été dé- pour trouver la ressource : c'est lors de l'uti- la normalisation relative à Internet, les bi- finis, l'un par la communauté des docu- lisation et grâce à un outil approprié de trai- bliothèques, les spécialistes de la structu- ments structurés, l'autre par celle de la nor- tement intelligent que les informations de ration des documents (XML/SGML) et malisation Internet. base seront interprétées pour donner ac- ceux de la représentation du savoir. Il béné- cès à cette ressource. ficie aussi d'une forte contribution tech- Le projet TEI Les différents acteurs qui souhaitent nique provenant des communautés de la exploiter Internet font par ailleurs pression programmation orientée objet, des langa- La Text Encoding Initiative (TEI) a été pour accélérer sa normalisation technique ges de modélisation et des systèmes de développée dès le début de la mise en afin de faciliter la découverte d'information gestion de bases de données. oeuvre de SGML (Standard Generalized grâce à des moteurs de recherche plus in- RDF est une modélisation des diffé- Markup Language, ISO 8879) par un telligents, et de mettre en œuvre la gestion rentes façons de gérer des métadonnées groupe de chercheurs en sciences humai- des droits d'utilisation des ressources. qui intègre celles qui existent déjà dans la nes, littérature et linguistique s'intéressant documentation et dans la gestion des res- à l'utilisation de l'informatique. Le projet sources électroniques des différentes com- TEI s'est concrétisé par une DTD (Défini- Le Resource Description munautés participant à son élaboration. Il tion de Type de Document) SGML accom- existe donc déjà des standards de méta- pagnée de recommandations pour le co- Framework (RDF) données qui appartiennent à l'un ou à dage de structure et l'échange des textes. l'autre mode d'association de métadon- La DTD TEI s'applique à chaque docu- C'est pour faciliter cette normalisation nées et de ressource et qui sont décrits ment électronique encode selon la DTD et technique que le W3Consortium, qui est dans le modèle RDF. Voici quelques exem- définit pour chaque unité documentaire responsable des évolutions techniques ples de l'intégration dans le modèle RDF électronique un en-tête obligatoire com- d'Internet, a proposé dès octobre 1997 un de standards de la documentation ou des portant les métadonnées. cadre général pour la description des res- bibliothèques. La sémantique de ces métadonnées sources dé l'Internet : le Resource Descrip- tion Framework. Son objectif était de faire peut être régie selon des règles de descrip- tion standardisées ou propriétaires. Dans passer le Web du niveau de machine-rea- Standards pour le mode le cadre d'une application telle que le pro- dable à celui de machine-understandable. Le modèle RDF ne prend en compte « service bureau » jet American Memory de la Bibliothèque que les métadonnées créées dans une du Congrès, une DTD TEI a été déve- Ces standards concernent la descrip- loppée et les métadonnées sont rédigées mention spécifique identifiée en tant que tion bibliographique ou documentaire. Ils selon les AACR2 (Anglo-American Catalo- telle. Cette mention de métadonnées peut recouvrent : ging Rules 2). être associée à la ressource de quatre ma- • les règles de description, c'est-à- nières différentes : dire la définition des éléments de descrip- » les métadonnées sont encapsu- La syntaxe meta HTML tion et les règles à observer pour créer ces lées dans la ressource: c'est le mode em- descriptifs à partir des informations figu- La DTD HTML (Hypertext Markup Lan- bedded; rant dans les ressources que l'on décrit; guage) qui a été définie pour la structura- • les métadonnées sont externes à la • les formats de description, c'est-à- tion des pages Web de l'Internet comporte ressource mais seront fournies avec elle dire le codage en machine permettant de une codification et une syntaxe dans le mécanisme de transfert de la ré- structurer les données en vue de leur exploi- pour l'écriture des métadonnées dans les ponse à une recherche d'information: tation dans des systèmes d'interrogation. pages Web. Ces tags ne sont pas c'est le mode along-with; Certains d'entre eux se sont déjà affichés par les navigateurs, mais ils sont « les métadonnées seront utilisées adaptés au contexte des ressources élec- utilisés par certains moteurs de recherche séparément de la ressource pour une re- troniques en étendant les règles de des- sur Internet de manière pondérée par rap- cherche d'information, éventuellement cription et les formats aux besoins de re- port au reste du texte des pages Web. dans des bases de données différentes : cherche et d'accès direct aux ressources Dans le cadre de cette standardisa- c'est le mode service bureau; électroniques. C'est ainsi que les formats tion Internet, certaines communautés d'uti- • la ressource est encapsulée dans MARC (Machine Readable Cataloging) of- lisateurs, dont les bibliothèques et les pro- les métadonnées qui la décrivent: c'est le frent désormais la possibilité d'indiquer la ducteurs de banques de données, ont tra- mode wrapped. localisation de la ressource électronique, vaillé à la standardisation des types de mé- Le dispositif RDF, qui est en cours ses caractéristiques techniques ainsi que tadonnées. C'est ainsi qu'est né le Dublin 192 octobre-décembre 1999
Documentation et bibliothèques Core qui définit un ensemble de quinze mé- cation des documents ont été créés de- net du terme) unique et persistant: il dé- tadonnées réparties en trois grands types : puis une trentaine d'années pour diffé- signe une ressource qui pourra être pré- • des métadonnées relatives au rents types de documents. L'ISBN (Interna- sente sur plusieurs sites comme autant contenu intellectuel de la page Web ; tionalStandard Book Number) pour le livre d'exemplaires. Ce numéro est résolu - a des métadonnées relatives à la pro- et l'ISSN (International Standard Serial c'est-à-dire qu'il indique le ou les URL du priété intellectuelle et en particulier aux in- Numbei) pour les publications en série, ou des sites où l'on peut consulter la res- formations sur la gestion des droits d'utili- sont les plus anciens et ont acquis le statut source - par une agence où il est enregis- sation de la page Web ; de normes internationales ISO. L'organisa- tré et qui maintient la validité des URL. m des métadonnées relatives à la res- tion de ces systèmes de numérotation re- Cette agence s'appelle une agence de ré- source elle-même et en particulier l'identi- pose sur un réseau international d'agen- solution du nom. fiant de la ressource, si possible unique et ces d'attribution et d'enregistrement des m L'URL (Uniform Resource Locatoi) persistant. Voir le tableau 1 du texte « La numéros. Ces identifiants sont utilisés à la est l'adresse du site où se trouve la res- publication électronique des thèses » des fois par les éditeurs pour la gestion de la source. On se connecte à ceJle-ci en cli- auteurs Boulétreau, Gauvin et Ducasse, commercialisation et par les bibliothèques quant sur ce lien qui n'est pas persistant et page 187. et centres de documentation pour la ges- dont la validité n'est pas garantie. Le succès du Dublin Core a été tel tion des commandes et l'identification bi- u L'URC (Uniform Resource Charac- que les éléments de description qui y sont bliographique et documentaire des ouvra- teristic) contient des métadonnées sur la définis sont retenus comme sémantique ges et périodiques. ressource et en particulier les modalités de métadonnées en dehors de la syntaxe Ce système de codes d'identification d'accès et la gestion des droits. Ces méta- HTML ; ils ont déjà été repris dans a ensuite été étendu aux unités logiques données peuvent être stockées dans une les premières spécifications de XML, dans composant un document, par exemple l'ar- banque de données d'enregistrement des un schéma minimum de base. ticle dans un fascicule de périodique. URN maintenue par l'agence d'enregistre- Dans la décennie quatre-vingt-dix, cette ment et de résolution. Elles peuvent égale- extension a été adaptée aux besoins de la ment se trouver sur un site différent et Standards pour le mode gestion, puis de la distribution de docu- liées aux URN. «wrapped» ments sous forme électronique. Alors que le concept de ressource Ce mode considère les métadonnées prend le pas sur celui de publication, une Le système DOI comme l'élément englobant pour la res- réflexion est actuellement conduite sur source. La DTD EAD (Encoding Archival l'identification des ressources. Envisagée Le système DOI (Digital Object Identi- Description) a été développée dans le dans le contexte du Web, cette identifica- fie/) est une application du système URI continent nord-américain pour la structura- tion s'accompagne d'une dimension dyna- mise en œuvre par une fédération d'édi- tion et l'encodage en XML des instru- mique, car il est devenu nécessaire que le teurs commerciaux par l'intermédiaire de ments de recherche décrivant des collec- système d'identification, non content la Fondation DOI. tions spécialisées telles que les archives d'identifier et de localiser une ressource, y Cette Fondation s'est constituée ou les collections de papiers. Ces instru- donne également accès. L'identifiant de- comme agence d'enregistrement des iden- ments de recherche sont, par exemple, vient actif et «cliquable». tifiants DOI des publications. Le numéro des inventaires d'archives publiques ou pri- DOI est un URN au sens Internet et il en a vées ou des catalogues de collections de la structure, composée d'un préfixe attri- documents manuscrits. Le système URI bué à l'éditeur et d'un suffixe qui est le nu- Cette DTD autorise une structuration méro de la ressource chez l'éditeur ou le de l'instrument de recherche en douze ni- L'Internet Engineering Task Force détenteur des droits. L'attribution de ce nu- veaux hiérarchiques et permet d'attacher (IETF), qui développe les standards Inter- méro relève de la responsabilité de l'édi- la ressource électronique à sa description. net, a lancé un travail de standardisation teur ou du détenteur des droits. Il peut être Elle est déjà utilisée dans des projets pour un système générique d'identifica- un identifiant issu des systèmes existants, coopératifs de collections de ressources tion des ressources du réseau, dont le prin- tels l'ISBN ou l'ISSN. L'attribution d'un électroniques. L'arborescence de l'instru- cipe est que l'identifiant peut à la fois repré- préfixe est conditionnée au paiement d'un ment de recherche peut servir de support senter la ressource et permettre d'y accé- droit par l'éditeur et elle comporte une à la navigation dans une telle collection. der: c'est le système URI (Uniform Re- clause sur le respect du copyright et l'enga- La DTD EAD émane de la communau- source Identifie/). Il s'agit de proposer un gement de mettre à jour, en cas de modifi- té des archives et des bibliothèques, mais cadre et des règles pour permettre à des cation, les URL servant à la résolution des elle est aussi expérimentée par des mu- organismes d'enregistrement de décrire DOI. sées d'Amérique du Nord. des ressources et d'en assurer la disponi- Les éditeurs entretiennent des bases bilité de manière à ce qu'elles soient finale- d'information sur les ressources qu'ils gè- ment accessibles dans un ou plusieurs rent: elles contiennent des URC, et c'est L'identification des sites via leurs URL. Ce cadre d'identifica- sur celles-ci que pointent les numéros DOI ressources tion s'appuie sur le dispositif suivant. de la base d'enregistrement. Un utilisateur a L'URN (Uniform Resource Name) effectuant une recherche par numéro Des numéros ou des codes d'identifi- de la ressource est son nom (au sens Inter- URN aura ainsi accès à la base URC octobre-décembre 1999 193
Documentation et bibliothèques associée à ce numéro et aura connais- formation peut être très important. Un sance des conditions d'accès à la res- exemple frappant en est le cas du Dublin source (accès gratuit, paiement à l'acte, Core. conditions d'abonnement, etc.). Les publications électroniques sur Internet utilisent et utiliseront de plus en Sources consultées plus souvent des données multimédias avec des droits complexes et entrelacés. Digital libraries : cataloging and indexing of electronic De plus révolution programmée de la resources. Bibliography. In : IFLA electronic col- lections. structure des pages Web, qui verra le pas- Digital libraries: metadata resources. In: IFLA electro- sage du codage HTML au codage XML, nic collections. des ressources et aux moyens de mettre en œuvre les métadonnées associées aux identifiants dans le contexte de l'édition électronique sur le Web. Les tendances présentes sont l'identi- fication d'un document ou d'une ressource et de ses inscriptions dans des publica- tions papier, électronique hors ligne, élec- tronique en ligne, une des difficultés étant que cette diversification des types de mani- festations d'une œuvre fait éclater les typo- logies classiques et, en particulier, la no- tion de publication en série, avec tout l'ap- >s pareil d'identification qui l'accompagnait. À cet égard, l'un des thèmes de réflexion ^HnadianaJ&ï, La bibliographie nationale actuellement le plus important - et directe- The National Bibliography ment lié à l'identification et aux métadon- Canadîana sur cédérom comprend 1,8 million de notices et nées - est la mise en œuvre de la gestion notamment : des droits d'accès aux ressources par navi- • toutes les notices contenues dans les versions antérieures du gation a partir des citations dans les arti- cédérom Canadîana cles. • les notices bibliographiques et d'autorités ajoutées ou modifiées par la Bibliothèque nationale en 1999 • les notices de Carto-Canad/ana ajoutées ou modifiées par les De nouveaux Archives nationales en 1999 partenaires • les notices de Canadîana anciens microfilmées et publiées en 1999 par l'Institut canadien de microreproductions historiques Les publications sur Internet ne (ICMH). peuvent être gérées à l'aide des standards Pour plus d'information, visitez notre site Web à : des publications classiques. On assiste ac- http://www.nlc-bnc.ca/canadiana/ tuellement à un grand mouvement de ré- ou téléphonez au : (819) 994-6921, Courriel : flexion et de modélisation conceptuelle qui canadiana@nlc-bnc.ca englobe les publications classiques et les Pour commander, veuillez communiquer avec : Les Editions du ressources électroniques. Cette modélisa- gouvernement du Canada, ou téléphonez au : 1 -800-635-7943 tion s'accompagne de standards plus gé- ou (819) 956-4800 ou Télécopieur : 1-800-565-7757 ou nériques que ceux que nous avons (819) 994-1498, site Web : http://publications.pwgsc.gc.ca connus pour les publications traditionnel- les. Leur élaboration se fait en collabora- 1^*1 Bibliothèque nationale National Library tion avec de nouveaux partenaires pour lesquels l'apport des professionnels de l'in- • • • du Canada of Canada Canada 194 octobre-décembre 1999
Vous pouvez aussi lire