Attribuer un identifiant numérique DOI à une plateforme scientifique en 4 points

La page est créée Patrick Simon
 
CONTINUER À LIRE
Attribuer un DOI à une plateforme scientifique                                    https://coop-ist.cirad.fr

               Attribuer un identifiant numérique DOI
                    à une plateforme scientifique
                             en 4 points

1. Avantages d’un identifiant numérique pour une plateforme
2. Comprendre le fonctionnement d’un identifiant numérique de type DOI
3. DOI et métadonnées enregistrés auprès de l’agence DataCite
4. Exemple d’un DOI avec ses métadonnées attribuées à une plateforme
Sites utiles

     1. Avantages d’un identifiant numérique pour une plateforme

Dans le domaine de la recherche et du développement, les infrastructures, ou « plateformes »,
peuvent être physiques, c’est-à-dire localisées sur un site ou réparties entre plusieurs sites (bâtiment,
laboratoire, équipement, instrument…), ou virtuelles (système d’information, base de données, site
internet).
Elles peuvent être dédiées à l’animation d’un réseau ou à la réalisation d’expérimentations,
d’observations, de traitements (modélisation, calcul), de collecte (observatoire), ou au stockage, à
l’archivage et à la diffusion d’informations.
Ces plateformes sont des ressources scientifiques essentielles aux partenaires ou aux publics cibles :
communautés scientifiques, financeurs, décideurs, entreprises, société civile, etc. En portant leur offre
de productions ou de services à la connaissance de leurs publics, elles concourent à leur visibilité et
encouragent leur exploitation.
Comme pour tout produit de la recherche (publications scientifiques, jeux de données), l’identification
univoque et pérenne de ces plateformes scientifiques facilite leur découverte. Cette identification
passe par l’attribution d’un identifiant numérique formalisé selon un ou plusieurs standards
internationaux. Cette attribution permet la citation directe de la plateforme.

     2. Comprendre le fonctionnement d’un identifiant numérique de type DOI

Parmi les identifiants numériques pérennes d’objets, le DOI (Digital Object Identifier, identifiant
numérique d’objet) est le plus connu car couramment utilisé dans la sphère académique pour citer de
façon univoque les publications scientifiques et les jeux de données de recherche (voir fiche CoopIST
Identifier et rechercher une publication ou un jeu de données par son DOI).

Le DOI est un code alphanumérique identifiant de façon univoque une ressource scientifique. Il est
associé à un ensemble d’informations, appelées métadonnées, qui décrivent la ressource et les
conditions d’accès à cette ressource. Il prend la forme d’un lien hypertexte actionnable par
l’internaute ou par une machine : il donne accès à une page internet, appelée landing page, affichant
l’ensemble de ces métadonnées et permettant de connaître les conditions et modalités d’accès à la
ressource. Le DOI répond de ce fait à des règles d’écriture qui encapsulent toutes les informations de
description et d’accès à la ressource, même si cette ressource n’est pas numérique (herbier, collection
géologique, etc.).

                                                   1
Attribuer un DOI à une plateforme scientifique                                     https://coop-ist.cirad.fr

Attribuer un DOI à une ressource implique que l’organisation (institution de recherche, éditeur, etc.)
qui l’édite doit enregistrer ce DOI auprès d’une agence accréditée, comme le consortium DataCite
(https://datacite.org/index.html). Pour cela, l’institution doit s’acquitter d’une adhésion annuelle à
l’agence afin de bénéficier de son service d’enregistrement de DOI.
Le DOI vise à garantir l’intégrité de la ressource et la pérennité de son accès. Pour cela, l’organisation
qui a attribué le DOI se porte garante de la qualité des informations fournies, de leur actualisation et
de la pérennité d’accès. Par exemple, si la ressource est déplacée sur un nouveau site internet,
l’institution qui a attribué le DOI doit ressaisir et réenregistrer auprès de l’agence la nouvelle adresse
internet associée au DOI.

     3. DOI et métadonnées enregistrés auprès de l’agence DataCite

Le consortium à but non lucratif DataCite (https://datacite.org/index.html) est une agence
spécialisée dans l’enregistrement d’identifiants pérennes DOI attribués à des données scientifiques
(jeux et bases de données) et à d’autres types de produits issus de la recherche (audiovisuel, carte,
image, logiciel, modèle, objet physique, service…). Les plateformes ou infrastructures scientifiques
sont également concernées.
Le service DataCite Commons (https://commons.datacite.org) permet à tout public de rechercher et
d’afficher les DOI avec les métadonnées associées enregistrés auprès de DataCite.
Le service Assign DOIs de DataCite (https://datacite.org/dois.html) s’adresse spécifiquement aux
organisations attribuant des DOI. DataCite fournit une documentation détaillée sur les métadonnées
à renseigner pour décrire l’objet auquel est attribué un DOI. Cette documentation est le schéma de
métadonnées (http://schema.datacite.org/ ; en mai 2021, version 4.4 du 30 mars 2021).
Ce schéma accessible en téléchargement (pdf) présente les 20 métadonnées utilisées par DataCite
pour enregistrer un DOI, avec six métadonnées obligatoires (Mandatory), six recommandées
(Recommanded) et huit facultatives (Optional).

Métadonnées obligatoires :
• Identifier : identifiant de la ressource, c’est-à-dire le DOI attribué par l’institution, qui sera
   enregistré avec ses métadonnées auprès de DataCite
• Creator : auteurs ou collectivités-auteurs impliqués dans la production de données, ou auteurs de
   la publication (nom et identifiant de l’auteur – ex. : ORCID ID, nom et identifiant de l’affiliation de
   l’auteur…)
• Title : titre de la ressource à laquelle est attribuée le DOI
• Publisher : l’organisation qui produit ou émet ou publie ou distribue ou diffuse ou détient ou
   archive ou imprime la ressource
• Publication Year : date de publication c’est-à-dire de mise à disposition de la ressource au public
• Resource Type : type de la ressource, constitué d’un type spécifique libre (ex. : Infrastructure) et
   d’un type général issu d’une liste contrôlée de valeurs fournie par Datacite (ex. : Service)

Métadonnées recommandées :
• Subject : thématique, mots-clés ou expressions décrivant le contenu intellectuel de la ressource
• Contributors : tous les contributeurs physiques ou moraux de la ressource, associé chacun à un
   type (ContactPerson, DataCollector, DataCurator, Editor…) à sélectionner dans une liste de valeurs
• Date : différentes dates possibles d’activités associées à la ressource, avec pour chacune un type
   (created, updated…) selon une liste contrôlée de valeurs

                                                    2
Attribuer un DOI à une plateforme scientifique                                       https://coop-ist.cirad.fr

•   RelatedIdentifier : identifiants de ressources liées à la présente ressource, à associer chacun à un
    type issu d’une liste contrôlée de valeurs (ISBN, DOI, URL…), et à un type de relation sur liste
    contrôlée (IsPartOf, IsNewVersionOf, IsReviewedBy, IsDocumentedBy…)
•   Description : toute information complémentaire en texte libre décrivant la ressource, associée à
    un type de description sur liste (Abstract, Methods…)
•   Geolocation : région spatiale ou lieu précis de la ressource ou de ce sur quoi elle porte (longitude,
    latitude, emprise, texte libre descriptif…)

Métadonnées facultatives :
• Language : langue principale de la ressource selon un code de langue international en 2 ou 3
   caractères (norme ISO)
• AlternatedIdentifier : autre identifiant de la ressource, libre, par exemple propre à un domaine ou
   une organisation
• Size : dimensions d’une ressource (volume, temps, pages…)
• Format : format numérique de la ressource (pdf, XML, txt, jpeg, mpg…)
• Version : numéro de version de la ressource lors de changements majeurs
• Rights : toute information relative aux droits associés à la ressource (mentions légales, copyright,
   licence d’utilisation de la ressource…) avec le lien internet (URL, URI…) vers sa licence d’utilisation
• FundingReference : données de financement de la ressource (nom du bailleur, nom du programme
   et/ou projet de la subvention, identifiant associé au bailleur, code du programme et/ou du projet)
• RelatedItem : informations (type, identifiant, auteurs…) sur chacune des ressources liées à la
   ressource (ex. : publications, jeux de données)

     4. Exemple d’un DOI avec ses métadonnées attribuées à une plateforme

L’exemple choisi est la plateforme scientifique physique, l’Insectarium de Baillarguet. L’Insectarium
de Baillarguet est membre du réseau d'infrastructures de recherche Vectopole Sud réseau
Montpelliérain et il fait aussi partie de l’infrastructure nationale de recherche Emerg’In dédiée à la «
lutte contre les maladies infectieuses animales émergentes ou zoonotiques par l’exploration in vivo ».
Le Cirad, qui est l’institution gestionnaire de la plateforme, l’Insectarium de Baillarguet, a souhaité
l’identifier de façon univoque pour en accroître la visibilité nationale et internationale, faciliter sa
découverte, sa citation et sa reconnaissance par les agences de financement, les autres
établissements et la communauté scientifique. Cette plateforme a en effet été conçue dans le cadre
d’un partenariat français entre plusieurs établissements d’enseignement supérieur ou de recherche
et une collectivité territoriale dont le but est de créer un réseau de plateformes pour la recherche
sur les arthropodes d'intérêt médical, vétérinaire et agricole.
Le choix d’attribuer un DOI via DataCite a été motivé par l’adhésion du Cirad au consortium DataCite
et par la richesse de son schéma de métadonnées. Le choix et l’enregistrement des métadonnées
ont été réalisés par la délégation à l’information scientifique et technique du Cirad en collaboration
étroite avec les responsables scientifiques de la plateforme, pour qualifier celle-ci de façon la plus
complète et précise possible.

Le DOI attribué « 10.18167/infrastructure/00001 » comprend trois éléments :

•   le préfixe DataCite propre au Cirad « 10.18167 »
•   le suffixe « /infrastructure/ » choisi par le Cirad pour faciliter le repérage en français et en anglais
    du type de ressource

                                                     3
Attribuer un DOI à une plateforme scientifique                                 https://coop-ist.cirad.fr

•   un numéro séquentiel à cinq chiffres, ici « 00001 » car il s’agit de la première infrastructure
    enregistrée par le Cirad auprès de DataCite.

Les valeurs choisies pour les métadonnées DataCite de l’Insectarium de Baillarguet sont listées ci-
après entre parenthèses () précédées d’indications. Le formalisme de DataCite (balises encadrant les
valeurs de métadonnées) n’est pas restitué pour faciliter la lecture.

Métadonnées obligatoires :
• Identifier : DOI Cirad de la plateforme (10.18167/infrastructure/00001)
• Creator : déclaration des unités de recherche (UMR ASTRE, UMR Intertryp) ; déclaration des
   établissements de tutelle (Cirad, INRAe, IRD) ; déclaration des réseaux (Vectopole Sud, Emerg’In)
• Title : (Insectarium de Baillarguet)
• Publisher : (Cirad)
• Publication Year : date de début des activités dans le bâtiment insectarium (2014)
• Resource Type : ResourceType (Infrastructure) ; ResourceTypeGeneral (Service)

Métadonnées recommandées :
• Subject : descripteurs en anglais et en français issus du thesaurus Agrovoc de la FAO (animal
   diseases/maladie des animaux/tick-borne diseases/Arthropoda…) ; descripteurs complémentaires
   (expertise/insectarium) ; mots-clés libres (Vector competence/One Health…)
• RelatedIdentifier : ressources liées à l’insectarium avec leur URL et DOI (Réseau Vectopole Sud,
   Emerg’In) et le type de relation (IsPartOf) ; Autres plateformes du réseau Vectopole Sud avec leur
   URL et DOI et le type de relation (References) ; Autres plateformes de l’infrastructure Emerg’In
   avec leur URL et DOI et le type de relation (References)
• Description : textes de présentation de l’insectarium, issus de supports existants et enrichis
• Geolocation : (Montpellier, France)

Métadonnées facultatives :
• Language : (fre)
• Rights : intitulé (Licence Vectopole Sud) ; lien hypertexte vers la page Mentions légales de
   Vectopole Sud (https://www.vectopole-sud.fr/mention-legales/)
• FundingReference : liste des financements et des agences issues d’Open Funder Registry
   (EC/H2020/Projet européen Infravec2 ; ANR ; Ministère de l’Agriculture ; Cirad ; INRAe ; IRD ;
   Région Occitanie)

L’URL DOI de l’Insectarium de Baillarguet est https://doi.org/10.18167/infrastructure/00001.
renvoie à la landing page de l’Insectarium qui est la page d’accueil de son site Internet :
https://www.vectopole-sud.fr/plateformes/insectarium-de-baillarguet/.
• Sur le site DataCite Commons (https://commons.datacite.org/), la référence de l’insectarium peut
    être recherchée en tant que Works (Travaux) parmi les types d’objets, et affichée ;
• Sur le site DataCite Search (https://search.datacite.org/), la référence de l’insectarium peut être
    recherchée, affichée et exportée selon différents standards de citation (APA, Harvard, MLA,
    Vancouver, Chicago, IEEE, BibTeX, RIS) et dans différents formats de fichier (XML, JSON,
    Schema.org JSON-LD) permettant de voir les valeurs de métadonnées avec leurs balises.

                                                 4
Attribuer un DOI à une plateforme scientifique                                                                 https://coop-ist.cirad.fr

Sites utiles

CASRAI. Research Data Management Glossary. https://casrai.org/rdm-glossary/
DataCite Metadata Working Group. 2021. DataCite Metadata Schema Documentation for the
Publication and Citation of Research Data and Other Research Outputs. Version 4.4. DataCite e.V.
https://doi.org/10.14454/3w3z-sa82
European Union (EU), 1995-2021. European Research Infrastructures: What Research Infrastructures
are, what the Commission is doing, strategy areas, funding and news.
https://ec.europa.eu/info/research-and-innovation/strategy/european-research-infrastructures_en
Ministère de la recherche de l’enseignement supérieur et de l’innovation. 2018. Stratégie nationale
des infrastructures de recherche.
https://www.enseignementsup-recherche.gouv.fr/cid72588/la-strategie-nationale-des-
infrastructures-de-recherche.html

Marie-Claude Deboin, Jacqueline Péricé
Délégation à l’information scientifique et technique, Cirad
4 juin 2021

Comment citer ce document :
Deboin, M. C. ; Péricé, J. 2021. Attribuer un identifiant numérique DOI à une plateforme scientifique en 4 points. Montpellier (FRA) : CIRAD,
5 p. https://doi.org/10.18167/coopist/0080
Cette œuvre est mise à disposition selon les termes de la Licence Creative Commons : Attribution - Pas d’Utilisation Commerciale - Partage
dans les Mêmes Conditions 4.0 International, disponible en ligne : http://creativecommons.org/licenses/by-nc-sa/4.0/deed.fr ou par courrier
postal à : Creative Commons, 171 Second Street, Suite 300, San Francisco, California 94105, USA. Cette licence vous permet de remixer,
arranger, et adapter cette œuvre à des fins non commerciales tant que vous créditez l’auteur en citant son nom et que les nouvelles œuvres
sont diffusées selon les mêmes conditions.

                                                                     5
Vous pouvez aussi lire