Modèle de Plan de gestion des données (PGD)

La page est créée Alexandra Rey
 
CONTINUER À LIRE
Modèle de Plan de gestion des données (PGD)
Modèle de Plan de gestion des données

      Modèle
de Plan de gestion
des données (PGD)
Modèle de Plan de gestion des données

Dans le cadre de sa politique science ouverte, et en lien avec le Plan national pour la science ouverte,
l’Agence nationale de la recherche (ANR) demande l’élaboration d’un Plan de Gestion des Données (PGD)
pour les projets financés à partir de 2019. Elle participe ainsi à l’alignement européen et international en
faveur de la structuration et de l’ouverture des données de la recherche. Le principe « aussi ouvert que
possible aussi fermé que nécessaire » sera au cœur de sa démarche.

Soucieuse de développer une approche concertée, l’ANR a suivi les recommandations du Comité pour la
Science Ouverte (CoSO) qu’elle a sollicité et a adopté le modèle de PGD proposé par Science Europe
visant une harmonisation internationale de la gestion des données.

La démarche de l’ANR est d’accompagner et de favoriser l’adaptation progressive des communautés à
l’évolution des pratiques sur la question des données. Par ailleurs ce modèle s’adresse à l’ensemble des
bénéficiaires de l’ANR dans le respect de leurs spécificités disciplinaires.

Ce plan de gestion des données constitue un livrable qui devra être fourni dans les 6 mois qui suivent le
démarrage scientifique du projet. Il sera mis à jour au cours de la vie du projet selon les modalités
communiquées dans l’acte attributif d’aide et le Règlement financier de l’ANR.

Le document original en langue anglaise est publié sous licence Creative Commons Attribution 4.0. Il est
accessible sur le site de Science Europe :
https://www.scienceeurope.org/wp-content/uploads/2018/12/SE_RDM_Practical_Guide_Final.pdf
La traduction française a été réalisée dans le cadre des travaux du Collège Données du Secrétariat
Permanent pour la Science Ouverte. Cette traduction est publiée sous licence Creative Commons
Attribution 4.0
Le modèle ANR de PGD est disponible sur le Portail DMP OPIDoR pour une saisie en ligne :
https://dmp.opidor.fr/
Vous pouvez consultez l’intégralité des recommandations proposées par le groupe de travail « PGD » du
collège « données » du CoSO : https://www.ouvrirlascience.fr/plan-de-gestion-de-donnees-
recommandations-a-lanr/
Modèle de Plan de gestion des données

     AGENCE NATIONALE DE LA RECHERCHE (ANR) :
                      ANR - MODELE DE DMP (FRANÇAIS)

INFORMATIONS GENERALES
Renseignements administratifs

Acronyme
Code décision
Titre
Nom du coordinateur
Prénom du coordinateur
Affiliation
Contact concernant le PGD
Version du PGD
Date

1. DESCRIPTION DES DONNEES ET COLLECTE OU REUTILISATION DE DONNEES EXISTANTES
1a. Comment de nouvelles données seront-elles recueillies ou produites et/ou comment des données préexistantes
seront-elles réutilisées ?

Recommandations :
    •   E xp l i q u e r q u e l l e s m é t h o d o l o g i e s o u q u e l s l o g i c i e l s s e r o n t u t i l i s é s s i d e n o u v e l l e s
        données sont recueillies ou produites.
    •   Enoncer les éventuelles restrictions à la réutilisation des données préexistantes.
    •   E xp l i q u e r c o m m e n t l a p r o v e n a n c e d e s d o n n é e s s e r a d o c u m e n t é e .
    •   Indiquer brièvement le cas échéant, les raisons pour lesquelles l’utilisation de sources
        d e d o n n é e s e xi s t a n t e s a é t é e n v i s a g é e m a i s é c a r t é e .

1b. Quelles données (types, formats et volumes par ex.) seront collectées ou produites ?

Recommandations :
    •   D o n n e r d e s d é t a i l s s u r l e t y p e d e d o n n é e s : p a r e xe m p l e n u m é r i q u e ( b a s e s d e
        d o n n é e s , t a b l e u r s ) , t e xt u e l ( d o c u m e n t s ) , i m a g e , a u d i o , v i d é o , e t / o u m é d i a s
        composites.
    •   Détailler le format des données : la manière selon laquelle les données sont codées
        pour le stockage, généralement reflétée par l'extension du nom de fichier (par exemple
        p d f , xl s , d o c , t x t , o u r d f ) .
    •   Justifier l'utilisation de certains formats. Par exemple, les choix d’un format peuvent
        ê t r e g u i d é s p a r l ’ e xp e r t i s e d u p e r s o n n e l d e l ' o r g a n i s m e , o u p a r u n e p r é f é r e n c e p o u r
        les formats ouverts, par les standards de format acceptés par les entrepôts de
        données, par l’usage largement répandu dans une communauté de recherche ou par le
        logiciel ou l'équipement qui sera utilisé.
Modèle de Plan de gestion des données

    •   P r i vi l é g i e r l e s f o r m a t s s t a n d a r d s e t o u v e r t s c a r i l s f a c i l i t e n t l e p a r t a g e e t l a
        réutilisation à long terme des données (plusieurs catalogues fournissent des listes de
        ces "formats préférés").
    •   Donner des détails sur les volumes (qui peuvent être exprimés en espace de stockage
        requis (octets), et/ou en quantités d'objets, de fichiers, de lignes, et colonnes).

2. DOCUMENTATION ET QUALITE DES DONNEES
2a. Quelles métadonnées et quelle documentation (par exemple méthodologie de collecte et mode d'organisation
des données) accompagneront les données ?

Recommandations :
    •   Indiquer quelles métadonnées seront fournies pour aider à la recherche et à
        l’identification des données.
    •   I n d i q u e r q u e l s s t a n d a r d s d e m é t a d o n n é e s s e r o n t u t i l i s é s ( p a r e x e m p l e D D I , TE I , E M L ,
        M A R C , C MD I ) .
    •   U t i l i s e r l e s s t a n d a r d s d e m é t a d o n n é e s d e s c o m m u n a u t é s s c i e n t i f i q u e s l o r s q u e c e u x- c i
        e xi s t e n t .
    •   Indiquer comment les données seront organisées au cours du projet, en mentionnant
        par exemple les conventions de nommage, le contrôle de version et les structures des
        dossiers. Des données bien classées et gérées de façon cohérente seront plus faciles
        à retrouver, à comprendre et à réutiliser.
    •   Penser à la documentation qui serait nécessaire pour permettre une réutilisation des
        données. Il peut s'agir notamment de l'information sur la méthodologie utilisée pour
        collecter les données, sur les procédures et méthodes d’analyse utilisées, sur la
        définition des variables, des unités de mesure, etc.
    •   Te n i r c o m p t e d e l a f a ç o n d o n t c e s i n f o r m a t i o n s s e r o n t o b t e n u e s e t e n r e g i s t r é e s p a r
        e xe m p l e d a n s u n e b a s e d e d o n n é e s a v e c d e s l i e n s v e r s c h a c u n d e s f i c h i e r s , d a n s u n
        f i c h i e r t e x t e d e t y p e « l i s e z- m o i » , d a n s l e s e n - t ê t e s d e f i c h i e r s , d a n s u n l i v r e d e
        référence (« code book ») ou dans les cahiers de laboratoire.

2b. Quelles mesures de contrôle de la qualité des données seront mises en œuvre ?

Recommandations :
    •   E xp l i q u e r c o m m e n t l a q u a l i t é e t l a c o n f o r m i t é d e l a c o l l e c t e d e s d o n n é e s s e r o n t
        contrôlées et documentées. Il s'agit là de préciser les processus comme la calibration,
        la répétition des échantillons ou des mesures, la capture standardisée des données, la
        va l i d a t i o n d e s a i s i e d e s d o n n é e s , l a r e v u e p a r l e s p a i r s , o u l a r e p r é s e n t a t i o n b a s é e
        sur des vocabulaires contrôlés.

3. STOCKAGE ET SAUVEGARDE PENDANT LE PROCESSUS DE RECHERCHE
3a. Comment les données et les métadonnées seront-elles stockées et sauvegardées tout au long du processus de
recherche ?

Recommandations :
    •   Décrire l'endroit où les données seront stockées et sauvegardées au cours du
        processus de recherche et la fréquence à laquelle la sauvegarde sera effectuée. Il est
        recommandé de stocker les données dans au moins deux lieux distincts.
    •   P r i vi l é g i e r l ' u t i l i s a t i o n d e s y s t è m e s d e s t o c k a g e r o b u s t e s , a v e c s a u v e g a r d e
        automatique, tels que ceux fournis par les services informatiques de l'institution
        d'origine. Le stockage des données sur des ordinateurs portables, des disques durs
        e xt e r n e s , o u d e s p é r i p h é r i q u e s d e s t o c k a g e t e l s q u e d e s c l é s U S B n ' e s t p a s
        recommandé.
Modèle de Plan de gestion des données

3b. Comment la sécurité des données et la protection des données sensibles seront-elles assurées tout au long du
processus de recherche ?

Recommandations :
     •     E xp l i q u e r c o m m e n t l e s d o n n é e s s e r o n t r é c u p é r é e s e n c a s d ' i n c i d e n t .
     •     E xp l i q u e r q u i a u r a a c c è s a u x d o n n é e s a u c o u r s d u p r o c e s s u s d e r e c h e r c h e e t c o m m e n t
           l'accès aux données est contrôlé, en particulier dans le cadre de recherches menées
           en collaboration.
     •     Te n i r c o m p t e d e l a p r o t e c t i o n d e s d o n n é e s , e n p a r t i c u l i e r s i v o s d o n n é e s s o n t
           sensibles (par exemple données à caractère personnel, politiquement sensibles des
           i n f o r m a t i o n s o u s e c r e t s c o m m e r c i a u x) . D é c r i r e l e s p r i n c i p a u x r i s q u e s e t l a f a ç o n d o n t
           ils seront gérés.
     •     E xp l i q u e r q u e l l e p o l i t i q u e i n s t i t u t i o n n e l l e d e p r o t e c t i o n d e s d o n n é e s e s t m i s e e n
           œuvre.

4. EXIGENCES LEGALES ET ETHIQUES, CODES DE CONDUITE
4a. Si des données à caractère personnel sont traitées, comment le respect des dispositions de la législation sur les
données à caractère personnel et sur la sécurité des données sera-t-il assuré ?

Recommandations :
L o r s q u e vo u s m a n i p u l e z d e s d o n n é e s à c a r a c t è r e p e r s o n n e l , v e i l l e z à c e q u e l e s l o i s s u r l a
protection des données (par exemple, RGPD) soient appliquées, notamment :
     •     Obtenir un consentement éclairé pour la préservation et/ou le partage de données
           personnelles.
     •     E n vi s a g e r l ' a n o n y m i s a t i o n d e s d o n n é e s p e r s o n n e l l e s p o u r l a p r é s e r v a t i o n e t / o u l e
           partage (des données correctement anonymisées ne sont plus considérées comme des
           données personnelles).
     •     E n vi s a g e r l a p s e u d o n y m i s a t i o n d e s d o n n é e s p e r s o n n e l l e s ( l a p r i n c i p a l e d i f f é r e n c e
           a ve c l ' a n o n y m i s a t i o n e s t q u e l a p s e u d o n y m i s a t i o n e s t r é v e r s i b l e ) .
     •     E n vi s a g e r l e c h i f f r e m e n t d e s d o n n é e s , q u i e s t c o n s i d é r é c o m m e u n c a s p a r t i c u l i e r d e
           pseudonymisation (la clé de cryptage doit alors être stockée séparément des données,
           par exemple par un tiers de confiance).
     •     E xp l i q u e r s i u n e p r o c é d u r e d ’ a c c è s s p é c i f i q u e a é t é m i s e e n p l a c e p o u r l e s u t i l i s a t e u r s
           autorisés à accéder aux données personnelles.

4b. Comment les autres questions juridiques, comme la titularité ou les droits de propriété intellectuelle sur les
données, seront-elles abordées ? Quelle est la législation applicable en la matière ?

Recommandations :
     •     E xp l i q u e r q u i s e r a l e p r o p r i é t a i r e d e s d o n n é e s , c ' e s t - à - d i r e q u i a u r a l e d r o i t d ’ e n
           contrôler l’accès :
                      E xp l i q u e r q u e l l e s c o n d i t i o n s d ' a c c è s s ' a p p l i q u e r o n t a u x d o n n é e s . L e s d o n n é e s
                       seront-elles librement accessibles, ou des restrictions seront-elles
                       appliquées ? Si oui, lesquelles ? Envisager l'utilisation de licences concernant
                       l'accès et la réutilisation des données.
                      S'assurer de couvrir, dans l’accord de consortium, ces questions de droits de
                       contrôle d'accès aux données pour les projets multipartenaires et en cas de
                       propriété partagée des données.
     •     Indiquer si les droits de propriété intellectuelle (par exemple la directive bases de
           données, droits sui generis) sont affectés. Dans l'affirmative, expliquer lesquels et
           comment cela sera traité.
     •     Indiquer s'il y a des restrictions sur la réutilisation des données fournies par des tiers.
Modèle de Plan de gestion des données

4c. Comment les éventuelles questions éthiques seront-elles prises en compte, et les codes déontologiques
respectés ?

Recommandations :
    •   Déterminer si les questions d'éthique auront une incidence sur la façon dont les
        données seront stockées et transférées, qui pourra les voir ou les utiliser, et quelles
        durées de conservation leur seront appliquées. Démontrer que ces aspects sont bien
        pris en compte et planifiés.
    •   Adopter les codes de conduite nationaux et internationaux et le code d’éthique
        institutionnel et vérifier si une revue des pratiques (par exemple par un comité
        d'éthique) est requise pour ce qui concerne la collecte de données dans le cadre du
        projet de recherche.

5. PARTAGE DES DONNEES ET CONSERVATION A LONG TERME
5a. Comment et quand les données seront-elles partagées ? Y-a-t-il des restrictions au partage des données ou des
raisons de définir un embargo ?

Recommandations :
    •   E xp l i q u e r c o m m e n t l e s d o n n é e s p o u r r o n t ê t r e r e t r o u v é e s e t p a r t a g é e s ( p a r e xe m p l e ,
        par le dépôt dans un entrepôt de données de confiance, l'indexation dans un
        catalogue, par l’utilisation d'un service de données sécurisé, par le traitement direct
        des demandes de données, ou l'utilisation de tout autre mécanisme).
    •   Définir le plan de préservation des données et fournir l’information sur la durée
        d’archivage pérenne des données.
    •   E xp l i q u e r à q u e l m o m e n t l e s d o n n é e s s e r o n t r e n d u e s d i s p o n i b l e s . I n d i q u e r l e s d é l a i s
        d e p u b l i c a t i o n p r é v u s . E x p l i q u e r s i u n e u t i l i s a t i o n e xc l u s i v e d e s d o n n é e s e s t
        r e ve n d i q u é e e t , d a n s l ' a f f i r m a t i v e , p o u r q u e l l e r a i s o n e t p o u r c o m b i e n d e t e m p s .
        Indiquer si le partage des données sera différé ou limité, par exemple pour des raisons
        de publication, pour protéger la propriété intellectuelle, ou le dépôt de brevets.
    •   Indiquer qui pourra utiliser les données. S'il s’avère nécessaire de restreindre l'accès
        pour certaines communautés ou d’imposer un accord pour le partage de données,
        e xp l i q u e r c o m m e n t e t p o u r q u o i . E x p l i q u e r l e s m e s u r e s q u i s e r o n t p r i s e s p o u r d é p a s s e r
        ou minimiser ces restrictions.

5b. Comment les données à conserver seront-elles sélectionnées et où seront-elles préservées sur le long terme (par
ex. un entrepôt de données ou une archive) ?

Recommandations :
    •   Indiquer quelles données ne doivent pas être divulguées ou doivent être détruites pour
        des raisons contractuelles, légales, ou réglementaires.
    •   Indiquer comment il sera décidé quelles données garder. Décrire les données qui
        seront à préserver à long terme.
    •   Décrire les utilisations (et/ou les utilisateurs) prévisibles des données dans un cadre
        de recherche.
    •   Indiquer où les données seront déposées. Si aucun entrepôt reconnu n'est proposé,
        démontrer dans le plan de gestion des données que les données pourront être prises
        en charge efficacement au-delà de la durée de financement du projet. Il est
        recommandé de démontrer que les politiques des entrepôts et les procédures de
        dépôts (y compris les standards de métadonnées, et coûts mis en œuvre) ont été
        vé r i f i é s .
Modèle de Plan de gestion des données

5c. Quelles méthodes ou quels outils logiciels seront nécessaires pour accéder et utiliser les données ?

Recommandations :
    •    Indiquer si les utilisateurs potentiels auront besoin d’outils spécifiques pour l’accès et
         la (ré)utilisation des données. Tenir compte de la durée de vie des logiciels
         nécessaires pour accéder aux données.
    •    Indiquer si les données seront partagées via un entrepôt, si les demandes d’accès
         seront traitées en direct, ou si un autre mécanisme sera utilisé ?

5d. Comment l'attribution d'un identifiant unique et pérenne (comme le DOI) sera-t-elle assurée pour chaque jeu de
données ?

Recommandations :
    •    E xp l i q u e r c o m m e n t l e s d o n n é e s p o u r r a i e n t ê t r e r é u t i l i s é e s d a n s d ' a u t re s c o n t e xt e s .
         Les identifiants pérennes devraient être appliqués de manière à ce que les données
         puissent être localisées et référencées de façon fiable et efficace. Les identifiants
         pérennes aident aussi à comptabiliser les citations et les réutilisations.
    •    Indiquer s’il sera envisagé d’attribuer aux données un identifiant pérenne.
         T yp i q u e m e n t , u n e n t r e p ô t p é r e n n e d e c o n f i a n c e a t t r i b u e r a d e s i d e n t i f i a n t s p é r e n n e s.

6. RESPONSABILITES ET RESSOURCES EN MATIERE DE GESTION DES DONNEES
6a. Qui (par exemple rôle, position et institution de rattachement) sera responsable de la gestion des données (c’est-
à-dire le gestionnaire des données) ?

Recommandations :
    •    Décrire les rôles et les responsabilités concernant les activités de gestion des
         données, par exemple : saisie des données, production des métadonnées, qualité des
         données, stockage et sauvegarde, archivage et partage des données. Nommer la(es)
         personne(s) responsable(s) impliquée(s) dans la mesure du possible.
    •    Pour les projets menés en collaboration, expliquer comment s’effectue la coordination
         des responsabilités de gestion des données entre partenaires.
    •    Indiquer qui est responsable de la mise en œuvre du DMP, et qui s'assure qu'il est
         e xa m i n é e t , s i n é c e s s a i r e , r é v i s é .
    •    E n vi s a g e r d e s m i s e s à j o u r r é g u l i è r e s d u D M P .

6b. Quelles seront les ressources (budget et temps alloués) dédiées à la gestion des données permettant de
s'assurer que les données seront FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable) ?

Recommandations :
    •    E xp l i q u e r c o m m e n t l e s r e s s o u r c e s n é c e s s a i r e s ( p a r e xe m p l e , l e t e m p s ) à l a
         préparation des données pour le partage/préservation (curation des données) ont été
         chiffrées. Examiner et justifier soigneusement toutes les ressources nécessaires pour
         diffuser les données.
    •    Il peut s'agir de frais de stockage, de coût matériel, de temps de personnel, de coûts
         de préparation des données pour le dépôt, de frais d’entrepôt et d'archivage.
    •    Indiquer si des ressources supplémentaires sont nécessaires pour préparer les
         d o n n é e s e n v u e d e l e u r d é p ô t o u p o u r p a ye r t o u s l e s f r a i s d e m a n d é s p a r l e s e n t r e p ô t s
         de données. Si oui, précisez le montant et comment ces coûts seront couverts.
Modèle de Plan de gestion des données

            www. anr.f r

   @agencerecherche             ANR
Vous pouvez aussi lire