Modèle de Plan de gestion des données (PGD)
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Modèle de Plan de gestion des données Dans le cadre de sa politique science ouverte, et en lien avec le Plan national pour la science ouverte, l’Agence nationale de la recherche (ANR) demande l’élaboration d’un Plan de Gestion des Données (PGD) pour les projets financés à partir de 2019. Elle participe ainsi à l’alignement européen et international en faveur de la structuration et de l’ouverture des données de la recherche. Le principe « aussi ouvert que possible aussi fermé que nécessaire » sera au cœur de sa démarche. Soucieuse de développer une approche concertée, l’ANR a suivi les recommandations du Comité pour la Science Ouverte (CoSO) qu’elle a sollicité et a adopté le modèle de PGD proposé par Science Europe visant une harmonisation internationale de la gestion des données. La démarche de l’ANR est d’accompagner et de favoriser l’adaptation progressive des communautés à l’évolution des pratiques sur la question des données. Par ailleurs ce modèle s’adresse à l’ensemble des bénéficiaires de l’ANR dans le respect de leurs spécificités disciplinaires. Ce plan de gestion des données constitue un livrable qui devra être fourni dans les 6 mois qui suivent le démarrage scientifique du projet. Il sera mis à jour au cours de la vie du projet selon les modalités communiquées dans l’acte attributif d’aide et le Règlement financier de l’ANR. Le document original en langue anglaise est publié sous licence Creative Commons Attribution 4.0. Il est accessible sur le site de Science Europe : https://www.scienceeurope.org/wp-content/uploads/2018/12/SE_RDM_Practical_Guide_Final.pdf La traduction française a été réalisée dans le cadre des travaux du Collège Données du Secrétariat Permanent pour la Science Ouverte. Cette traduction est publiée sous licence Creative Commons Attribution 4.0 Le modèle ANR de PGD est disponible sur le Portail DMP OPIDoR pour une saisie en ligne : https://dmp.opidor.fr/ Vous pouvez consultez l’intégralité des recommandations proposées par le groupe de travail « PGD » du collège « données » du CoSO : https://www.ouvrirlascience.fr/plan-de-gestion-de-donnees- recommandations-a-lanr/
Modèle de Plan de gestion des données AGENCE NATIONALE DE LA RECHERCHE (ANR) : ANR - MODELE DE DMP (FRANÇAIS) INFORMATIONS GENERALES Renseignements administratifs Acronyme Code décision Titre Nom du coordinateur Prénom du coordinateur Affiliation Contact concernant le PGD Version du PGD Date 1. DESCRIPTION DES DONNEES ET COLLECTE OU REUTILISATION DE DONNEES EXISTANTES 1a. Comment de nouvelles données seront-elles recueillies ou produites et/ou comment des données préexistantes seront-elles réutilisées ? Recommandations : • E xp l i q u e r q u e l l e s m é t h o d o l o g i e s o u q u e l s l o g i c i e l s s e r o n t u t i l i s é s s i d e n o u v e l l e s données sont recueillies ou produites. • Enoncer les éventuelles restrictions à la réutilisation des données préexistantes. • E xp l i q u e r c o m m e n t l a p r o v e n a n c e d e s d o n n é e s s e r a d o c u m e n t é e . • Indiquer brièvement le cas échéant, les raisons pour lesquelles l’utilisation de sources d e d o n n é e s e xi s t a n t e s a é t é e n v i s a g é e m a i s é c a r t é e . 1b. Quelles données (types, formats et volumes par ex.) seront collectées ou produites ? Recommandations : • D o n n e r d e s d é t a i l s s u r l e t y p e d e d o n n é e s : p a r e xe m p l e n u m é r i q u e ( b a s e s d e d o n n é e s , t a b l e u r s ) , t e xt u e l ( d o c u m e n t s ) , i m a g e , a u d i o , v i d é o , e t / o u m é d i a s composites. • Détailler le format des données : la manière selon laquelle les données sont codées pour le stockage, généralement reflétée par l'extension du nom de fichier (par exemple p d f , xl s , d o c , t x t , o u r d f ) . • Justifier l'utilisation de certains formats. Par exemple, les choix d’un format peuvent ê t r e g u i d é s p a r l ’ e xp e r t i s e d u p e r s o n n e l d e l ' o r g a n i s m e , o u p a r u n e p r é f é r e n c e p o u r les formats ouverts, par les standards de format acceptés par les entrepôts de données, par l’usage largement répandu dans une communauté de recherche ou par le logiciel ou l'équipement qui sera utilisé.
Modèle de Plan de gestion des données • P r i vi l é g i e r l e s f o r m a t s s t a n d a r d s e t o u v e r t s c a r i l s f a c i l i t e n t l e p a r t a g e e t l a réutilisation à long terme des données (plusieurs catalogues fournissent des listes de ces "formats préférés"). • Donner des détails sur les volumes (qui peuvent être exprimés en espace de stockage requis (octets), et/ou en quantités d'objets, de fichiers, de lignes, et colonnes). 2. DOCUMENTATION ET QUALITE DES DONNEES 2a. Quelles métadonnées et quelle documentation (par exemple méthodologie de collecte et mode d'organisation des données) accompagneront les données ? Recommandations : • Indiquer quelles métadonnées seront fournies pour aider à la recherche et à l’identification des données. • I n d i q u e r q u e l s s t a n d a r d s d e m é t a d o n n é e s s e r o n t u t i l i s é s ( p a r e x e m p l e D D I , TE I , E M L , M A R C , C MD I ) . • U t i l i s e r l e s s t a n d a r d s d e m é t a d o n n é e s d e s c o m m u n a u t é s s c i e n t i f i q u e s l o r s q u e c e u x- c i e xi s t e n t . • Indiquer comment les données seront organisées au cours du projet, en mentionnant par exemple les conventions de nommage, le contrôle de version et les structures des dossiers. Des données bien classées et gérées de façon cohérente seront plus faciles à retrouver, à comprendre et à réutiliser. • Penser à la documentation qui serait nécessaire pour permettre une réutilisation des données. Il peut s'agir notamment de l'information sur la méthodologie utilisée pour collecter les données, sur les procédures et méthodes d’analyse utilisées, sur la définition des variables, des unités de mesure, etc. • Te n i r c o m p t e d e l a f a ç o n d o n t c e s i n f o r m a t i o n s s e r o n t o b t e n u e s e t e n r e g i s t r é e s p a r e xe m p l e d a n s u n e b a s e d e d o n n é e s a v e c d e s l i e n s v e r s c h a c u n d e s f i c h i e r s , d a n s u n f i c h i e r t e x t e d e t y p e « l i s e z- m o i » , d a n s l e s e n - t ê t e s d e f i c h i e r s , d a n s u n l i v r e d e référence (« code book ») ou dans les cahiers de laboratoire. 2b. Quelles mesures de contrôle de la qualité des données seront mises en œuvre ? Recommandations : • E xp l i q u e r c o m m e n t l a q u a l i t é e t l a c o n f o r m i t é d e l a c o l l e c t e d e s d o n n é e s s e r o n t contrôlées et documentées. Il s'agit là de préciser les processus comme la calibration, la répétition des échantillons ou des mesures, la capture standardisée des données, la va l i d a t i o n d e s a i s i e d e s d o n n é e s , l a r e v u e p a r l e s p a i r s , o u l a r e p r é s e n t a t i o n b a s é e sur des vocabulaires contrôlés. 3. STOCKAGE ET SAUVEGARDE PENDANT LE PROCESSUS DE RECHERCHE 3a. Comment les données et les métadonnées seront-elles stockées et sauvegardées tout au long du processus de recherche ? Recommandations : • Décrire l'endroit où les données seront stockées et sauvegardées au cours du processus de recherche et la fréquence à laquelle la sauvegarde sera effectuée. Il est recommandé de stocker les données dans au moins deux lieux distincts. • P r i vi l é g i e r l ' u t i l i s a t i o n d e s y s t è m e s d e s t o c k a g e r o b u s t e s , a v e c s a u v e g a r d e automatique, tels que ceux fournis par les services informatiques de l'institution d'origine. Le stockage des données sur des ordinateurs portables, des disques durs e xt e r n e s , o u d e s p é r i p h é r i q u e s d e s t o c k a g e t e l s q u e d e s c l é s U S B n ' e s t p a s recommandé.
Modèle de Plan de gestion des données 3b. Comment la sécurité des données et la protection des données sensibles seront-elles assurées tout au long du processus de recherche ? Recommandations : • E xp l i q u e r c o m m e n t l e s d o n n é e s s e r o n t r é c u p é r é e s e n c a s d ' i n c i d e n t . • E xp l i q u e r q u i a u r a a c c è s a u x d o n n é e s a u c o u r s d u p r o c e s s u s d e r e c h e r c h e e t c o m m e n t l'accès aux données est contrôlé, en particulier dans le cadre de recherches menées en collaboration. • Te n i r c o m p t e d e l a p r o t e c t i o n d e s d o n n é e s , e n p a r t i c u l i e r s i v o s d o n n é e s s o n t sensibles (par exemple données à caractère personnel, politiquement sensibles des i n f o r m a t i o n s o u s e c r e t s c o m m e r c i a u x) . D é c r i r e l e s p r i n c i p a u x r i s q u e s e t l a f a ç o n d o n t ils seront gérés. • E xp l i q u e r q u e l l e p o l i t i q u e i n s t i t u t i o n n e l l e d e p r o t e c t i o n d e s d o n n é e s e s t m i s e e n œuvre. 4. EXIGENCES LEGALES ET ETHIQUES, CODES DE CONDUITE 4a. Si des données à caractère personnel sont traitées, comment le respect des dispositions de la législation sur les données à caractère personnel et sur la sécurité des données sera-t-il assuré ? Recommandations : L o r s q u e vo u s m a n i p u l e z d e s d o n n é e s à c a r a c t è r e p e r s o n n e l , v e i l l e z à c e q u e l e s l o i s s u r l a protection des données (par exemple, RGPD) soient appliquées, notamment : • Obtenir un consentement éclairé pour la préservation et/ou le partage de données personnelles. • E n vi s a g e r l ' a n o n y m i s a t i o n d e s d o n n é e s p e r s o n n e l l e s p o u r l a p r é s e r v a t i o n e t / o u l e partage (des données correctement anonymisées ne sont plus considérées comme des données personnelles). • E n vi s a g e r l a p s e u d o n y m i s a t i o n d e s d o n n é e s p e r s o n n e l l e s ( l a p r i n c i p a l e d i f f é r e n c e a ve c l ' a n o n y m i s a t i o n e s t q u e l a p s e u d o n y m i s a t i o n e s t r é v e r s i b l e ) . • E n vi s a g e r l e c h i f f r e m e n t d e s d o n n é e s , q u i e s t c o n s i d é r é c o m m e u n c a s p a r t i c u l i e r d e pseudonymisation (la clé de cryptage doit alors être stockée séparément des données, par exemple par un tiers de confiance). • E xp l i q u e r s i u n e p r o c é d u r e d ’ a c c è s s p é c i f i q u e a é t é m i s e e n p l a c e p o u r l e s u t i l i s a t e u r s autorisés à accéder aux données personnelles. 4b. Comment les autres questions juridiques, comme la titularité ou les droits de propriété intellectuelle sur les données, seront-elles abordées ? Quelle est la législation applicable en la matière ? Recommandations : • E xp l i q u e r q u i s e r a l e p r o p r i é t a i r e d e s d o n n é e s , c ' e s t - à - d i r e q u i a u r a l e d r o i t d ’ e n contrôler l’accès : E xp l i q u e r q u e l l e s c o n d i t i o n s d ' a c c è s s ' a p p l i q u e r o n t a u x d o n n é e s . L e s d o n n é e s seront-elles librement accessibles, ou des restrictions seront-elles appliquées ? Si oui, lesquelles ? Envisager l'utilisation de licences concernant l'accès et la réutilisation des données. S'assurer de couvrir, dans l’accord de consortium, ces questions de droits de contrôle d'accès aux données pour les projets multipartenaires et en cas de propriété partagée des données. • Indiquer si les droits de propriété intellectuelle (par exemple la directive bases de données, droits sui generis) sont affectés. Dans l'affirmative, expliquer lesquels et comment cela sera traité. • Indiquer s'il y a des restrictions sur la réutilisation des données fournies par des tiers.
Modèle de Plan de gestion des données 4c. Comment les éventuelles questions éthiques seront-elles prises en compte, et les codes déontologiques respectés ? Recommandations : • Déterminer si les questions d'éthique auront une incidence sur la façon dont les données seront stockées et transférées, qui pourra les voir ou les utiliser, et quelles durées de conservation leur seront appliquées. Démontrer que ces aspects sont bien pris en compte et planifiés. • Adopter les codes de conduite nationaux et internationaux et le code d’éthique institutionnel et vérifier si une revue des pratiques (par exemple par un comité d'éthique) est requise pour ce qui concerne la collecte de données dans le cadre du projet de recherche. 5. PARTAGE DES DONNEES ET CONSERVATION A LONG TERME 5a. Comment et quand les données seront-elles partagées ? Y-a-t-il des restrictions au partage des données ou des raisons de définir un embargo ? Recommandations : • E xp l i q u e r c o m m e n t l e s d o n n é e s p o u r r o n t ê t r e r e t r o u v é e s e t p a r t a g é e s ( p a r e xe m p l e , par le dépôt dans un entrepôt de données de confiance, l'indexation dans un catalogue, par l’utilisation d'un service de données sécurisé, par le traitement direct des demandes de données, ou l'utilisation de tout autre mécanisme). • Définir le plan de préservation des données et fournir l’information sur la durée d’archivage pérenne des données. • E xp l i q u e r à q u e l m o m e n t l e s d o n n é e s s e r o n t r e n d u e s d i s p o n i b l e s . I n d i q u e r l e s d é l a i s d e p u b l i c a t i o n p r é v u s . E x p l i q u e r s i u n e u t i l i s a t i o n e xc l u s i v e d e s d o n n é e s e s t r e ve n d i q u é e e t , d a n s l ' a f f i r m a t i v e , p o u r q u e l l e r a i s o n e t p o u r c o m b i e n d e t e m p s . Indiquer si le partage des données sera différé ou limité, par exemple pour des raisons de publication, pour protéger la propriété intellectuelle, ou le dépôt de brevets. • Indiquer qui pourra utiliser les données. S'il s’avère nécessaire de restreindre l'accès pour certaines communautés ou d’imposer un accord pour le partage de données, e xp l i q u e r c o m m e n t e t p o u r q u o i . E x p l i q u e r l e s m e s u r e s q u i s e r o n t p r i s e s p o u r d é p a s s e r ou minimiser ces restrictions. 5b. Comment les données à conserver seront-elles sélectionnées et où seront-elles préservées sur le long terme (par ex. un entrepôt de données ou une archive) ? Recommandations : • Indiquer quelles données ne doivent pas être divulguées ou doivent être détruites pour des raisons contractuelles, légales, ou réglementaires. • Indiquer comment il sera décidé quelles données garder. Décrire les données qui seront à préserver à long terme. • Décrire les utilisations (et/ou les utilisateurs) prévisibles des données dans un cadre de recherche. • Indiquer où les données seront déposées. Si aucun entrepôt reconnu n'est proposé, démontrer dans le plan de gestion des données que les données pourront être prises en charge efficacement au-delà de la durée de financement du projet. Il est recommandé de démontrer que les politiques des entrepôts et les procédures de dépôts (y compris les standards de métadonnées, et coûts mis en œuvre) ont été vé r i f i é s .
Modèle de Plan de gestion des données 5c. Quelles méthodes ou quels outils logiciels seront nécessaires pour accéder et utiliser les données ? Recommandations : • Indiquer si les utilisateurs potentiels auront besoin d’outils spécifiques pour l’accès et la (ré)utilisation des données. Tenir compte de la durée de vie des logiciels nécessaires pour accéder aux données. • Indiquer si les données seront partagées via un entrepôt, si les demandes d’accès seront traitées en direct, ou si un autre mécanisme sera utilisé ? 5d. Comment l'attribution d'un identifiant unique et pérenne (comme le DOI) sera-t-elle assurée pour chaque jeu de données ? Recommandations : • E xp l i q u e r c o m m e n t l e s d o n n é e s p o u r r a i e n t ê t r e r é u t i l i s é e s d a n s d ' a u t re s c o n t e xt e s . Les identifiants pérennes devraient être appliqués de manière à ce que les données puissent être localisées et référencées de façon fiable et efficace. Les identifiants pérennes aident aussi à comptabiliser les citations et les réutilisations. • Indiquer s’il sera envisagé d’attribuer aux données un identifiant pérenne. T yp i q u e m e n t , u n e n t r e p ô t p é r e n n e d e c o n f i a n c e a t t r i b u e r a d e s i d e n t i f i a n t s p é r e n n e s. 6. RESPONSABILITES ET RESSOURCES EN MATIERE DE GESTION DES DONNEES 6a. Qui (par exemple rôle, position et institution de rattachement) sera responsable de la gestion des données (c’est- à-dire le gestionnaire des données) ? Recommandations : • Décrire les rôles et les responsabilités concernant les activités de gestion des données, par exemple : saisie des données, production des métadonnées, qualité des données, stockage et sauvegarde, archivage et partage des données. Nommer la(es) personne(s) responsable(s) impliquée(s) dans la mesure du possible. • Pour les projets menés en collaboration, expliquer comment s’effectue la coordination des responsabilités de gestion des données entre partenaires. • Indiquer qui est responsable de la mise en œuvre du DMP, et qui s'assure qu'il est e xa m i n é e t , s i n é c e s s a i r e , r é v i s é . • E n vi s a g e r d e s m i s e s à j o u r r é g u l i è r e s d u D M P . 6b. Quelles seront les ressources (budget et temps alloués) dédiées à la gestion des données permettant de s'assurer que les données seront FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable) ? Recommandations : • E xp l i q u e r c o m m e n t l e s r e s s o u r c e s n é c e s s a i r e s ( p a r e xe m p l e , l e t e m p s ) à l a préparation des données pour le partage/préservation (curation des données) ont été chiffrées. Examiner et justifier soigneusement toutes les ressources nécessaires pour diffuser les données. • Il peut s'agir de frais de stockage, de coût matériel, de temps de personnel, de coûts de préparation des données pour le dépôt, de frais d’entrepôt et d'archivage. • Indiquer si des ressources supplémentaires sont nécessaires pour préparer les d o n n é e s e n v u e d e l e u r d é p ô t o u p o u r p a ye r t o u s l e s f r a i s d e m a n d é s p a r l e s e n t r e p ô t s de données. Si oui, précisez le montant et comment ces coûts seront couverts.
Modèle de Plan de gestion des données www. anr.f r @agencerecherche ANR
Vous pouvez aussi lire