Les données de recherche : un potentiel insoupçonné - Une trousse de sensibilisation réalisée pour l'Association des bibliothèques de recherche du ...
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Les données de recherche :
un potentiel insoupçonné
Une trousse de sensibilisation réalisée pour
l’Association des bibliothèques de recherche du Canada (ABRC)2 Cette trousse , réalisée pour le Sous-comité sur la gestion des données de
l’ABRC, contient des renseignements de base sur la gestion des données de
recherche au Canada. Elle vise à aider les directeurs membres de l’Association des
bibliothèques de recherche du Canada (ABRC) à sensibiliser les administrateurs
et les chercheurs sur le campus aux questions entourant la gestion des données.
La trousse, conjointement avec un document d’accompagnement qui explique
le rôle des bibliothèques dans la gestion des données de recherche, procure aux
lecteurs des connaissances générales sur l’état actuel des données de recherche
au Canada et à l’étranger, et présente de suggestions pour commencer à trouver
des solutions aux problèmes évoqués.
Par Kathleen Shearer
Sous-comité sur la gestion des données de l’ABRC
Marnie Swanson (Présidente, University of Victoria)
Pam Bjornson (CNRC-ICIST)
Lynn Copeland (Simon Fraser University)
Michelle Edwards (University of Guelph)
Bernie Gloyn (Observateur, Statistique Canada)
Margaret Haines (Carleton University)
Janine Schmidt (McGill University)
Kathleen Shearer ( Attaché de recherche, ABRC)
Diego Argáez (Sécretaire, ABRC)
Merci à Diane Sauvé (Université de Montréal) pour son aide avec la traduction
au français de ce document.
© 2009 ABRC, Le contenu dans ce document est sujet à une licence de Creative
Commons Paternité - Pas d’Utilisation Commerciale 2.5 Canada.
Les données de recherche :
un potentiel insoupçonné3
Table des Vue d’ensemble
Avantages d’une bonne gestion et d’un partage des données
matières Le contexte actuel
À l’étranger
Au Canada
Groupes canadiens intéressés à la gestion des données
Études de cas
Lacunes dans la gérance des données au Canada
Politiques de gestion des données au Canada
Organismes subventionnaires
Autres politiques sur les données
Réponses aux préoccupations des chercheurs et des administrateurs
Que peut-on faire sur le campus?
Les données de recherche :
un potentiel insoupçonné4
Vue d’ensemble
On entend ici par données de Au cours des cinq prochaines années, Les données de recherche au Canada
recherche les enregistrements on produira dans le monde plus de ne sont pas gérées systématiquement
factuels (par exemple données données de recherche que tout ce de sorte que des données précieuses
textuelles, audio, iconographiques, qui a été fait dans toute l’histoire sont sous-utilisées. Il existe bien sûr
numériques ou de microréseaux) humaine 2. La plus grande partie des moyens de gestion des données
servant de sources de première de ces données auront été créées offerts par des établissements, ou
main pour la recherche et qui numériquement et elles seront par des organismes nationaux et
sont généralement reconnus stockées et gérées électroniquement, internationaux pour certaines
comme nécessaires par l’ensemble de sorte qu’il sera facile de les disciplines et projets de recherche,
des chercheurs pour valider les rendre accessibles, de les reproduire mais ils ne sont à la disposition que
conclusions de la recherche. et de les combiner avec d’autres d’une minorité de chercheurs.
données. Toutefois, en vue de
Selon la US National Science rendre accessibles et de réutiliser des Pour créer des données qui pourront
Foundation, les données numériques données, elles doivent être créées et être utilisées pendant longtemps, il
sont à la fois les produits de la gérées de manière à permettre leur faut absolument que les documents
recherche et, de plus en plus, le point conservation à long terme. Il faut d’accompagnement soient conviviaux,
de départ de nouvelles recherches. donc à cette fin faire une gestion clairs et compréhensibles. Idéalement,
Dans l’univers numérique, il est active des données tout au long de les métadonnées et la documentation
possible pour les chercheurs leur cycle de vie, dès le moment où devraient être produites dès le
d’adapter les données, c’est à-dire l’on envisage pour la première fois début d’un projet de recherche et
de les utiliser de façons et en leur création. améliorées tout au long du cycle de
combinaisons novatrices non vie des données. Grâce au service de
prévues par ceux qui les ont créés. À l’heure actuelle au Canada, la planification et de soutien offert par
Il est courant également pour des grande majorité des données de les professionnels des données dès
chercheurs d’utiliser les données recherche sont perdues. Par exemple, le début d’un projet de recherche, on
d’une étude en prenant comme selon une étude sur les projets de peut réduire de beaucoup le temps et
point de départ les conclusions de recherche subventionnés par le l’argent nécessaires pour en assurer
travaux précédents et de les pousser Conseil de recherche en sciences l’accessibilité à long terme.
plus loin; ou encore d’entreprendre humaines du Canada (CRSH), on 1
Community-based Data Interoperability
des études longitudinales qui a constaté que les données de Networks. 2009. National Science Foundation.
consistent à comparer des données seulement trois études sur 110 ont http://www.nsf.gov/pubs/2007/nsf07565/
nsf07565.htm
d’observations répétées des mêmes été archivées dans un dépôt et que
éléments sur une longue période — celles de ces trois études ont toutes 2
Beagrie, N. Digital Preservation: Setting the
Course for a Decade of Change. 2007. www.
souvent de nombreuses décennies 1. été hébergées aux États-Unis 3. abd-bvd.be/documents/60/BDA-1107_NB.ppt
3
Humphrey, C. Preserving research data: A
Time for Action. In Preservation of Electronic
Crédit photo : www.curri.miyakyo-u.ac.jp Records: New Knowledge and Decision-making.
2003. Canadian Conservation Institute:
Ottawa. pp. 83-89.Avantages d’une bonne gestion et 5
d’un partage des données
Accélérer le progrès scientifique.
La bonne gestion des données
de recherche permettra aux
chercheurs d’obtenir et de
comprendre les données des
autres et de les réutiliser pour
leurs propres fins scientifiques,
ce qui accélérera les nouvelles
découvertes.
Accroître la visibilité et les
retombées de la recherche. Les
données rendues visibles par
l’entremise d’un dépôt de données
peuvent de beaucoup accroître
les retombées de cette recherche.
L’accessibilité des données de
recherche est étroitement liée à
l’augmentation du nombre de
citations. Par exemple, selon une
étude sur le nombre de citations
dans les publications sur les
essais cliniques sur le cancer, on a
constaté que les essais cliniques Crédit photo : Bollen J, Van de Sompel H, Hagberg A, Bettencourt L, Chute R, et al. (2009) Clickstream Data Yields High-
pour lesquels les données avaient Resolution Maps of Science. PLoS ONE 4(3): e4803. doi:10.1371/journal.pone.000480
été communiquées ont été cités
environ 70 fois plus fréquemment Éviter la répétition des travaux de recherche. Lorsqu’un ensemble de
que dans les cas où on ne l’avait pas données est disponible publiquement, il est beaucoup plus probable que ces
fait 4. données ne seront pas créées de nouveau, ce qui évite des travaux coûteux et
Respecter les politiques des inutiles de collection et de production des données.
organismes subventionnaires. Permettre la reproduction et la validation des résultats de la recherche.
De plus en plus d’organismes Lorsque les données sont archivées et connues, les résultats peuvent être
subventionnaires exigent que les répétés et les données peuvent servir à une nouvelle analyse, ce qui permet de
chercheurs et les établissements confirmer les premières constatations de la recherche. Elles peuvent aussi servir
hôtes conservent, gèrent et rendent à faire état d’erreurs ou d’incohérences dans la première analyse des données.
accessibles leurs données à la
fin d’un projet de recherche. Par Intensifier la collaboration : Les données disponibles publiquement
conséquent, les universités et les permettent aux chercheurs de collaborer les uns avec les autres en mettant en
chercheurs ont une obligation commun les ensembles de données, le contexte et les outils de recherche.
juridique et éthique d’assurer
la pérennité des données de 4
Piwowar, HA, Day, RS, Fridsma, DB. Sharing Detailed Research Data Is Associated with Increased
recherche. Certains éditeurs Citation Rate. 2007. PLoS ONE 2(3): http://dx.doi.org/doi:10.1371/journal.pone.0000308
exigent également que les données
liées à leurs publications soient
conservées.
La banque de données sur les protéines
La banque de données sur les protéines (Protein Data Bank ou PDB) est une base de données en libre accès, permettant
d’accélérer le progrès et les découvertes scientifiques. Créée en 1971, la banque a commencé avec sept structures de protéines
résolues. Depuis ses débuts, le programme a connu une croissance rapide et il contient actuellement plus de 43 000 structures
résolues. L’utilisation de la banque de données a également connu une croissance importante : de un million de téléchargements
par mois au début de 2007, elle est passée à cinq millions par mois en 2008.
www.wwpdb.org6
Le contexte actuel
Les méthodes utilisées pour la gestion des données de recherche varient beaucoup selon les disciplines. Dans certains
domaines, comme la génomique, la protéomique, la physique des hautes énergies et l’astronomie, des traditions de
longue date existent pour l’archivage et la mise en commun des données, ce qui n’est pas le cas dans d’autres domaines
tels que la chimie et les sciences humaines et sociales. Les chercheurs dans certains domaines sont réticents à rendre
accessibles leurs données pour les raisons suivantes : inquiétudes au sujet de la propriété des données ou de la propriété
intellectuelle; méconnaissance de la valeur ajoutée que représente le partage des données ou manque de connaissance
ou de temps pour préparer les données à des fins de diffusion.
À l’étranger
Il existe de plus en plus de grands dépôts d’archives de données par discipline comme PubChem, GenBank, Protein
Data Bank, Digital Sky Survey, World Data Centers (données solaires, géophysiques et autres sur l’environnement),
Global Biodiversity Information Facility, International Virtual Observatory, Digital Earth et Interuniversity Consortium
for Political and Social Research (ICPSR). Ces archives ont une envergure internationale et visent à recueillir des
données partout dans le monde. Elles offrent aussi un large accès aux données qu’elles recueillent en vue de faire
avancer la recherche et la création du savoir. La vaste majorité de ces archives sont financées par des ministères ou
des organismes subventionnaires nationaux dans le pays où elles sont hébergées – bien qu’il existe aussi quelques
archives de données internationales gérées par le secteur privé. Outre ces archives internationales par discipline,
plusieurs pays ont des archives de données nationales qui ont le mandat de recueillir des données nationales
précieuses sur un sujet donné. Par exemple, la plupart des pays recueillent et archivent des données sur la population,
sur le climat, sur la santé, etc.
En 2004, 34 pays, dont le Canada, ont signé la Déclaration sur l’accès aux données de la recherche financée par des
fonds publics de l’OCDE 5. La déclaration repose sur le postulat selon lequel les données de recherche subventionnées
par les fonds publics doivent être à la libre disposition du plus grand nombre possible. C’est ainsi qu’un certain
nombre de pays cherchent actuellement à déterminer comment ils peuvent exploiter plus systématiquement les
données créées par la recherche subventionnée par les fonds publics. Voici des exemples :
États-Unis Aux États-Unis, la National Science Foundation (NSF) a annoncé la création d’un programme de
subventions de 100 millions de dollars appelé « Sustainable Digital Data Preservation and Access
Network Partners (DataNet) » 6. Le programme est en voie d’élaborer de nouvelles méthodes, structures
de gestion et technologies pour gérer la diversité, la taille et la complexité des ensembles de données
et des flux de données actuels et futurs par la création d’un ensemble d’organismes exemplaires pour
l’infrastructure des données de recherche nationales et mondiales.
Aux États-Unis également, un groupe appelé Interagency Working Group on Digital Data a été formé
en décembre 2006. Près de 30 organismes, bureaux et conseils gouvernementaux ont été désignés à
titre de membres ou de participants, démontrant l’intérêt élargi suscité par les données scientifiques
numériques. Dans son rapport final, le groupe propose la stratégie suivante pour les États-Unis :
élaborer un cadre global de politiques transparentes, évolutives et extensibles, ainsi que des structures
de gestion et d’organisation qui offrent un accès fiable et efficace à toute la gamme des données
scientifiques numériques publiques.
Ce cadre se veut un élément moteur pour que les États-Unis puissent jouer un rôle de premier plan dans
les sciences et dans une société de l’information marquée par la concurrence et la mondialisation. 7.
5
Science, technologie et innovation pour le 21ème siècle. Réunion du Comité de la politique scientifique et technologique de l’OCDE au niveau
ministériel, 29-30 janvier 2004 - Communiqué final. 2004. Organisation de coopération et de développement économiques.
http://www.oecd.org/document/0,3343,fr_2649_34487_26006977_1_1_1_1,00.html
6
Community-based Data Interoperability Net¬works. 2009. National Science Foundation, www.nsf.gov/pubs/2007/nsf07565/nsf07565.htm
7
Harnessing the Power of Digital Data for Science and Society. Report of the Interagency Working Group on Digital Data to the Committee on
Science of the National Science and Technology Council. January 2009. p.2 www.nitrd.gov/about/Harnessing_Power_Web.pdfRoyaume-Uni Le Royaume-Uni possède déjà une infrastructure très solide de dépôt de données pour la collecte de 7
données de recherche, administrée par plusieurs organismes subventionnaires des Research Councils
UK (RCUK). Dans le prolongement de cette initiative, le Consortium of Research Libraries au R.-U. et en
Irlande, et le IT Directors Group ont entrepris une étude pour déterminer la faisabilité et les coûts de
l’élaboration et du maintien d’un service national commun pour les données de recherche numériques
à l’intention du secteur de l’enseignement supérieur au R.-U. Les auteurs ont conclu que des efforts
considérables sont faits par d’autres pays pour repérer et exploiter les données à l’échelle nationale ou
régionale et que le R.-U. doit adopter une démarche globale pour la gestion des données de recherche
afin de ne pas prendre de retard 8.
Australie En septembre 2008, des représentants des grands établissements de recherche de l’Australie ont adopté
la déclaration de Brisbane qui affirme notamment que chaque citoyen doit avoir le libre accès gratuit
aux données et connaissances provenant de la recherche subventionnée par les fonds publics et que
chaque université australienne doit avoir accès à un dépôt numérique. 9
Le gouvernement de l’Australie a annoncé récemment la création du Australian National Data Service
(ANDS). L’ANDS a démarré en septembre 2008 et il fait partie d’une stratégie visant une infrastructure
nationale commune pour la recherche. Parmi ses buts déclarés, mentionnons qu’il vise à faire en sorte
que les données de recherche en Australie soient bien gérées, accessibles et exploitables 10.
8
UK Research Data Service. http://www.ukrds.ac.uk/home
9
Open Access and Research Conference 2008. 2008. Queensland University of Technology. www.oar2008.qut.edu.au
10
Australian National Data Service. 2009. Monash University. www.ands.org.au
Au Canada
En octobre 2000, le Conseil de recherches en sciences humaines et l’Archiviste national du Canada ont constitué un groupe de
travail comprenant des chercheurs et des spécialistes de la gestion de documents et leur ont demandé d’évaluer les besoins en
ce qui a trait à un système national de diffusion, de conservation et de gestion des données de recherche. Le groupe de travail a
constaté de vastes lacunes dans l’infrastructure de collecte et de conservation des données. Dans son rapport final publié en 2002,
il recommande la création d’un nouveau service national d’archivage des données de recherche 11.
En novembre 2004, le Conseil national de recherches du Canada (CNRC), en collaboration avec la Fondation canadienne pour
l’innovation (FCI), les Instituts de recherche en santé du Canada (IRSC) et le Conseil de recherches en sciences naturelles et en
génie (CRNSG), a lancé une consultation sur l’accès aux données de recherche au Canada (appelée la Consultation nationale sur
l’accès aux données de la recherche scientifique ou CNADRS). Les chercheurs en sciences naturelles et médicales ont exprimé
leur avis à cette occasion. Le rapport final a été publié en janvier 2005 et il constitue une « car te routière » pour la mise en
œuvre d’un plan national pour le libre accès aux données de la recherche scientifique subventionnée par les fonds publics. Les
recommandations du rapport n’ont pas encore été mises en œuvre.
En janvier 2004, le Canada a été signataire de la Déclaration sur l’accès aux données de la recherche financée par des fonds publics
de l’OCDE. Mais, contrairement à d’autres pays signataires, le Canada n’a pas encore réagi par des mesures concrètes pour donner
suite au protocole d’entente.
11
Savoir, c’est comprendre. Rapport final de la Consultation sur les archives nationales de données. Juin 2002. Conseil de recherches en sciences
humaines. www.sshrc-crsh.gc.ca/site/about-crsh/publications/da_finalreport_f.pdf
Les données de recherche :
un potentiel insoupçonné8 Les données de recherche : Groupes canadiens
intéressés à la gestion
un potentiel insoupçonné des données
Groupe de travail sur la
stratégie des données de
recherche du Canada
Le 25 janvier 2008, l’Institut canadien de
l’information scientifique et technique
(ICIST) a organisé une réunion des
principales parties intéressées pour
examiner de quelle façon commencer à
mettre en place les recommandations
issues de la consultation nationale sur
l’accès aux données de recherche
scientifique 12. Un groupe de travail a été
établi avec la participation de tous les
organismes subventionnaires fédéraux,
de l’Association des bibliothèques de
recherche du Canada (ABRC), de Compute
Canada, de CANARIE et d’un certain
nombre de chercheurs à titre individuel.
Le groupe a publié à l’automne de 2008
un document portant sur l’analyse des
écarts et il cherche actuellement à corriger
ces écarts dans la gestion des données de
recherche au Canada.
12
Données de recherche Canada. 2009. Institut
canadien de l’information scientifique et
technique. www.data-donnees.gc.ca
Comité national
canadien de CODATA
(CNC/CODATA)
Ce comité est la voix canadienne de
CODATA (Committee on Data for Science
and Technology) 13. CODATA est un comité
scientifique interdisciplinaire du Conseil
international pour la science ( ICSU),
établi il y a 40 ans. Le CNC/CODATA est
parrainé par l’ICIST (Institut canadien de
l’information scientifique et technique)
qui relève de son côté du Conseil national
de recherches du Canada. CODATA n’est
pas un organisme public comme tel
mais il s’efforce par l’intermédiaire de
ses membres nationaux et groupes de
travail d’ « améliorer la qualité, la fiabilité,
la gestion et l’accessibilité des données
d’importance dans tous les domaines de la
science et de la technologie. »
13
Canadian National Committee for CODATA.
2009. www.codata.org/canada
Crédit photo : Bernard O’Hara & Renos Savva, Wellcome ImagesÉtudes de cas d’activités de gestion 9
des données au Canada
Ontario Data Documentation, Extraction Service and Infrastructure Initiative
ODESI est un projet subventionné conjointement par le Conseil des bibliothèques universitaires de l’Ontario (CBUO)
et OntarioBuys qui offre aux chercheurs universitaires un accès sans précédent à un grand nombre d’ensembles
de données. Le projet vise avant tout les ensembles de données de Statistique Canada 14, les fichiers de données de
Gallup Canada et d’autres entreprises de sondage, des fichiers du domaine public comme les sondages sur les élections
nationales au Canada et certains fichiers de l’Inter-University Consortium for Political and Social Research (ICPSR).
Les fichiers sont balisés selon la norme DDI (Initiative de documentation de données), un système international de
marquage de métadonnées fondées sur XML permettant la découverte des ensembles de données, l’accès réseauté à
ces données, leur extraction et leur analyse.
14
“Initiative ontarienne en matière de documentation des données, de service d’extraction et d’infrastructure”. 2009. Ontario Council of
University Libraries. http://search2.odesi.ca
Année polaire internationale
L’Année polaire internationale (API) est un vaste programme scientifique portant sur l’Arctique et l’Antarctique qui s’est
déroulé de mars 2007 à mars 2008. Le programme est assorti d’une politique globale qui exige que les données, y
compris les données opérationnelles communiquées en temps réel, soient accessibles intégralement, librement, sans
frais et dans les plus brefs délais possibles 15. Des douzaines de projets de recherche canadiens ont été subventionnés
dans le cadre de l’API par diverses sources dont le gouvernement fédéral, les gouvernements territoriaux, les organismes
subventionnaires et des fondations. Chaque projet devait élaborer un plan de gestion des données pour recevoir des
subventions. Il est probable que plusieurs projets canadiens auront de la difficulté à respecter la politique de l’API car il
y a peu de dépôts au Canada pouvant recueillir et conserver les données qui sont ainsi créées et y donner accès.
15
International Polar Year 2007-2008 Data Policy. April 2008. http://classic.ipy.org/Subcommittees/final_ipy_data_policy.pdf
Les données de recherche :
un potentiel insoupçonné10
Études de cas d’activités de gestion
des données au Canada
VENUS Canadian Barcode of Life
Victoria Experimental Network Under the Sea Canadian Barcode of Life Network, de concert avec le
(VENUS)16, sous la direction de l’Université de Victoria, vaste consortium international dont il fait partie, est
est un observatoire océanique câblé. Il communique un réseau en voie d’élaborer un système précis, rapide,
des données en temps réel provenant du fond rentable et universellement accessible qui s’appuie
de l’océan par câbles en fibre optique reliés à des sur l’ADN pour l’identification des espèces. L’attribution
instruments à l’Université de Victoria, en C.-B., où de codes à barres selon l’ADN est une solution très
elles sont archivées. Le portail de VENUS procure prometteuse pour résoudre l’« obstacle taxonomique »
aux scientifiques et au grand public le libre accès qui limite beaucoup la recherche sur la biodiversité.
à un « entrepôt » grandissant d’images, de sons et Tous ces projets d’identification par codes à barres ont
de données en temps réel provenant du fonds de comme objectif commun d’établir une base de données
l’océan 17 pour faciliter la recherche sur les océans en libre accès de codes à barres de référence qui nous
partout dans le monde. permettront de mieux comprendre la biodiversité et
permettront aux non-taxonomistes d’identifier les
16, 17
VENUS: Victoria Network Under the Sea. 2009. University of espèces. En août 2009, les chercheurs avaient déposé
Victoria. www.venus.uvic.ca
plus de 670 000 enregistrements de codes à barres
provenant de 61 000 espèces de la base de données
internationale de codes à barres de la vie (la vaste
majorité – soit près de 500 000—proviennent du Centre
canadien) 18.
18
Barcode of Life Data Systems. 2009. Biodiversity Institute of
Ontario. www.barcodinglife.org/views/login.php
Projet de métadonnées des Centres de données de recherche
Ce projet a pour but de produire un ensemble d’outils qui permettront aux chercheurs de fournir de meilleures
métadonnées pendant tout le cycle de vie de leurs travaux de recherche au moyen du schéma DDI 3 XML. Le projet,
établi à l’Université du Manitoba, permettra de baliser des fichiers dans les centres de données de recherche et de
créer des outils pour la migration vers la norme DDI (Initiative de documentation des données) version 3. Il produira
un ensemble d’outils qui permettra aux chercheurs de fournir de meilleures métadonnées pour toute la durée de
vie de leur projet. Un Centre de métadonnées de recherche a été établi à Gatineau (Québec) pour produire des
métadonnées conformes pour les fichiers confidentiels de Statistique Canada dans le Réseau des centres de données
de recherche du Canada. Aussi, un consortium international de développement logiciel dirigé par Brechenhill au
Canada travaille au développement d’outils pour appliquer la norme DDI 3 à la documentation des données.
Les données de recherche :
un potentiel insoupçonnéLacunes dans la gérance des données au Canada 11
Le Groupe de travail sur la stratégie Dépôts de données : Il existe Récompenses et reconnaissance :
des données de recherche dirigé par seulement quelques dépôts de Il y a peu de mesures incitatives
l’ICIST a fait à l’automne de 2008 une données actifs au Canada permettant favorisant le partage des données par
bonne analyse des écarts dans la aux chercheurs d’y déposer leurs les chercheurs. Des facteurs dissuasifs
gérance des données de recherche au données. Il y a de vastes écarts tant réels existent même : en effet, les
Canada19. L’analyse révèle l’existence dans la couverture que dans la capacité chercheurs sont exhortés à produire le
d’obstacles importants à l’accessibilité des dépôts de données. Il n’existe pas plus de publications possible avec les
et à la conservation des données de de dépôts pour tous les domaines de données de première main qu’ils ont
recherche — des obstacles qui, s’ils ne recherche et la grande majorité des recueillies avant de mettre celles-ci à la
sont pas éliminés, pourraient avoir des données de recherche sont encore disposition de tous.
répercussions sérieuses sur l’avenir de la hébergées sur les disques durs des
recherche et de l’innovation au Canada. chercheurs. Rôles et responsabilités : À l’exception
Voici les écarts recensés : de certains ministères, il n’y a pas
Compétences : Les chercheurs ont d’ organisme national chargé de la
Politiques sur les données : Les rarement les compétences nécessaires conservation, de la gestion et de la
politiques sur les données au Canada pour bien gérer leurs données. En outre, diffusion des données de recherche
ne portent pas sur tous les types de il y a peu de scientifiques spécialisés dans ayant l’envergure nécessaire pour
données de recherche et, dans certains les données ou de professionnels de répondre aux besoins des différents
cas, des chercheurs ne se conforment l’information ayant une connaissance intervenants.
pas aux politiques existantes. Le volet du catalogage des données, des
conservation des données est rarement normes et des processus relatifs aux Temps requis: Il est essentiel pour
pris en compte dans les politiques. métadonnées, de la conservation et la création d’un bon ensemble de
de l’évaluation de la pertinence des données pouvant être utilisé de façon
Financement de la gestion des données pour les chercheurs. pérenne de faire en sorte que les
données : La structure de financement données soient faciles à comprendre
de la recherche au Canada ne prévoit Normes : Ce ne sont pas tous les et à analyser. Il faut donc à cette fin
pas la gestion des données au-delà de la chercheurs ni toutes les disciplines qui une description des données et une
durée de vie d’un projet de recherche. ont adopté les normes internationales. documentation qui soient conviviales,
Il n’y a pas beaucoup d’établissements Beaucoup reste à faire pour assurer claires et détaillées, mais aussi
au Canada qui offrent un financement l’interopérabilité des données provenant complètes. Ceci requiert du temps et
durable pour les dépôts de données. de divers projets et touchant plusieurs la plupart des chercheurs n’en ont pas
En outre, il y a des coûts importants disciplines. Les normes relatives aux beaucoup.
associés à la préparation des données métadonnées, cruciales pour garantir
pour diffusion et ces coûts ne sont pas l’accessibilité et l’interopérabilité 19
Groupe de travail sur la stratégie des
prévus dans les mécanismes de finance- des différents types d’ensembles données de recherche. Gérance des données
ment actuels (c.-à-d. les subventions de données entre eux, ne sont pas de recherche au Canada : une analyse des
écarts. Octobre 2008. Institut canadien de
ou les budgets universitaires). toujours respectées par les créateurs
l’information scientifique et technique. http://
ou les aggrégateurs de données. data-donnees.gc.ca/docs/AnalyseEcarts.pdf
Crédit photo : Photo par Joriel Jiménez
Les données de recherche :
un potentiel insoupçonné12 Politiques de gestion des données au Canada
Tout un ensemble de politiques établies par le gouvernement fédéral et les gouvernements provinciaux, les organismes
subventionnaires, d’autres établissements et même certains projets de recherche régissent les activités de gestion des
données au Canada. Ces politiques varient beaucoup et, dans certains cas, portent sur des aspects différents de la gestion
des données. Toutefois, la plupart des chercheurs sont tenus par leur établissement, leur organisme subventionnaire ou
les deux, de conserver leurs données de recherche jusqu’à cinq ans après avoir terminé un projet.
Politiques des organismes subventionnaires
IRSC Les Instituts de recherche en santé du Canada exigent des bénéficiaires de subventions qu’ils déposent certains
types de données – données en matière de bioinformatique, d’atomistique et données de coordonnées
moléculaires – dans les bases de données publiques correspondantes dès la publication des résultats de leur
recherche. Les IRSC exigent légalement des chercheurs qu’ils conservent les ensembles de données originales
découlant de la recherche qu’ils subventionnent pendant au moins cinq ans après la fin de la subvention. Les
IRSC ont l’intention de réexaminer cette politique prochainement et peut-être de l’élargir. 20
CRSH Le Conseil de recherches en sciences humaines a une politique d’archivage des données de recherche depuis
1990. Selon cette politique, « Toutes les données de recherche rassemblées grâce au financement du CRSH
doivent être conservées et mises à la disposition des autres chercheurs dans des délais raisonnables.» 21 .
Selon le CRSH, un délai raisonnable est une période de deux ans après la fin du projet de recherche pour
lesquels les données ont été recueillies. Le CRSH n’a pas appliqué cette politique auprès des chercheurs et
moins de 10 % des chercheurs s’y sont conformés depuis ses débuts. 22
CRSNG Le Conseil de recherches en sciences naturelles et en génie n’a pas de politique générale relativement
aux données de recherches. Il y a cependant des lignes directrices pour les chercheurs subventionnés par
l’intermédiaire du Programme de subventions de réseaux stratégiques. On y lit ce qui suit : « Pour encourager
le partage et la diffusion des données de recherche et leur utilisation par d’autres dans un délai raisonnable,
on doit conclure dès le début des activités de réseau une entente établissant la responsabilité en matière de
mise à jour et de conservation de grands ensembles de données.» 23
Les trois Énoncé de politique des trois conseils sur l’éthique de la recherche avec des êtres humains
« Les chercheurs devraient s’assurer que les données obtenues sont conservées avec toutes les précautions
nécessaires particulières dues à la nature délicate des renseignements. Les données publiées ne devraient
contenir ni nom, ni initiales, ni aucune autre sorte de renseignement pouvant mener à une identification. Il
peut s’avérer important de conserver certains types d’identificateurs (p. ex., région de résidence), mais ceux-
ci devraient être dissimulés le mieux possible, selon un protocole normalisé, avant que les données ne soient
communiquées aux fins de la recherche. » 24
20
Politique sur l’accès aux résultats de la recherche. Septembre 2007. Instituts de recherche en santé du Canada. www.cihr-irsc.gc.ca/f/34846.html
21
Politique du CRSH sur l’archivage des données de recherche. 2009. Conseil de recherches en sciences humaines. www.sshrc.ca/site/apply-
demande/policies-politiques/edata-donnees_electroniques-fra.aspx
22
Humphrey, C. Preserving research data: A Time for Action. In Preservation of Electronic Records: New Knowledge and Decision-making. 2003.
Canadian Conservation Institute: Ottawa. pp. 83-89.
23
Programme de subventions de réseaux stratégiques. 2009. Conseil de recherches en sciences naturelles et en génie du Canada.
www.nserc-crsng.gc.ca/Professors-Professeurs/RPP-PP/SNG-SRS_fra.asp
24
Proposition de la 2e édition de L’Énoncé de politique des trois Conseils : Éthique de la recherche avec des êtres humains. Décembre 2008.
Groupe consultatif interagences en éthique de la recherche. http://www.ger.ethique.gc.ca/fra/policy-politique/initiatives/draft-preliminaire/
Les données de recherche :
un potentiel insoupçonnéAutres politiques sur les données 13
Des universités, centres de recherche et projets de recherche ont parfois aussi des politiques
régissant les données de recherche. Voici quelques exemples.
Université McGill Cette politique stipule que les données doivent être organisées de manière à ce qu’elles
puissent être facilement vérifiées. Sous réserve d’exceptions fondées sur le devoir de
(Nous n’avons trouvé aucune confidentialité et les lois régissant la propriété intellectuelle et l’accès à l’information, et une
autre politique universitaire fois les résultats de la recherche publiés, les données doivent être mises à la disposition de
dans la rédaction du présent quiconque présente une demande raisonnable de les examiner. Dans les cas de désaccord
document.) entre le chercheur et la personne qui demande à voir les données, c’est le bureau du
vice-principal à la recherche qui tranchera. La politique indique également que toutes les
données originales doivent être conservées pendant un délai raisonnable et recommande
une période d’au moins cinq ans après la date de la publication 25.
Pêches et Océans La Politique d’accès aux données scientifiques spécifie ce qui suit : « Les gestionnaires de
Canada Pêches et Océans ont la responsabilité de s’assurer que les collecteurs de données sous leur
direction transmettent leurs données ainsi que les données recueillies en vertu d’un contrat
(Un exemple d’une ou de partenariat avec d’autres organismes au centre de données appropriées de façon
opportune. Il est important de s’assurer que les données sont rapidement transférées dans
politique sur les données
un environnement « géré » où elles seront sauvegardées de façon appropriée et mises à l’abri
d’un ministère) de toute perte accidentelle ou circonstancielles et où les métadonnées essentielles seront
intégrées aux données afin de préserver l’utilité à long terme d’un ensemble de données » 26.
Année polaire La Politique sur les données de l’API indique qu’en vue de maximiser les bénéfices des
internationale (API) données recueillies sous l’égide de l’API, le Comité conjoint de l’API exige que ces données,
y compris les données opérationnelles communiquées en temps réel, soient accessibles
intégralement, gratuitement, librement et dans le plus bref délai possible 27. En outre, toutes
les données de l’API doivent être archivées dans leur forme la plus simple et la plus utile et
être accompagnées d’une description complète à l’aide de métadonnées 28.
Gouvernement fédéral : « Les renseignements personnels ne doivent pas être utilisés ou communiqués à des fins
Loi sur la protection autres que celles auxquelles ils ont été recueillis à moins que la personne concernée n’y
des renseignements consente ou que la loi ne l’exige. On ne doit conserver des renseignements personnels
personnels et que pendant le temps nécessaire pour la réalisation des fins déterminées. [...] On devrait
détruire, effacer ou dépersonnaliser les renseignements personnels dont on a plus besoin
les documents
aux fins précisées. Les organisations doivent élaborer des lignes directrices et appliquer des
électroniques (LPRPDE) procédures régissant la destruction des renseignements personnels. » 29
25
Policy on Research Ethics. April 7, 2008. McGill University. www.mcgill.ca/files/secretariat/Research-Ethics-Policy-on.pdf
26
Politique d’accès aux données scientifiques du MPO. 12 juin 2001. Pêches et Océans Canada.
www.osl.gc.ca/sgdo/fr/info-donnees/acces-donnees.html
27, 28
International Polar Year 2007-2008 Data Policy. April 2008. http://classic.ipy.org/Subcommittees/final_ipy_data_policy.pdf
29
Loi sur la protection des renseignements personnels et les documents électroniques. 2009. Ministère de la Justice Canada.
http://laws.justice.gc.ca/fra/P-8.6/index.html
Les données de recherche :
un potentiel insoupçonné14 Réponses aux préoccupations des
chercheurs et des administrateurs
Je ne peux pas archiver et communiquer mes
données parce qu’elles portent sur des humains.
Le respect des renseignements personnels dans la recherche est une norme
internationalement reconnue et un principe d’éthique. Au Canada, les trois
principaux conseils subventionnaires ont adopté un énoncé de politique
commun régissant toute la recherche avec des êtres humains entreprise au
Canada. La politique énonce que les renseignements personnels au sujet
des participants de l’étude ne doivent pas être communiqués. Toutefois, la
politique recommande aussi ce qui suit :
« D’une façon générale, la meilleure façon de protéger la confidentialité des
renseignements personnels passe par l’anonymat. Si les données conservées
sont véritablement anonymes, la recherche ne fera l’objet que d’une
évaluation minimale du CÉR [Comité d’éthique de la recherche]. » 30
Des procédures bien établies existent pour assurer l’anonymat des données
et les chercheurs peuvent consulter les spécialistes des données de leur
établissement de recherche pour savoir s’il y a lieu de rendre anonymes les Si je partage mes données,
données contenant des renseignements personnels et comment le faire je limite mes options
de façon à pouvoir partager ces données. Du travail reste à faire pour bien
faire connaître les techniques permettant d’assurer l’anonymat des données
d’exploitation de brevets
au sein des comités d’éthique de la recherche (CÉR). Malgré l’avis des trois et d’autres avantages
conseils relativement à la possibilité de conserver en rendant anonymes les économiques.
données traitant de sujets humains, beaucoup de CÉR demandent encore
souvent aux chercheurs de détruire les données. Les bons principes de gestion des données
ne sont pas incompatibles avec ceux qui
30
Énoncé de politique des trois Conseils : Éthique de la recherche avec des êtres humains:
2e édition. Décembre 2008. Groupe consultatif interagences en éthique de la recherche.
régissent la propriété intellectuelle et la
www.ger.ethique.gc.ca/fra/policy-politique/initiatives/draft-preliminaire/
propriété des données. Les chercheurs
peuvent choisir de restreindre l’accès à leurs
données afin de maximiser leurs avantages
professionnels et économiques en reportant
la communication des données jusqu’à la
Les bonnes pratiques de gestion des données sont publication ou à l’application du brevet, ou
trop coûteuses. en faisant appel à une licence d’utilisation
non commerciale pour les données.
La gestion des données, comme l’attribution de métadonnées, la gestion
de dépôts et les activités de conservation des données ont bien entendu L’OCDE recommande de prendre en
un coût mais les avantages dépassent largement ces coûts. Refaire la considération les mesures qui favorisent
recherche pour obtenir les mêmes données est onéreux. De plus, c’est l’accès et l’exploitation à des fins non
impossible dans de nombreux cas parce que les chercheurs, les sujets, les commerciales tout en protégeant les intérêts
conditions des tests, etc. n’y sont plus. Le maintien d’un cadre fiable et commerciaux, comme la communication
ordonné pour protéger les investissements considérables consentis par les différée ou partielle des données ou
établissements dans la création de données de recherche représentent un l’adoption volontaire de mécanismes d’octroi
coût relativement modeste comparativement à celui prohibitif de recréer ces de licences. De telles mesures peuvent
données. permettre aux principaux participants
d’exploiter pleinement les données de la
recherche, sans en interdire inutilement
l’accès.Que peut-on faire sur le campus?
Chercheurs
S’engager à communiquer les données de recherche le plus ouvertement possible.
Élaborer un plan de gestion des données avant d’entamer un projet de recherche.
Comprendre les politiques de gestion des données des organismes subventionnaires et s’y conformer.
Faire appel aux spécialistes des données sur le campus pour de l’aide dans la collecte et la gestion des
données de recherche.
Repérer et utiliser les normes internationales pour la gestion des données.
Administrateurs universitaires
Élaborer des politiques qui favorisent la bonne gestion des données.
Appuyer la mise en place de dépôts de données par l’établissement.
Donner une formation aux chercheurs au sujet des pratiques de gestion des données.
Aider les chercheurs en embauchant des spécialistes ou des bibliothécaires experts en matière de données
et faire connaître ces spécialistes aux équipes de recherche (et les y intégrer).
Reconnaître l’apport du partage des données dans l’embauche, les promotions et les nominations.
Bibliothèques de recherche
Mettre sur pied et gérer des dépôts de données pour l’établissement.
Favoriser la formation des bibliothécaires dans le domaine de la gérance des données.
Venir en aide aux chercheurs en embauchant des bibliothécaires experts en matière de données et en
mettant ces spécialistes à la disposition de l’ensemble des chercheurs.
Assurer la formation des chercheurs au sujet des pratiques de gestion des données.65 Université Privé, Pièce 238, Ottawa, (Ontario) K1N 9A5
Tél: 613-562-5385 Télécopieur: 613-562-5297
carladm@uottawa.ca • www.carl-abrc.ca
L’Association des bibliothèques de recherche du Canada (ABRC) a été fondée en 1976. Elle regroupe les 28
principales bibliothèques de recherche universitaires au Canada, ainsi que Bibliothèque et Archives Canada,
l’Institut canadien de l’information scientifique et technique (ICIST), et la Bibliothèque du Parlement. L’Association
ne comprend que ces membres institutionnels et vise surtout à rassembler les bibliothèques des universités
canadiennes qui ont des programmes de doctorat dans les arts, les sciences humaines et les sciences.
L’ABRC tâche d’augmenter la capacité des bibliothèques de recherche du Canada d’effectuer des partenariats dans
la recherche et les études supérieures, cherchant à encourager un système de communication savante efficace et
soutenable et une politique publique qui encourage la recherche et du large accès à l’information scientifique.
L’Association est associée à l’Association des universités et collèges du Canada (AUCC) et constituée en société à
but non lucratif selon les dispositions de la Loi sur les corporations canadiennes.
Membres institutionnels de L’ABRC
University of Alberta Université Laval Queen’s University
Bibliothèque et Archives Canada University of Manitoba University of Regina
Bibliothèque du Parlement McGill University University of Saskatchewan
University of British Columbia McMaster University Université de Sherbrooke
Brock University Memorial University of Simon Fraser University
Newfoundland
University of Calgary University of Toronto
Université de Montréal
Carleton University University of Victoria
University of New Brunswick
Concordia University University of Waterloo
Université d’Ottawa
Dalhousie University University of Western Ontario
Université du Québec à Montréal
University of Guelph University of Windsor
ICIST (Institut canadien de York University
l’information scientifique et
technique)
Directeur général : Brent Roe Président : Ernie Ingles, MSRC (2009 – 2011)Vous pouvez aussi lire