Les données de recherche : un potentiel insoupçonné - Une trousse de sensibilisation réalisée pour l'Association des bibliothèques de recherche du ...
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Les données de recherche : un potentiel insoupçonné Une trousse de sensibilisation réalisée pour l’Association des bibliothèques de recherche du Canada (ABRC)
2 Cette trousse , réalisée pour le Sous-comité sur la gestion des données de l’ABRC, contient des renseignements de base sur la gestion des données de recherche au Canada. Elle vise à aider les directeurs membres de l’Association des bibliothèques de recherche du Canada (ABRC) à sensibiliser les administrateurs et les chercheurs sur le campus aux questions entourant la gestion des données. La trousse, conjointement avec un document d’accompagnement qui explique le rôle des bibliothèques dans la gestion des données de recherche, procure aux lecteurs des connaissances générales sur l’état actuel des données de recherche au Canada et à l’étranger, et présente de suggestions pour commencer à trouver des solutions aux problèmes évoqués. Par Kathleen Shearer Sous-comité sur la gestion des données de l’ABRC Marnie Swanson (Présidente, University of Victoria) Pam Bjornson (CNRC-ICIST) Lynn Copeland (Simon Fraser University) Michelle Edwards (University of Guelph) Bernie Gloyn (Observateur, Statistique Canada) Margaret Haines (Carleton University) Janine Schmidt (McGill University) Kathleen Shearer ( Attaché de recherche, ABRC) Diego Argáez (Sécretaire, ABRC) Merci à Diane Sauvé (Université de Montréal) pour son aide avec la traduction au français de ce document. © 2009 ABRC, Le contenu dans ce document est sujet à une licence de Creative Commons Paternité - Pas d’Utilisation Commerciale 2.5 Canada. Les données de recherche : un potentiel insoupçonné
3 Table des Vue d’ensemble Avantages d’une bonne gestion et d’un partage des données matières Le contexte actuel À l’étranger Au Canada Groupes canadiens intéressés à la gestion des données Études de cas Lacunes dans la gérance des données au Canada Politiques de gestion des données au Canada Organismes subventionnaires Autres politiques sur les données Réponses aux préoccupations des chercheurs et des administrateurs Que peut-on faire sur le campus? Les données de recherche : un potentiel insoupçonné
4 Vue d’ensemble On entend ici par données de Au cours des cinq prochaines années, Les données de recherche au Canada recherche les enregistrements on produira dans le monde plus de ne sont pas gérées systématiquement factuels (par exemple données données de recherche que tout ce de sorte que des données précieuses textuelles, audio, iconographiques, qui a été fait dans toute l’histoire sont sous-utilisées. Il existe bien sûr numériques ou de microréseaux) humaine 2. La plus grande partie des moyens de gestion des données servant de sources de première de ces données auront été créées offerts par des établissements, ou main pour la recherche et qui numériquement et elles seront par des organismes nationaux et sont généralement reconnus stockées et gérées électroniquement, internationaux pour certaines comme nécessaires par l’ensemble de sorte qu’il sera facile de les disciplines et projets de recherche, des chercheurs pour valider les rendre accessibles, de les reproduire mais ils ne sont à la disposition que conclusions de la recherche. et de les combiner avec d’autres d’une minorité de chercheurs. données. Toutefois, en vue de Selon la US National Science rendre accessibles et de réutiliser des Pour créer des données qui pourront Foundation, les données numériques données, elles doivent être créées et être utilisées pendant longtemps, il sont à la fois les produits de la gérées de manière à permettre leur faut absolument que les documents recherche et, de plus en plus, le point conservation à long terme. Il faut d’accompagnement soient conviviaux, de départ de nouvelles recherches. donc à cette fin faire une gestion clairs et compréhensibles. Idéalement, Dans l’univers numérique, il est active des données tout au long de les métadonnées et la documentation possible pour les chercheurs leur cycle de vie, dès le moment où devraient être produites dès le d’adapter les données, c’est à-dire l’on envisage pour la première fois début d’un projet de recherche et de les utiliser de façons et en leur création. améliorées tout au long du cycle de combinaisons novatrices non vie des données. Grâce au service de prévues par ceux qui les ont créés. À l’heure actuelle au Canada, la planification et de soutien offert par Il est courant également pour des grande majorité des données de les professionnels des données dès chercheurs d’utiliser les données recherche sont perdues. Par exemple, le début d’un projet de recherche, on d’une étude en prenant comme selon une étude sur les projets de peut réduire de beaucoup le temps et point de départ les conclusions de recherche subventionnés par le l’argent nécessaires pour en assurer travaux précédents et de les pousser Conseil de recherche en sciences l’accessibilité à long terme. plus loin; ou encore d’entreprendre humaines du Canada (CRSH), on 1 Community-based Data Interoperability des études longitudinales qui a constaté que les données de Networks. 2009. National Science Foundation. consistent à comparer des données seulement trois études sur 110 ont http://www.nsf.gov/pubs/2007/nsf07565/ nsf07565.htm d’observations répétées des mêmes été archivées dans un dépôt et que éléments sur une longue période — celles de ces trois études ont toutes 2 Beagrie, N. Digital Preservation: Setting the Course for a Decade of Change. 2007. www. souvent de nombreuses décennies 1. été hébergées aux États-Unis 3. abd-bvd.be/documents/60/BDA-1107_NB.ppt 3 Humphrey, C. Preserving research data: A Time for Action. In Preservation of Electronic Crédit photo : www.curri.miyakyo-u.ac.jp Records: New Knowledge and Decision-making. 2003. Canadian Conservation Institute: Ottawa. pp. 83-89.
Avantages d’une bonne gestion et 5 d’un partage des données Accélérer le progrès scientifique. La bonne gestion des données de recherche permettra aux chercheurs d’obtenir et de comprendre les données des autres et de les réutiliser pour leurs propres fins scientifiques, ce qui accélérera les nouvelles découvertes. Accroître la visibilité et les retombées de la recherche. Les données rendues visibles par l’entremise d’un dépôt de données peuvent de beaucoup accroître les retombées de cette recherche. L’accessibilité des données de recherche est étroitement liée à l’augmentation du nombre de citations. Par exemple, selon une étude sur le nombre de citations dans les publications sur les essais cliniques sur le cancer, on a constaté que les essais cliniques Crédit photo : Bollen J, Van de Sompel H, Hagberg A, Bettencourt L, Chute R, et al. (2009) Clickstream Data Yields High- pour lesquels les données avaient Resolution Maps of Science. PLoS ONE 4(3): e4803. doi:10.1371/journal.pone.000480 été communiquées ont été cités environ 70 fois plus fréquemment Éviter la répétition des travaux de recherche. Lorsqu’un ensemble de que dans les cas où on ne l’avait pas données est disponible publiquement, il est beaucoup plus probable que ces fait 4. données ne seront pas créées de nouveau, ce qui évite des travaux coûteux et Respecter les politiques des inutiles de collection et de production des données. organismes subventionnaires. Permettre la reproduction et la validation des résultats de la recherche. De plus en plus d’organismes Lorsque les données sont archivées et connues, les résultats peuvent être subventionnaires exigent que les répétés et les données peuvent servir à une nouvelle analyse, ce qui permet de chercheurs et les établissements confirmer les premières constatations de la recherche. Elles peuvent aussi servir hôtes conservent, gèrent et rendent à faire état d’erreurs ou d’incohérences dans la première analyse des données. accessibles leurs données à la fin d’un projet de recherche. Par Intensifier la collaboration : Les données disponibles publiquement conséquent, les universités et les permettent aux chercheurs de collaborer les uns avec les autres en mettant en chercheurs ont une obligation commun les ensembles de données, le contexte et les outils de recherche. juridique et éthique d’assurer la pérennité des données de 4 Piwowar, HA, Day, RS, Fridsma, DB. Sharing Detailed Research Data Is Associated with Increased recherche. Certains éditeurs Citation Rate. 2007. PLoS ONE 2(3): http://dx.doi.org/doi:10.1371/journal.pone.0000308 exigent également que les données liées à leurs publications soient conservées. La banque de données sur les protéines La banque de données sur les protéines (Protein Data Bank ou PDB) est une base de données en libre accès, permettant d’accélérer le progrès et les découvertes scientifiques. Créée en 1971, la banque a commencé avec sept structures de protéines résolues. Depuis ses débuts, le programme a connu une croissance rapide et il contient actuellement plus de 43 000 structures résolues. L’utilisation de la banque de données a également connu une croissance importante : de un million de téléchargements par mois au début de 2007, elle est passée à cinq millions par mois en 2008. www.wwpdb.org
6 Le contexte actuel Les méthodes utilisées pour la gestion des données de recherche varient beaucoup selon les disciplines. Dans certains domaines, comme la génomique, la protéomique, la physique des hautes énergies et l’astronomie, des traditions de longue date existent pour l’archivage et la mise en commun des données, ce qui n’est pas le cas dans d’autres domaines tels que la chimie et les sciences humaines et sociales. Les chercheurs dans certains domaines sont réticents à rendre accessibles leurs données pour les raisons suivantes : inquiétudes au sujet de la propriété des données ou de la propriété intellectuelle; méconnaissance de la valeur ajoutée que représente le partage des données ou manque de connaissance ou de temps pour préparer les données à des fins de diffusion. À l’étranger Il existe de plus en plus de grands dépôts d’archives de données par discipline comme PubChem, GenBank, Protein Data Bank, Digital Sky Survey, World Data Centers (données solaires, géophysiques et autres sur l’environnement), Global Biodiversity Information Facility, International Virtual Observatory, Digital Earth et Interuniversity Consortium for Political and Social Research (ICPSR). Ces archives ont une envergure internationale et visent à recueillir des données partout dans le monde. Elles offrent aussi un large accès aux données qu’elles recueillent en vue de faire avancer la recherche et la création du savoir. La vaste majorité de ces archives sont financées par des ministères ou des organismes subventionnaires nationaux dans le pays où elles sont hébergées – bien qu’il existe aussi quelques archives de données internationales gérées par le secteur privé. Outre ces archives internationales par discipline, plusieurs pays ont des archives de données nationales qui ont le mandat de recueillir des données nationales précieuses sur un sujet donné. Par exemple, la plupart des pays recueillent et archivent des données sur la population, sur le climat, sur la santé, etc. En 2004, 34 pays, dont le Canada, ont signé la Déclaration sur l’accès aux données de la recherche financée par des fonds publics de l’OCDE 5. La déclaration repose sur le postulat selon lequel les données de recherche subventionnées par les fonds publics doivent être à la libre disposition du plus grand nombre possible. C’est ainsi qu’un certain nombre de pays cherchent actuellement à déterminer comment ils peuvent exploiter plus systématiquement les données créées par la recherche subventionnée par les fonds publics. Voici des exemples : États-Unis Aux États-Unis, la National Science Foundation (NSF) a annoncé la création d’un programme de subventions de 100 millions de dollars appelé « Sustainable Digital Data Preservation and Access Network Partners (DataNet) » 6. Le programme est en voie d’élaborer de nouvelles méthodes, structures de gestion et technologies pour gérer la diversité, la taille et la complexité des ensembles de données et des flux de données actuels et futurs par la création d’un ensemble d’organismes exemplaires pour l’infrastructure des données de recherche nationales et mondiales. Aux États-Unis également, un groupe appelé Interagency Working Group on Digital Data a été formé en décembre 2006. Près de 30 organismes, bureaux et conseils gouvernementaux ont été désignés à titre de membres ou de participants, démontrant l’intérêt élargi suscité par les données scientifiques numériques. Dans son rapport final, le groupe propose la stratégie suivante pour les États-Unis : élaborer un cadre global de politiques transparentes, évolutives et extensibles, ainsi que des structures de gestion et d’organisation qui offrent un accès fiable et efficace à toute la gamme des données scientifiques numériques publiques. Ce cadre se veut un élément moteur pour que les États-Unis puissent jouer un rôle de premier plan dans les sciences et dans une société de l’information marquée par la concurrence et la mondialisation. 7. 5 Science, technologie et innovation pour le 21ème siècle. Réunion du Comité de la politique scientifique et technologique de l’OCDE au niveau ministériel, 29-30 janvier 2004 - Communiqué final. 2004. Organisation de coopération et de développement économiques. http://www.oecd.org/document/0,3343,fr_2649_34487_26006977_1_1_1_1,00.html 6 Community-based Data Interoperability Net¬works. 2009. National Science Foundation, www.nsf.gov/pubs/2007/nsf07565/nsf07565.htm 7 Harnessing the Power of Digital Data for Science and Society. Report of the Interagency Working Group on Digital Data to the Committee on Science of the National Science and Technology Council. January 2009. p.2 www.nitrd.gov/about/Harnessing_Power_Web.pdf
Royaume-Uni Le Royaume-Uni possède déjà une infrastructure très solide de dépôt de données pour la collecte de 7 données de recherche, administrée par plusieurs organismes subventionnaires des Research Councils UK (RCUK). Dans le prolongement de cette initiative, le Consortium of Research Libraries au R.-U. et en Irlande, et le IT Directors Group ont entrepris une étude pour déterminer la faisabilité et les coûts de l’élaboration et du maintien d’un service national commun pour les données de recherche numériques à l’intention du secteur de l’enseignement supérieur au R.-U. Les auteurs ont conclu que des efforts considérables sont faits par d’autres pays pour repérer et exploiter les données à l’échelle nationale ou régionale et que le R.-U. doit adopter une démarche globale pour la gestion des données de recherche afin de ne pas prendre de retard 8. Australie En septembre 2008, des représentants des grands établissements de recherche de l’Australie ont adopté la déclaration de Brisbane qui affirme notamment que chaque citoyen doit avoir le libre accès gratuit aux données et connaissances provenant de la recherche subventionnée par les fonds publics et que chaque université australienne doit avoir accès à un dépôt numérique. 9 Le gouvernement de l’Australie a annoncé récemment la création du Australian National Data Service (ANDS). L’ANDS a démarré en septembre 2008 et il fait partie d’une stratégie visant une infrastructure nationale commune pour la recherche. Parmi ses buts déclarés, mentionnons qu’il vise à faire en sorte que les données de recherche en Australie soient bien gérées, accessibles et exploitables 10. 8 UK Research Data Service. http://www.ukrds.ac.uk/home 9 Open Access and Research Conference 2008. 2008. Queensland University of Technology. www.oar2008.qut.edu.au 10 Australian National Data Service. 2009. Monash University. www.ands.org.au Au Canada En octobre 2000, le Conseil de recherches en sciences humaines et l’Archiviste national du Canada ont constitué un groupe de travail comprenant des chercheurs et des spécialistes de la gestion de documents et leur ont demandé d’évaluer les besoins en ce qui a trait à un système national de diffusion, de conservation et de gestion des données de recherche. Le groupe de travail a constaté de vastes lacunes dans l’infrastructure de collecte et de conservation des données. Dans son rapport final publié en 2002, il recommande la création d’un nouveau service national d’archivage des données de recherche 11. En novembre 2004, le Conseil national de recherches du Canada (CNRC), en collaboration avec la Fondation canadienne pour l’innovation (FCI), les Instituts de recherche en santé du Canada (IRSC) et le Conseil de recherches en sciences naturelles et en génie (CRNSG), a lancé une consultation sur l’accès aux données de recherche au Canada (appelée la Consultation nationale sur l’accès aux données de la recherche scientifique ou CNADRS). Les chercheurs en sciences naturelles et médicales ont exprimé leur avis à cette occasion. Le rapport final a été publié en janvier 2005 et il constitue une « car te routière » pour la mise en œuvre d’un plan national pour le libre accès aux données de la recherche scientifique subventionnée par les fonds publics. Les recommandations du rapport n’ont pas encore été mises en œuvre. En janvier 2004, le Canada a été signataire de la Déclaration sur l’accès aux données de la recherche financée par des fonds publics de l’OCDE. Mais, contrairement à d’autres pays signataires, le Canada n’a pas encore réagi par des mesures concrètes pour donner suite au protocole d’entente. 11 Savoir, c’est comprendre. Rapport final de la Consultation sur les archives nationales de données. Juin 2002. Conseil de recherches en sciences humaines. www.sshrc-crsh.gc.ca/site/about-crsh/publications/da_finalreport_f.pdf Les données de recherche : un potentiel insoupçonné
8 Les données de recherche : Groupes canadiens intéressés à la gestion un potentiel insoupçonné des données Groupe de travail sur la stratégie des données de recherche du Canada Le 25 janvier 2008, l’Institut canadien de l’information scientifique et technique (ICIST) a organisé une réunion des principales parties intéressées pour examiner de quelle façon commencer à mettre en place les recommandations issues de la consultation nationale sur l’accès aux données de recherche scientifique 12. Un groupe de travail a été établi avec la participation de tous les organismes subventionnaires fédéraux, de l’Association des bibliothèques de recherche du Canada (ABRC), de Compute Canada, de CANARIE et d’un certain nombre de chercheurs à titre individuel. Le groupe a publié à l’automne de 2008 un document portant sur l’analyse des écarts et il cherche actuellement à corriger ces écarts dans la gestion des données de recherche au Canada. 12 Données de recherche Canada. 2009. Institut canadien de l’information scientifique et technique. www.data-donnees.gc.ca Comité national canadien de CODATA (CNC/CODATA) Ce comité est la voix canadienne de CODATA (Committee on Data for Science and Technology) 13. CODATA est un comité scientifique interdisciplinaire du Conseil international pour la science ( ICSU), établi il y a 40 ans. Le CNC/CODATA est parrainé par l’ICIST (Institut canadien de l’information scientifique et technique) qui relève de son côté du Conseil national de recherches du Canada. CODATA n’est pas un organisme public comme tel mais il s’efforce par l’intermédiaire de ses membres nationaux et groupes de travail d’ « améliorer la qualité, la fiabilité, la gestion et l’accessibilité des données d’importance dans tous les domaines de la science et de la technologie. » 13 Canadian National Committee for CODATA. 2009. www.codata.org/canada Crédit photo : Bernard O’Hara & Renos Savva, Wellcome Images
Études de cas d’activités de gestion 9 des données au Canada Ontario Data Documentation, Extraction Service and Infrastructure Initiative ODESI est un projet subventionné conjointement par le Conseil des bibliothèques universitaires de l’Ontario (CBUO) et OntarioBuys qui offre aux chercheurs universitaires un accès sans précédent à un grand nombre d’ensembles de données. Le projet vise avant tout les ensembles de données de Statistique Canada 14, les fichiers de données de Gallup Canada et d’autres entreprises de sondage, des fichiers du domaine public comme les sondages sur les élections nationales au Canada et certains fichiers de l’Inter-University Consortium for Political and Social Research (ICPSR). Les fichiers sont balisés selon la norme DDI (Initiative de documentation de données), un système international de marquage de métadonnées fondées sur XML permettant la découverte des ensembles de données, l’accès réseauté à ces données, leur extraction et leur analyse. 14 “Initiative ontarienne en matière de documentation des données, de service d’extraction et d’infrastructure”. 2009. Ontario Council of University Libraries. http://search2.odesi.ca Année polaire internationale L’Année polaire internationale (API) est un vaste programme scientifique portant sur l’Arctique et l’Antarctique qui s’est déroulé de mars 2007 à mars 2008. Le programme est assorti d’une politique globale qui exige que les données, y compris les données opérationnelles communiquées en temps réel, soient accessibles intégralement, librement, sans frais et dans les plus brefs délais possibles 15. Des douzaines de projets de recherche canadiens ont été subventionnés dans le cadre de l’API par diverses sources dont le gouvernement fédéral, les gouvernements territoriaux, les organismes subventionnaires et des fondations. Chaque projet devait élaborer un plan de gestion des données pour recevoir des subventions. Il est probable que plusieurs projets canadiens auront de la difficulté à respecter la politique de l’API car il y a peu de dépôts au Canada pouvant recueillir et conserver les données qui sont ainsi créées et y donner accès. 15 International Polar Year 2007-2008 Data Policy. April 2008. http://classic.ipy.org/Subcommittees/final_ipy_data_policy.pdf Les données de recherche : un potentiel insoupçonné
10 Études de cas d’activités de gestion des données au Canada VENUS Canadian Barcode of Life Victoria Experimental Network Under the Sea Canadian Barcode of Life Network, de concert avec le (VENUS)16, sous la direction de l’Université de Victoria, vaste consortium international dont il fait partie, est est un observatoire océanique câblé. Il communique un réseau en voie d’élaborer un système précis, rapide, des données en temps réel provenant du fond rentable et universellement accessible qui s’appuie de l’océan par câbles en fibre optique reliés à des sur l’ADN pour l’identification des espèces. L’attribution instruments à l’Université de Victoria, en C.-B., où de codes à barres selon l’ADN est une solution très elles sont archivées. Le portail de VENUS procure prometteuse pour résoudre l’« obstacle taxonomique » aux scientifiques et au grand public le libre accès qui limite beaucoup la recherche sur la biodiversité. à un « entrepôt » grandissant d’images, de sons et Tous ces projets d’identification par codes à barres ont de données en temps réel provenant du fonds de comme objectif commun d’établir une base de données l’océan 17 pour faciliter la recherche sur les océans en libre accès de codes à barres de référence qui nous partout dans le monde. permettront de mieux comprendre la biodiversité et permettront aux non-taxonomistes d’identifier les 16, 17 VENUS: Victoria Network Under the Sea. 2009. University of espèces. En août 2009, les chercheurs avaient déposé Victoria. www.venus.uvic.ca plus de 670 000 enregistrements de codes à barres provenant de 61 000 espèces de la base de données internationale de codes à barres de la vie (la vaste majorité – soit près de 500 000—proviennent du Centre canadien) 18. 18 Barcode of Life Data Systems. 2009. Biodiversity Institute of Ontario. www.barcodinglife.org/views/login.php Projet de métadonnées des Centres de données de recherche Ce projet a pour but de produire un ensemble d’outils qui permettront aux chercheurs de fournir de meilleures métadonnées pendant tout le cycle de vie de leurs travaux de recherche au moyen du schéma DDI 3 XML. Le projet, établi à l’Université du Manitoba, permettra de baliser des fichiers dans les centres de données de recherche et de créer des outils pour la migration vers la norme DDI (Initiative de documentation des données) version 3. Il produira un ensemble d’outils qui permettra aux chercheurs de fournir de meilleures métadonnées pour toute la durée de vie de leur projet. Un Centre de métadonnées de recherche a été établi à Gatineau (Québec) pour produire des métadonnées conformes pour les fichiers confidentiels de Statistique Canada dans le Réseau des centres de données de recherche du Canada. Aussi, un consortium international de développement logiciel dirigé par Brechenhill au Canada travaille au développement d’outils pour appliquer la norme DDI 3 à la documentation des données. Les données de recherche : un potentiel insoupçonné
Lacunes dans la gérance des données au Canada 11 Le Groupe de travail sur la stratégie Dépôts de données : Il existe Récompenses et reconnaissance : des données de recherche dirigé par seulement quelques dépôts de Il y a peu de mesures incitatives l’ICIST a fait à l’automne de 2008 une données actifs au Canada permettant favorisant le partage des données par bonne analyse des écarts dans la aux chercheurs d’y déposer leurs les chercheurs. Des facteurs dissuasifs gérance des données de recherche au données. Il y a de vastes écarts tant réels existent même : en effet, les Canada19. L’analyse révèle l’existence dans la couverture que dans la capacité chercheurs sont exhortés à produire le d’obstacles importants à l’accessibilité des dépôts de données. Il n’existe pas plus de publications possible avec les et à la conservation des données de de dépôts pour tous les domaines de données de première main qu’ils ont recherche — des obstacles qui, s’ils ne recherche et la grande majorité des recueillies avant de mettre celles-ci à la sont pas éliminés, pourraient avoir des données de recherche sont encore disposition de tous. répercussions sérieuses sur l’avenir de la hébergées sur les disques durs des recherche et de l’innovation au Canada. chercheurs. Rôles et responsabilités : À l’exception Voici les écarts recensés : de certains ministères, il n’y a pas Compétences : Les chercheurs ont d’ organisme national chargé de la Politiques sur les données : Les rarement les compétences nécessaires conservation, de la gestion et de la politiques sur les données au Canada pour bien gérer leurs données. En outre, diffusion des données de recherche ne portent pas sur tous les types de il y a peu de scientifiques spécialisés dans ayant l’envergure nécessaire pour données de recherche et, dans certains les données ou de professionnels de répondre aux besoins des différents cas, des chercheurs ne se conforment l’information ayant une connaissance intervenants. pas aux politiques existantes. Le volet du catalogage des données, des conservation des données est rarement normes et des processus relatifs aux Temps requis: Il est essentiel pour pris en compte dans les politiques. métadonnées, de la conservation et la création d’un bon ensemble de de l’évaluation de la pertinence des données pouvant être utilisé de façon Financement de la gestion des données pour les chercheurs. pérenne de faire en sorte que les données : La structure de financement données soient faciles à comprendre de la recherche au Canada ne prévoit Normes : Ce ne sont pas tous les et à analyser. Il faut donc à cette fin pas la gestion des données au-delà de la chercheurs ni toutes les disciplines qui une description des données et une durée de vie d’un projet de recherche. ont adopté les normes internationales. documentation qui soient conviviales, Il n’y a pas beaucoup d’établissements Beaucoup reste à faire pour assurer claires et détaillées, mais aussi au Canada qui offrent un financement l’interopérabilité des données provenant complètes. Ceci requiert du temps et durable pour les dépôts de données. de divers projets et touchant plusieurs la plupart des chercheurs n’en ont pas En outre, il y a des coûts importants disciplines. Les normes relatives aux beaucoup. associés à la préparation des données métadonnées, cruciales pour garantir pour diffusion et ces coûts ne sont pas l’accessibilité et l’interopérabilité 19 Groupe de travail sur la stratégie des prévus dans les mécanismes de finance- des différents types d’ensembles données de recherche. Gérance des données ment actuels (c.-à-d. les subventions de données entre eux, ne sont pas de recherche au Canada : une analyse des écarts. Octobre 2008. Institut canadien de ou les budgets universitaires). toujours respectées par les créateurs l’information scientifique et technique. http:// ou les aggrégateurs de données. data-donnees.gc.ca/docs/AnalyseEcarts.pdf Crédit photo : Photo par Joriel Jiménez Les données de recherche : un potentiel insoupçonné
12 Politiques de gestion des données au Canada Tout un ensemble de politiques établies par le gouvernement fédéral et les gouvernements provinciaux, les organismes subventionnaires, d’autres établissements et même certains projets de recherche régissent les activités de gestion des données au Canada. Ces politiques varient beaucoup et, dans certains cas, portent sur des aspects différents de la gestion des données. Toutefois, la plupart des chercheurs sont tenus par leur établissement, leur organisme subventionnaire ou les deux, de conserver leurs données de recherche jusqu’à cinq ans après avoir terminé un projet. Politiques des organismes subventionnaires IRSC Les Instituts de recherche en santé du Canada exigent des bénéficiaires de subventions qu’ils déposent certains types de données – données en matière de bioinformatique, d’atomistique et données de coordonnées moléculaires – dans les bases de données publiques correspondantes dès la publication des résultats de leur recherche. Les IRSC exigent légalement des chercheurs qu’ils conservent les ensembles de données originales découlant de la recherche qu’ils subventionnent pendant au moins cinq ans après la fin de la subvention. Les IRSC ont l’intention de réexaminer cette politique prochainement et peut-être de l’élargir. 20 CRSH Le Conseil de recherches en sciences humaines a une politique d’archivage des données de recherche depuis 1990. Selon cette politique, « Toutes les données de recherche rassemblées grâce au financement du CRSH doivent être conservées et mises à la disposition des autres chercheurs dans des délais raisonnables.» 21 . Selon le CRSH, un délai raisonnable est une période de deux ans après la fin du projet de recherche pour lesquels les données ont été recueillies. Le CRSH n’a pas appliqué cette politique auprès des chercheurs et moins de 10 % des chercheurs s’y sont conformés depuis ses débuts. 22 CRSNG Le Conseil de recherches en sciences naturelles et en génie n’a pas de politique générale relativement aux données de recherches. Il y a cependant des lignes directrices pour les chercheurs subventionnés par l’intermédiaire du Programme de subventions de réseaux stratégiques. On y lit ce qui suit : « Pour encourager le partage et la diffusion des données de recherche et leur utilisation par d’autres dans un délai raisonnable, on doit conclure dès le début des activités de réseau une entente établissant la responsabilité en matière de mise à jour et de conservation de grands ensembles de données.» 23 Les trois Énoncé de politique des trois conseils sur l’éthique de la recherche avec des êtres humains « Les chercheurs devraient s’assurer que les données obtenues sont conservées avec toutes les précautions nécessaires particulières dues à la nature délicate des renseignements. Les données publiées ne devraient contenir ni nom, ni initiales, ni aucune autre sorte de renseignement pouvant mener à une identification. Il peut s’avérer important de conserver certains types d’identificateurs (p. ex., région de résidence), mais ceux- ci devraient être dissimulés le mieux possible, selon un protocole normalisé, avant que les données ne soient communiquées aux fins de la recherche. » 24 20 Politique sur l’accès aux résultats de la recherche. Septembre 2007. Instituts de recherche en santé du Canada. www.cihr-irsc.gc.ca/f/34846.html 21 Politique du CRSH sur l’archivage des données de recherche. 2009. Conseil de recherches en sciences humaines. www.sshrc.ca/site/apply- demande/policies-politiques/edata-donnees_electroniques-fra.aspx 22 Humphrey, C. Preserving research data: A Time for Action. In Preservation of Electronic Records: New Knowledge and Decision-making. 2003. Canadian Conservation Institute: Ottawa. pp. 83-89. 23 Programme de subventions de réseaux stratégiques. 2009. Conseil de recherches en sciences naturelles et en génie du Canada. www.nserc-crsng.gc.ca/Professors-Professeurs/RPP-PP/SNG-SRS_fra.asp 24 Proposition de la 2e édition de L’Énoncé de politique des trois Conseils : Éthique de la recherche avec des êtres humains. Décembre 2008. Groupe consultatif interagences en éthique de la recherche. http://www.ger.ethique.gc.ca/fra/policy-politique/initiatives/draft-preliminaire/ Les données de recherche : un potentiel insoupçonné
Autres politiques sur les données 13 Des universités, centres de recherche et projets de recherche ont parfois aussi des politiques régissant les données de recherche. Voici quelques exemples. Université McGill Cette politique stipule que les données doivent être organisées de manière à ce qu’elles puissent être facilement vérifiées. Sous réserve d’exceptions fondées sur le devoir de (Nous n’avons trouvé aucune confidentialité et les lois régissant la propriété intellectuelle et l’accès à l’information, et une autre politique universitaire fois les résultats de la recherche publiés, les données doivent être mises à la disposition de dans la rédaction du présent quiconque présente une demande raisonnable de les examiner. Dans les cas de désaccord document.) entre le chercheur et la personne qui demande à voir les données, c’est le bureau du vice-principal à la recherche qui tranchera. La politique indique également que toutes les données originales doivent être conservées pendant un délai raisonnable et recommande une période d’au moins cinq ans après la date de la publication 25. Pêches et Océans La Politique d’accès aux données scientifiques spécifie ce qui suit : « Les gestionnaires de Canada Pêches et Océans ont la responsabilité de s’assurer que les collecteurs de données sous leur direction transmettent leurs données ainsi que les données recueillies en vertu d’un contrat (Un exemple d’une ou de partenariat avec d’autres organismes au centre de données appropriées de façon opportune. Il est important de s’assurer que les données sont rapidement transférées dans politique sur les données un environnement « géré » où elles seront sauvegardées de façon appropriée et mises à l’abri d’un ministère) de toute perte accidentelle ou circonstancielles et où les métadonnées essentielles seront intégrées aux données afin de préserver l’utilité à long terme d’un ensemble de données » 26. Année polaire La Politique sur les données de l’API indique qu’en vue de maximiser les bénéfices des internationale (API) données recueillies sous l’égide de l’API, le Comité conjoint de l’API exige que ces données, y compris les données opérationnelles communiquées en temps réel, soient accessibles intégralement, gratuitement, librement et dans le plus bref délai possible 27. En outre, toutes les données de l’API doivent être archivées dans leur forme la plus simple et la plus utile et être accompagnées d’une description complète à l’aide de métadonnées 28. Gouvernement fédéral : « Les renseignements personnels ne doivent pas être utilisés ou communiqués à des fins Loi sur la protection autres que celles auxquelles ils ont été recueillis à moins que la personne concernée n’y des renseignements consente ou que la loi ne l’exige. On ne doit conserver des renseignements personnels personnels et que pendant le temps nécessaire pour la réalisation des fins déterminées. [...] On devrait détruire, effacer ou dépersonnaliser les renseignements personnels dont on a plus besoin les documents aux fins précisées. Les organisations doivent élaborer des lignes directrices et appliquer des électroniques (LPRPDE) procédures régissant la destruction des renseignements personnels. » 29 25 Policy on Research Ethics. April 7, 2008. McGill University. www.mcgill.ca/files/secretariat/Research-Ethics-Policy-on.pdf 26 Politique d’accès aux données scientifiques du MPO. 12 juin 2001. Pêches et Océans Canada. www.osl.gc.ca/sgdo/fr/info-donnees/acces-donnees.html 27, 28 International Polar Year 2007-2008 Data Policy. April 2008. http://classic.ipy.org/Subcommittees/final_ipy_data_policy.pdf 29 Loi sur la protection des renseignements personnels et les documents électroniques. 2009. Ministère de la Justice Canada. http://laws.justice.gc.ca/fra/P-8.6/index.html Les données de recherche : un potentiel insoupçonné
14 Réponses aux préoccupations des chercheurs et des administrateurs Je ne peux pas archiver et communiquer mes données parce qu’elles portent sur des humains. Le respect des renseignements personnels dans la recherche est une norme internationalement reconnue et un principe d’éthique. Au Canada, les trois principaux conseils subventionnaires ont adopté un énoncé de politique commun régissant toute la recherche avec des êtres humains entreprise au Canada. La politique énonce que les renseignements personnels au sujet des participants de l’étude ne doivent pas être communiqués. Toutefois, la politique recommande aussi ce qui suit : « D’une façon générale, la meilleure façon de protéger la confidentialité des renseignements personnels passe par l’anonymat. Si les données conservées sont véritablement anonymes, la recherche ne fera l’objet que d’une évaluation minimale du CÉR [Comité d’éthique de la recherche]. » 30 Des procédures bien établies existent pour assurer l’anonymat des données et les chercheurs peuvent consulter les spécialistes des données de leur établissement de recherche pour savoir s’il y a lieu de rendre anonymes les Si je partage mes données, données contenant des renseignements personnels et comment le faire je limite mes options de façon à pouvoir partager ces données. Du travail reste à faire pour bien faire connaître les techniques permettant d’assurer l’anonymat des données d’exploitation de brevets au sein des comités d’éthique de la recherche (CÉR). Malgré l’avis des trois et d’autres avantages conseils relativement à la possibilité de conserver en rendant anonymes les économiques. données traitant de sujets humains, beaucoup de CÉR demandent encore souvent aux chercheurs de détruire les données. Les bons principes de gestion des données ne sont pas incompatibles avec ceux qui 30 Énoncé de politique des trois Conseils : Éthique de la recherche avec des êtres humains: 2e édition. Décembre 2008. Groupe consultatif interagences en éthique de la recherche. régissent la propriété intellectuelle et la www.ger.ethique.gc.ca/fra/policy-politique/initiatives/draft-preliminaire/ propriété des données. Les chercheurs peuvent choisir de restreindre l’accès à leurs données afin de maximiser leurs avantages professionnels et économiques en reportant la communication des données jusqu’à la Les bonnes pratiques de gestion des données sont publication ou à l’application du brevet, ou trop coûteuses. en faisant appel à une licence d’utilisation non commerciale pour les données. La gestion des données, comme l’attribution de métadonnées, la gestion de dépôts et les activités de conservation des données ont bien entendu L’OCDE recommande de prendre en un coût mais les avantages dépassent largement ces coûts. Refaire la considération les mesures qui favorisent recherche pour obtenir les mêmes données est onéreux. De plus, c’est l’accès et l’exploitation à des fins non impossible dans de nombreux cas parce que les chercheurs, les sujets, les commerciales tout en protégeant les intérêts conditions des tests, etc. n’y sont plus. Le maintien d’un cadre fiable et commerciaux, comme la communication ordonné pour protéger les investissements considérables consentis par les différée ou partielle des données ou établissements dans la création de données de recherche représentent un l’adoption volontaire de mécanismes d’octroi coût relativement modeste comparativement à celui prohibitif de recréer ces de licences. De telles mesures peuvent données. permettre aux principaux participants d’exploiter pleinement les données de la recherche, sans en interdire inutilement l’accès.
Que peut-on faire sur le campus? Chercheurs S’engager à communiquer les données de recherche le plus ouvertement possible. Élaborer un plan de gestion des données avant d’entamer un projet de recherche. Comprendre les politiques de gestion des données des organismes subventionnaires et s’y conformer. Faire appel aux spécialistes des données sur le campus pour de l’aide dans la collecte et la gestion des données de recherche. Repérer et utiliser les normes internationales pour la gestion des données. Administrateurs universitaires Élaborer des politiques qui favorisent la bonne gestion des données. Appuyer la mise en place de dépôts de données par l’établissement. Donner une formation aux chercheurs au sujet des pratiques de gestion des données. Aider les chercheurs en embauchant des spécialistes ou des bibliothécaires experts en matière de données et faire connaître ces spécialistes aux équipes de recherche (et les y intégrer). Reconnaître l’apport du partage des données dans l’embauche, les promotions et les nominations. Bibliothèques de recherche Mettre sur pied et gérer des dépôts de données pour l’établissement. Favoriser la formation des bibliothécaires dans le domaine de la gérance des données. Venir en aide aux chercheurs en embauchant des bibliothécaires experts en matière de données et en mettant ces spécialistes à la disposition de l’ensemble des chercheurs. Assurer la formation des chercheurs au sujet des pratiques de gestion des données.
65 Université Privé, Pièce 238, Ottawa, (Ontario) K1N 9A5 Tél: 613-562-5385 Télécopieur: 613-562-5297 carladm@uottawa.ca • www.carl-abrc.ca L’Association des bibliothèques de recherche du Canada (ABRC) a été fondée en 1976. Elle regroupe les 28 principales bibliothèques de recherche universitaires au Canada, ainsi que Bibliothèque et Archives Canada, l’Institut canadien de l’information scientifique et technique (ICIST), et la Bibliothèque du Parlement. L’Association ne comprend que ces membres institutionnels et vise surtout à rassembler les bibliothèques des universités canadiennes qui ont des programmes de doctorat dans les arts, les sciences humaines et les sciences. L’ABRC tâche d’augmenter la capacité des bibliothèques de recherche du Canada d’effectuer des partenariats dans la recherche et les études supérieures, cherchant à encourager un système de communication savante efficace et soutenable et une politique publique qui encourage la recherche et du large accès à l’information scientifique. L’Association est associée à l’Association des universités et collèges du Canada (AUCC) et constituée en société à but non lucratif selon les dispositions de la Loi sur les corporations canadiennes. Membres institutionnels de L’ABRC University of Alberta Université Laval Queen’s University Bibliothèque et Archives Canada University of Manitoba University of Regina Bibliothèque du Parlement McGill University University of Saskatchewan University of British Columbia McMaster University Université de Sherbrooke Brock University Memorial University of Simon Fraser University Newfoundland University of Calgary University of Toronto Université de Montréal Carleton University University of Victoria University of New Brunswick Concordia University University of Waterloo Université d’Ottawa Dalhousie University University of Western Ontario Université du Québec à Montréal University of Guelph University of Windsor ICIST (Institut canadien de York University l’information scientifique et technique) Directeur général : Brent Roe Président : Ernie Ingles, MSRC (2009 – 2011)
Vous pouvez aussi lire