Les données de recherche : un potentiel insoupçonné - Une trousse de sensibilisation réalisée pour l'Association des bibliothèques de recherche du ...

La page est créée René Devaux
 
CONTINUER À LIRE
Les données de recherche : un potentiel insoupçonné - Une trousse de sensibilisation réalisée pour l'Association des bibliothèques de recherche du ...
Les données de recherche :
 un potentiel insoupçonné
                          Une trousse de sensibilisation réalisée pour
      l’Association des bibliothèques de recherche du Canada (ABRC)
Les données de recherche : un potentiel insoupçonné - Une trousse de sensibilisation réalisée pour l'Association des bibliothèques de recherche du ...
2    Cette trousse , réalisée pour le Sous-comité sur la gestion des données de
     l’ABRC, contient des renseignements de base sur la gestion des données de
     recherche au Canada. Elle vise à aider les directeurs membres de l’Association des
     bibliothèques de recherche du Canada (ABRC) à sensibiliser les administrateurs
     et les chercheurs sur le campus aux questions entourant la gestion des données.
     La trousse, conjointement avec un document d’accompagnement qui explique
     le rôle des bibliothèques dans la gestion des données de recherche, procure aux
     lecteurs des connaissances générales sur l’état actuel des données de recherche
     au Canada et à l’étranger, et présente de suggestions pour commencer à trouver
     des solutions aux problèmes évoqués.
     Par Kathleen Shearer

     Sous-comité sur la gestion des données de l’ABRC
     Marnie Swanson (Présidente, University of Victoria)
     Pam Bjornson (CNRC-ICIST)
     Lynn Copeland (Simon Fraser University)
     Michelle Edwards (University of Guelph)
     Bernie Gloyn (Observateur, Statistique Canada)
     Margaret Haines (Carleton University)
     Janine Schmidt (McGill University)
     Kathleen Shearer ( Attaché de recherche, ABRC)
     Diego Argáez (Sécretaire, ABRC)

     Merci à Diane Sauvé (Université de Montréal) pour son aide avec la traduction
     au français de ce document.

     © 2009 ABRC, Le contenu dans ce document est sujet à une licence de Creative
     Commons Paternité - Pas d’Utilisation Commerciale 2.5 Canada.

    Les données de recherche :
    un potentiel insoupçonné
Les données de recherche : un potentiel insoupçonné - Une trousse de sensibilisation réalisée pour l'Association des bibliothèques de recherche du ...
3

Table des   Vue d’ensemble
            Avantages d’une bonne gestion et d’un partage des données

matières    Le contexte actuel
                   À l’étranger
                   Au Canada
                   Groupes canadiens intéressés à la gestion des données
            Études de cas
            Lacunes dans la gérance des données au Canada
            Politiques de gestion des données au Canada
                   Organismes subventionnaires
                   Autres politiques sur les données
            Réponses aux préoccupations des chercheurs et des administrateurs
            Que peut-on faire sur le campus?

   Les données de recherche :
   un potentiel insoupçonné
Les données de recherche : un potentiel insoupçonné - Une trousse de sensibilisation réalisée pour l'Association des bibliothèques de recherche du ...
4
    Vue d’ensemble
    On entend ici par données de              Au cours des cinq prochaines années,      Les données de recherche au Canada
    recherche les enregistrements             on produira dans le monde plus de         ne sont pas gérées systématiquement
    factuels (par exemple données             données de recherche que tout ce          de sorte que des données précieuses
    textuelles, audio, iconographiques,       qui a été fait dans toute l’histoire      sont sous-utilisées. Il existe bien sûr
    numériques ou de microréseaux)            humaine 2. La plus grande partie          des moyens de gestion des données
    servant de sources de première            de ces données auront été créées          offerts par des établissements, ou
    main pour la recherche et qui             numériquement et elles seront             par des organismes nationaux et
    sont généralement reconnus                stockées et gérées électroniquement,      internationaux pour certaines
    comme nécessaires par l’ensemble          de sorte qu’il sera facile de les         disciplines et projets de recherche,
    des chercheurs pour valider les           rendre accessibles, de les reproduire     mais ils ne sont à la disposition que
    conclusions de la recherche.              et de les combiner avec d’autres          d’une minorité de chercheurs.
                                              données. Toutefois, en vue de
    Selon la US National Science              rendre accessibles et de réutiliser des   Pour créer des données qui pourront
    Foundation, les données numériques        données, elles doivent être créées et     être utilisées pendant longtemps, il
    sont à la fois les produits de la         gérées de manière à permettre leur        faut absolument que les documents
    recherche et, de plus en plus, le point   conservation à long terme. Il faut        d’accompagnement soient conviviaux,
    de départ de nouvelles recherches.        donc à cette fin faire une gestion        clairs et compréhensibles. Idéalement,
    Dans l’univers numérique, il est          active des données tout au long de        les métadonnées et la documentation
    possible pour les chercheurs              leur cycle de vie, dès le moment où       devraient être produites dès le
    d’adapter les données, c’est à-dire       l’on envisage pour la première fois       début d’un projet de recherche et
    de les utiliser de façons et en           leur création.                            améliorées tout au long du cycle de
    combinaisons novatrices non                                                         vie des données. Grâce au service de
    prévues par ceux qui les ont créés.       À l’heure actuelle au Canada, la          planification et de soutien offert par
    Il est courant également pour des         grande majorité des données de            les professionnels des données dès
    chercheurs d’utiliser les données         recherche sont perdues. Par exemple,      le début d’un projet de recherche, on
    d’une étude en prenant comme              selon une étude sur les projets de        peut réduire de beaucoup le temps et
    point de départ les conclusions de        recherche subventionnés par le            l’argent nécessaires pour en assurer
    travaux précédents et de les pousser      Conseil de recherche en sciences          l’accessibilité à long terme.
    plus loin; ou encore d’entreprendre       humaines du Canada (CRSH), on             1
                                                                                         Community-based Data Interoperability
    des études longitudinales qui             a constaté que les données de             Networks. 2009. National Science Foundation.
    consistent à comparer des données         seulement trois études sur 110 ont        http://www.nsf.gov/pubs/2007/nsf07565/
                                                                                        nsf07565.htm
    d’observations répétées des mêmes         été archivées dans un dépôt et que
    éléments sur une longue période —         celles de ces trois études ont toutes     2
                                                                                         Beagrie, N. Digital Preservation: Setting the
                                                                                        Course for a Decade of Change. 2007. www.
    souvent de nombreuses décennies 1.        été hébergées aux États-Unis 3.           abd-bvd.be/documents/60/BDA-1107_NB.ppt
                                                                                        3
                                                                                         Humphrey, C. Preserving research data: A
                                                                                        Time for Action. In Preservation of Electronic
                 Crédit photo : www.curri.miyakyo-u.ac.jp                               Records: New Knowledge and Decision-making.
                                                                                        2003. Canadian Conservation Institute:
                                                                                        Ottawa. pp. 83-89.
Les données de recherche : un potentiel insoupçonné - Une trousse de sensibilisation réalisée pour l'Association des bibliothèques de recherche du ...
Avantages d’une bonne gestion et                                                                                                                     5

                      d’un partage des données
Accélérer le progrès scientifique.
La bonne gestion des données
de recherche permettra aux
chercheurs d’obtenir et de
comprendre les données des
autres et de les réutiliser pour
leurs propres fins scientifiques,
ce qui accélérera les nouvelles
découvertes.
Accroître la visibilité et les
retombées de la recherche. Les
données rendues visibles par
l’entremise d’un dépôt de données
peuvent de beaucoup accroître
les retombées de cette recherche.
L’accessibilité des données de
recherche est étroitement liée à
l’augmentation du nombre de
citations. Par exemple, selon une
étude sur le nombre de citations
dans les publications sur les
essais cliniques sur le cancer, on a
constaté que les essais cliniques            Crédit photo : Bollen J, Van de Sompel H, Hagberg A, Bettencourt L, Chute R, et al. (2009) Clickstream Data Yields High-
pour lesquels les données avaient            Resolution Maps of Science. PLoS ONE 4(3): e4803. doi:10.1371/journal.pone.000480
été communiquées ont été cités
environ 70 fois plus fréquemment             Éviter la répétition des travaux de recherche. Lorsqu’un ensemble de
que dans les cas où on ne l’avait pas        données est disponible publiquement, il est beaucoup plus probable que ces
fait 4.                                      données ne seront pas créées de nouveau, ce qui évite des travaux coûteux et
Respecter les politiques des                 inutiles de collection et de production des données.
organismes subventionnaires.                 Permettre la reproduction et la validation des résultats de la recherche.
De plus en plus d’organismes                 Lorsque les données sont archivées et connues, les résultats peuvent être
subventionnaires exigent que les             répétés et les données peuvent servir à une nouvelle analyse, ce qui permet de
chercheurs et les établissements             confirmer les premières constatations de la recherche. Elles peuvent aussi servir
hôtes conservent, gèrent et rendent          à faire état d’erreurs ou d’incohérences dans la première analyse des données.
accessibles leurs données à la
fin d’un projet de recherche. Par            Intensifier la collaboration : Les données disponibles publiquement
conséquent, les universités et les           permettent aux chercheurs de collaborer les uns avec les autres en mettant en
chercheurs ont une obligation                commun les ensembles de données, le contexte et les outils de recherche.
juridique et éthique d’assurer
la pérennité des données de                  4
                                              Piwowar, HA, Day, RS, Fridsma, DB. Sharing Detailed Research Data Is Associated with Increased
recherche. Certains éditeurs                 Citation Rate. 2007. PLoS ONE 2(3): http://dx.doi.org/doi:10.1371/journal.pone.0000308
exigent également que les données
liées à leurs publications soient
conservées.

                                                                                   La banque de données sur les protéines
           La banque de données sur les protéines (Protein Data Bank ou PDB) est une base de données en libre accès, permettant
    d’accélérer le progrès et les découvertes scientifiques. Créée en 1971, la banque a commencé avec sept structures de protéines
    résolues. Depuis ses débuts, le programme a connu une croissance rapide et il contient actuellement plus de 43 000 structures
 résolues. L’utilisation de la banque de données a également connu une croissance importante : de un million de téléchargements
                                                         par mois au début de 2007, elle est passée à cinq millions par mois en 2008.
                                                                                                                                                www.wwpdb.org
Les données de recherche : un potentiel insoupçonné - Une trousse de sensibilisation réalisée pour l'Association des bibliothèques de recherche du ...
6
    Le contexte actuel
    Les méthodes utilisées pour la gestion des données de recherche varient beaucoup selon les disciplines. Dans certains
    domaines, comme la génomique, la protéomique, la physique des hautes énergies et l’astronomie, des traditions de
    longue date existent pour l’archivage et la mise en commun des données, ce qui n’est pas le cas dans d’autres domaines
    tels que la chimie et les sciences humaines et sociales. Les chercheurs dans certains domaines sont réticents à rendre
    accessibles leurs données pour les raisons suivantes : inquiétudes au sujet de la propriété des données ou de la propriété
    intellectuelle; méconnaissance de la valeur ajoutée que représente le partage des données ou manque de connaissance
    ou de temps pour préparer les données à des fins de diffusion.

    À l’étranger
    Il existe de plus en plus de grands dépôts d’archives de données par discipline comme PubChem, GenBank, Protein
    Data Bank, Digital Sky Survey, World Data Centers (données solaires, géophysiques et autres sur l’environnement),
    Global Biodiversity Information Facility, International Virtual Observatory, Digital Earth et Interuniversity Consortium
    for Political and Social Research (ICPSR). Ces archives ont une envergure internationale et visent à recueillir des
    données partout dans le monde. Elles offrent aussi un large accès aux données qu’elles recueillent en vue de faire
    avancer la recherche et la création du savoir. La vaste majorité de ces archives sont financées par des ministères ou
    des organismes subventionnaires nationaux dans le pays où elles sont hébergées – bien qu’il existe aussi quelques
    archives de données internationales gérées par le secteur privé. Outre ces archives internationales par discipline,
    plusieurs pays ont des archives de données nationales qui ont le mandat de recueillir des données nationales
    précieuses sur un sujet donné. Par exemple, la plupart des pays recueillent et archivent des données sur la population,
    sur le climat, sur la santé, etc.

    En 2004, 34 pays, dont le Canada, ont signé la Déclaration sur l’accès aux données de la recherche financée par des
    fonds publics de l’OCDE 5. La déclaration repose sur le postulat selon lequel les données de recherche subventionnées
    par les fonds publics doivent être à la libre disposition du plus grand nombre possible. C’est ainsi qu’un certain
    nombre de pays cherchent actuellement à déterminer comment ils peuvent exploiter plus systématiquement les
    données créées par la recherche subventionnée par les fonds publics. Voici des exemples :

        États-Unis               Aux États-Unis, la National Science Foundation (NSF) a annoncé la création d’un programme de
                                 subventions de 100 millions de dollars appelé « Sustainable Digital Data Preservation and Access
                                 Network Partners (DataNet) » 6. Le programme est en voie d’élaborer de nouvelles méthodes, structures
                                 de gestion et technologies pour gérer la diversité, la taille et la complexité des ensembles de données
                                 et des flux de données actuels et futurs par la création d’un ensemble d’organismes exemplaires pour
                                 l’infrastructure des données de recherche nationales et mondiales.

                                 Aux États-Unis également, un groupe appelé Interagency Working Group on Digital Data a été formé
                                 en décembre 2006. Près de 30 organismes, bureaux et conseils gouvernementaux ont été désignés à
                                 titre de membres ou de participants, démontrant l’intérêt élargi suscité par les données scientifiques
                                 numériques. Dans son rapport final, le groupe propose la stratégie suivante pour les États-Unis :
                                 élaborer un cadre global de politiques transparentes, évolutives et extensibles, ainsi que des structures
                                 de gestion et d’organisation qui offrent un accès fiable et efficace à toute la gamme des données
                                 scientifiques numériques publiques.

                                 Ce cadre se veut un élément moteur pour que les États-Unis puissent jouer un rôle de premier plan dans
                                 les sciences et dans une société de l’information marquée par la concurrence et la mondialisation. 7.

    5
        Science, technologie et innovation pour le 21ème siècle. Réunion du Comité de la politique scientifique et technologique de l’OCDE au niveau
        ministériel, 29-30 janvier 2004 - Communiqué final. 2004. Organisation de coopération et de développement économiques.
        http://www.oecd.org/document/0,3343,fr_2649_34487_26006977_1_1_1_1,00.html
    6
        Community-based Data Interoperability Net¬works. 2009. National Science Foundation, www.nsf.gov/pubs/2007/nsf07565/nsf07565.htm
    7
        Harnessing the Power of Digital Data for Science and Society. Report of the Interagency Working Group on Digital Data to the Committee on
        Science of the National Science and Technology Council. January 2009. p.2 www.nitrd.gov/about/Harnessing_Power_Web.pdf
Les données de recherche : un potentiel insoupçonné - Une trousse de sensibilisation réalisée pour l'Association des bibliothèques de recherche du ...
Royaume-Uni               Le Royaume-Uni possède déjà une infrastructure très solide de dépôt de données pour la collecte de                          7
                              données de recherche, administrée par plusieurs organismes subventionnaires des Research Councils
                              UK (RCUK). Dans le prolongement de cette initiative, le Consortium of Research Libraries au R.-U. et en
                              Irlande, et le IT Directors Group ont entrepris une étude pour déterminer la faisabilité et les coûts de
                              l’élaboration et du maintien d’un service national commun pour les données de recherche numériques
                              à l’intention du secteur de l’enseignement supérieur au R.-U. Les auteurs ont conclu que des efforts
                              considérables sont faits par d’autres pays pour repérer et exploiter les données à l’échelle nationale ou
                              régionale et que le R.-U. doit adopter une démarche globale pour la gestion des données de recherche
                              afin de ne pas prendre de retard 8.

    Australie                 En septembre 2008, des représentants des grands établissements de recherche de l’Australie ont adopté
                              la déclaration de Brisbane qui affirme notamment que chaque citoyen doit avoir le libre accès gratuit
                              aux données et connaissances provenant de la recherche subventionnée par les fonds publics et que
                              chaque université australienne doit avoir accès à un dépôt numérique. 9

                              Le gouvernement de l’Australie a annoncé récemment la création du Australian National Data Service
                              (ANDS). L’ANDS a démarré en septembre 2008 et il fait partie d’une stratégie visant une infrastructure
                              nationale commune pour la recherche. Parmi ses buts déclarés, mentionnons qu’il vise à faire en sorte
                              que les données de recherche en Australie soient bien gérées, accessibles et exploitables 10.

8
     UK Research Data Service. http://www.ukrds.ac.uk/home
9
     Open Access and Research Conference 2008. 2008. Queensland University of Technology. www.oar2008.qut.edu.au
10
     Australian National Data Service. 2009. Monash University. www.ands.org.au

Au Canada
En octobre 2000, le Conseil de recherches en sciences humaines et l’Archiviste national du Canada ont constitué un groupe de
travail comprenant des chercheurs et des spécialistes de la gestion de documents et leur ont demandé d’évaluer les besoins en
ce qui a trait à un système national de diffusion, de conservation et de gestion des données de recherche. Le groupe de travail a
constaté de vastes lacunes dans l’infrastructure de collecte et de conservation des données. Dans son rapport final publié en 2002,
il recommande la création d’un nouveau service national d’archivage des données de recherche 11.

En novembre 2004, le Conseil national de recherches du Canada (CNRC), en collaboration avec la Fondation canadienne pour
l’innovation (FCI), les Instituts de recherche en santé du Canada (IRSC) et le Conseil de recherches en sciences naturelles et en
génie (CRNSG), a lancé une consultation sur l’accès aux données de recherche au Canada (appelée la Consultation nationale sur
l’accès aux données de la recherche scientifique ou CNADRS). Les chercheurs en sciences naturelles et médicales ont exprimé
leur avis à cette occasion. Le rapport final a été publié en janvier 2005 et il constitue une « car te routière » pour la mise en
œuvre d’un plan national pour le libre accès aux données de la recherche scientifique subventionnée par les fonds publics. Les
recommandations du rapport n’ont pas encore été mises en œuvre.

En janvier 2004, le Canada a été signataire de la Déclaration sur l’accès aux données de la recherche financée par des fonds publics
de l’OCDE. Mais, contrairement à d’autres pays signataires, le Canada n’a pas encore réagi par des mesures concrètes pour donner
suite au protocole d’entente.

11
     Savoir, c’est comprendre. Rapport final de la Consultation sur les archives nationales de données. Juin 2002. Conseil de recherches en sciences
     humaines. www.sshrc-crsh.gc.ca/site/about-crsh/publications/da_finalreport_f.pdf

                    Les données de recherche :
                    un potentiel insoupçonné
8   Les données de recherche :                                           Groupes canadiens
                                                                         intéressés à la gestion
    un potentiel insoupçonné                                             des données
                                                                         Groupe de travail sur la
                                                                         stratégie des données de
                                                                         recherche du Canada
                                                                         Le 25 janvier 2008, l’Institut canadien de
                                                                         l’information scientifique et technique
                                                                         (ICIST) a organisé une réunion des
                                                                         principales parties intéressées pour
                                                                         examiner de quelle façon commencer à
                                                                         mettre en place les recommandations
                                                                         issues de la consultation nationale sur
                                                                         l’accès aux données de recherche
                                                                         scientifique 12. Un groupe de travail a été
                                                                         établi avec la participation de tous les
                                                                         organismes subventionnaires fédéraux,
                                                                         de l’Association des bibliothèques de
                                                                         recherche du Canada (ABRC), de Compute
                                                                         Canada, de CANARIE et d’un certain
                                                                         nombre de chercheurs à titre individuel.
                                                                         Le groupe a publié à l’automne de 2008
                                                                         un document portant sur l’analyse des
                                                                         écarts et il cherche actuellement à corriger
                                                                         ces écarts dans la gestion des données de
                                                                         recherche au Canada.
                                                                         12
                                                                           Données de recherche Canada. 2009. Institut
                                                                         canadien de l’information scientifique et
                                                                         technique. www.data-donnees.gc.ca

                                                                         Comité national
                                                                         canadien de CODATA
                                                                         (CNC/CODATA)
                                                                         Ce comité est la voix canadienne de
                                                                         CODATA (Committee on Data for Science
                                                                         and Technology) 13. CODATA est un comité
                                                                         scientifique interdisciplinaire du Conseil
                                                                         international pour la science ( ICSU),
                                                                         établi il y a 40 ans. Le CNC/CODATA est
                                                                         parrainé par l’ICIST (Institut canadien de
                                                                         l’information scientifique et technique)
                                                                         qui relève de son côté du Conseil national
                                                                         de recherches du Canada. CODATA n’est
                                                                         pas un organisme public comme tel
                                                                         mais il s’efforce par l’intermédiaire de
                                                                         ses membres nationaux et groupes de
                                                                         travail d’ « améliorer la qualité, la fiabilité,
                                                                         la gestion et l’accessibilité des données
                                                                         d’importance dans tous les domaines de la
                                                                         science et de la technologie. »
                                                                         13
                                                                           Canadian National Committee for CODATA.
                                                                         2009. www.codata.org/canada
          Crédit photo : Bernard O’Hara & Renos Savva, Wellcome Images
Études de cas d’activités de gestion                                                                                              9

                 des données au Canada

Ontario Data Documentation, Extraction Service and Infrastructure Initiative
ODESI est un projet subventionné conjointement par le Conseil des bibliothèques universitaires de l’Ontario (CBUO)
et OntarioBuys qui offre aux chercheurs universitaires un accès sans précédent à un grand nombre d’ensembles
de données. Le projet vise avant tout les ensembles de données de Statistique Canada 14, les fichiers de données de
Gallup Canada et d’autres entreprises de sondage, des fichiers du domaine public comme les sondages sur les élections
nationales au Canada et certains fichiers de l’Inter-University Consortium for Political and Social Research (ICPSR).
Les fichiers sont balisés selon la norme DDI (Initiative de documentation de données), un système international de
marquage de métadonnées fondées sur XML permettant la découverte des ensembles de données, l’accès réseauté à
ces données, leur extraction et leur analyse.
14
     “Initiative ontarienne en matière de documentation des données, de service d’extraction et d’infrastructure”. 2009. Ontario Council of
     University Libraries. http://search2.odesi.ca

Année polaire internationale
L’Année polaire internationale (API) est un vaste programme scientifique portant sur l’Arctique et l’Antarctique qui s’est
déroulé de mars 2007 à mars 2008. Le programme est assorti d’une politique globale qui exige que les données, y
compris les données opérationnelles communiquées en temps réel, soient accessibles intégralement, librement, sans
frais et dans les plus brefs délais possibles 15. Des douzaines de projets de recherche canadiens ont été subventionnés
dans le cadre de l’API par diverses sources dont le gouvernement fédéral, les gouvernements territoriaux, les organismes
subventionnaires et des fondations. Chaque projet devait élaborer un plan de gestion des données pour recevoir des
subventions. Il est probable que plusieurs projets canadiens auront de la difficulté à respecter la politique de l’API car il
y a peu de dépôts au Canada pouvant recueillir et conserver les données qui sont ainsi créées et y donner accès.

15
     International Polar Year 2007-2008 Data Policy. April 2008. http://classic.ipy.org/Subcommittees/final_ipy_data_policy.pdf

                    Les données de recherche :
                    un potentiel insoupçonné
10
                 Études de cas d’activités de gestion
                      des données au Canada

       VENUS                                                                    Canadian Barcode of Life
       Victoria Experimental Network Under the Sea                              Canadian Barcode of Life Network, de concert avec le
       (VENUS)16, sous la direction de l’Université de Victoria,                vaste consortium international dont il fait partie, est
       est un observatoire océanique câblé. Il communique                       un réseau en voie d’élaborer un système précis, rapide,
       des données en temps réel provenant du fond                              rentable et universellement accessible qui s’appuie
       de l’océan par câbles en fibre optique reliés à des                      sur l’ADN pour l’identification des espèces. L’attribution
       instruments à l’Université de Victoria, en C.-B., où                     de codes à barres selon l’ADN est une solution très
       elles sont archivées. Le portail de VENUS procure                        prometteuse pour résoudre l’« obstacle taxonomique »
       aux scientifiques et au grand public le libre accès                      qui limite beaucoup la recherche sur la biodiversité.
       à un « entrepôt » grandissant d’images, de sons et                       Tous ces projets d’identification par codes à barres ont
       de données en temps réel provenant du fonds de                           comme objectif commun d’établir une base de données
       l’océan 17 pour faciliter la recherche sur les océans                    en libre accès de codes à barres de référence qui nous
       partout dans le monde.                                                   permettront de mieux comprendre la biodiversité et
                                                                                permettront aux non-taxonomistes d’identifier les
       16, 17
                VENUS: Victoria Network Under the Sea. 2009. University of 		   espèces. En août 2009, les chercheurs avaient déposé
                Victoria. www.venus.uvic.ca
                                                                                plus de 670 000 enregistrements de codes à barres
                                                                                provenant de 61 000 espèces de la base de données
                                                                                internationale de codes à barres de la vie (la vaste
                                                                                majorité – soit près de 500 000—proviennent du Centre
                                                                                canadien) 18.
                                                                                18
                                                                                     Barcode of Life Data Systems. 2009. Biodiversity Institute of
                                                                                     Ontario. www.barcodinglife.org/views/login.php

     Projet de métadonnées des Centres de données de recherche
     Ce projet a pour but de produire un ensemble d’outils qui permettront aux chercheurs de fournir de meilleures
     métadonnées pendant tout le cycle de vie de leurs travaux de recherche au moyen du schéma DDI 3 XML. Le projet,
     établi à l’Université du Manitoba, permettra de baliser des fichiers dans les centres de données de recherche et de
     créer des outils pour la migration vers la norme DDI (Initiative de documentation des données) version 3. Il produira
     un ensemble d’outils qui permettra aux chercheurs de fournir de meilleures métadonnées pour toute la durée de
     vie de leur projet. Un Centre de métadonnées de recherche a été établi à Gatineau (Québec) pour produire des
     métadonnées conformes pour les fichiers confidentiels de Statistique Canada dans le Réseau des centres de données
     de recherche du Canada. Aussi, un consortium international de développement logiciel dirigé par Brechenhill au
     Canada travaille au développement d’outils pour appliquer la norme DDI 3 à la documentation des données.

                         Les données de recherche :
                         un potentiel insoupçonné
Lacunes dans la gérance des données au Canada                                                                                               11

Le Groupe de travail sur la stratégie        Dépôts de données : Il existe                  Récompenses et reconnaissance :
des données de recherche dirigé par          seulement quelques dépôts de                   Il y a peu de mesures incitatives
l’ICIST a fait à l’automne de 2008 une       données actifs au Canada permettant            favorisant le partage des données par
bonne analyse des écarts dans la             aux chercheurs d’y déposer leurs               les chercheurs. Des facteurs dissuasifs
gérance des données de recherche au          données. Il y a de vastes écarts tant          réels existent même : en effet, les
Canada19. L’analyse révèle l’existence       dans la couverture que dans la capacité        chercheurs sont exhortés à produire le
d’obstacles importants à l’accessibilité     des dépôts de données. Il n’existe pas         plus de publications possible avec les
et à la conservation des données de          de dépôts pour tous les domaines de            données de première main qu’ils ont
recherche — des obstacles qui, s’ils ne      recherche et la grande majorité des            recueillies avant de mettre celles-ci à la
sont pas éliminés, pourraient avoir des      données de recherche sont encore               disposition de tous.
répercussions sérieuses sur l’avenir de la   hébergées sur les disques durs des
recherche et de l’innovation au Canada.      chercheurs.                                    Rôles et responsabilités : À l’exception
Voici les écarts recensés :                                                                 de certains ministères, il n’y a pas
                                             Compétences : Les chercheurs ont               d’ organisme national chargé de la
Politiques sur les données : Les             rarement les compétences nécessaires           conservation, de la gestion et de la
politiques sur les données au Canada         pour bien gérer leurs données. En outre,       diffusion des données de recherche
ne portent pas sur tous les types de         il y a peu de scientifiques spécialisés dans   ayant l’envergure nécessaire pour
données de recherche et, dans certains       les données ou de professionnels de            répondre aux besoins des différents
cas, des chercheurs ne se conforment         l’information ayant une connaissance           intervenants.
pas aux politiques existantes. Le volet      du catalogage des données, des
conservation des données est rarement        normes et des processus relatifs aux           Temps requis: Il est essentiel pour
pris en compte dans les politiques.          métadonnées, de la conservation et             la création d’un bon ensemble de
                                             de l’évaluation de la pertinence des           données pouvant être utilisé de façon
Financement de la gestion des                données pour les chercheurs.                   pérenne de faire en sorte que les
données : La structure de financement                                                       données soient faciles à comprendre
de la recherche au Canada ne prévoit         Normes : Ce ne sont pas tous les               et à analyser. Il faut donc à cette fin
pas la gestion des données au-delà de la     chercheurs ni toutes les disciplines qui       une description des données et une
durée de vie d’un projet de recherche.       ont adopté les normes internationales.         documentation qui soient conviviales,
Il n’y a pas beaucoup d’établissements       Beaucoup reste à faire pour assurer            claires et détaillées, mais aussi
au Canada qui offrent un financement         l’interopérabilité des données provenant       complètes. Ceci requiert du temps et
durable pour les dépôts de données.          de divers projets et touchant plusieurs        la plupart des chercheurs n’en ont pas
En outre, il y a des coûts importants        disciplines. Les normes relatives aux          beaucoup.
associés à la préparation des données        métadonnées, cruciales pour garantir
pour diffusion et ces coûts ne sont pas      l’accessibilité et l’interopérabilité          19
                                                                                               Groupe de travail sur la stratégie des
prévus dans les mécanismes de finance-       des différents types d’ensembles               données de recherche. Gérance des données
ment actuels (c.-à-d. les subventions        de données entre eux, ne sont pas              de recherche au Canada : une analyse des
                                                                                            écarts. Octobre 2008. Institut canadien de
ou les budgets universitaires).              toujours respectées par les créateurs
                                                                                            l’information scientifique et technique. http://
                                             ou les aggrégateurs de données.                data-donnees.gc.ca/docs/AnalyseEcarts.pdf

Crédit photo : Photo par Joriel Jiménez

               Les données de recherche :
               un potentiel insoupçonné
12            Politiques de gestion des données au Canada
     Tout un ensemble de politiques établies par le gouvernement fédéral et les gouvernements provinciaux, les organismes
     subventionnaires, d’autres établissements et même certains projets de recherche régissent les activités de gestion des
     données au Canada. Ces politiques varient beaucoup et, dans certains cas, portent sur des aspects différents de la gestion
     des données. Toutefois, la plupart des chercheurs sont tenus par leur établissement, leur organisme subventionnaire ou
     les deux, de conserver leurs données de recherche jusqu’à cinq ans après avoir terminé un projet.

                                           Politiques des organismes subventionnaires
       IRSC                Les Instituts de recherche en santé du Canada exigent des bénéficiaires de subventions qu’ils déposent certains
                           types de données – données en matière de bioinformatique, d’atomistique et données de coordonnées
                           moléculaires – dans les bases de données publiques correspondantes dès la publication des résultats de leur
                           recherche. Les IRSC exigent légalement des chercheurs qu’ils conservent les ensembles de données originales
                           découlant de la recherche qu’ils subventionnent pendant au moins cinq ans après la fin de la subvention. Les
                           IRSC ont l’intention de réexaminer cette politique prochainement et peut-être de l’élargir. 20

       CRSH                Le Conseil de recherches en sciences humaines a une politique d’archivage des données de recherche depuis
                           1990. Selon cette politique, « Toutes les données de recherche rassemblées grâce au financement du CRSH
                           doivent être conservées et mises à la disposition des autres chercheurs dans des délais raisonnables.» 21 .
                           Selon le CRSH, un délai raisonnable est une période de deux ans après la fin du projet de recherche pour
                           lesquels les données ont été recueillies. Le CRSH n’a pas appliqué cette politique auprès des chercheurs et
                           moins de 10 % des chercheurs s’y sont conformés depuis ses débuts. 22

       CRSNG               Le Conseil de recherches en sciences naturelles et en génie n’a pas de politique générale relativement
                           aux données de recherches. Il y a cependant des lignes directrices pour les chercheurs subventionnés par
                           l’intermédiaire du Programme de subventions de réseaux stratégiques. On y lit ce qui suit : « Pour encourager
                           le partage et la diffusion des données de recherche et leur utilisation par d’autres dans un délai raisonnable,
                           on doit conclure dès le début des activités de réseau une entente établissant la responsabilité en matière de
                           mise à jour et de conservation de grands ensembles de données.» 23

       Les trois           Énoncé de politique des trois conseils sur l’éthique de la recherche avec des êtres humains
                           « Les chercheurs devraient s’assurer que les données obtenues sont conservées avec toutes les précautions
                           nécessaires particulières dues à la nature délicate des renseignements. Les données publiées ne devraient
                           contenir ni nom, ni initiales, ni aucune autre sorte de renseignement pouvant mener à une identification. Il
                           peut s’avérer important de conserver certains types d’identificateurs (p. ex., région de résidence), mais ceux-
                           ci devraient être dissimulés le mieux possible, selon un protocole normalisé, avant que les données ne soient
                           communiquées aux fins de la recherche. » 24

      20
           Politique sur l’accès aux résultats de la recherche. Septembre 2007. Instituts de recherche en santé du Canada. www.cihr-irsc.gc.ca/f/34846.html
      21
           Politique du CRSH sur l’archivage des données de recherche. 2009. Conseil de recherches en sciences humaines. www.sshrc.ca/site/apply-
           demande/policies-politiques/edata-donnees_electroniques-fra.aspx
      22
           Humphrey, C. Preserving research data: A Time for Action. In Preservation of Electronic Records: New Knowledge and Decision-making. 2003.
           Canadian Conservation Institute: Ottawa. pp. 83-89.
      23
           Programme de subventions de réseaux stratégiques. 2009. Conseil de recherches en sciences naturelles et en génie du Canada.
           www.nserc-crsng.gc.ca/Professors-Professeurs/RPP-PP/SNG-SRS_fra.asp
      24
           Proposition de la 2e édition de L’Énoncé de politique des trois Conseils : Éthique de la recherche avec des êtres humains. Décembre 2008.
           Groupe consultatif interagences en éthique de la recherche. http://www.ger.ethique.gc.ca/fra/policy-politique/initiatives/draft-preliminaire/

                        Les données de recherche :
                        un potentiel insoupçonné
Autres politiques sur les données                                                          13
                  Des universités, centres de recherche et projets de recherche ont parfois aussi des politiques
                                  régissant les données de recherche. Voici quelques exemples.

Université McGill             Cette politique stipule que les données doivent être organisées de manière à ce qu’elles
                              puissent être facilement vérifiées. Sous réserve d’exceptions fondées sur le devoir de
(Nous n’avons trouvé aucune confidentialité et les lois régissant la propriété intellectuelle et l’accès à l’information, et une
autre politique universitaire fois les résultats de la recherche publiés, les données doivent être mises à la disposition de
dans la rédaction du présent quiconque présente une demande raisonnable de les examiner. Dans les cas de désaccord
document.)                    entre le chercheur et la personne qui demande à voir les données, c’est le bureau du
                              vice-principal à la recherche qui tranchera. La politique indique également que toutes les
                              données originales doivent être conservées pendant un délai raisonnable et recommande
                              une période d’au moins cinq ans après la date de la publication 25.

Pêches et Océans                      La Politique d’accès aux données scientifiques spécifie ce qui suit : « Les gestionnaires de
Canada                                Pêches et Océans ont la responsabilité de s’assurer que les collecteurs de données sous leur
                                      direction transmettent leurs données ainsi que les données recueillies en vertu d’un contrat
(Un exemple d’une                     ou de partenariat avec d’autres organismes au centre de données appropriées de façon
                                      opportune. Il est important de s’assurer que les données sont rapidement transférées dans
politique sur les données
                                      un environnement « géré » où elles seront sauvegardées de façon appropriée et mises à l’abri
d’un ministère)                       de toute perte accidentelle ou circonstancielles et où les métadonnées essentielles seront
                                      intégrées aux données afin de préserver l’utilité à long terme d’un ensemble de données » 26.

Année polaire                         La Politique sur les données de l’API indique qu’en vue de maximiser les bénéfices des
internationale (API)                  données recueillies sous l’égide de l’API, le Comité conjoint de l’API exige que ces données,
                                      y compris les données opérationnelles communiquées en temps réel, soient accessibles
                                      intégralement, gratuitement, librement et dans le plus bref délai possible 27. En outre, toutes
                                      les données de l’API doivent être archivées dans leur forme la plus simple et la plus utile et
                                      être accompagnées d’une description complète à l’aide de métadonnées 28.

Gouvernement fédéral :                « Les renseignements personnels ne doivent pas être utilisés ou communiqués à des fins
Loi sur la protection                 autres que celles auxquelles ils ont été recueillis à moins que la personne concernée n’y
des renseignements                    consente ou que la loi ne l’exige. On ne doit conserver des renseignements personnels
personnels et                         que pendant le temps nécessaire pour la réalisation des fins déterminées. [...] On devrait
                                      détruire, effacer ou dépersonnaliser les renseignements personnels dont on a plus besoin
les documents
                                      aux fins précisées. Les organisations doivent élaborer des lignes directrices et appliquer des
électroniques (LPRPDE)                procédures régissant la destruction des renseignements personnels. » 29

 25
          Policy on Research Ethics. April 7, 2008. McGill University. www.mcgill.ca/files/secretariat/Research-Ethics-Policy-on.pdf
 26
          Politique d’accès aux données scientifiques du MPO. 12 juin 2001. Pêches et Océans Canada.
          www.osl.gc.ca/sgdo/fr/info-donnees/acces-donnees.html
 27, 28
          International Polar Year 2007-2008 Data Policy. April 2008. http://classic.ipy.org/Subcommittees/final_ipy_data_policy.pdf
 29
          Loi sur la protection des renseignements personnels et les documents électroniques. 2009. Ministère de la Justice Canada.
          http://laws.justice.gc.ca/fra/P-8.6/index.html

                  Les données de recherche :
                  un potentiel insoupçonné
14   Réponses aux préoccupations des
     chercheurs et des administrateurs
     Je ne peux pas archiver et communiquer mes
     données parce qu’elles portent sur des humains.
     Le respect des renseignements personnels dans la recherche est une norme
     internationalement reconnue et un principe d’éthique. Au Canada, les trois
     principaux conseils subventionnaires ont adopté un énoncé de politique
     commun régissant toute la recherche avec des êtres humains entreprise au
     Canada. La politique énonce que les renseignements personnels au sujet
     des participants de l’étude ne doivent pas être communiqués. Toutefois, la
     politique recommande aussi ce qui suit :

     « D’une façon générale, la meilleure façon de protéger la confidentialité des
     renseignements personnels passe par l’anonymat. Si les données conservées
     sont véritablement anonymes, la recherche ne fera l’objet que d’une
     évaluation minimale du CÉR [Comité d’éthique de la recherche]. » 30

     Des procédures bien établies existent pour assurer l’anonymat des données
     et les chercheurs peuvent consulter les spécialistes des données de leur
     établissement de recherche pour savoir s’il y a lieu de rendre anonymes les                    Si je partage mes données,
     données contenant des renseignements personnels et comment le faire                            je limite mes options
     de façon à pouvoir partager ces données. Du travail reste à faire pour bien
     faire connaître les techniques permettant d’assurer l’anonymat des données
                                                                                                    d’exploitation de brevets
     au sein des comités d’éthique de la recherche (CÉR). Malgré l’avis des trois                   et d’autres avantages
     conseils relativement à la possibilité de conserver en rendant anonymes les                    économiques.
     données traitant de sujets humains, beaucoup de CÉR demandent encore
     souvent aux chercheurs de détruire les données.                                                Les bons principes de gestion des données
                                                                                                    ne sont pas incompatibles avec ceux qui
     30
         Énoncé de politique des trois Conseils : Éthique de la recherche avec des êtres humains:
     2e édition. Décembre 2008. Groupe consultatif interagences en éthique de la recherche.
                                                                                                    régissent la propriété intellectuelle et la
     www.ger.ethique.gc.ca/fra/policy-politique/initiatives/draft-preliminaire/
                                                                                                    propriété des données. Les chercheurs
                                                                                                    peuvent choisir de restreindre l’accès à leurs
                                                                                                    données afin de maximiser leurs avantages
                                                                                                    professionnels et économiques en reportant
                                                                                                    la communication des données jusqu’à la
     Les bonnes pratiques de gestion des données sont                                               publication ou à l’application du brevet, ou
     trop coûteuses.                                                                                en faisant appel à une licence d’utilisation
                                                                                                    non commerciale pour les données.
     La gestion des données, comme l’attribution de métadonnées, la gestion
     de dépôts et les activités de conservation des données ont bien entendu                        L’OCDE recommande de prendre en
     un coût mais les avantages dépassent largement ces coûts. Refaire la                           considération les mesures qui favorisent
     recherche pour obtenir les mêmes données est onéreux. De plus, c’est                           l’accès et l’exploitation à des fins non
     impossible dans de nombreux cas parce que les chercheurs, les sujets, les                      commerciales tout en protégeant les intérêts
     conditions des tests, etc. n’y sont plus. Le maintien d’un cadre fiable et                     commerciaux, comme la communication
     ordonné pour protéger les investissements considérables consentis par les                      différée ou partielle des données ou
     établissements dans la création de données de recherche représentent un                        l’adoption volontaire de mécanismes d’octroi
     coût relativement modeste comparativement à celui prohibitif de recréer ces                    de licences. De telles mesures peuvent
     données.                                                                                       permettre aux principaux participants
                                                                                                    d’exploiter pleinement les données de la
                                                                                                    recherche, sans en interdire inutilement
                                                                                                    l’accès.
Que peut-on faire sur le campus?
Chercheurs

S’engager à communiquer les données de recherche le plus ouvertement possible.
Élaborer un plan de gestion des données avant d’entamer un projet de recherche.
Comprendre les politiques de gestion des données des organismes subventionnaires et s’y conformer.
Faire appel aux spécialistes des données sur le campus pour de l’aide dans la collecte et la gestion des
       données de recherche.
Repérer et utiliser les normes internationales pour la gestion des données.

Administrateurs universitaires

Élaborer des politiques qui favorisent la bonne gestion des données.
Appuyer la mise en place de dépôts de données par l’établissement.
Donner une formation aux chercheurs au sujet des pratiques de gestion des données.
Aider les chercheurs en embauchant des spécialistes ou des bibliothécaires experts en matière de données
        et faire connaître ces spécialistes aux équipes de recherche (et les y intégrer).
Reconnaître l’apport du partage des données dans l’embauche, les promotions et les nominations.

Bibliothèques de recherche

Mettre sur pied et gérer des dépôts de données pour l’établissement.
Favoriser la formation des bibliothécaires dans le domaine de la gérance des données.
Venir en aide aux chercheurs en embauchant des bibliothécaires experts en matière de données et en
       mettant ces spécialistes à la disposition de l’ensemble des chercheurs.
Assurer la formation des chercheurs au sujet des pratiques de gestion des données.
65 Université Privé, Pièce 238, Ottawa, (Ontario) K1N 9A5
                   Tél: 613-562-5385 Télécopieur: 613-562-5297
                      carladm@uottawa.ca • www.carl-abrc.ca

L’Association des bibliothèques de recherche du Canada (ABRC) a été fondée en 1976. Elle regroupe les 28
principales bibliothèques de recherche universitaires au Canada, ainsi que Bibliothèque et Archives Canada,
l’Institut canadien de l’information scientifique et technique (ICIST), et la Bibliothèque du Parlement. L’Association
ne comprend que ces membres institutionnels et vise surtout à rassembler les bibliothèques des universités
canadiennes qui ont des programmes de doctorat dans les arts, les sciences humaines et les sciences.
L’ABRC tâche d’augmenter la capacité des bibliothèques de recherche du Canada d’effectuer des partenariats dans
la recherche et les études supérieures, cherchant à encourager un système de communication savante efficace et
soutenable et une politique publique qui encourage la recherche et du large accès à l’information scientifique.
L’Association est associée à l’Association des universités et collèges du Canada (AUCC) et constituée en société à
but non lucratif selon les dispositions de la Loi sur les corporations canadiennes.

                                        Membres institutionnels de L’ABRC

        University of Alberta                     Université Laval                       Queen’s University
 Bibliothèque et Archives Canada               University of Manitoba                    University of Regina
    Bibliothèque du Parlement                    McGill University                   University of Saskatchewan
  University of British Columbia                McMaster University                   Université de Sherbrooke
          Brock University                     Memorial University of                  Simon Fraser University
                                                  Newfoundland
        University of Calgary                                                           University of Toronto
                                             Université de Montréal
         Carleton University                                                            University of Victoria
                                           University of New Brunswick
        Concordia University                                                           University of Waterloo
                                               Université d’Ottawa
        Dalhousie University                                                        University of Western Ontario
                                         Université du Québec à Montréal
        University of Guelph                                                            University of Windsor
    ICIST (Institut canadien de                                                            York University
   l’information scientifique et
             technique)

              Directeur général : Brent Roe                      Président : Ernie Ingles, MSRC (2009 – 2011)
Vous pouvez aussi lire