CONNAISSANCES " - Sorbonne ...
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
« MIEUX PARTAGER LES CONNAISSANCES » Pour une information scientifique et technique claire, interopérable, pérenne fondée sur des ressources innovantes, évolutives, accessibles. Louki-Géronimo Richou, stagiaire SciencesPo, Publié sous la direction de Renaud Fabre. Juillet 2017 Direction de l’information scientifique et technique Renaud FABRE, DIST du CNRS, Juillet 2017
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS PREFACE La Stratégie "Mieux partager les connaissances" proposée par Alain FUCHS, Président du CNRS, est désormais un objet familier de l'IST nationale, puisqu'elle a effectivement conduit à un ensemble de résultats concrétisant son intitulé et ses axes moteurs : faire le bilan d'étape de cette démarche nationale s'imposait d'autant plus qu'une nouvelle étape, tout aussi importante pour le travail de la science à l'heure numérique, est devant nous pour utiliser ce "fluide" numérique qu'est l'IST. Grâce à l'investissement personnel exceptionnel de Louki-Géronimo RICHOU, Stagiaire à la DIST de SciencesPo Paris et auteur de ce rapport, une vue d'ensemble, élaborée sous ma responsabilité, est désormais accessible tant sur les éléments essentiels du travail accompli que sur les priorités de l'étape qui s'ouvre. Qu'a-t-on accompli depuis 2014 et quels sont les thèmes porteurs des évolutions en cours ? Nous avons pris le parti dans ce rapport, d'une approche strictement pragmatique et "documentaire" : quels sont les changements dans les faits, les pratiques, les règles et ceci quels que soient par ailleurs les indispensables adaptations de l'éthique et des comportements, sur lesquels, à mes yeux, seule une réflexion collective s'impose, et qui a été initiée pour cet automne entre le Conseil scientifique du CNRS et des Instituts, d'une part, et la DIST, d'autre part. La période 2014-2017 Elle a permis de construire un certain nombre de convergences inédites des usages et des règles visant à "Mieux partager les connaissances" et à penser ces mutations en partageant les pratiques professionnelles des acteurs nationaux ( CNRS, CPU, ADBU, Couperin, ABES, EPRIST): l'exigence d'interopérabilité est la primordiale tant pour le CNRS lui-même, où sont représentées toutes les approches disciplinaires, que pour tous les travaux de recherche conduits à l'heure numérique quels qu'en soient les disciplines et les laboratoires d'origine, dans la recherche publique nationale et en dehors. L'optique de Science Ouverte a ainsi été recherchée par un ensemble cohérent de démarches et de projets visant ; -le repérage des atouts et handicaps des pratiques existantes : documents stratégiques de la DIST, de l'INIST, de PERSEE, du CCSD ; -la connaissance fine des pratiques nationales des laboratoires et des Etablissements de recherche : enquêtes en 2014, puis en 2015 et 2016 avec le COPIST ; -l'adaptation des règles garantissant l'optimisation du partage des connaissances : refontes réglementaires et législatives sur les données, et bien sûr, loi "Pour une République numérique". La période 2017-2020 Pour reprendre un découpage temporel européen, la période qui s'ouvre est au moins aussi porteuse d'acquis et de défis et ouvre à la fois : - à la stabilisation des pratiques numériques nouvelles de la recherche sous la forme de services à la science et à ses usagers, -au développement d'applications nouvelles des résultats scientifiques aux besoins de la société ; -à l'articulation dans les deux cas entre les projets développés en France et les projets internationaux. 2
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS Un tableau synthétique et comparatif à la fin du rapport présente l'essentiel des évolutions détectées par le rapport, enregistrées et attendues dans ces deux phases, passée et à venir. La phase à venir repose sur une série très dense de chantiers d'organisation et de construction de services : création et homogénéisation de réseaux de plateformes dotées de règles et langages interopérables, normalisation des "grammaires "et "vocabulaires" de l'IST à grande échelle et dans des formes stabilisées, développements des échanges et interactions de données à très grande échelle, mise en place de nouvelles formes contractuelles pour accompagner des formes inédites de création de valeur, pour ne citer qu'un échantillon des changements en cours de préparation. Bien entendu, ces changements seront accompagnés de nouveaux modèles de création de valeur, de nouveaux services à la recherche, et d'une structuration nationale du potentiel de l'INIST enfin stabilisée, et accompagnée d'un développement dynamique. Comme cela fut le cas ces dernières années, ces changements vont s'accompagner d'une intense activité de discussion et de débats entre les parties prenantes de l'IST nationale, de sa construction et de ses usages : je forme le vœu que ce court rapport permette d'esquisser un balisage et un éclairage sur les choix futurs dont l'IST a besoin dans cette période d'intense transformation. Renaud FABRE, juillet 2017 3
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS Table des matières 0. PREAMBULE : QUELLE VISION DE L’IST ? ............................................................................ 6 0.1. A L’HEURE NUMERIQUE : QUE TRANSFORME L’IST ? ................................................................................................................... 6 0.2. DEFINITION : LA NATURE DE L’IST .................................................................................................................................................... 8 0.3. MUTATIONS EN COURS....................................................................................................................................................................... 9 0.3.1. De nouveaux volumes ................................................................................................................................... 10 0.3.2. De nouveaux supports et démarches : plateformes ........................................................................................ 11 0.3.3. De nouvelles formes : métaconnaissances… ................................................................................................. 12 0.3.4. De nouveaux usages : recommandation, captation contrôlée ......................................................................... 13 0.4. CONTEXTE ET OBJECTIF DU PRESENT DOCUMENT .................................................................................................................. 14 0.5. UNE VISION D’ENSEMBLE FOURNIE PAR LE CNRS AUX ACTEURS DE L’IST .......................................................................... 18 1. CONSTAT : DES ATTENTES PARTAGEES ENTRE LES NOUVEAUX ACTEURS DE L’IST : UNE DYNAMIQUE POUR LA SCIENCE PUBLIQUE OUVERTE .................................................... 20 1.1. UNE NECESSITE COMMUNE : OUVRIR ET SIMPLIFIER LES CONDITIONS D’ACCES ............................................................. 20 1.1.1. Le besoin d’être formés à l’interaction avec l’IST, et informés de ses évolutions ............................................. 20 1.1.2. Accéder de façon sûre à de larges fonds documentaires et outils d’analyse au meilleur coût .......................... 25 1.1.3. Le paysage de l’IST française : un territoire en interaction forte mais morcelé, proposant des solutions inégalement ouvertes...................................................................................................................................................... 27 1.2. DES BESOINS D’IST SPECIFIQUES A CERTAINS ACTEURS ....................................................................................................... 34 1.2.1. Les spécificités des Unités de Recherche et Instituts...................................................................................... 34 1.2.2. Les besoins différenciés des Universités, Organismes et Grandes Ecoles ...................................................... 38 1.2.3. L’action de l’Etat au service du citoyen (agences, APUL, ODAC, mission Etalab) ........................................... 39 1.2.4. Les besoins des entreprises........................................................................................................................... 44 2. VISION : FAIRE EVOLUER LES SERVICES D’IST VERS L’INTEROPERABILITE ............... 47 2.1. DEVELOPPER UNE POLITIQUE NATIONALE DE FORMATION ET DE SOUTIEN POUR LA RECHERCHE ET L’EDUCATION 48 2.1.1. Fluidifier l’utilisation des outils en répondant aux difficultés rencontrées ......................................................... 48 2.1.2. Optimiser les savoirs et compétences pour la transition numérique ................................................................ 49 2.1.3. Connecter les chercheurs de l’IST française entre eux ................................................................................... 53 2.2. DEVELOPPER DE NOUVEAUX CIRCUITS ECONOMIQUES .......................................................................................................... 55 2.2.1. Poursuivre la coordination les efforts de négociation et d’acquisition des établissements au sein de partenariats européens pour les stratégies d’achat ............................................................................................................................. 55 2.2.2. Concevoir une offre soutenable pour les établissements, en repenser les périmètres d’accès ........................ 57 2.2.3. Etablir un nouveau modèle économique de valorisation (recommandation, etc.) au cœur d’une Science Ouverte fonctionnant sur le principe de Libre Accès ........................................................................................................ 60 4
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS 2.2.4. Mettre en place les structures (agences, charte éthique) à même d’assurer l’application des principes juridiques contenus dans la LPRN (loyauté des plateformes, lisibilité, exhaustivité) ......................................................................... 63 2.3. PROPOSER UN POINT D’ENTREE UNIQUE, TENANT COMPTE DE LA GRANDE DIVERSITE DE RESSOURCES ET DE PLATEFORMES .................................................................................................................................................................................................. 68 2.3.1. Faire appliquer les principes juridiques de protection des données (secret dans la recherche, confidentialité, anonymat simple ou coordonné) ..................................................................................................................................... 68 2.3.2. Tenir compte des évolutions vers l’interopérabilité des outils de l’industrie et des voisins européens .............. 71 2.3.3. Permettre l’adoption de référentiels et standards normés communs ............................................................... 72 2.3.4. Rendre le dispositif modulable pour s’adapter aux différents besoins ............................................................. 75 2.3.5. Bibliométrie et outils assimilés : vers la curation et la facilitation de l’exploitation des données de la recherche 76 2.4. SAUVEGARDER LA PERENNITE ET LA COMPETITIVITE DE L’IST FRANCAISE ....................................................................... 78 2.4.1. Construire un programme national cohérent et interdisciplinaire de préservation du patrimoine scientifique incluant un archivage pérenne (HAL, ISTEX) .................................................................................................................. 78 2.4.2. Apporter un appui logistique et linguistique à la visibilité internationale des publications (notamment en OA) du CNRS et de ses partenaires, en assistant la rédaction et la traduction ............................................................................ 81 2.4.3. Anticiper les partenariats pour réguler les relations entre les producteurs, les intermédiaires et les usagers finaux d’IST .................................................................................................................................................................... 84 3. SYNTHESE ET ACTUALISATION STRATEGIQUE : VERS L’INTEROPERABILITE DES OUTILS ET DES USAGES ............................................................................................................... 86 4. ANNEXE BIBLIOGRAPHIQUE.................................................................................................. 89 5
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS 0. PREAMBULE : QUELLE VISION DE L’IST ? 0.1. A L’HEURE NUMERIQUE : QUE TRANSFORME L’IST ? De nouveaux supports ont donc émergé pour héberger l’IST. Il s’agit notamment de vastes plateformes, mettant en relation une (ou plusieurs) offre(s) avec une (ou plusieurs) demande(s), dans des systèmes multifaces qui fonctionnent essentiellement comme des organes de référencement produisant à partir de larges listings des résultats selon les filtres appliqués par l’utilisateur. Ces plateformes font l’objet de démarches nouvelles s’inscrivant dans la digitalisation de la science, qui fonctionnent en « couches de cycle » interactives entre des users et des items. Cette digitalisation s’appuie sur deux grands objectifs indissociables ; l’interopérabilité et la réduction des déformations induites par les nécessaires opérations de traduction entre le langage humain verbal et les langages machine. Plateformes et régulation dynamique des contenus 6
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS Les plateformes proposent des services IST qui sont des outils de documentation, de recherche, d’analyse et de mise en relation. Ces services sont construits à l’amont par différents acteurs privés et publics, et encadrés par les règles issues de la Loi pour une République Numérique et les lignes de conduite adoptées par les organismes et agences d’Etat tels que la mission Etalab. L’Etat et les différents acteurs situés dans les organismes mûrissent de façon partagée les grandes orientations financières et réglementaires en vue d’établir des principes qui ouvrent et sécurisent les possibilités d’usage des outils par les chercheurs. Les principes viennent à l’amont, et conditionnent les usages des services par les chercheurs, tandis que les règles forment un cadre rigide mais en constante adaptation, dans lequel les usages peuvent s’épanouir sans danger. Le CNRS et les études COPIST jouent un rôle prépondérant dans la définition des conditions d’accès des chercheurs aux services IST, et l’expression de leurs besoins influe à son tour sur le développement de ces services, de la programmation informatique à l’ergonomie en passant par les ressources inclues. Il s’agit donc d’une interaction tripartite à variables multiples, où chaque action d’un acteur rétroagit sur celles des autres. Une approche systémique : vers l’interopérabilité 7
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS 0.2. DEFINITION : LA NATURE DE L’IST L’information scientifique et technique (IST) désigne l'ensemble des informations nécessaires à l'activité scientifique comme à l'industrie. Bien qu’elle fût originellement principalement représentée par des formats papier, elle recoupe aujourd’hui grandement l’information produite par les recherches simples faites par les citoyens, c’est-à- dire les données sur les utilisateurs et les usages, harmonisées dans de grands fichiers par les moteurs de recherche et les plateformes. En ce sens, l’IST se définit plutôt par ses modalités de partage et ses destinataires que par ses producteurs ; son champ étendu couvre donc toute information dont le contenu spécialisé permet de développer des modèles scientifiques ou d’élaborer des applications commerciales ayant trait à un domaine scientifique à terme. L’IST peut se lire comme une matière ayant plusieurs dénominateurs communs ; Une caractérisation de la nature et du périmètre de l’IST ■ Au premier abord, l’IST est pareille à un fluide en ce qu’elle se constitue par les apports infimes et constants de diverses sources, qui se déversent dans de petits affluents (les matériels informatiques particuliers et locaux), confluant vers de grands bassins (les serveurs et centres de stockage), puis qui communiquent tous entre eux à la manière des océans. Ces sources sont notamment des chercheurs, des universités, des citoyens, et des entreprises. ■ Ce fluide connaît aussi ses cycles et protocoles, et à l’image des nuages qui se forment de minuscules gouttelettes et redeviennent à leur tour pluie, celui qui émet des données personnelles par ses recherches et activités (cookies, historique) reçoit à son tour, et absorbe, des données organisées, suggérées et adaptées en provenance des plateformes. La catégorie de ceux qui ont besoin d’IST recouvre une réalité très large ; il peut s’agir de chercheurs, d’institutions, d’entreprises, mais encore d’associations, et plus globalement la société civile en général. ■ Sont-ce les données qui « font » la science, comme le suggère le mouvement pour un « Quatrième Pilier » de la science ou bien, comme l’avance la Contribution du CNRS à la Stratégie nationale de la Recherche, la science possède-t-elle des fondements numériques complexes ? 1er fil rouge : Adapter les compétences et usages à l’évolution de l’IST par la formation 8
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS ■ En ce sens, un premier « fil rouge » du présent document doit se focaliser sur la définition inchangée de l’IST, ce qui en constitue sa base, et les moyens d’adapter les réalités de ceux qui ont besoin d’IST à cette base, en les préparant et en les formant. Ce processus a déjà été largement engagé, et mérite une réflexion quant à ses voies de pérennisation. 2nd fil rouge : Rechercher et publier pour un coût modeste et en toute sécurité ■ Ensuite, l’IST dépasse cependant cette métaphore simplifiée, car contrairement à l’eau terrestre, qui toujours demeure égale à elle-même et dont on ne peut que disperser, répartir les molécules sans en ajouter, son volume total est en constante et exponentielle augmentation. Le second « fil rouge » doit donc s’attacher à permettre à celui qui recherche, qui fonde ses espoirs sur l’acquisition de nouvelles connaissances parmi ce nombre croissant de publications et bases de données, de pouvoir explorer les chemins les plus larges (potentialisation par l’acquisition de fonds documentaires), sans pour autant s’y perdre (référencement, loyauté des plateformes), ni encourir de dangers (protection des droits d’auteur, des données, de la vie privée, droit à l’oubli). En effet, si nul ne peut affecter cette production exponentielle d’IST, car elle dépend de chaque individu et se nourrit d’elle-même en recoupant les données entre elles dans un monde numérique peuplé d’interactions, un cadre coopéré par tous les acteurs nationaux doit permettre à l’usager des plateformes et services IST de ne pas se perdre, ni encourir le moindre danger en les utilisant. 3ème fil rouge : Simplifier le point d’entrée, les conditions d’usage et de partage ■ Enfin, cette croissance exponentielle de l’IST a eu comme corolaire la création par des ingénieurs et programmeurs de nouveaux outils et services (services partagés d’organisation du travail, fouille de textes avancée (TDM), bibliométrie) pour la traiter. Le troisième « fil rouge » concerne donc les besoins exprimés par les chercheurs d’unification d’outils aujourd’hui disparates et aux utilités se recoupant pourtant souvent. Ces besoins doivent trouver une réponse maximisant l’efficacité des outils sous la contrainte de prise en main par ceux auxquels ces derniers sont destinés ; le non-recours et les mauvais usages seraient ainsi diminués. En outre, ces points d’entrée simplifiés vers l’IST doivent présenter, pour plus de commodité, un caractère interopérable, et être adaptables facilement à chaque domaine de la science. ■ Pour synthétiser le déroulement ces trois fils rouges à chaque étape, ce tableau de trois colonnes évoluera en début de chaque partie ; Une définition inchangée Un changement d'échelle (big data) De nouveaux outils pour la traiter (smart data) 0.3. MUTATIONS EN COURS Des externalités positives au cœur d’une formidable prise de volume L’IST connaît des externalités positives générant une multiplication endogène des potentiels ; plus il y a de volume d’IST mis en relation sur une même plateforme, un même outil de traitement, plus il y a de potentielle IST générée. Métaphoriquement, l’IST est un monde où 1 + 1 est égal à 3. Plus encore, ce phénomène est exponentiel ; 9
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS (2 + 2) > 6. Les chercheurs, les citoyens et les entreprises produisent de l’IST en publiant des articles et textes (voie classique), mais également en générant des données par leurs recherches bibliométriques et leurs propres travaux (voie périphérique). Elle a connu, sur les 20 dernières années, une progression exponentielle comparable à celle connue par la puissance des processeurs décrite par la loi de Moore. Cette prise de volume a été accompagnée et encadrée par une évolution majeure dans 3 domaines ; les supports, les usages et les outils de traitement de l’IST. 0.3.1. De nouveaux volumes La constante est le volume de ces données, réparties sous divers formats dans des endroits physiques très éparpillés et avec des conditions sécuritaires très hétérogènes ; entre 1980 et 2015, le volume total des données a connu une prise de masse sans précédent, à tel point qu’il est estimé1 que l’Humanité produit aujourd’hui en 2 jours autant de données brutes que pendant les 2 millions d’années précédant l’avènement de l’informatique. Bernard Benhamou, délégué aux usages d’Internet auprès du ministère de l’Enseignement supérieur et de la Recherche : « L’essentiel du volume d’informations généré aujourd’hui l’est encore par des humains, mais, dans les prochaines années, il sera produit par des capteurs.» ■ Ces capteurs peuvent notamment être des outils de précision utilisés par les sciences dures, comme des outils statistiques chers à la sociologie, ou encore des détections automatiques issues de larges fouilles de textes concernant les SHS. Serge Abiteboul, de l’Institut national de recherche en informatique et en automatique (Inria), dans une interview pour Libération : « La nouveauté, c’est la capacité à croiser toutes les données en provenance des capteurs, du Web et de l’Open Data gouvernementale. » ■ Le téraoctet est couramment utilisé par les unités de recherche voire les particuliers, et les entreprises connaissent le pétaoctet depuis plusieurs années déjà. Ces volumes sont hors de toute mesure humaine, et les consciences ne peuvent donc plus les traiter, ni même avec l’aide d’outils traditionnels. C’est en cela que l’algorithmique et le traitement par l’intelligence artificielle sertie du deep-learning prend son sens, afin de rétablir du sens et de permettre aux 1 INSEE et Eurostat, 2015. 10
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS chercheurs ou aux citoyens de s’y retrouver au beau milieu de cet océan, de ces torrents d’IST se déversant sans jamais discontinuer. Jean-Yves Pronier : « C’est bien d’avoir des données, mais c’est mieux de les faire parler. Et, pour cela, les technologies traditionnelles ne suffisent plus. » 0.3.2. De nouveaux supports et démarches : plateformes Quels rôles pour les plateformes de l’IST ? ■ Certaines plateformes sont commerciales, d’autres non. Certaines ont un nombre de filtres restreint, d’autres beaucoup. Certaines encore hébergent des biens et capacités de service en leur possession, d’autres présentent simplement des biens et services de prestataires extérieurs. Enfin, certaines ont une matière bien définie, et d’autres sont généralistes. Des articles papier s’additionnant au sein de journaux eux-mêmes compris dans des cercles de diffusion, l’IST a éclaté en des bribes d’information disséminées et rapprochables par la recherche voire le text and data mining (TDM), qui forment à chaque nouvelle recherche une nouvelle galaxie de possibles, un nouveau texte qui se lit différemment et associe plusieurs auteurs, plusieurs contributeurs. Les données personnelles issues de ces recherches ont bien évidemment trouvé une place plus discrète pour le grand public, et constituent la matière première des plateformes. ■ Dire « plateforme », c’est comprendre, avec une pondération différente selon le contexte, trois grands rôles fonctionnels qui interviennent dans la chaîne fléchant cette information vers l’utilisateur final ; HEBERGEUR Stocke des data sets bruts (matériellement) EDITEUR Sélectionne des portions de données AFFICHEUR Gère l’ordre et les modalités de listing des résultats La situation du marché actuel des plateformes : entre hégémonie et reconfiguration ■ De grandes plateformes anglo-saxonnes monopolisent les marchés, pour trois grandes raisons ; 1. d’abord car cette économie est automatisée, dématérialisée et désintermédiée, ses coûts fixes de lancement très forts, et ses coûts marginaux quasi-nuls 2. ensuite, car les effets de réseaux y dominent (plus il y a d’utilisateurs sur une plateforme donnée, plus le coût d’opportunité de la quitter est fort, et plus elle croît) 3. et enfin et surtout parce que les plateformes réalisent de larges marges et bénéfices, en offrant souvent un modèle « Premium », en plus de revendre la valeur publicitaire générée par l’agrégation des audiences (vues, clics, temps passé, etc.) qu’elle reçoit. ■ Cette hégémonie a généré un questionnement sur ce que devrait être la « loyauté » de ces plateformes envers leurs utilisateurs ; en effet, le niveau de maîtrise moyen par les utilisateurs des outils numériques ne permet pas à ces derniers d’appréhender avec précision la complexité des modèles économiques et du partage des revenus par les plateformes. La caractéristique du concept anciennement admis de plateforme est qu’il désigne un aspect pragmatiste, quasi-visuel, de la réalité offerte à l’utilisateur, et non un rôle précis dans le circuit de la valeur-information. Un rapport de force que la loi doit arbitrer 11
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS ■ La particularité de l’IST est qu’elle se cache partout, y compris dans les métadonnées des moteurs de recherche tels que Google. La trouver relève donc d’une compétence technique avancée, ou de l’usage des plateformes, qui doivent donc présenter des conditions d’utilisation simples et ne trompant pas l’utilisateur, le rapport de force réel étant très déséquilibré entre des expertises serties d’algorithmes et des profanes munis de leurs seuls ordinateurs personnels. C’est ce rapport de force que la Loi pour une République Numérique doit tenter d’arbitrer avec des principes tels que la « loyauté des plateformes ». En outre, la loi pour la confiance dans l'économie numérique (LCEN, juin 2014) prévoyait déjà l'obligation de signaler qu'un contenu est publicitaire, ce qui s'applique par exemple aux liens sponsorisés. On peut imaginer un système de labellisation d’Etat, révélant l’information payée, potentiellement complété par un peer-reviewing en blockchain, révélant quelle information est fiable, afin de permettre à l’utilisateur de savoir qui est qui. 0.3.3. De nouvelles formes : métaconnaissances… Les différents niveaux d’IST ■ L’IST regroupe des données brutes pouvant servir dans des études statistiques, des tests, ou encore l’élaboration d’articles et textes exigeants une réflexion périphérique, mais elle s’étend également plus loin. Jusqu’à la donnée qui parle de données, la métadonnée. Il peut s’agir d’informations sur les volumes, les récurrences, les dates, les contenus spécifiques. Et cela s’inscrit dans plusieurs cadres ; bibliométrie, analyse de la production scientifique, de la production de données par les consommateurs, les utilisateurs, les usagers, etc. ■ L’information scientifique et technique, c’est en définitive l’ensemble des données chiffrées, verbales et/ou picturales, qui abritent le potentiel d’un usage pour améliorer l’état de connaissance scientifique, ou rendre possible l’application d’un nouveau produit commercialisable à terme. QUELQUES EXEMPLES D’IST Production Destination Articles scientifiques Chercheurs Chercheurs, société civile Données bibliométriques Chercheurs, experts TDM Chercheurs Big data Consommateurs, citoyens Entreprises, Etat Algorithmes statistiques Entreprises Entreprises, Etat Un périmètre large pour comprendre l’IST ■ Aussi, ces données doivent être entendues dans un sens très général, et inclure à la fois les données issues de la Recherche (collectées par les laboratoires et le CNRS), celles issues des autres sphères administratives, c’est-à- dire des citoyens en tant qu’entrepreneurs, contribuables et usagers (collectées par les services de l’Etat), et enfin celles issues des citoyens en tant que consommateurs (collectées par des entreprises). ■ Assimiler une méthodologie prend du temps pour le chercheur, émetteur de la connaissance, comme pour le lecteur de l’article, de la revue, du brevet, qui en est le récepteur mais aussi le tributaire. Il y a une opposition classique entre deux logiques ; une première logique, existante semble-t-il depuis toujours, qui veut que l’émetteur de la connaissance soit docte, assimile la méthode et le langage technique afin de travailler dans un environnement spécialisé, et que ce dernier soit responsable directement, ou laisse à des intermédiaires la responsabilité de la 12
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS vulgarisation vers le récepteur. Une seconde logique, apparue depuis les années 1990 avec l’émergence d’internet, qui veut que les rôles d’émetteur et de récepteur soient confondus, et que les deux maîtrisent le même langage et la même méthodologie, afin de pouvoir communiquer directement, l’un et l’autre étant tour émetteur et récepteur. L’intermédiaire est dans ce cas relégué au rôle transitoire du commentateur ponctuel. Le partage et les circuits de l’IST ■ L’IST peut être considérée comme un produit qui se transmet, mais cette voie classique de production trouve sa limite dans un fait pas nécessairement intuitif, que les groupes travaillant dans le secteur numérique connaissent bien comme étant leur source de revenus la plus importante ; l’IST se génère aussi par les habitudes de recherche, et d’interaction (ex : réseaux sociaux, peer-reviewing sur les plateformes, etc.) des utilisateurs. Voie classique ; Emetteur de l’info A Récepteur de l’info A, avec différents niveaux d’intermédiation Voie périphérique ; Emetteur de l’info A Récepteur recherche info A produit info B Récepteur de l’info B ■ L'innovation repose surtout sur l'évolution des systèmes d’information, des bases de données, des systèmes d'archivage, de la gestion électronique des documents (GED), des traitements linguistiques, de la conceptualisation de l'information, de la connaissance i.e. tout ce qui peut enrichir les bases de données et accélérer la recherche en ligne. Il faut être en mesure de s'emparer des technologies novatrices pour optimiser le traitement ou l'accès à l'information. 0.3.4. De nouveaux usages : recommandation, captation contrôlée ■ En ce sens, les chercheurs en situation de recherche documentaire produisant de l’IST (par la création de schémas bibliométriques ou leurs propres historiques de recherche) sont rapprochables des citoyens en situation de consommation ou d’activité sociale. Cette voie périphérique est donc à protéger et doit faire l’objet de règles différentes de la voie classique, qui connaît déjà un long passé de techniques de protection juridique (brevets, contrats, notion de secret). Des indicateurs bibliométriques (répartition par institut, relations interdisciplinaires, part nationale ou régionale, collaborations internationales,…) sont produits par le Service d’appui à la politique et à la prospective scientifique (SAPPS) de la Direction d’appui à la structuration territoriale de la recherche (DASTR), et sont largement utilisés. Les nouveaux usages dans l’entreprise ■ A l’échelle collective, au sein de l’entreprise, la voie périphérique se doit d’être encore plus protégée, en raison des potentielles distorsions de la concurrence qui pourraient résulter d’une divulgation des informations privées des clientèles et modèles de management internes. ■ Les entreprises sont un acteur majeur qui, en prenant leur part dans le réemploi de l’IST à fin commerciale, ont profondément modifié les normes qui la structurent. Elles produisent de l’IST à plusieurs titres ; - En recevant et incrémentant l’IST produite par les chercheurs afin de servir les intérêts de ces derniers, dans des marchés de niche (voie classique spécialisée) 13
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS - En développant de nouveaux produits grâce à l’IST (voie classique commerciale) - En produisant leurs propres données IST (voie périphérique) De grands axes d’usage IST contemporains ■ Les recherches en IST s'organisent autour de trois axes correspondant à de nombreux nouveaux usages potentiels : les mathématiques appliquées, les techniques symboliques et numériques de l'intelligence artificielle et le Traitement Automatique du Langage (TAL). ■ La recherche d’une donnée précise au sein de corpus de plus en plus larges, la compilation, le TDM, la citation et la création automatique de bibliographies, sont autant de nouveaux usages cruciaux qui amènent à des innovations dans la manière de gérer les supports et outils IST. La gestion des usages de l’IST est répartie, comme suit, en différentes catégories, avec des volumes différents ; Source : analyse technico-budgétaire par le cabinet Ourouk 0.4. CONTEXTE ET OBJECTIF DU PRESENT DOCUMENT Points d’ancrage fixés et limites de la Stratégie 2013 14
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS Le document de Stratégie IST 2013 avait souligné plusieurs défaillances concernant la mise en œuvre d’une cohérence nationale dans les usages et la gestion de l’IST. Cependant, plusieurs études ont souligné les insuffisances de cette approche, qui intervient dans le cadre d’évolution rapide et changeante qu’il a été donné de voir dans le point précédent. - D’abord, l’enquête UMR auprès des directeurs d’unités (DU) avait mis en évidence une connaissance des pratiques incertaine et inégale, rendant le non-recours aux outils numériques de traitement et d’analyse de l’IST très prégnant. - Ensuite, et du fait de cette connaissance incertaine, l’enquête COPIST avait souligné la difficulté dans la mise en œuvre concrète d’un partage de l’IST efficace et élargi. 15
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS - Enfin, il manquait des normes d’encadrement juridique de l’IST, prenant en compte ses spécificités ayant trait au numérique et portant en conséquence des modifications dans tous les domaines de la Loi. La résolution des questions ouvertes : marché-cadre, PAP, coopération européenne ■ La mise en place d’un marché-cadre national pour l’acquisition de ressources documentaires, ainsi que la communication établie entre les acteurs de l’IST (établissements, universités, unités mixtes de recherche (UMR), administrations) ont permis d’amorcer une mise à niveau des connaissances et une relance du partage. La recherche en IST autour du Pôle Lorrain (Université de Lorraine, LORIA, ATILF…) et de l’INIST est venue en appui aux projets IST du CNRS et de tout l’Enseignement Supérieur et Recherche (ESR). Les projets retenus viseront une valorisation économique et sociale. Un partenariat sur l’IST a été développé par mise en réseau des projets des organismes de recherche. Les travaux d’amont visant l’interdisciplinarité ont été développés en partenariat avec la Mission Interdisciplinarité (MI). ■ En 2014, l’analyse stratégique de l’IST française (SIST : « Mieux partager les connaissances ; Une stratégie ouverte pour une information scientifique et technique d’avenir ») rappelait les 4 plans d’action partagée (PAP) définis par le Directeur général délégué pour la science du CNRS, visant à mieux : 1."Se documenter", 2."Publier", 3."Analyser l'information", 4."Accompagner l'IST et sa valorisation". Ces PAP ont porté leurs fruits dans différentes mesures, et un retour sur les résultats doit être effectué, comme une reformulation des objectifs à la lumière du recul acquis d’une part et des nouveaux événements survenus dans le monde de l’économie numérique de l’autre. Conjointement à cette progression globale de la Recherche et de l’Education pour la science numérique, la Loi pour une République Numérique (LPRN) a fait émerger les premières bornes d’un cadre juridique agile et intelligent, qui prend en compte l’apport économique des grandes entreprises du secteur sans l’ignorer et tout en protégeant les données pour l’intérêt général. Cette Loi constitue le point de convergence de toutes les attentes des acteurs de l’IST, et tous les regards convergent donc dans sa direction. Les objectifs de la Stratégie IST 2013 ont donc été atteints. ■ Ces 4 PAP étaient ensuite reliés parallèlement à 10 grandes orientations (O) pour l’action concrète visant à faciliter les 4 démarches. D’abord, une conception évolutive consistant à partager les savoirs et compétences au service de l’IST (O1 ; anticiper et construire les options globales, O2 ; adapter les savoirs et compétences, O3 ; former par et dans la recherche). Ensuite, l’ouverture des modalités pour accueillir les besoins de tous les chercheurs (O4 ; harmoniser l’offre et la demande d’IST, O5 ; partager les ressources communes HAL et Persée, O6 ; valoriser et partager les données de la recherche, O7 ; identifier et analyser les publications, O8 ; une stratégie globale pour le libre accès à la science publique). Enfin, une régulation partagée destinée à dynamiser les pratiques (O9 ; partager les règles, O10 ; innover dans les démarches). Ces 10 orientations ont connu des développements alternant entre réussites et difficultés de mise en œuvre, entraînant parfois la « mise en silos » de certaines logiques, alors même que des fusions et des interactions sont possibles. C’est pourquoi le présent document stratégique tâche d’adapter les recommandations au paysage de l’IST 2017, avec ses nouveautés, et fort de l’héritage des stratégies antérieures. La partie II (Vision) détaille les points d’amélioration proposés, qui sont ensuite repris de façon synthétique dans la partie III (Résumé et plan de mise en œuvre). ■ A l’échelle européenne également, la déclaration de Berlin (2003), les principes OCDE d’accès aux données de recherche (2006), les principes des conseils de recherche britanniques (2011), les recommandations de la Commission européenne (2012) suite au rapport «Riding the Wave» (2010), les directives de l’OSTP vers les agences fédérales de recherche américaines (2013), sont autant de recommandations, principes voire injonctions à partager, rendre 16
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS accessibles les productions scientifiques de recherche, tout comme la directive européenne 2007/2/CE du 14 mars 2007 (INSPIRE), qui vise à établir une infrastructure d’information géographique dans la Communauté européenne pour favoriser la protection de l’environnement. Son application aux données de la recherche fait l’objet de soins attentifs de la part de l’Institut Ecologie et Environnement (INEE) et de l’Institut National des Sciences de l’Univers (INSU). Explorer les zones de questionnement profondes tout en répondant aux besoins immédiats ■ Néanmoins, des interrogations majeures demeurent, en raison de la perpétuelle évolution des attentes et de la technologie y étant associée. Le cabinet Ourouk a été chargé par la DIST du CNRS d’identifier les grands points de tension empêchant le partage de l’IST. Au nombre de 6, ces « verrous » sont à lever pour assurer une meilleure cohérence du système national, et grâce aux activités et entrevues mises en place à la mi-2017 par Ourouk, ils concentreront les efforts de chacun pour poser la première brique des objectifs de l’Horizon 2020 (H2020). Un verrou est en général plus politique que technique : les mathématiciens utilisent par exemple une base de données IST spécifique, qui pourrait facilement être convertible vers le format employé sur le Système Universitaire de documentation (SUDOC), mais certaines logiques de chasses gardées persistent. Par ailleurs, en dehors des « verrous » que les études du cabinet Ourouk s’emploient à définir, certaines inerties correspondent à des zones d’oubli, qui n’ont simplement pas recueilli jusqu’alors l’attention nécessaire au changement ; les thèses en ligne ne sont par exemple pas signalées dans le SUDOC. ■ Un premier pas a été fait, durant l’année 2016-2017, en réunissant dans une liste claire, exhaustive et cliquable tous les outils et supports participant de l’offre IST pour les chercheurs. Elle est en ligne sur le site de la DIST, et permet, en amont d’une simplification des outils eux-mêmes, d’apporter en miroir une simplification de l’accès à ces ressources. A la moitié du gué : les objectifs 2017 inscrits dans le projet d’un grand Etat numérique ■ Le présent document de Stratégie IST 2017 ne prétend pas apporter une réponse unilatérale et exhaustive à la multitude d’enjeux soulevés par le passage de la France et de sa Recherche à l’heure numérique. Il s’agit bien plutôt de prendre acte dans un premier temps des étapes d’ores et déjà franchies pour fournir une vision d’ensemble claire et synthétique (1), pour ensuite estimer la portée et la direction des actions qui restent à mener tout en en identifiant les points de tensions (2). Enfin, un bref résumé établira les circuits de mise en œuvre des préconisations ayant été effectuées (3). ■ L’ensemble de ces événements marquants, dans tous les secteurs de l’IST, ont jalonné le long sentier vers un grand Etat numérique. La Recherche française, et la France toute entière, sont à la croisée des chemins. Dans cet état intermédiaire, à la mi-parcours en quelque sorte, il est nécessaire de préciser la portée normative de la LPRN, qui doit s’inscrire dans un cadre européen plus large et plus profond, en visant la mise à niveau de la France vis-à-vis de ses partenaires. Il est nécessaire de développer de nouvelles pratiques opérationnelles, modifiant les structures et les logiques de la politique numérique nationale concernant l’IST ; en ce sens, la réforme récente de l’INIST a ouvert des perspectives d’optimisation des ressources mobilisées. Ces perspectives s’inscrivent dans un ancrage territorial fort, celui d’un pôle d’excellence IST en Lorraine. L’INIST, en association avec des partenaires universitaires dont en particulier l’Université de Lorraine, dispose d'atouts pour développer le pôle d’excellence en IST qui s’impose au niveau national. Cette conviction s’appuie sur les compétences qu’a développé l’INIST mais aussi la présence de recherche 17
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS de qualité sur le traitement automatique des langues, tant au sein de l’ATILF que du LORIA (plus spécialement dans son département « Traitement automatique des langues et des connaissances »). La présence d’un laboratoire de recherche de qualité en sciences de l’information et de la communication, le Centre de Recherche en Ethnomusicologie (CREM), complète ces ressources. ■ La stratégie IST doit être considérée comme une politique d’investissement visant l’intérêt général et l’équité intergénérationnelle. En effet, d’une part les secteurs intégrant l’IST sont créateurs de connaissances, et à terme de valeurs économiques réelles, mais ne sont rentables qu’à long terme et avec de fortes incertitudes ; l’Etat doit donc jouer un rôle de développement des innovations, y compris en sciences humaines et sociales. D’autre part, des quasi- monopoles ayant émergé grâce de forts coûts fixes et de faibles coûts marginaux et à l’effet de réseau, une action de sécurisation de l’emploi et des données IST doit être menée par tous les partenaires français, et ce dès la formation des personnels produisant et gérant l’IST, évitant parallèlement leur subordination complète à des méthodes et besoins ne représentant pas l’intérêt général national. 0.5. UNE VISION D’ENSEMBLE FOURNIE PAR LE CNRS AUX ACTEURS DE L’IST Le positionnement du CNRS en tant qu’acteur coordinateur Les positions du CNRS sont motrices dans la définition et la promotion des positions nationales, européennes et internationales en faveur d'une IST partagée. Comme les constats globaux l'ont mis en évidence, le CNRS est présent dans toutes les enceintes nationales, européennes et internationales où progresse le projet de la Science ouverte. Ces positions peuvent s'appuyer sur des ressources et des réflexions internes qui développent autant de lignes d'actions opérationnelles. Les difficultés à assurer la cohérence globale des positions en faveur de la science ouverte ne sont pas sous-estimées, comme le montre les étapes en cours des négociations sur l'Open Access (cf. Principe d'action 8). ■ Les positions internationales, européennes et nationales du CNRS en faveur de la Science ouverte sont confortées par l'ampleur des besoins et la qualité des propositions de mise en œuvre. Ces positions s'appuient à l'amont sur l'action du Ministère de l’Enseignement Supérieur, de la Recherche et de l’Innovation, dans le cadre de la Bibliothèque Scientifique Numérique (BSN). Le Schéma d'Orientation stratégique s'appuie sur le projet national de la BSN, dont le programme observe : "Le secteur de l’édition scientifique a été totalement bouleversé par les nouveaux modes de diffusion du savoir, à la fois sur les plans économique et heuristique.(…) Aux médiations traditionnelles a succédé un ensemble d’usages qui méritent d’être encouragés tout en conservant la liberté indispensable à l’exercice scientifique et la qualité des protocoles de validation de la production scientifique". Le Chantier BSN 7 mène dans ce sens une veille globale sur l'Edition scientifique numérique et a mis en place la ressource nationale qu'est le Collège de l'Edition numérique scientifique. Une enquête nationale est lancée sur l'Edition scientifique : le CNRS y participera activement. Une vision générale à l’écoute des chercheurs et qui sert leurs intérêts ■ Le CNRS, en tant qu’acteur possédant une vision globale de l’écosystème scientifique des chercheurs, producteurs et consommateurs d’IST français, adresse donc à tous ses partenaires ce document afin de focaliser les attentions sur les points stratégiques qui constitueront les leviers numériques et éthiques d’encadrement de l’IST dans les années à venir. Le champ d’action de la Direction de l’Information Scientifique et Technique du CNRS est donc orienté 18
Vous pouvez aussi lire