CONNAISSANCES " - Sorbonne ...

La page est créée Dominique Fernandes
 
CONTINUER À LIRE
CONNAISSANCES " - Sorbonne ...
« MIEUX PARTAGER LES
         CONNAISSANCES »
             Pour une information scientifique et technique
             claire, interopérable, pérenne
             fondée sur des ressources
             innovantes, évolutives, accessibles.

                                                Louki-Géronimo Richou, stagiaire SciencesPo,
                                                    Publié sous la direction de Renaud Fabre.

                                                                              Juillet 2017

                                           Direction de l’information scientifique et technique
Renaud FABRE, DIST du CNRS, Juillet 2017
CONNAISSANCES " - Sorbonne ...
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

                                                      PREFACE

         La Stratégie "Mieux partager les connaissances" proposée par Alain FUCHS, Président du CNRS, est
désormais un objet familier de l'IST nationale, puisqu'elle a effectivement conduit à un ensemble de résultats
concrétisant son intitulé et ses axes moteurs : faire le bilan d'étape de cette démarche nationale s'imposait d'autant
plus qu'une nouvelle étape, tout aussi importante pour le travail de la science à l'heure numérique, est devant nous
pour utiliser ce "fluide" numérique qu'est l'IST.
Grâce à l'investissement personnel exceptionnel de Louki-Géronimo RICHOU, Stagiaire à la DIST de SciencesPo
Paris et auteur de ce rapport, une vue d'ensemble, élaborée sous ma responsabilité, est désormais accessible tant
sur les éléments essentiels du travail accompli que sur les priorités de l'étape qui s'ouvre.

Qu'a-t-on accompli depuis 2014 et quels sont les thèmes porteurs des évolutions en cours ? Nous avons pris le parti
dans ce rapport, d'une approche strictement pragmatique et "documentaire" : quels sont les changements dans les
faits, les pratiques, les règles et ceci quels que soient par ailleurs les indispensables adaptations de l'éthique et des
comportements, sur lesquels, à mes yeux, seule une réflexion collective s'impose, et qui a été initiée pour cet automne
entre le Conseil scientifique du CNRS et des Instituts, d'une part, et la DIST, d'autre part.

La période 2014-2017
Elle a permis de construire un certain nombre de convergences inédites des usages et des règles visant à "Mieux
partager les connaissances" et à penser ces mutations en partageant les pratiques professionnelles des acteurs
nationaux ( CNRS, CPU, ADBU, Couperin, ABES, EPRIST): l'exigence d'interopérabilité est la primordiale tant pour
le CNRS lui-même, où sont représentées toutes les approches disciplinaires, que pour tous les travaux de recherche
conduits à l'heure numérique quels qu'en soient les disciplines et les laboratoires d'origine, dans la recherche publique
nationale et en dehors. L'optique de Science Ouverte a ainsi été recherchée par un ensemble cohérent de démarches
et de projets visant ;
-le repérage des atouts et handicaps des pratiques existantes : documents stratégiques de la DIST, de l'INIST, de
PERSEE, du CCSD ;
-la connaissance fine des pratiques nationales des laboratoires et des Etablissements de recherche : enquêtes en
2014, puis en 2015 et 2016 avec le COPIST ;

-l'adaptation des règles garantissant l'optimisation du partage des connaissances : refontes réglementaires et
législatives sur les données, et bien sûr, loi "Pour une République numérique".
La période 2017-2020
Pour reprendre un découpage temporel européen, la période qui s'ouvre est au moins aussi porteuse d'acquis et de
défis et ouvre à la fois :
- à la stabilisation des pratiques numériques nouvelles de la recherche sous la forme de services à la science et à ses
usagers,
-au développement d'applications nouvelles des résultats scientifiques aux besoins de la société ;
-à l'articulation dans les deux cas entre les projets développés en France et les projets internationaux.

                                                                                                                                  2
CONNAISSANCES " - Sorbonne ...
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

Un tableau synthétique et comparatif à la fin du rapport présente l'essentiel des évolutions détectées par le rapport,
enregistrées et attendues dans ces deux phases, passée et à venir.
La phase à venir repose sur une série très dense de chantiers d'organisation et de construction de services : création
et homogénéisation de réseaux de plateformes dotées de règles et langages interopérables, normalisation des
"grammaires "et "vocabulaires" de l'IST à grande échelle et dans des formes stabilisées, développements des
échanges et interactions de données à très grande échelle, mise en place de nouvelles formes contractuelles pour
accompagner des formes inédites de création de valeur, pour ne citer qu'un échantillon des changements en cours de
préparation.
Bien entendu, ces changements seront accompagnés de nouveaux modèles de création de valeur, de nouveaux
services à la recherche, et d'une structuration nationale du potentiel de l'INIST enfin stabilisée, et accompagnée d'un
développement dynamique.
Comme cela fut le cas ces dernières années, ces changements vont s'accompagner d'une intense activité de
discussion et de débats entre les parties prenantes de l'IST nationale, de sa construction et de ses usages : je forme
le vœu que ce court rapport permette d'esquisser un balisage et un éclairage sur les choix futurs dont l'IST a besoin
dans cette période d'intense transformation.

                                                                                         Renaud FABRE, juillet 2017

                                                                                                                                 3
CONNAISSANCES " - Sorbonne ...
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

                                                                   Table des matières
0. PREAMBULE : QUELLE VISION DE L’IST ? ............................................................................ 6
  0.1.      A L’HEURE NUMERIQUE : QUE TRANSFORME L’IST ? ................................................................................................................... 6
  0.2.      DEFINITION : LA NATURE DE L’IST .................................................................................................................................................... 8
  0.3.      MUTATIONS EN COURS....................................................................................................................................................................... 9
     0.3.1.         De nouveaux volumes ................................................................................................................................... 10
     0.3.2.         De nouveaux supports et démarches : plateformes ........................................................................................ 11
     0.3.3.         De nouvelles formes : métaconnaissances… ................................................................................................. 12
     0.3.4.         De nouveaux usages : recommandation, captation contrôlée ......................................................................... 13
  0.4.      CONTEXTE ET OBJECTIF DU PRESENT DOCUMENT .................................................................................................................. 14
  0.5.      UNE VISION D’ENSEMBLE FOURNIE PAR LE CNRS AUX ACTEURS DE L’IST .......................................................................... 18

1. CONSTAT : DES ATTENTES PARTAGEES ENTRE LES NOUVEAUX ACTEURS DE L’IST :
UNE DYNAMIQUE POUR LA SCIENCE PUBLIQUE OUVERTE .................................................... 20
  1.1.      UNE NECESSITE COMMUNE : OUVRIR ET SIMPLIFIER LES CONDITIONS D’ACCES ............................................................. 20
     1.1.1.         Le besoin d’être formés à l’interaction avec l’IST, et informés de ses évolutions ............................................. 20
     1.1.2.         Accéder de façon sûre à de larges fonds documentaires et outils d’analyse au meilleur coût .......................... 25
     1.1.3.   Le paysage de l’IST française : un territoire en interaction forte mais morcelé, proposant des solutions
     inégalement ouvertes...................................................................................................................................................... 27
  1.2.      DES BESOINS D’IST SPECIFIQUES A CERTAINS ACTEURS ....................................................................................................... 34
     1.2.1.         Les spécificités des Unités de Recherche et Instituts...................................................................................... 34
     1.2.2.         Les besoins différenciés des Universités, Organismes et Grandes Ecoles ...................................................... 38
     1.2.3.         L’action de l’Etat au service du citoyen (agences, APUL, ODAC, mission Etalab) ........................................... 39
     1.2.4.         Les besoins des entreprises........................................................................................................................... 44

2. VISION : FAIRE EVOLUER LES SERVICES D’IST VERS L’INTEROPERABILITE ............... 47
  2.1.      DEVELOPPER UNE POLITIQUE NATIONALE DE FORMATION ET DE SOUTIEN POUR LA RECHERCHE ET L’EDUCATION
            48
     2.1.1.         Fluidifier l’utilisation des outils en répondant aux difficultés rencontrées ......................................................... 48
     2.1.2.         Optimiser les savoirs et compétences pour la transition numérique ................................................................ 49
     2.1.3.         Connecter les chercheurs de l’IST française entre eux ................................................................................... 53
  2.2.      DEVELOPPER DE NOUVEAUX CIRCUITS ECONOMIQUES .......................................................................................................... 55
     2.2.1.    Poursuivre la coordination les efforts de négociation et d’acquisition des établissements au sein de partenariats
     européens pour les stratégies d’achat ............................................................................................................................. 55
     2.2.2.         Concevoir une offre soutenable pour les établissements, en repenser les périmètres d’accès ........................ 57
     2.2.3.    Etablir un nouveau modèle économique de valorisation (recommandation, etc.) au cœur d’une Science
     Ouverte fonctionnant sur le principe de Libre Accès ........................................................................................................ 60

                                                                                                                                                                                                    4
CONNAISSANCES " - Sorbonne ...
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

      2.2.4.    Mettre en place les structures (agences, charte éthique) à même d’assurer l’application des principes juridiques
      contenus dans la LPRN (loyauté des plateformes, lisibilité, exhaustivité) ......................................................................... 63
  2.3.  PROPOSER UN POINT D’ENTREE UNIQUE, TENANT COMPTE DE LA GRANDE DIVERSITE DE RESSOURCES ET DE
  PLATEFORMES .................................................................................................................................................................................................. 68
      2.3.1.   Faire appliquer les principes juridiques de protection des données (secret dans la recherche, confidentialité,
      anonymat simple ou coordonné) ..................................................................................................................................... 68
      2.3.2.             Tenir compte des évolutions vers l’interopérabilité des outils de l’industrie et des voisins européens .............. 71
      2.3.3.             Permettre l’adoption de référentiels et standards normés communs ............................................................... 72
      2.3.4.             Rendre le dispositif modulable pour s’adapter aux différents besoins ............................................................. 75
      2.3.5.             Bibliométrie et outils assimilés : vers la curation et la facilitation de l’exploitation des données de la recherche
                         76
  2.4.         SAUVEGARDER LA PERENNITE ET LA COMPETITIVITE DE L’IST FRANCAISE ....................................................................... 78
      2.4.1.     Construire un programme national cohérent et interdisciplinaire de préservation du patrimoine scientifique
      incluant un archivage pérenne (HAL, ISTEX) .................................................................................................................. 78
      2.4.2.   Apporter un appui logistique et linguistique à la visibilité internationale des publications (notamment en OA) du
      CNRS et de ses partenaires, en assistant la rédaction et la traduction ............................................................................ 81
      2.4.3.     Anticiper les partenariats pour réguler les relations entre les producteurs, les intermédiaires et les usagers
      finaux d’IST .................................................................................................................................................................... 84

3. SYNTHESE ET ACTUALISATION STRATEGIQUE : VERS L’INTEROPERABILITE DES
OUTILS ET DES USAGES ............................................................................................................... 86

4. ANNEXE BIBLIOGRAPHIQUE.................................................................................................. 89

                                                                                                                                                                                                                5
CONNAISSANCES " - Sorbonne ...
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

                                        0. PREAMBULE :
                                      QUELLE VISION DE L’IST ?
0.1.    A L’HEURE NUMERIQUE : QUE TRANSFORME L’IST ?

         De nouveaux supports ont donc émergé pour héberger l’IST. Il s’agit notamment de vastes plateformes,
mettant en relation une (ou plusieurs) offre(s) avec une (ou plusieurs) demande(s), dans des systèmes multifaces qui
fonctionnent essentiellement comme des organes de référencement produisant à partir de larges listings des résultats
selon les filtres appliqués par l’utilisateur. Ces plateformes font l’objet de démarches nouvelles s’inscrivant dans la
digitalisation de la science, qui fonctionnent en « couches de cycle » interactives entre des users et des items. Cette
digitalisation s’appuie sur deux grands objectifs indissociables ; l’interopérabilité et la réduction des déformations
induites par les nécessaires opérations de traduction entre le langage humain verbal et les langages machine.

                                                                   Plateformes et régulation dynamique des contenus

                                                                                                                                 6
CONNAISSANCES " - Sorbonne ...
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

         Les plateformes proposent des services IST qui sont des outils de documentation, de recherche, d’analyse et
de mise en relation. Ces services sont construits à l’amont par différents acteurs privés et publics, et encadrés par les
règles issues de la Loi pour une République Numérique et les lignes de conduite adoptées par les organismes et
agences d’Etat tels que la mission Etalab. L’Etat et les différents acteurs situés dans les organismes mûrissent de
façon partagée les grandes orientations financières et réglementaires en vue d’établir des principes qui ouvrent et
sécurisent les possibilités d’usage des outils par les chercheurs. Les principes viennent à l’amont, et conditionnent les
usages des services par les chercheurs, tandis que les règles forment un cadre rigide mais en constante adaptation,
dans lequel les usages peuvent s’épanouir sans danger. Le CNRS et les études COPIST jouent un rôle prépondérant
dans la définition des conditions d’accès des chercheurs aux services IST, et l’expression de leurs besoins influe à
son tour sur le développement de ces services, de la programmation informatique à l’ergonomie en passant par les
ressources inclues. Il s’agit donc d’une interaction tripartite à variables multiples, où chaque action d’un acteur rétroagit
sur celles des autres.

                                                                        Une approche systémique : vers l’interopérabilité

                                                                                                                                    7
CONNAISSANCES " - Sorbonne ...
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

0.2.    DEFINITION : LA NATURE DE L’IST

         L’information scientifique et technique (IST) désigne l'ensemble des informations nécessaires à l'activité
scientifique comme à l'industrie. Bien qu’elle fût originellement principalement représentée par des formats papier,
elle recoupe aujourd’hui grandement l’information produite par les recherches simples faites par les citoyens, c’est-à-
dire les données sur les utilisateurs et les usages, harmonisées dans de grands fichiers par les moteurs de recherche
et les plateformes. En ce sens, l’IST se définit plutôt par ses modalités de partage et ses destinataires que par
ses producteurs ; son champ étendu couvre donc toute information dont le contenu spécialisé permet de développer
des modèles scientifiques ou d’élaborer des applications commerciales ayant trait à un domaine scientifique à terme.
L’IST peut se lire comme une matière ayant plusieurs dénominateurs communs ;

Une caractérisation de la nature et du périmètre de l’IST

■ Au premier abord, l’IST est pareille à un fluide en ce qu’elle se constitue par les apports infimes et constants de
diverses sources, qui se déversent dans de petits affluents (les matériels informatiques particuliers et locaux), confluant
vers de grands bassins (les serveurs et centres de stockage), puis qui communiquent tous entre eux à la manière des
océans. Ces sources sont notamment des chercheurs, des universités, des citoyens, et des entreprises.

■ Ce fluide connaît aussi ses cycles et protocoles, et à l’image des nuages qui se forment de minuscules
gouttelettes et redeviennent à leur tour pluie, celui qui émet des données personnelles par ses recherches et activités
(cookies, historique) reçoit à son tour, et absorbe, des données organisées, suggérées et adaptées en provenance
des plateformes. La catégorie de ceux qui ont besoin d’IST recouvre une réalité très large ; il peut s’agir de chercheurs,
d’institutions, d’entreprises, mais encore d’associations, et plus globalement la société civile en général.

■ Sont-ce les données qui « font » la science, comme le suggère le mouvement pour un « Quatrième Pilier » de la
science ou bien, comme l’avance la Contribution du CNRS à la Stratégie nationale de la Recherche, la science
possède-t-elle des fondements numériques complexes ?

1er fil rouge : Adapter les compétences et usages à l’évolution de l’IST par la formation
                                                                                                                                   8
CONNAISSANCES " - Sorbonne ...
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

■ En ce sens, un premier « fil rouge » du présent document doit se focaliser sur la définition inchangée de l’IST, ce
qui en constitue sa base, et les moyens d’adapter les réalités de ceux qui ont besoin d’IST à cette base, en les
préparant et en les formant. Ce processus a déjà été largement engagé, et mérite une réflexion quant à ses voies de
pérennisation.

2nd fil rouge : Rechercher et publier pour un coût modeste et en toute sécurité

■ Ensuite, l’IST dépasse cependant cette métaphore simplifiée, car contrairement à l’eau terrestre, qui toujours
demeure égale à elle-même et dont on ne peut que disperser, répartir les molécules sans en ajouter, son volume total
est en constante et exponentielle augmentation. Le second « fil rouge » doit donc s’attacher à permettre à celui qui
recherche, qui fonde ses espoirs sur l’acquisition de nouvelles connaissances parmi ce nombre croissant de
publications et bases de données, de pouvoir explorer les chemins les plus larges (potentialisation par l’acquisition de
fonds documentaires), sans pour autant s’y perdre (référencement, loyauté des plateformes), ni encourir de dangers
(protection des droits d’auteur, des données, de la vie privée, droit à l’oubli). En effet, si nul ne peut affecter cette
production exponentielle d’IST, car elle dépend de chaque individu et se nourrit d’elle-même en recoupant les données
entre elles dans un monde numérique peuplé d’interactions, un cadre coopéré par tous les acteurs nationaux doit
permettre à l’usager des plateformes et services IST de ne pas se perdre, ni encourir le moindre danger en les utilisant.

3ème fil rouge : Simplifier le point d’entrée, les conditions d’usage et de partage

■ Enfin, cette croissance exponentielle de l’IST a eu comme corolaire la création par des ingénieurs et programmeurs
de nouveaux outils et services (services partagés d’organisation du travail, fouille de textes avancée (TDM),
bibliométrie) pour la traiter. Le troisième « fil rouge » concerne donc les besoins exprimés par les chercheurs
d’unification d’outils aujourd’hui disparates et aux utilités se recoupant pourtant souvent. Ces besoins doivent trouver
une réponse maximisant l’efficacité des outils sous la contrainte de prise en main par ceux auxquels ces derniers sont
destinés ; le non-recours et les mauvais usages seraient ainsi diminués. En outre, ces points d’entrée simplifiés vers
l’IST doivent présenter, pour plus de commodité, un caractère interopérable, et être adaptables facilement à chaque
domaine de la science.

■ Pour synthétiser le déroulement ces trois fils rouges à chaque étape, ce tableau de trois colonnes évoluera en début
de chaque partie ;

 Une définition inchangée              Un changement d'échelle (big data)           De nouveaux outils pour la traiter
                                                                                    (smart data)

0.3.    MUTATIONS EN COURS

Des externalités positives au cœur d’une formidable prise de volume

       L’IST connaît des externalités positives générant une multiplication endogène des potentiels ; plus il y a de
volume d’IST mis en relation sur une même plateforme, un même outil de traitement, plus il y a de potentielle IST
générée. Métaphoriquement, l’IST est un monde où 1 + 1 est égal à 3. Plus encore, ce phénomène est exponentiel ;
                                                                                                                                  9
CONNAISSANCES " - Sorbonne ...
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

(2 + 2) > 6. Les chercheurs, les citoyens et les entreprises produisent de l’IST en publiant des articles et textes (voie
classique), mais également en générant des données par leurs recherches bibliométriques et leurs propres travaux
(voie périphérique). Elle a connu, sur les 20 dernières années, une progression exponentielle comparable à celle
connue par la puissance des processeurs décrite par la loi de Moore. Cette prise de volume a été accompagnée et
encadrée par une évolution majeure dans 3 domaines ; les supports, les usages et les outils de traitement de l’IST.

0.3.1. De nouveaux volumes

         La constante est le volume de ces données, réparties sous divers formats dans des endroits physiques très
éparpillés et avec des conditions sécuritaires très hétérogènes ; entre 1980 et 2015, le volume total des données a
connu une prise de masse sans précédent, à tel point qu’il est estimé1 que l’Humanité produit aujourd’hui en 2 jours
autant de données brutes que pendant les 2 millions d’années précédant l’avènement de l’informatique.

    Bernard Benhamou, délégué aux usages d’Internet auprès du ministère de l’Enseignement supérieur et de la
    Recherche : « L’essentiel du volume d’informations généré aujourd’hui l’est encore par des humains, mais, dans les
    prochaines années, il sera produit par des capteurs.»

■ Ces capteurs peuvent notamment être des outils de précision utilisés par les sciences dures, comme des outils
statistiques chers à la sociologie, ou encore des détections automatiques issues de larges fouilles de textes concernant
les SHS.

    Serge Abiteboul, de l’Institut national de recherche en informatique et en automatique (Inria), dans une interview
    pour Libération : « La nouveauté, c’est la capacité à croiser toutes les données en provenance des capteurs, du
    Web et de l’Open Data gouvernementale. »

■ Le téraoctet est couramment utilisé par les unités de recherche voire les particuliers, et les entreprises connaissent
le pétaoctet depuis plusieurs années déjà. Ces volumes sont hors de toute mesure humaine, et les consciences ne
peuvent donc plus les traiter, ni même avec l’aide d’outils traditionnels. C’est en cela que l’algorithmique et le traitement
par l’intelligence artificielle sertie du deep-learning prend son sens, afin de rétablir du sens et de permettre aux

1   INSEE et Eurostat, 2015.
                                                                                                                                  10
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

chercheurs ou aux citoyens de s’y retrouver au beau milieu de cet océan, de ces torrents d’IST se déversant sans
jamais discontinuer.

 Jean-Yves Pronier : « C’est bien d’avoir des données, mais c’est mieux de les faire parler. Et, pour cela, les
 technologies traditionnelles ne suffisent plus. »

0.3.2. De nouveaux supports et démarches : plateformes
Quels rôles pour les plateformes de l’IST ?

■ Certaines plateformes sont commerciales, d’autres non. Certaines ont un nombre de filtres restreint, d’autres
beaucoup. Certaines encore hébergent des biens et capacités de service en leur possession, d’autres présentent
simplement des biens et services de prestataires extérieurs. Enfin, certaines ont une matière bien définie, et d’autres
sont généralistes. Des articles papier s’additionnant au sein de journaux eux-mêmes compris dans des cercles de
diffusion, l’IST a éclaté en des bribes d’information disséminées et rapprochables par la recherche voire le text and
data mining (TDM), qui forment à chaque nouvelle recherche une nouvelle galaxie de possibles, un nouveau texte qui
se lit différemment et associe plusieurs auteurs, plusieurs contributeurs. Les données personnelles issues de ces
recherches ont bien évidemment trouvé une place plus discrète pour le grand public, et constituent la matière première
des plateformes.

■ Dire « plateforme », c’est comprendre, avec une pondération différente selon le contexte, trois grands rôles
fonctionnels qui interviennent dans la chaîne fléchant cette information vers l’utilisateur final ;

                                         HEBERGEUR Stocke des data sets bruts (matériellement)
                                            EDITEUR Sélectionne des portions de données
                                          AFFICHEUR Gère l’ordre et les modalités de listing des résultats

La situation du marché actuel des plateformes : entre hégémonie et reconfiguration

■ De grandes plateformes anglo-saxonnes monopolisent les marchés, pour trois grandes raisons ;
       1. d’abord car cette économie est automatisée, dématérialisée et désintermédiée, ses coûts fixes de
           lancement très forts, et ses coûts marginaux quasi-nuls
       2. ensuite, car les effets de réseaux y dominent (plus il y a d’utilisateurs sur une plateforme donnée, plus le
           coût d’opportunité de la quitter est fort, et plus elle croît)
       3. et enfin et surtout parce que les plateformes réalisent de larges marges et bénéfices, en offrant souvent
           un modèle « Premium », en plus de revendre la valeur publicitaire générée par l’agrégation des audiences
           (vues, clics, temps passé, etc.) qu’elle reçoit.

■ Cette hégémonie a généré un questionnement sur ce que devrait être la « loyauté » de ces plateformes envers
leurs utilisateurs ; en effet, le niveau de maîtrise moyen par les utilisateurs des outils numériques ne permet pas à
ces derniers d’appréhender avec précision la complexité des modèles économiques et du partage des revenus par les
plateformes. La caractéristique du concept anciennement admis de plateforme est qu’il désigne un aspect pragmatiste,
quasi-visuel, de la réalité offerte à l’utilisateur, et non un rôle précis dans le circuit de la valeur-information.

Un rapport de force que la loi doit arbitrer
                                                                                                                               11
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

■ La particularité de l’IST est qu’elle se cache partout, y compris dans les métadonnées des moteurs de recherche
tels que Google. La trouver relève donc d’une compétence technique avancée, ou de l’usage des plateformes, qui
doivent donc présenter des conditions d’utilisation simples et ne trompant pas l’utilisateur, le rapport de force réel étant
très déséquilibré entre des expertises serties d’algorithmes et des profanes munis de leurs seuls ordinateurs
personnels. C’est ce rapport de force que la Loi pour une République Numérique doit tenter d’arbitrer avec des
principes tels que la « loyauté des plateformes ». En outre, la loi pour la confiance dans l'économie numérique (LCEN,
juin 2014) prévoyait déjà l'obligation de signaler qu'un contenu est publicitaire, ce qui s'applique par exemple aux
liens sponsorisés. On peut imaginer un système de labellisation d’Etat, révélant l’information payée, potentiellement
complété par un peer-reviewing en blockchain, révélant quelle information est fiable, afin de permettre à l’utilisateur de
savoir qui est qui.

0.3.3. De nouvelles formes : métaconnaissances…

Les différents niveaux d’IST

■ L’IST regroupe des données brutes pouvant servir dans des études statistiques, des tests, ou encore l’élaboration
d’articles et textes exigeants une réflexion périphérique, mais elle s’étend également plus loin. Jusqu’à la donnée qui
parle de données, la métadonnée. Il peut s’agir d’informations sur les volumes, les récurrences, les dates, les contenus
spécifiques. Et cela s’inscrit dans plusieurs cadres ; bibliométrie, analyse de la production scientifique, de la production
de données par les consommateurs, les utilisateurs, les usagers, etc.

■ L’information scientifique et technique, c’est en définitive l’ensemble des données chiffrées, verbales et/ou picturales,
qui abritent le potentiel d’un usage pour améliorer l’état de connaissance scientifique, ou rendre possible l’application
d’un nouveau produit commercialisable à terme.

 QUELQUES EXEMPLES D’IST                 Production                         Destination
 Articles scientifiques                  Chercheurs                         Chercheurs, société civile
 Données bibliométriques                 Chercheurs, experts TDM            Chercheurs
 Big data                                Consommateurs, citoyens            Entreprises, Etat
 Algorithmes statistiques                Entreprises                        Entreprises, Etat

Un périmètre large pour comprendre l’IST

■ Aussi, ces données doivent être entendues dans un sens très général, et inclure à la fois les données issues de la
Recherche (collectées par les laboratoires et le CNRS), celles issues des autres sphères administratives, c’est-à-
dire des citoyens en tant qu’entrepreneurs, contribuables et usagers (collectées par les services de l’Etat), et enfin
celles issues des citoyens en tant que consommateurs (collectées par des entreprises).

■ Assimiler une méthodologie prend du temps pour le chercheur, émetteur de la connaissance, comme pour le
lecteur de l’article, de la revue, du brevet, qui en est le récepteur mais aussi le tributaire. Il y a une opposition classique
entre deux logiques ; une première logique, existante semble-t-il depuis toujours, qui veut que l’émetteur de la
connaissance soit docte, assimile la méthode et le langage technique afin de travailler dans un environnement
spécialisé, et que ce dernier soit responsable directement, ou laisse à des intermédiaires la responsabilité de la
                                                                                                                                   12
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

vulgarisation vers le récepteur. Une seconde logique, apparue depuis les années 1990 avec l’émergence d’internet,
qui veut que les rôles d’émetteur et de récepteur soient confondus, et que les deux maîtrisent le même langage et la
même méthodologie, afin de pouvoir communiquer directement, l’un et l’autre étant tour émetteur et récepteur.
L’intermédiaire est dans ce cas relégué au rôle transitoire du commentateur ponctuel.

Le partage et les circuits de l’IST

■ L’IST peut être considérée comme un produit qui se transmet, mais cette voie classique de production trouve sa
limite dans un fait pas nécessairement intuitif, que les groupes travaillant dans le secteur numérique connaissent bien
comme étant leur source de revenus la plus importante ; l’IST se génère aussi par les habitudes de recherche, et
d’interaction (ex : réseaux sociaux, peer-reviewing sur les plateformes, etc.) des utilisateurs.

Voie classique ;
 Emetteur de l’info A  Récepteur de l’info A, avec différents niveaux d’intermédiation

Voie périphérique ;
 Emetteur de l’info A  Récepteur recherche info A  produit info B  Récepteur de l’info B

■ L'innovation repose surtout sur l'évolution des systèmes d’information, des bases de données, des systèmes
d'archivage, de la gestion électronique des documents (GED), des traitements linguistiques, de la conceptualisation
de l'information, de la connaissance i.e. tout ce qui peut enrichir les bases de données et accélérer la recherche en
ligne. Il faut être en mesure de s'emparer des technologies novatrices pour optimiser le traitement ou l'accès à
l'information.

0.3.4. De nouveaux usages : recommandation, captation contrôlée

■ En ce sens, les chercheurs en situation de recherche documentaire produisant de l’IST (par la création de schémas
bibliométriques ou leurs propres historiques de recherche) sont rapprochables des citoyens en situation de
consommation ou d’activité sociale. Cette voie périphérique est donc à protéger et doit faire l’objet de règles différentes
de la voie classique, qui connaît déjà un long passé de techniques de protection juridique (brevets, contrats, notion de
secret). Des indicateurs bibliométriques (répartition par institut, relations interdisciplinaires, part nationale ou régionale,
collaborations internationales,…) sont produits par le Service d’appui à la politique et à la prospective scientifique
(SAPPS) de la Direction d’appui à la structuration territoriale de la recherche (DASTR), et sont largement utilisés.

Les nouveaux usages dans l’entreprise

■ A l’échelle collective, au sein de l’entreprise, la voie périphérique se doit d’être encore plus protégée, en raison des
potentielles distorsions de la concurrence qui pourraient résulter d’une divulgation des informations privées des
clientèles et modèles de management internes.

■ Les entreprises sont un acteur majeur qui, en prenant leur part dans le réemploi de l’IST à fin commerciale, ont
profondément modifié les normes qui la structurent. Elles produisent de l’IST à plusieurs titres ;
    - En recevant et incrémentant l’IST produite par les chercheurs afin de servir les intérêts de ces derniers, dans
        des marchés de niche (voie classique spécialisée)
                                                                                                                                   13
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

    -   En développant de nouveaux produits grâce à l’IST (voie classique commerciale)
    -   En produisant leurs propres données IST (voie périphérique)

De grands axes d’usage IST contemporains

■ Les recherches en IST s'organisent autour de trois axes correspondant à de nombreux nouveaux usages potentiels
: les mathématiques appliquées, les techniques symboliques et numériques de l'intelligence artificielle et le Traitement
Automatique du Langage (TAL).

■ La recherche d’une donnée précise au sein de corpus de plus en plus larges, la compilation, le TDM, la citation et
la création automatique de bibliographies, sont autant de nouveaux usages cruciaux qui amènent à des innovations
dans la manière de gérer les supports et outils IST. La gestion des usages de l’IST est répartie, comme suit, en
différentes catégories, avec des volumes différents ;

                                                           Source : analyse technico-budgétaire par le cabinet Ourouk

0.4.    CONTEXTE ET OBJECTIF DU PRESENT DOCUMENT

Points d’ancrage fixés et limites de la Stratégie 2013

                                                                                                                                14
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

        Le document de Stratégie IST 2013 avait souligné plusieurs défaillances concernant la mise en œuvre d’une
cohérence nationale dans les usages et la gestion de l’IST. Cependant, plusieurs études ont souligné les insuffisances
de cette approche, qui intervient dans le cadre d’évolution rapide et changeante qu’il a été donné de voir dans le point
précédent.

    -   D’abord, l’enquête UMR auprès des directeurs d’unités (DU) avait mis en évidence une connaissance des
        pratiques incertaine et inégale, rendant le non-recours aux outils numériques de traitement et d’analyse de
        l’IST très prégnant.

    -   Ensuite, et du fait de cette connaissance incertaine, l’enquête COPIST avait souligné la difficulté dans la mise
        en œuvre concrète d’un partage de l’IST efficace et élargi.

                                                                                                                                15
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

    -   Enfin, il manquait des normes d’encadrement juridique de l’IST, prenant en compte ses spécificités ayant trait
        au numérique et portant en conséquence des modifications dans tous les domaines de la Loi.

La résolution des questions ouvertes : marché-cadre, PAP, coopération européenne

■ La mise en place d’un marché-cadre national pour l’acquisition de ressources documentaires, ainsi que la
communication établie entre les acteurs de l’IST (établissements, universités, unités mixtes de recherche (UMR),
administrations) ont permis d’amorcer une mise à niveau des connaissances et une relance du partage. La recherche
en IST autour du Pôle Lorrain (Université de Lorraine, LORIA, ATILF…) et de l’INIST est venue en appui aux projets
IST du CNRS et de tout l’Enseignement Supérieur et Recherche (ESR). Les projets retenus viseront une valorisation
économique et sociale. Un partenariat sur l’IST a été développé par mise en réseau des projets des organismes de
recherche. Les travaux d’amont visant l’interdisciplinarité ont été développés en partenariat avec la Mission
Interdisciplinarité (MI).

■ En 2014, l’analyse stratégique de l’IST française (SIST : « Mieux partager les connaissances ; Une stratégie ouverte
pour une information scientifique et technique d’avenir ») rappelait les 4 plans d’action partagée (PAP) définis par le
Directeur général délégué pour la science du CNRS, visant à mieux : 1."Se documenter", 2."Publier", 3."Analyser
l'information", 4."Accompagner l'IST et sa valorisation". Ces PAP ont porté leurs fruits dans différentes mesures, et un
retour sur les résultats doit être effectué, comme une reformulation des objectifs à la lumière du recul acquis d’une part
et des nouveaux événements survenus dans le monde de l’économie numérique de l’autre. Conjointement à cette
progression globale de la Recherche et de l’Education pour la science numérique, la Loi pour une République
Numérique (LPRN) a fait émerger les premières bornes d’un cadre juridique agile et intelligent, qui prend en compte
l’apport économique des grandes entreprises du secteur sans l’ignorer et tout en protégeant les données pour l’intérêt
général. Cette Loi constitue le point de convergence de toutes les attentes des acteurs de l’IST, et tous les regards
convergent donc dans sa direction. Les objectifs de la Stratégie IST 2013 ont donc été atteints.

■ Ces 4 PAP étaient ensuite reliés parallèlement à 10 grandes orientations (O) pour l’action concrète visant à faciliter
les 4 démarches. D’abord, une conception évolutive consistant à partager les savoirs et compétences au service de
l’IST (O1 ; anticiper et construire les options globales, O2 ; adapter les savoirs et compétences, O3 ; former par et
dans la recherche). Ensuite, l’ouverture des modalités pour accueillir les besoins de tous les chercheurs (O4 ;
harmoniser l’offre et la demande d’IST, O5 ; partager les ressources communes HAL et Persée, O6 ; valoriser et
partager les données de la recherche, O7 ; identifier et analyser les publications, O8 ; une stratégie globale pour le
libre accès à la science publique). Enfin, une régulation partagée destinée à dynamiser les pratiques (O9 ; partager
les règles, O10 ; innover dans les démarches). Ces 10 orientations ont connu des développements alternant entre
réussites et difficultés de mise en œuvre, entraînant parfois la « mise en silos » de certaines logiques, alors même que
des fusions et des interactions sont possibles. C’est pourquoi le présent document stratégique tâche d’adapter les
recommandations au paysage de l’IST 2017, avec ses nouveautés, et fort de l’héritage des stratégies antérieures. La
partie II (Vision) détaille les points d’amélioration proposés, qui sont ensuite repris de façon synthétique dans la partie
III (Résumé et plan de mise en œuvre).

■ A l’échelle européenne également, la déclaration de Berlin (2003), les principes OCDE d’accès aux données de
recherche (2006), les principes des conseils de recherche britanniques (2011), les recommandations de la Commission
européenne (2012) suite au rapport «Riding the Wave» (2010), les directives de l’OSTP vers les agences fédérales
de recherche américaines (2013), sont autant de recommandations, principes voire injonctions à partager, rendre

                                                                                                                                 16
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

accessibles les productions scientifiques de recherche, tout comme la directive européenne 2007/2/CE du 14 mars
2007 (INSPIRE), qui vise à établir une infrastructure d’information géographique dans la Communauté européenne
pour favoriser la protection de l’environnement. Son application aux données de la recherche fait l’objet de soins
attentifs de la part de l’Institut Ecologie et Environnement (INEE) et de l’Institut National des Sciences de l’Univers
(INSU).

Explorer les zones de questionnement profondes tout en répondant aux besoins immédiats

■ Néanmoins, des interrogations majeures demeurent, en raison de la perpétuelle évolution des attentes et de la
technologie y étant associée. Le cabinet Ourouk a été chargé par la DIST du CNRS d’identifier les grands points de
tension empêchant le partage de l’IST. Au nombre de 6, ces « verrous » sont à lever pour assurer une meilleure
cohérence du système national, et grâce aux activités et entrevues mises en place à la mi-2017 par Ourouk, ils
concentreront les efforts de chacun pour poser la première brique des objectifs de l’Horizon 2020 (H2020). Un verrou
est en général plus politique que technique : les mathématiciens utilisent par exemple une base de données IST
spécifique, qui pourrait facilement être convertible vers le format employé sur le Système Universitaire de
documentation (SUDOC), mais certaines logiques de chasses gardées persistent. Par ailleurs, en dehors des
« verrous » que les études du cabinet Ourouk s’emploient à définir, certaines inerties correspondent à des zones
d’oubli, qui n’ont simplement pas recueilli jusqu’alors l’attention nécessaire au changement ; les thèses en ligne ne
sont par exemple pas signalées dans le SUDOC.

■ Un premier pas a été fait, durant l’année 2016-2017, en réunissant dans une liste claire, exhaustive et cliquable
tous les outils et supports participant de l’offre IST pour les chercheurs. Elle est en ligne sur le site de la DIST,
et permet, en amont d’une simplification des outils eux-mêmes, d’apporter en miroir une simplification de l’accès à ces
ressources.

A la moitié du gué : les objectifs 2017 inscrits dans le projet d’un grand Etat numérique

■ Le présent document de Stratégie IST 2017 ne prétend pas apporter une réponse unilatérale et exhaustive à la
multitude d’enjeux soulevés par le passage de la France et de sa Recherche à l’heure numérique. Il s’agit bien plutôt
de prendre acte dans un premier temps des étapes d’ores et déjà franchies pour fournir une vision d’ensemble claire
et synthétique (1), pour ensuite estimer la portée et la direction des actions qui restent à mener tout en en identifiant
les points de tensions (2). Enfin, un bref résumé établira les circuits de mise en œuvre des préconisations ayant été
effectuées (3).

■ L’ensemble de ces événements marquants, dans tous les secteurs de l’IST, ont jalonné le long sentier vers un
grand Etat numérique. La Recherche française, et la France toute entière, sont à la croisée des chemins. Dans cet
état intermédiaire, à la mi-parcours en quelque sorte, il est nécessaire de préciser la portée normative de la LPRN, qui
doit s’inscrire dans un cadre européen plus large et plus profond, en visant la mise à niveau de la France vis-à-vis de
ses partenaires. Il est nécessaire de développer de nouvelles pratiques opérationnelles, modifiant les structures et les
logiques de la politique numérique nationale concernant l’IST ; en ce sens, la réforme récente de l’INIST a ouvert des
perspectives d’optimisation des ressources mobilisées. Ces perspectives s’inscrivent dans un ancrage territorial fort,
celui d’un pôle d’excellence IST en Lorraine. L’INIST, en association avec des partenaires universitaires dont en
particulier l’Université de Lorraine, dispose d'atouts pour développer le pôle d’excellence en IST qui s’impose au niveau
national. Cette conviction s’appuie sur les compétences qu’a développé l’INIST mais aussi la présence de recherche

                                                                                                                                17
« Mieux partager les connaissances » - Stratégie IST 2018 du CNRS

de qualité sur le traitement automatique des langues, tant au sein de l’ATILF que du LORIA (plus spécialement dans
son département « Traitement automatique des langues et des connaissances »). La présence d’un laboratoire de
recherche de qualité en sciences de l’information et de la communication, le Centre de Recherche en Ethnomusicologie
(CREM), complète ces ressources.

■ La stratégie IST doit être considérée comme une politique d’investissement visant l’intérêt général et l’équité
intergénérationnelle. En effet, d’une part les secteurs intégrant l’IST sont créateurs de connaissances, et à terme de
valeurs économiques réelles, mais ne sont rentables qu’à long terme et avec de fortes incertitudes ; l’Etat doit donc
jouer un rôle de développement des innovations, y compris en sciences humaines et sociales. D’autre part, des quasi-
monopoles ayant émergé grâce de forts coûts fixes et de faibles coûts marginaux et à l’effet de réseau, une action de
sécurisation de l’emploi et des données IST doit être menée par tous les partenaires français, et ce dès la formation
des personnels produisant et gérant l’IST, évitant parallèlement leur subordination complète à des méthodes et besoins
ne représentant pas l’intérêt général national.

0.5.    UNE VISION D’ENSEMBLE FOURNIE PAR LE CNRS AUX ACTEURS DE L’IST

Le positionnement du CNRS en tant qu’acteur coordinateur

        Les positions du CNRS sont motrices dans la définition et la promotion des positions nationales,
européennes et internationales en faveur d'une IST partagée. Comme les constats globaux l'ont mis en évidence, le
CNRS est présent dans toutes les enceintes nationales, européennes et internationales où progresse le projet de la
Science ouverte. Ces positions peuvent s'appuyer sur des ressources et des réflexions internes qui développent autant
de lignes d'actions opérationnelles. Les difficultés à assurer la cohérence globale des positions en faveur de la science
ouverte ne sont pas sous-estimées, comme le montre les étapes en cours des négociations sur l'Open Access (cf.
Principe d'action 8).

■ Les positions internationales, européennes et nationales du CNRS en faveur de la Science ouverte sont
confortées par l'ampleur des besoins et la qualité des propositions de mise en œuvre. Ces positions s'appuient à
l'amont sur l'action du Ministère de l’Enseignement Supérieur, de la Recherche et de l’Innovation, dans le cadre de la
Bibliothèque Scientifique Numérique (BSN). Le Schéma d'Orientation stratégique s'appuie sur le projet national de la
BSN, dont le programme observe : "Le secteur de l’édition scientifique a été totalement bouleversé par les nouveaux
modes de diffusion du savoir, à la fois sur les plans économique et heuristique.(…) Aux médiations traditionnelles a
succédé un ensemble d’usages qui méritent d’être encouragés tout en conservant la liberté indispensable à l’exercice
scientifique et la qualité des protocoles de validation de la production scientifique". Le Chantier BSN 7 mène dans ce
sens une veille globale sur l'Edition scientifique numérique et a mis en place la ressource nationale qu'est le Collège
de l'Edition numérique scientifique. Une enquête nationale est lancée sur l'Edition scientifique : le CNRS y participera
activement.

Une vision générale à l’écoute des chercheurs et qui sert leurs intérêts

■ Le CNRS, en tant qu’acteur possédant une vision globale de l’écosystème scientifique des chercheurs, producteurs
et consommateurs d’IST français, adresse donc à tous ses partenaires ce document afin de focaliser les attentions sur
les points stratégiques qui constitueront les leviers numériques et éthiques d’encadrement de l’IST dans les années à
venir. Le champ d’action de la Direction de l’Information Scientifique et Technique du CNRS est donc orienté
                                                                                                                                18
Vous pouvez aussi lire