Cycle d'ateliers de cross fertilisation : "Passer de la donnée brute aux croisements de données entre disciplines " - DatanooS

 
CONTINUER À LIRE
Cycle d'ateliers de cross fertilisation : "Passer de la donnée brute aux croisements de données entre disciplines " - DatanooS
Cycle d'ateliers de cross fertilisation :
  "Passer de la donnée brute aux croisements de
           données entre disciplines »
                    15 Juin 2021

                                             S
Cycle d'ateliers de cross fertilisation : "Passer de la donnée brute aux croisements de données entre disciplines " - DatanooS
CYCLE D’ATELIERS DE CROSS FERTILISATION :
  "Passer de la donnée brute aux croisements de
            données entre disciplines"

         Incitation aux croisement de données :
expression de besoins, de retours d'expériences à partager
           et définition de nouveaux use cases
 Thèmes des journées du cycle + APPEL à REX à partager :
 • 15 juin 2021 : Déposer ces données au sein de référentiels
 • Sept 2021 : Apport des infrastructures orientées services pour
   une recherche collaborative - exemples d'EOSC et OGC
 • Nov 2021 : réutiliser et croiser des données
 • Janv 2022 : déposer des codes
Cycle d'ateliers de cross fertilisation : "Passer de la donnée brute aux croisements de données entre disciplines " - DatanooS
Atelier 1 "Déposer des données
    au sein de référentiels"
Cycle d'ateliers de cross fertilisation : "Passer de la donnée brute aux croisements de données entre disciplines " - DatanooS
Atelier 1 "Déposer des données
    au sein de référentiels"
Cycle d'ateliers de cross fertilisation : "Passer de la donnée brute aux croisements de données entre disciplines " - DatanooS
Quelles données
                                                         sont concernées ?

Définition de l’OCDE des données de la recherche financée sur fonds publics (1) :

               « Les «données de la recherche » sont définies comme des
         enregistrements factuels (chiffres, textes, images, sons) utilisés comme
           sources principales pour la recherche scientifique et généralement
          reconnus par la communauté scientifique comme nécessaires pour
                         valider les résultats de la recherche. »

   (1)    : Principes et lignes directrices de l’OCDE pour l’accès aux données de la recherche financée sur fonds publics
            http://www.oecd.org/fr/science/inno/38500823.pdf

    19/03/2021                                                           4                                        Open Access Week - CeSO
Cycle d'ateliers de cross fertilisation : "Passer de la donnée brute aux croisements de données entre disciplines " - DatanooS
Quelles données
                                    sont concernées ?

                                                           PRE-PRINTS
               D’OBSERVATION        MODELES                 (reviews)   POST-PRINTS

DONNEES            EXPERIMENTALES
                                       CODES               PUBLICATIONS
               DE SIMULATION
                                    ALGORITHMES           DATA PAPERS
               DERIVEES

TRAVAUX DE RECHERCHE                          RESULTATS                 VALIDATION

  19/03/2021                                  5                   Open Access Week - CeSO
Cycle d'ateliers de cross fertilisation : "Passer de la donnée brute aux croisements de données entre disciplines " - DatanooS
Autres « données » ?

Les « données » liées aux activités scientifiques

                   PROCEDURES

                     « BONNES PRATIQUES »
   CAHIERS DE
  LABORATOIRES                                        WORKFLOW

                 DONNEES                    ESSAIS      CODES PUBLICATIONS

            TRAVAUX DE RECHERCHE                    RESULTATS        VALIDATION

   19/03/2021                                   6                Open Access Week - CeSO
Cycle d'ateliers de cross fertilisation : "Passer de la donnée brute aux croisements de données entre disciplines " - DatanooS
Quelles données partagez-vous ?

• Partagez-vous vos données ? vos publications ? vos
  codes ?

Si oui ,
• Avec qui ?
• Comment ?

Si non, pourquoi ?
Cycle d'ateliers de cross fertilisation : "Passer de la donnée brute aux croisements de données entre disciplines " - DatanooS
Atelier 1 "Déposer des données
    au sein de référentiels"
Cycle d'ateliers de cross fertilisation : "Passer de la donnée brute aux croisements de données entre disciplines " - DatanooS
C’est quoi un dépôt ?

                 META DONNEES
                                Findable
DONNEES
                                Accessible
           +                    Interoperable

                                Reusable

STOCKAGE
               DEPOSER UN DATASET               REFERENTIEL
C’est quoi un dépôt ?

                                                    ANNUAIRE

                 META DONNEES
                                Findable
DONNEES
                                Accessible
           +                    Interoperable

                                Reusable

STOCKAGE       DEPOSER UN DATASET
                                                REFERENTIEL
Ouvrir la Science …
  PREMIER AXE : GÉNÉRALISER L’ACCÈS OUVERT AUX PUBLICATIONS

                                              PUBLICATIONS

TRAVAUX DE RECHERCHE              RESULTATS         VALIDATION

  19/03/2021                  7                Open Access Week - CeSO
Ouvrir la Science …
     DEUXIÈME AXE : STRUCTURER ET OUVRIR LES DONNÉES DE LA
                          RECHERCHE

                DONNEES        CODES           PUBLICATIONS

TRAVAUX DE RECHERCHE               RESULTATS         VALIDATION

               ENTREPOT            ENTREPOT

  19/03/2021                   7                Open Access Week - CeSO
Quelles méta-données partagez-
             vous ?

Partagez-vous les méta-données de vos données
? vos publications ? vos codes ?

Si oui :
   o avec qui ?
   o comment ?

Si non, pourquoi ,
Atelier 1 "Déposer des données
    au sein de référentiels"
Enjeux scientifiques

        C, E-C, Ing     Etudiant.e.s

+ Aller vers de la Data Driven Science
+ Disposer d’un écosystème
+ Initier de nouvelles recherches
  (inter)disciplinaires
+ Valoriser les résultats
+ …

   19/03/2021                            16   Open Access Week - CeSO
Enjeux scientifiques

                                                          Fouille
                                                          de texte   ISTEX
                    Etudiant.e.s                       Mise en
    C, E-C, Ing                                        relation

                                                       Découverte de
+ Aller vers de la Data Driven Science                 connaissances

+ Disposer d’un écosystème
                                                            . Recherche de
+ Initier de nouvelles recherches         Fouille de        régularités passées pour
                                           données          interpréter de nouvelles
  (inter)disciplinaires                                     données
+ Valoriser les résultats                Classifi
                                         cation
                                                            . Alternatives à la
                                                            modélisation
+ …                                      Apprentissage      mathématique ou à la
                                         Automatique        simulation
                                                            . Anticiper des
                                                            comportements, des
                                                                   17
                                                            choix …
Enjeux scientifiques
                                                                                   collecter

                                                                                       infrastru
                                                          réutiliser                    ctures
                                                                                                                 nettoyer
                                                                                                       entrepots
                                                                 données

                        Etudiant.e.s
    C, E-C, Ing                                              Pratiques de
                                                              recherche                                       registres
                                                      Archiver                                                            analyser
+ Aller vers de la Data Driven Science
+ Disposer d’un écosystème                                                   Traces
                                                                            d’usages           publications

    + Partager des données, des expériences et
      en trouver beaucoup d’autres                                     stocker                     documenter
    + Mieux connaître l'état des lieux et les
      initiatives
+ Initier de nouvelles recherches                     Écosystème par domaine :
  (inter)disciplinaires
                                                      Ecosystème de site :
+ Valoriser les résultats
                                                 18
+ …
Enjeux scientifiques

    C, E-C, Ing         Etudiant.e.s                      Fouille de
                                                           données

+ Aller vers de la Data Driven Science                   Classifi
                                                         cation

                                                         Apprentissage
+ Disposer d’un écosystème                               Automatique

+ Initier de nouvelles recherches
  (inter)disciplinaires
    + Se connaître (jusqu’à l’international)
    + Etre efficace
+ Valoriser les résultats
                                                    Nouvelles recherches
+ …
                                               19
Enjeux scientifiques

                                                       Rendre visibles et accessibles ses
                                                       données et ses publications c’est
    C, E-C, Ing                                        • Amplifier leur visibilité
                           Etudiant.e.s
                                                       • Circulation des métadonnées des
+ Aller vers de la Data Driven Science                   portails vers des registres sans
                                                         intervention du chercheur
+ Disposer d’un écosystème
+ Initier de nouvelles recherches
  (inter)disciplinaires
                                                                  Portails      Registres
+ Valoriser les résultats
    +   Porter une visibilité
        disciplinaire/communautaire
                                                       • Pouvoir reproduire les expériences
    +   Aller vers une reconnaissance (acteurs de la
        SO, évaluation)
                                                         des autres chercheurs
                                                       • Mieux comparer les contributions
+ …
                                                       • Gage de qualité des recherches
Enjeux scientifiques

   C, E-C, Ing        Etudiant.e.s

+ Aller vers de la Data Driven Science
+ Disposer d’un écosystème
+ Initier de nouvelles recherches                 Statistiques sur Google Dataset Search
  (inter)disciplinaires                           N. Noy, 2021

+ Valoriser les résultats
    + Porter une visibilité
      disciplinaire/communautaire
    + Aller vers une reconnaissance (acteurs de
      la SO, évaluation)
Enjeux scientifiques

                  + Enjeu de visibilité des recherches (pôles,
                     interdisciplinarité)
                     +   Image positive, cohérente et coordonnée
                     +   Réduire les disparités entre communautés scientifiques
                         (locales et nationales)

                  + Offrir des services de qualité, adaptés aux
                     disciplines/communautés
Etablissements,      +   Faciliter les activités (individuelles, projets, communautés)
                         des chercheurs
 Organismes          +   Rationaliser des moyens, des services, des compétences
                     +   Réduire les coûts

                  + Approche responsable des points de vue éthique et
                     environnement
                             22
Pourquoi et pour quoi partager
        les données ?

Expliquez vos motivations et vos objectifs lors
du partage de données, de codes, de
publications
Atelier 1 "Déposer des données
    au sein de référentiels"
Centre d’Expertises
Trans et Interdisciplinaires   FAIR Data
       Mutualisées             +    Une gestion du cycle de vie tout au
                                    long de l’activité de recherche

     dataCore

                               +   Nécessité d’un accompagnement,
                                   d’environnements de partage et de
                                   traitement commun et de domaine
Centre d’Expertises
Trans et Interdisciplinaires   FAIR Data
       Mutualisées             +     Identification des MetaDonnées,
                                     vocabulaires de domaine standards,
                                     ontologies

                                                              RECHERCHE DE

     dataCore                                                JEUX DE DONNÉES

                                   DEPOT DE
                                    JEUX DE
                                   DONNÉES

                                                        RECHERCHE
                                                       PAR FACETTE,
                                                       SEMANTIQUE
Centre d’Expertises                       GT dataCore
Trans et Interdisciplinaires
       Mutualisées
                                   Meta-infrastructure
                                   (Virtual Research Environment)
                                   +        Construction de référentiels de
                                            données FAIR
     dataCore                           o
                                        o
                                               Partage entre chercheurs, partenaires de projet
                                               Sémantisation métier
                                        o      Workflow Métier : CALLISTO et autres
                                               outils/résultats de recherche
                                        o      Préparation des données pour l’IA
                                        o      Datalake sémantisé

                               +       Intégration de référentiels de
                                       données de l’écosystème de la
                                       Science Ouverte
Collaborations de projets
 (Post-doc, Stages de Master, Ingénieurs, E-C, C)

                               Chantier RTRA ENV’IA
ANR SO-DRIIHM                                           CALMIP
                             Semantics4FAIR
                                                      Projet EU SMS
                                       RECHERCHE
                                      PAR FACETTE,
                                      SEMANTIQUE       CALLISTO
                                                        Extension de
                                                         Dataverse
     PLATE-FORME EXPÉRIMENTATION
                ACCES AUX DONNEES
  GeoNetwork                         DCAT-AP

                                                       Dataverse
    ENTREPOT
Collaborations de site
Etat des Lieux – Recueil des besoins

    Vers un portail de
     l’Université de
       Toulouse ?
                          CéSO
                                     Etudiant.e.s   C, E-C, Ing

                            PLATE-FORME

                          ACCES AUX DONNEES

 ENTREPOT                ENTREPOT
Quels sont vos besoins pour
   mieux / plus partager vos
          données ?

• Besoins pour plus partager vos données ?
• Besoins pour plus partager vos codes ?
• Besoins pour plus partager vos publications
  ?
Réutilisez-vous des données
   ouvertes ou diffusées par
            d'autres ?

Si oui : Expliquez quelles données et où vous
les trouvez

Si non : pourquoi ?
?      Question sur la (ré)utilisation ?

    Réutilisez-vous des données ouvertes ou
    diffusées par d'autres ?

    Vers un portail de l’Université de Toulouse, qu’en
    pensez-vous ?
Vous pouvez aussi lire