Cycle d'ateliers de cross fertilisation : "Passer de la donnée brute aux croisements de données entre disciplines " - DatanooS
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Cycle d'ateliers de cross fertilisation : "Passer de la donnée brute aux croisements de données entre disciplines » 15 Juin 2021 S
CYCLE D’ATELIERS DE CROSS FERTILISATION : "Passer de la donnée brute aux croisements de données entre disciplines" Incitation aux croisement de données : expression de besoins, de retours d'expériences à partager et définition de nouveaux use cases Thèmes des journées du cycle + APPEL à REX à partager : • 15 juin 2021 : Déposer ces données au sein de référentiels • Sept 2021 : Apport des infrastructures orientées services pour une recherche collaborative - exemples d'EOSC et OGC • Nov 2021 : réutiliser et croiser des données • Janv 2022 : déposer des codes
Quelles données sont concernées ? Définition de l’OCDE des données de la recherche financée sur fonds publics (1) : « Les «données de la recherche » sont définies comme des enregistrements factuels (chiffres, textes, images, sons) utilisés comme sources principales pour la recherche scientifique et généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. » (1) : Principes et lignes directrices de l’OCDE pour l’accès aux données de la recherche financée sur fonds publics http://www.oecd.org/fr/science/inno/38500823.pdf 19/03/2021 4 Open Access Week - CeSO
Quelles données sont concernées ? PRE-PRINTS D’OBSERVATION MODELES (reviews) POST-PRINTS DONNEES EXPERIMENTALES CODES PUBLICATIONS DE SIMULATION ALGORITHMES DATA PAPERS DERIVEES TRAVAUX DE RECHERCHE RESULTATS VALIDATION 19/03/2021 5 Open Access Week - CeSO
Autres « données » ? Les « données » liées aux activités scientifiques PROCEDURES « BONNES PRATIQUES » CAHIERS DE LABORATOIRES WORKFLOW DONNEES ESSAIS CODES PUBLICATIONS TRAVAUX DE RECHERCHE RESULTATS VALIDATION 19/03/2021 6 Open Access Week - CeSO
Quelles données partagez-vous ? • Partagez-vous vos données ? vos publications ? vos codes ? Si oui , • Avec qui ? • Comment ? Si non, pourquoi ?
C’est quoi un dépôt ? META DONNEES Findable DONNEES Accessible + Interoperable Reusable STOCKAGE DEPOSER UN DATASET REFERENTIEL
C’est quoi un dépôt ? ANNUAIRE META DONNEES Findable DONNEES Accessible + Interoperable Reusable STOCKAGE DEPOSER UN DATASET REFERENTIEL
Ouvrir la Science … PREMIER AXE : GÉNÉRALISER L’ACCÈS OUVERT AUX PUBLICATIONS PUBLICATIONS TRAVAUX DE RECHERCHE RESULTATS VALIDATION 19/03/2021 7 Open Access Week - CeSO
Ouvrir la Science … DEUXIÈME AXE : STRUCTURER ET OUVRIR LES DONNÉES DE LA RECHERCHE DONNEES CODES PUBLICATIONS TRAVAUX DE RECHERCHE RESULTATS VALIDATION ENTREPOT ENTREPOT 19/03/2021 7 Open Access Week - CeSO
Quelles méta-données partagez- vous ? Partagez-vous les méta-données de vos données ? vos publications ? vos codes ? Si oui : o avec qui ? o comment ? Si non, pourquoi ,
Atelier 1 "Déposer des données au sein de référentiels"
Enjeux scientifiques C, E-C, Ing Etudiant.e.s + Aller vers de la Data Driven Science + Disposer d’un écosystème + Initier de nouvelles recherches (inter)disciplinaires + Valoriser les résultats + … 19/03/2021 16 Open Access Week - CeSO
Enjeux scientifiques Fouille de texte ISTEX Etudiant.e.s Mise en C, E-C, Ing relation Découverte de + Aller vers de la Data Driven Science connaissances + Disposer d’un écosystème . Recherche de + Initier de nouvelles recherches Fouille de régularités passées pour données interpréter de nouvelles (inter)disciplinaires données + Valoriser les résultats Classifi cation . Alternatives à la modélisation + … Apprentissage mathématique ou à la Automatique simulation . Anticiper des comportements, des 17 choix …
Enjeux scientifiques collecter infrastru réutiliser ctures nettoyer entrepots données Etudiant.e.s C, E-C, Ing Pratiques de recherche registres Archiver analyser + Aller vers de la Data Driven Science + Disposer d’un écosystème Traces d’usages publications + Partager des données, des expériences et en trouver beaucoup d’autres stocker documenter + Mieux connaître l'état des lieux et les initiatives + Initier de nouvelles recherches Écosystème par domaine : (inter)disciplinaires Ecosystème de site : + Valoriser les résultats 18 + …
Enjeux scientifiques C, E-C, Ing Etudiant.e.s Fouille de données + Aller vers de la Data Driven Science Classifi cation Apprentissage + Disposer d’un écosystème Automatique + Initier de nouvelles recherches (inter)disciplinaires + Se connaître (jusqu’à l’international) + Etre efficace + Valoriser les résultats Nouvelles recherches + … 19
Enjeux scientifiques Rendre visibles et accessibles ses données et ses publications c’est C, E-C, Ing • Amplifier leur visibilité Etudiant.e.s • Circulation des métadonnées des + Aller vers de la Data Driven Science portails vers des registres sans intervention du chercheur + Disposer d’un écosystème + Initier de nouvelles recherches (inter)disciplinaires Portails Registres + Valoriser les résultats + Porter une visibilité disciplinaire/communautaire • Pouvoir reproduire les expériences + Aller vers une reconnaissance (acteurs de la SO, évaluation) des autres chercheurs • Mieux comparer les contributions + … • Gage de qualité des recherches
Enjeux scientifiques C, E-C, Ing Etudiant.e.s + Aller vers de la Data Driven Science + Disposer d’un écosystème + Initier de nouvelles recherches Statistiques sur Google Dataset Search (inter)disciplinaires N. Noy, 2021 + Valoriser les résultats + Porter une visibilité disciplinaire/communautaire + Aller vers une reconnaissance (acteurs de la SO, évaluation)
Enjeux scientifiques + Enjeu de visibilité des recherches (pôles, interdisciplinarité) + Image positive, cohérente et coordonnée + Réduire les disparités entre communautés scientifiques (locales et nationales) + Offrir des services de qualité, adaptés aux disciplines/communautés Etablissements, + Faciliter les activités (individuelles, projets, communautés) des chercheurs Organismes + Rationaliser des moyens, des services, des compétences + Réduire les coûts + Approche responsable des points de vue éthique et environnement 22
Pourquoi et pour quoi partager les données ? Expliquez vos motivations et vos objectifs lors du partage de données, de codes, de publications
Atelier 1 "Déposer des données au sein de référentiels"
Centre d’Expertises Trans et Interdisciplinaires FAIR Data Mutualisées + Une gestion du cycle de vie tout au long de l’activité de recherche dataCore + Nécessité d’un accompagnement, d’environnements de partage et de traitement commun et de domaine
Centre d’Expertises Trans et Interdisciplinaires FAIR Data Mutualisées + Identification des MetaDonnées, vocabulaires de domaine standards, ontologies RECHERCHE DE dataCore JEUX DE DONNÉES DEPOT DE JEUX DE DONNÉES RECHERCHE PAR FACETTE, SEMANTIQUE
Centre d’Expertises GT dataCore Trans et Interdisciplinaires Mutualisées Meta-infrastructure (Virtual Research Environment) + Construction de référentiels de données FAIR dataCore o o Partage entre chercheurs, partenaires de projet Sémantisation métier o Workflow Métier : CALLISTO et autres outils/résultats de recherche o Préparation des données pour l’IA o Datalake sémantisé + Intégration de référentiels de données de l’écosystème de la Science Ouverte
Collaborations de projets (Post-doc, Stages de Master, Ingénieurs, E-C, C) Chantier RTRA ENV’IA ANR SO-DRIIHM CALMIP Semantics4FAIR Projet EU SMS RECHERCHE PAR FACETTE, SEMANTIQUE CALLISTO Extension de Dataverse PLATE-FORME EXPÉRIMENTATION ACCES AUX DONNEES GeoNetwork DCAT-AP Dataverse ENTREPOT
Collaborations de site Etat des Lieux – Recueil des besoins Vers un portail de l’Université de Toulouse ? CéSO Etudiant.e.s C, E-C, Ing PLATE-FORME ACCES AUX DONNEES ENTREPOT ENTREPOT
Quels sont vos besoins pour mieux / plus partager vos données ? • Besoins pour plus partager vos données ? • Besoins pour plus partager vos codes ? • Besoins pour plus partager vos publications ?
Réutilisez-vous des données ouvertes ou diffusées par d'autres ? Si oui : Expliquez quelles données et où vous les trouvez Si non : pourquoi ?
? Question sur la (ré)utilisation ? Réutilisez-vous des données ouvertes ou diffusées par d'autres ? Vers un portail de l’Université de Toulouse, qu’en pensez-vous ?
Vous pouvez aussi lire