TRAVAILLER SUR DES CORPUS NUMÉRIQUES : DES COLLECTIONS AUX CHERCHEURS - DÉPARTEMENT DE LA COOPÉRATION - BNF
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Travailler sur des corpus numériques : des collections aux chercheurs Jean-Philippe Moreux Département de la Coopération © art Buck/Flickr
Maintenant Les chercheurs extraient et utilisent les contenus des collections (API, jeux GALLICA de données…) Entrepôt numérique GALLICAPIX Partager les résultats (transcription, annotation) entre équipes, avec les Collections institutions, est patrimoniales difficile MANDRAGORE Entrepôt numérique
International Image Demain Interoperability Framework Les chercheurs https://iiif.io partagent annotations et transcriptions avec IIIF GALLICA Les institutions peuvent exposer plus GALLICAPIX de métadonnées avec IIIF Elles peuvent bénéficier du travail Collections des chercheurs patrimoniales MANDRAGORE
Q uelles métadonnées ? Où sont les illustrations ? (segmentation) Canvas, Liste d’annotations Manuscrits Presse Magazines (Web Annotations x,y,w,h W3C)
Q uelles métadonnées ? Quel est le contenu des illustrations ? (annotations, transcriptions) + travail de recherche : commentaires, analyse… Person, Woman x1,y1,w1,h1 Canvas, Liste Hair d’annotations x1,y1,w1,h1 Vogue, 1936
Document Gallica ouvert dans Mirador et enrichi avec des annotations NewsEye Cas d’usage : partage des annotations iconographiques NewsEye : application web et serveur d’annotations IIIF Démo Vogue : https://api.bnf.fr/fr/node/191 Serveur IIIF Gallica
Q uelles métadonnées ? Titre article (annotations) Quel est le contenu textuel ? (OCR, type d’éléments, entités nommées, événements, …) Texte (annotations ou lien vers l’OCR) Canvas, Liste d’annotations, Texte See Also Vogue, 1936
Cas d’usage : partage des textes et de leur enrichissement ... "seeAlso": { "@id": "https://platform.newseye.eu/IIIF/bpt6 k9604118j/X/X00000019.xml", "profile": "http://www.loc.gov/standards/alto/ns- v4#", "format": "text/xml" }, ... Démo Vogue
Q uelles métadonnées ? Range Quelle est la structure du document ? Bibliothèque nationale du pays de Galles Article Feuilleton
Et aussi Collections Collection de documents (IIIF) Curation Editorialisation Curation (extension IIIF) Démo Collection Vogue http://codh.rois.ac.jp/icp/index.html.en
Et aussi Collections Storytelling Curation Editorialisation Démo Exhibit Démo Storiiies
Interopérabilité Projet de recherche #2 Projet de recherche #3 IIIF mais aussi : - les données d‘autorité - le web de données - TEI … Projet de recherche #1 Gallica ONB
Interopérabilité À la BnF : • implémentation des API IIIF v3 ; exposition des ressources textuelles • instance Mirador • rénovation du rapport de recherche Gallica (sous-collections, export CSV, visualisation de données) • portail compatible TEI pour les dictionnaires et encyclopédies historiques
C oopération Bibliothèques et ACCÈS AUX chercheurs DONNÉES, FOURNITURE ANIMATION D’UNE DE DONNÉES COMMUNAUTÉ CONSEIL ET TRANSDISCIPLINAIRE FORMATION SUR LES MODÈLES DE DISSÉMINATION ET DONNÉES, FORMATS INTÉGRATION ET POLITIQUES D’OUTILS ET DE DOCUMENTAIRES CONSEIL ET RÉSULTATS DE RECHERCHE ORIENTATION
C oopération Les métiers enrichissement Bibliothécaire préparation des données/ documentation/ expertise bibliographique – sciences de l’information Chercheur analyse/ Résultats Valorisation interprétation et critique/ expertise scientifique Ingénieur automation/ infrastructure/ stockage expertise technique
C oopération À la BnF : ouverture du BnF DataLab (septembre 2021) en coopération avec la TGIR Huma-Num • Accompagnement • Chercheurs et équipes en résidence • Catalogue de services • Boîte à outils • Infrastructure
C oopération Diffuser les jeux de données et autres ressources au plus près des utilisateurs api.bnf Version 2 du site, nouvelle data.gouv, catégorie « vérité terrain » Zenodo api.gouv CLARIN Historical Compétitions Corpora scientifiques
C oopération api.bnf.fr : « vérité terrain »
C oopération Trouver des solutions en matière de fouille de données sur les collections sous droits Capsules Projet CollEx-Persée BnF DataLab RESPADON Université de Lille, SciencesPo Medialab, BnF, GED Condorcet
C oopération Réfléchir à l’usage de l’IA en bibliothèque, expérimenter, réaliser BnF Datalab Initiative projets IA4LAM CS-SHS-GLAM Feuille de route ia4lam.org IA @ BnF
MERCI ! jean-philippe.moreux@bnf.fr
Vous pouvez aussi lire