TRAVAILLER SUR DES CORPUS NUMÉRIQUES : DES COLLECTIONS AUX CHERCHEURS - DÉPARTEMENT DE LA COOPÉRATION - BNF

La page est créée Clément Roussel
 
CONTINUER À LIRE
TRAVAILLER SUR DES CORPUS NUMÉRIQUES : DES COLLECTIONS AUX CHERCHEURS - DÉPARTEMENT DE LA COOPÉRATION - BNF
Travailler sur des corpus
numériques : des collections
aux chercheurs

Jean-Philippe Moreux
Département de la Coopération

                                © art Buck/Flickr
TRAVAILLER SUR DES CORPUS NUMÉRIQUES : DES COLLECTIONS AUX CHERCHEURS - DÉPARTEMENT DE LA COOPÉRATION - BNF
Plan
Interopérabilité
Coopération
Accès aux collections sous droits
IA
TRAVAILLER SUR DES CORPUS NUMÉRIQUES : DES COLLECTIONS AUX CHERCHEURS - DÉPARTEMENT DE LA COOPÉRATION - BNF
Maintenant
Les chercheurs
extraient et utilisent
les contenus des
collections (API, jeux                 GALLICA
de données…)                      Entrepôt numérique

                         GALLICAPIX
Partager les résultats
(transcription,
annotation) entre
équipes, avec les
                                                            Collections
institutions, est
                                                           patrimoniales
difficile
                                        MANDRAGORE
                                      Entrepôt numérique
TRAVAILLER SUR DES CORPUS NUMÉRIQUES : DES COLLECTIONS AUX CHERCHEURS - DÉPARTEMENT DE LA COOPÉRATION - BNF
International Image
Demain                                                   Interoperability
                                                              Framework
Les chercheurs
                                                              https://iiif.io
partagent annotations
et transcriptions
avec IIIF                             GALLICA

Les institutions
peuvent exposer plus
                        GALLICAPIX
de métadonnées
avec IIIF

Elles peuvent
bénéficier du travail                              Collections
des chercheurs                                    patrimoniales
                                     MANDRAGORE
TRAVAILLER SUR DES CORPUS NUMÉRIQUES : DES COLLECTIONS AUX CHERCHEURS - DÉPARTEMENT DE LA COOPÉRATION - BNF
Q uelles métadonnées ?

                              Où sont les illustrations ?
                              (segmentation)

                                                            Canvas,
                                                            Liste
                                                            d’annotations
Manuscrits           Presse   Magazines                     (Web Annotations
                                          x,y,w,h           W3C)
TRAVAILLER SUR DES CORPUS NUMÉRIQUES : DES COLLECTIONS AUX CHERCHEURS - DÉPARTEMENT DE LA COOPÉRATION - BNF
Q uelles métadonnées ?

                         Quel est le contenu des illustrations ?
                         (annotations, transcriptions) + travail
                         de recherche : commentaires,
                         analyse…

                         Person, Woman
                         x1,y1,w1,h1
                                                                   Canvas,
                                                                   Liste
                             Hair                                  d’annotations
                             x1,y1,w1,h1
Vogue, 1936
TRAVAILLER SUR DES CORPUS NUMÉRIQUES : DES COLLECTIONS AUX CHERCHEURS - DÉPARTEMENT DE LA COOPÉRATION - BNF
Document Gallica ouvert dans Mirador et enrichi
                                                               avec des annotations NewsEye
Cas d’usage : partage
des annotations
iconographiques

                 NewsEye :
              application web
                 et serveur
             d’annotations IIIF

Démo Vogue : https://api.bnf.fr/fr/node/191

                                              Serveur IIIF Gallica
TRAVAILLER SUR DES CORPUS NUMÉRIQUES : DES COLLECTIONS AUX CHERCHEURS - DÉPARTEMENT DE LA COOPÉRATION - BNF
Q uelles métadonnées ?
                         Titre article (annotations)

                            Quel est le contenu textuel ? (OCR,
                            type d’éléments, entités nommées,
                            événements, …)

                                       Texte (annotations ou
                                       lien vers l’OCR)
                                                                  Canvas,
                                                                  Liste
                                                                  d’annotations,
                                      Texte
                                                                  See Also
Vogue, 1936
TRAVAILLER SUR DES CORPUS NUMÉRIQUES : DES COLLECTIONS AUX CHERCHEURS - DÉPARTEMENT DE LA COOPÉRATION - BNF
Cas d’usage : partage
des textes et de leur
enrichissement

...
"seeAlso": {

"@id": "https://platform.newseye.eu/IIIF/bpt6
k9604118j/X/X00000019.xml",
  "profile": "http://www.loc.gov/standards/alto/ns-
v4#",
  "format": "text/xml"
       }, ...

                                                      Démo Vogue
TRAVAILLER SUR DES CORPUS NUMÉRIQUES : DES COLLECTIONS AUX CHERCHEURS - DÉPARTEMENT DE LA COOPÉRATION - BNF
Q uelles métadonnées ?
                                                                                             Range

                         Quelle est la structure du document ?

                                                  Bibliothèque nationale du pays de Galles

                            Article

                            Feuilleton
Et aussi
                                                                            Collections
Collection de documents (IIIF)                                              Curation
                                                                            Editorialisation
                                 Curation (extension IIIF)

Démo Collection Vogue            http://codh.rois.ac.jp/icp/index.html.en
Et aussi
                                Collections
Storytelling                    Curation
                                Editorialisation

Démo Exhibit   Démo Storiiies
Interopérabilité             Projet de
                           recherche #2
                                             Projet de
                                           recherche #3

IIIF mais aussi :
- les données
  d‘autorité
- le web de données
- TEI
…

                                     Projet de
                                   recherche #1

                      Gallica                     ONB
Interopérabilité
À la BnF :
• implémentation des API IIIF v3 ; exposition
  des ressources textuelles
• instance Mirador
• rénovation du rapport de recherche Gallica (sous-collections,
  export CSV, visualisation de données)
• portail compatible TEI pour les dictionnaires
  et encyclopédies historiques
C oopération

                                                           Bibliothèques et
     ACCÈS AUX
                                                             chercheurs
     DONNÉES,
    FOURNITURE                       ANIMATION D’UNE
    DE DONNÉES                         COMMUNAUTÉ
                    CONSEIL ET      TRANSDISCIPLINAIRE
                  FORMATION SUR
                  LES MODÈLES DE                                 DISSÉMINATION ET
                 DONNÉES, FORMATS                                   INTÉGRATION
                   ET POLITIQUES                                   D’OUTILS ET DE
                  DOCUMENTAIRES
                                                    CONSEIL ET     RÉSULTATS DE
                                                                     RECHERCHE
                                                   ORIENTATION
C oopération                                                                           Les métiers
                                                                      enrichissement
   Bibliothécaire
   préparation des données/
        documentation/
   expertise bibliographique –
    sciences de l’information
                                         Chercheur
                                                analyse/                Résultats        Valorisation
                                        interprétation et critique/
                                          expertise scientifique

                   Ingénieur
                      automation/
                    infrastructure/                                    stockage
                  expertise technique
C oopération
À la BnF : ouverture du BnF DataLab
(septembre 2021) en coopération
avec la TGIR Huma-Num

• Accompagnement
• Chercheurs et équipes en résidence
• Catalogue de services
• Boîte à outils
• Infrastructure
C oopération
Diffuser les jeux de données et autres ressources au plus près des utilisateurs

                                                        api.bnf
                                              Version 2 du site, nouvelle
                     data.gouv,               catégorie « vérité terrain »
Zenodo                api.gouv
                                                                              CLARIN
                                                                             Historical
                                  Compétitions                               Corpora
                                  scientifiques
C oopération
api.bnf.fr :
« vérité terrain »
C oopération
Trouver des solutions en matière de fouille de données sur les collections sous droits

                  Capsules
                                             Projet CollEx-Persée
                 BnF DataLab
                                                 RESPADON
                                               Université de Lille,
                                           SciencesPo Medialab, BnF,
                                                 GED Condorcet
C oopération
Réfléchir à l’usage de l’IA en bibliothèque, expérimenter, réaliser

                  BnF Datalab
                                                                       Initiative
                     projets
                                                                        IA4LAM
                  CS-SHS-GLAM          Feuille de route
                                                                      ia4lam.org
                                          IA @ BnF
MERCI !
jean-philippe.moreux@bnf.fr
Vous pouvez aussi lire