Politiques de préservation numérique à la Bibliothèque nationale de France - L'écosystème de SPAR

La page est créée Olivier Camus
 
CONTINUER À LIRE
Politiques de préservation numérique à la Bibliothèque nationale de France - L'écosystème de SPAR
Politiques de préservation
numérique à la Bibliothèque
    nationale de France
     L’écosystème de SPAR

                                   Louise Fauduet
                   Département de la Conservation
Politiques de préservation numérique à la Bibliothèque nationale de France - L'écosystème de SPAR
Du numérique à foison
Numérisation de valorisation

Numérisation de préservation

Né numérique

                          Politiques de préservation numérique :
           20 juin 2013                                            2
                                    l'exemple de la BnF
Politiques de préservation numérique à la Bibliothèque nationale de France - L'écosystème de SPAR
Du numérisé

• Déjà plusieurs « strates » de numérisation …

                          Politiques de préservation numérique :
         20 juin 2013                                              3
                                    l'exemple de la BnF
Politiques de préservation numérique à la Bibliothèque nationale de France - L'écosystème de SPAR
Qu’a-t-on numérisé ?
• D’abord du papier : livres, images, presse, etc.
• Puis des objets : maquettes, statues, etc.
• Et de l’audiovisuel : « plan de sauvegarde » des
  cassettes audio, VHS, disquettes, CD, CD-ROM,
  etc.
   – Certains déjà numériques

• Des originaux rares, précieux, fragiles
• Des versions numériques plus ou moins fidèles à
  l’original

                      Politiques de préservation numérique :
       20 juin 2013                                            4
                                l'exemple de la BnF
Politiques de préservation numérique à la Bibliothèque nationale de France - L'écosystème de SPAR
Comment ?
• Choix techniques :
  – Liés aux objectifs
     • Diffusion, préservation, les deux

  – Aux moyens techniques à une date donnée
     • Format de fichier, résolution, couleur
     • Mode image, texte (OCR), table des matières et autres
       enrichissements (entités nommées, etc.)

                     Politiques de préservation numérique :
      20 juin 2013                                             5
                               l'exemple de la BnF
Politiques de préservation numérique à la Bibliothèque nationale de France - L'écosystème de SPAR
Comparons…

Débuts de la numérisation                                         Numérisation maintenant
 N&B - 300dpi -TIFF G4                                           Couleur– 400dpi – TIFF non
    1 page ~ 200Ko                                                        compressé
                                                                      1 page ~ 80Mo
                       Plus de 500 fois plus !
                            Politiques de préservation numérique :
        20 juin 2013                                                                          6
                                      l'exemple de la BnF
Politiques de préservation numérique à la Bibliothèque nationale de France - L'écosystème de SPAR
Du né-numérique
• Une masse et une diversité
croissantes
• Beaucoup de questions

                        Politiques de préservation numérique :
      20 juin 2013                                               7
                                  l'exemple de la BnF
Politiques de préservation numérique à la Bibliothèque nationale de France - L'écosystème de SPAR
Livres, périodiques, bases de données
•   Acquis ou accessibles ?
•   Sous licence locale ou globale ?
•   Catalogués ou indexés ?
•   Libres ou protégés (DRM) ?
•   PDF, HTML, EPUB, indéterminés ?
•   Quelles relations au « papier » : copie exacte,
    contenu similaire, genre totalement nouveau ?

    – Sans oublier les éditions électroniques de la
      bibliothèque elle-même…

                       Politiques de préservation numérique :
        20 juin 2013                                            8
                                 l'exemple de la BnF
Politiques de préservation numérique à la Bibliothèque nationale de France - L'écosystème de SPAR
Comparons…

               Politiques de préservation numérique :
20 juin 2013                                            9
                         l'exemple de la BnF
Politiques de préservation numérique à la Bibliothèque nationale de France - L'écosystème de SPAR
Internet
   • Dépôt légal de l’internet : à la BnF et à l’INA,
     depuis 2006 (décret d’application fin 2011)
                                         Collectes larges :
Nom-                                     - annuelles
                                         - internalisées en 2010
bre de
sites
         Collectes projet :
         - ponctuelles
         - liées à un événement
         ou un thème particulier                                       Collectes courantes :
                                                                       - sur toute l’année
                                                                       - sites d’actualité ou de référence

                                   Politiques de préservation numérique :
               20 juin 2013
                                             l'exemple de la BnF            Année calendaire          10
Archives
• Archives de la BnF elle-même
• Archives privées, achetées ou reçues

• Quels droits sur les documents ?
  – Archives internes : conservation pendant la période
    d’utilisation courante (GED), et après ?
  – Archives de tiers : qu’est-ce qui a été négocié ?
• Quelle variété de documents ?
  – Progiciels, environnements numériques de travail, e-
    mails, etc.

                     Politiques de préservation numérique :
      20 juin 2013                                            11
                               l'exemple de la BnF
Résultat, du numérique partout
 Communication                  site Web institutionnel

                                                                                       collections numériques
   Collections                                        14 départements                  (acquisition, signalement,
                                                                                       gestion et diffusion)

Services et réseaux                                 Systèmes d’information

                                                           Dépôt légal                 Dépôt légal numérique

                                                           Coopération                   Gallica (contenu)

                                                            Information                prospective, standards
                                                          bibliographique                  métadonnées
                                                           et numérique

                                                                                            numérisation

                                                           Conservation
                                                                                            préservation
                                              Politiques de préservation numérique :
                 20 juin 2013                                                              du numérique             12
                                                        l'exemple de la BnF
Gérer la diversité
• Dans l’idéal :
   – un plan de conservation
   – commun pour toutes les collections, physiques et
     numériques
   – définissant des niveaux de services

• Quelques initiatives intéressantes dans la
  définition de niveaux de services
   – Article de la National Library of Australia
   – Travaux de la National Digital Stewardship Alliance
     (organisation d’institutions américaines)

                         Politiques de préservation numérique :
       20 juin 2013                                               13
                                   l'exemple de la BnF
Preservation Intent à la BN d’Australie
• L’article : “'Oh, you wanted us to preserve that?!' Statements
  of preservation intent for the National Library of Australia's
  digital collection”
   –   http://www.nla.gov.au/our-publications/staff-papers/oh-you-wanted-us-to-preserve-that-
       statements-of-preservation-intent

• Un exemple : les cartes
   –   “The Library's digital Maps collection includes born digital images from internal and external sources.
       As a largely published collection, Maps should consider the Preservation Intent of related institutions
       in determining intention to preserve.
   –   Maps intend that:
          • All Maps digital preservation masters should be retained in perpetuity, including all metadata.
             All technical properties should be maintained to the full extent possible.
          • Derivative copies created for access should be maintained only for as long as useful; a new
             derivative version may be generated according to future access requirements.
          • Born digital maps and map related material coming from external and internal sources should
             be treated similarly.”
   –   « http://www.nla.gov.au/content/statements-of-preservation-intent

                                    Politiques de préservation numérique :
           20 juin 2013                                                                                    14
                                              l'exemple de la BnF
NDSA Levels of Digital Preservation
                                  Level One                                   Level Two                                Level Three                             Level Four
                                  (Protect Your Data)                         (Know Your data)                         (Monitor Your Data)                     (Repair Your Data)
Storage and Geographic Location   •Two complete copies that are not           •At least three complete copies          •At least one copy in a geographic      •At least 3 copies in geographic
                                  collocated                                  •At least one copy in a different        location with a different disaster      locations with different disaster
                                  •For data on heterogeneous media            geographic location                      threat                                  threats.
                                  (optical disks, hard drives, etc.) get      •Document your storage system(s)         •Obsolescence monitoring process for    •Have a comprehensive plan in place
                                  the content off the medium and into         and storage media and what you           your storage system(s) and media        that will keep files and metadata on
                                  your storage system                         need to use them                                                                 currently accessible media or systems

File Fixity and Data Integrity    •Check file fixity on ingest if it has      •Check fixity on all ingestsUse write-   •Check fixity of content at fixed       •Check fixity of all content in response
                                  been provided with the content              blockers when working with original      intervals                               to specific events or activities
                                  •Create fixity info if it wasn’t provided   media                                    •Maintain logs of fixity info; supply   •Ability to replace/repair corrupted
                                  with the content                            •Virus-check high risk content           audit on demand                         data
                                                                                                                       •Ability to detect corrupt data         •Ensure no one person has write
                                                                                                                       •Virus-check all content                access to all copies

Information Security              •Identify who has read, write, move, •Document access restrictions for               •Maintain logs of who performed         •Perform audit of logs
                                  and delete authorization to individual content                                       what actions on files, including
                                  files                                                                                deletions and preservation actions
                                  •Restrict who has those
                                  authorizations to individual files

Metadata                          •Inventory of content and its storage •Store administrative metadata                 •Store standard technical and           •Store standard preservation
                                  location                              •Store transformative metadata and             descriptive metadata                    metadata
                                  •Ensure backup and non-collocation log events
                                  of inventory
File Formats                      •When you can give input into the       •Inventory of file formats in use            •Monitor file format obsolescence       •Perform format migrations,
                                  creation of digital files encourage use                                              issues                                  emulation and similar activities as
                                  of a limited set of known open file                                                                                          needed
                                  formats and codecs

                                         http://blogs.loc.gov/digitalpreservation/2012/11/ndsa-levels-of-digital-preservation-release-candidate-one/

                                                                   Politiques de préservation numérique :
                          20 juin 2013                                                                                                                                                               15
                                                                             l'exemple de la BnF
PAC (Plate-forme d'Archivage du CINES)

• Comment archiver au CINES
  http://www.cines.fr/spip.php?rubrique225
   – « Archivage de documents n’ayant plus une utilité courante.
   – Mise en place d’un plan de classement et sélection intelligente des
     données : ce document doit-il être archivé et pourquoi ? (…)
   – Vérification du contexte légal de production de l’archive : droits de
     propriété intellectuelle sur les documents à archiver.
   – Les données doivent pouvoir être converties dans un des formats de
     données pris en charge par la plateforme du CINES. Ceci facilitera les
     futures migrations des documents : (FACILE) !.
   – Mise en place d’un protocole de versement avec des métadonnées
     explicites »

                          Politiques de préservation numérique :
        20 juin 2013                                                          16
                                    l'exemple de la BnF
L’outil SPAR en contexte
Applications de production de données                             Applications de diffusion de données

Numérisation de
 conservation                                                                            ….

                                                                                          ….
  Production
 administrative

                                                                                        wayback

 Archivage WEB

         …                                                                                …

                                  Politiques de préservation numérique :
              20 juin 2013                                                                        17
                                            l'exemple de la BnF
Les filières
• Les collections numériques de la BnF
    – sont multiples
    – évoluent rapidement
• Les acteurs du numérique aussi

Les filières définissent de grandes catégories en fonction
    – du statut légal des documents
    – du rapport entre Producteur et Archive
    – non d’une entité transitoire dans l’organigramme

• vues sous l’angle des entités OAIS :
    – Versement, Préservation et Accès

                          Politiques de préservation numérique :
         20 juin 2013                                              18
                                    l'exemple de la BnF
Pourquoi des « filières » ?
• Les collections numériques de la BnF
    – sont multiples
    – évoluent rapidement
• Les acteurs du numérique aussi

Les filières définissent de grandes catégories en fonction
    – du statut légal des documents
    – du rapport entre Producteur et Archive
    – non d’une entité transitoire dans l’organigramme

• vues sous l’angle des entités OAIS :
    – Versement, Préservation et Accès

                          Politiques de préservation numérique :
         20 juin 2013                                              19
                                    l'exemple de la BnF
Les filières

•   Numérisation de conservation
•   Audiovisuel et multimédia
•   Numérisation de consultation
•   Dépôt légal automatique
•   Dépôt légal négocié
•   Production administrative/ technique
•   Dons et acquisitions
•   Tiers archivage
                    Politiques de préservation numérique :
     20 juin 2013                                            20
                              l'exemple de la BnF
Les filières et les chaînes
Une filière se décline en chaînes aux caractéristiques techniques propres

                                                                Politiques
          Filière
                                       Contrat de
                                       service
                                                                                  Accès
                                                                                 Préservation
                                                                                    Versement

                     Chaine A                                                       AQS-V

                          Chaine B

                            Chaine …

                                        Politiques de préservation numérique :
           20 juin 2013                                                                         21
                                                  l'exemple de la BnF
A chaque chaîne sa politique
• Politique de versement : caractéristiques de la
  négociation et du protocole de versement
   – Qui négocie ?
   – Que négocie-t-on ? : droit, format, volumétrie, flux

• Politique d’archivage : caractéristiques de la
  conservation
   – Que conserve-t-on ? : données, métadonnées,
     systèmes de représentation… original, master,
     produits dérivés
   – Comment conserve-t-on ? : à l’identique (train original
     des bits), émulation, migration
   – Combien de temps conserve-t-on ?
                      Politiques de préservation numérique :
       20 juin 2013                                            22
                                l'exemple de la BnF
A chaque chaîne sa politique (suite)

• Politique d’accès : caractéristiques de l’accès
  – Avec ou sans restriction
  – Avec ou sans services supplémentaires (ex. veille
    des formats)
  – Immédiat ou différé
  – Direct (applicatif DSI) ou indirect
  – Sur place, à distance
  – Volumétrie des transactions

                     Politiques de préservation numérique :
      20 juin 2013                                            23
                               l'exemple de la BnF
Quels moyens humains ?
• Lors de l’instruction d’une nouvelle chaîne :
  – Équipe de développement : 2 informaticiens, 2
    bibliothécaires, en lien avec les prestataires
  – Représentants de la chaîne : en général 2 à 3
    experts
• En cours de production :
  – Équipes de production du DSI
  – Équipes de développement pour les évolutions
  – Représentants des communautés d’utilisateurs

                     Politiques de préservation numérique :
      20 juin 2013                                            24
                               l'exemple de la BnF
Préserver la chaîne elle-même

• 3 AQS: Versement, Préservation, Accès
• Formalise en xml les conditions d’exploitation des paquets
• Ces 3 AQS sont enregistrés dans un paquet de référence descriptif
  de la chaîne

                           Mets.xml

                           Contrat de service.pdf

                           AQS-V.xml, AQS-P.xml, AQS-D.xml
                       Politiques de préservation numérique :
        20 juin 2013                                            25
                                 l'exemple de la BnF
Description de chaîne (exemple)

    FIL_NUM_CONS_A
    info:bnf/spar/context/channel#ingest
  
    42
    5
    32
    
          *
      
          ark:/12148/fTIFF_6_0w
        
        *
      
                            Politiques de préservation numérique :
           20 juin 2013                                                     26
                                      l'exemple de la BnF
AQS : prise en compte dans le système

                       Quelle est la
                     taille maximum
                      d’un paquet ?
                                                                           rdf
   P
   rA quel                                                    Dois-je journaliser les
 format ai-je                Préservation Administration          demandes de
   é
    droit?                                                          paquets ?
   -
   v                                                     rdf
                versement                                      Accès
   e                             Gestion des données
                                     Combien   de copies
   r                                  dois-je faire, sur
            SIP            mets                                                   DIP
   s                                  quels supports ?
   e
                                       Stockage
   m
   e                       AIP                               AIP
   n
   t                      Service d’abstraction du stockage

                             Politiques de préservation numérique :
      20 juin 2013                                                                27
                                       l'exemple de la BnF
Au planning
2004   2005        2006        2007      2008         2009        2010         2011    2012      2013

                                                                            mise en production
   étude                                                                        mai 2010
                          infrastructure
                                                                      renouvellement
                          GT                                   groupes de travail
                               appel d’offre
                                              cœur et num cons.
                                                                       autres fonctionnalités
                                                                       TA
                                                                            Admin
                                                                                AV
                                                                                     DLW
                                                                                           GT
                                   Politiques de préservation numérique :
           20 juin 2013
                                             l'exemple de la BnF                                nouveau 28
                                                                                                        marché
Toujours plus
                    600000                                                                   400,00

                                                                                             350,00
                    500000
                                                                                             300,00
Nombre de paquets

                    400000
                                                                                             250,00

                                                                                                      Taille (To)
                    300000                                                                   200,00

                                                                                             150,00
                    200000
                                                                                             100,00
                    100000
                                                                                             50,00

                         0                                                                   0,00

                                             Paquets cumulés           Taille cumulée (To)

                                             Politiques de préservation numérique :
                             20 juin 2013                                                            29
                                                       l'exemple de la BnF
Pour les tiers
• Tiers-archivage seul
• Préservation lors de programmes combinés à tarif
  réduit (à partir de -80%)
• http://www.bnf.fr/fr/professionnels/numerisation/a.bnf_archi
  vage_numerique.html

• Espace coopération en cours de développement pour
  la gestion des documents préservés à la BnF

• Contacter Catherine Dhérent à la direction des Services
  et réseaux

                        Politiques de préservation numérique :
        20 juin 2013                                             30
                                  l'exemple de la BnF
Vous pouvez aussi lire