Politiques de préservation numérique à la Bibliothèque nationale de France - L'écosystème de SPAR
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Politiques de préservation numérique à la Bibliothèque nationale de France L’écosystème de SPAR Louise Fauduet Département de la Conservation
Du numérique à foison Numérisation de valorisation Numérisation de préservation Né numérique Politiques de préservation numérique : 20 juin 2013 2 l'exemple de la BnF
Du numérisé • Déjà plusieurs « strates » de numérisation … Politiques de préservation numérique : 20 juin 2013 3 l'exemple de la BnF
Qu’a-t-on numérisé ? • D’abord du papier : livres, images, presse, etc. • Puis des objets : maquettes, statues, etc. • Et de l’audiovisuel : « plan de sauvegarde » des cassettes audio, VHS, disquettes, CD, CD-ROM, etc. – Certains déjà numériques • Des originaux rares, précieux, fragiles • Des versions numériques plus ou moins fidèles à l’original Politiques de préservation numérique : 20 juin 2013 4 l'exemple de la BnF
Comment ? • Choix techniques : – Liés aux objectifs • Diffusion, préservation, les deux – Aux moyens techniques à une date donnée • Format de fichier, résolution, couleur • Mode image, texte (OCR), table des matières et autres enrichissements (entités nommées, etc.) Politiques de préservation numérique : 20 juin 2013 5 l'exemple de la BnF
Comparons… Débuts de la numérisation Numérisation maintenant N&B - 300dpi -TIFF G4 Couleur– 400dpi – TIFF non 1 page ~ 200Ko compressé 1 page ~ 80Mo Plus de 500 fois plus ! Politiques de préservation numérique : 20 juin 2013 6 l'exemple de la BnF
Du né-numérique • Une masse et une diversité croissantes • Beaucoup de questions Politiques de préservation numérique : 20 juin 2013 7 l'exemple de la BnF
Livres, périodiques, bases de données • Acquis ou accessibles ? • Sous licence locale ou globale ? • Catalogués ou indexés ? • Libres ou protégés (DRM) ? • PDF, HTML, EPUB, indéterminés ? • Quelles relations au « papier » : copie exacte, contenu similaire, genre totalement nouveau ? – Sans oublier les éditions électroniques de la bibliothèque elle-même… Politiques de préservation numérique : 20 juin 2013 8 l'exemple de la BnF
Internet • Dépôt légal de l’internet : à la BnF et à l’INA, depuis 2006 (décret d’application fin 2011) Collectes larges : Nom- - annuelles - internalisées en 2010 bre de sites Collectes projet : - ponctuelles - liées à un événement ou un thème particulier Collectes courantes : - sur toute l’année - sites d’actualité ou de référence Politiques de préservation numérique : 20 juin 2013 l'exemple de la BnF Année calendaire 10
Archives • Archives de la BnF elle-même • Archives privées, achetées ou reçues • Quels droits sur les documents ? – Archives internes : conservation pendant la période d’utilisation courante (GED), et après ? – Archives de tiers : qu’est-ce qui a été négocié ? • Quelle variété de documents ? – Progiciels, environnements numériques de travail, e- mails, etc. Politiques de préservation numérique : 20 juin 2013 11 l'exemple de la BnF
Résultat, du numérique partout Communication site Web institutionnel collections numériques Collections 14 départements (acquisition, signalement, gestion et diffusion) Services et réseaux Systèmes d’information Dépôt légal Dépôt légal numérique Coopération Gallica (contenu) Information prospective, standards bibliographique métadonnées et numérique numérisation Conservation préservation Politiques de préservation numérique : 20 juin 2013 du numérique 12 l'exemple de la BnF
Gérer la diversité • Dans l’idéal : – un plan de conservation – commun pour toutes les collections, physiques et numériques – définissant des niveaux de services • Quelques initiatives intéressantes dans la définition de niveaux de services – Article de la National Library of Australia – Travaux de la National Digital Stewardship Alliance (organisation d’institutions américaines) Politiques de préservation numérique : 20 juin 2013 13 l'exemple de la BnF
Preservation Intent à la BN d’Australie • L’article : “'Oh, you wanted us to preserve that?!' Statements of preservation intent for the National Library of Australia's digital collection” – http://www.nla.gov.au/our-publications/staff-papers/oh-you-wanted-us-to-preserve-that- statements-of-preservation-intent • Un exemple : les cartes – “The Library's digital Maps collection includes born digital images from internal and external sources. As a largely published collection, Maps should consider the Preservation Intent of related institutions in determining intention to preserve. – Maps intend that: • All Maps digital preservation masters should be retained in perpetuity, including all metadata. All technical properties should be maintained to the full extent possible. • Derivative copies created for access should be maintained only for as long as useful; a new derivative version may be generated according to future access requirements. • Born digital maps and map related material coming from external and internal sources should be treated similarly.” – « http://www.nla.gov.au/content/statements-of-preservation-intent Politiques de préservation numérique : 20 juin 2013 14 l'exemple de la BnF
NDSA Levels of Digital Preservation Level One Level Two Level Three Level Four (Protect Your Data) (Know Your data) (Monitor Your Data) (Repair Your Data) Storage and Geographic Location •Two complete copies that are not •At least three complete copies •At least one copy in a geographic •At least 3 copies in geographic collocated •At least one copy in a different location with a different disaster locations with different disaster •For data on heterogeneous media geographic location threat threats. (optical disks, hard drives, etc.) get •Document your storage system(s) •Obsolescence monitoring process for •Have a comprehensive plan in place the content off the medium and into and storage media and what you your storage system(s) and media that will keep files and metadata on your storage system need to use them currently accessible media or systems File Fixity and Data Integrity •Check file fixity on ingest if it has •Check fixity on all ingestsUse write- •Check fixity of content at fixed •Check fixity of all content in response been provided with the content blockers when working with original intervals to specific events or activities •Create fixity info if it wasn’t provided media •Maintain logs of fixity info; supply •Ability to replace/repair corrupted with the content •Virus-check high risk content audit on demand data •Ability to detect corrupt data •Ensure no one person has write •Virus-check all content access to all copies Information Security •Identify who has read, write, move, •Document access restrictions for •Maintain logs of who performed •Perform audit of logs and delete authorization to individual content what actions on files, including files deletions and preservation actions •Restrict who has those authorizations to individual files Metadata •Inventory of content and its storage •Store administrative metadata •Store standard technical and •Store standard preservation location •Store transformative metadata and descriptive metadata metadata •Ensure backup and non-collocation log events of inventory File Formats •When you can give input into the •Inventory of file formats in use •Monitor file format obsolescence •Perform format migrations, creation of digital files encourage use issues emulation and similar activities as of a limited set of known open file needed formats and codecs http://blogs.loc.gov/digitalpreservation/2012/11/ndsa-levels-of-digital-preservation-release-candidate-one/ Politiques de préservation numérique : 20 juin 2013 15 l'exemple de la BnF
PAC (Plate-forme d'Archivage du CINES) • Comment archiver au CINES http://www.cines.fr/spip.php?rubrique225 – « Archivage de documents n’ayant plus une utilité courante. – Mise en place d’un plan de classement et sélection intelligente des données : ce document doit-il être archivé et pourquoi ? (…) – Vérification du contexte légal de production de l’archive : droits de propriété intellectuelle sur les documents à archiver. – Les données doivent pouvoir être converties dans un des formats de données pris en charge par la plateforme du CINES. Ceci facilitera les futures migrations des documents : (FACILE) !. – Mise en place d’un protocole de versement avec des métadonnées explicites » Politiques de préservation numérique : 20 juin 2013 16 l'exemple de la BnF
L’outil SPAR en contexte Applications de production de données Applications de diffusion de données Numérisation de conservation …. …. Production administrative wayback Archivage WEB … … Politiques de préservation numérique : 20 juin 2013 17 l'exemple de la BnF
Les filières • Les collections numériques de la BnF – sont multiples – évoluent rapidement • Les acteurs du numérique aussi Les filières définissent de grandes catégories en fonction – du statut légal des documents – du rapport entre Producteur et Archive – non d’une entité transitoire dans l’organigramme • vues sous l’angle des entités OAIS : – Versement, Préservation et Accès Politiques de préservation numérique : 20 juin 2013 18 l'exemple de la BnF
Pourquoi des « filières » ? • Les collections numériques de la BnF – sont multiples – évoluent rapidement • Les acteurs du numérique aussi Les filières définissent de grandes catégories en fonction – du statut légal des documents – du rapport entre Producteur et Archive – non d’une entité transitoire dans l’organigramme • vues sous l’angle des entités OAIS : – Versement, Préservation et Accès Politiques de préservation numérique : 20 juin 2013 19 l'exemple de la BnF
Les filières • Numérisation de conservation • Audiovisuel et multimédia • Numérisation de consultation • Dépôt légal automatique • Dépôt légal négocié • Production administrative/ technique • Dons et acquisitions • Tiers archivage Politiques de préservation numérique : 20 juin 2013 20 l'exemple de la BnF
Les filières et les chaînes Une filière se décline en chaînes aux caractéristiques techniques propres Politiques Filière Contrat de service Accès Préservation Versement Chaine A AQS-V Chaine B Chaine … Politiques de préservation numérique : 20 juin 2013 21 l'exemple de la BnF
A chaque chaîne sa politique • Politique de versement : caractéristiques de la négociation et du protocole de versement – Qui négocie ? – Que négocie-t-on ? : droit, format, volumétrie, flux • Politique d’archivage : caractéristiques de la conservation – Que conserve-t-on ? : données, métadonnées, systèmes de représentation… original, master, produits dérivés – Comment conserve-t-on ? : à l’identique (train original des bits), émulation, migration – Combien de temps conserve-t-on ? Politiques de préservation numérique : 20 juin 2013 22 l'exemple de la BnF
A chaque chaîne sa politique (suite) • Politique d’accès : caractéristiques de l’accès – Avec ou sans restriction – Avec ou sans services supplémentaires (ex. veille des formats) – Immédiat ou différé – Direct (applicatif DSI) ou indirect – Sur place, à distance – Volumétrie des transactions Politiques de préservation numérique : 20 juin 2013 23 l'exemple de la BnF
Quels moyens humains ? • Lors de l’instruction d’une nouvelle chaîne : – Équipe de développement : 2 informaticiens, 2 bibliothécaires, en lien avec les prestataires – Représentants de la chaîne : en général 2 à 3 experts • En cours de production : – Équipes de production du DSI – Équipes de développement pour les évolutions – Représentants des communautés d’utilisateurs Politiques de préservation numérique : 20 juin 2013 24 l'exemple de la BnF
Préserver la chaîne elle-même • 3 AQS: Versement, Préservation, Accès • Formalise en xml les conditions d’exploitation des paquets • Ces 3 AQS sont enregistrés dans un paquet de référence descriptif de la chaîne Mets.xml Contrat de service.pdf AQS-V.xml, AQS-P.xml, AQS-D.xml Politiques de préservation numérique : 20 juin 2013 25 l'exemple de la BnF
Description de chaîne (exemple) FIL_NUM_CONS_A info:bnf/spar/context/channel#ingest 42 5 32 * ark:/12148/fTIFF_6_0w * Politiques de préservation numérique : 20 juin 2013 26 l'exemple de la BnF
AQS : prise en compte dans le système Quelle est la taille maximum d’un paquet ? rdf P rA quel Dois-je journaliser les format ai-je Préservation Administration demandes de é droit? paquets ? - v rdf versement Accès e Gestion des données Combien de copies r dois-je faire, sur SIP mets DIP s quels supports ? e Stockage m e AIP AIP n t Service d’abstraction du stockage Politiques de préservation numérique : 20 juin 2013 27 l'exemple de la BnF
Au planning 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 mise en production étude mai 2010 infrastructure renouvellement GT groupes de travail appel d’offre cœur et num cons. autres fonctionnalités TA Admin AV DLW GT Politiques de préservation numérique : 20 juin 2013 l'exemple de la BnF nouveau 28 marché
Toujours plus 600000 400,00 350,00 500000 300,00 Nombre de paquets 400000 250,00 Taille (To) 300000 200,00 150,00 200000 100,00 100000 50,00 0 0,00 Paquets cumulés Taille cumulée (To) Politiques de préservation numérique : 20 juin 2013 29 l'exemple de la BnF
Pour les tiers • Tiers-archivage seul • Préservation lors de programmes combinés à tarif réduit (à partir de -80%) • http://www.bnf.fr/fr/professionnels/numerisation/a.bnf_archi vage_numerique.html • Espace coopération en cours de développement pour la gestion des documents préservés à la BnF • Contacter Catherine Dhérent à la direction des Services et réseaux Politiques de préservation numérique : 20 juin 2013 30 l'exemple de la BnF
Vous pouvez aussi lire