• nl
  • en
beeldband

Tweede workshop Preservation Metadata: 19 juni 2014

18 September 2014 Published by Leave your thoughts

Preservation metadata staat momenteel volop in de belangstelling. Voor de workshop die Annemiek de Jong, senior beleidsadviseur Digitale Duurzaamheid van het Instituut voor Beeld en Geluid (B&G) en Marcel Ras, programmamanager bij de Nationale Coalitie Digitale Duurzaamheid (NCDD) op 4 maart jl. organiseerden over dit onderwerp organiseerden, was zoveel belangstelling, dat er voor 19 juni een tweede bijeenkomst werd georganiseerd. Ook deze tweede dag was snel volgeboekt. Eerder deed ik in verslag van de bijeenkomst op 4 maart. Hier volgt een verslag van de bijeenkomst van 19 juni.

Programma
Het programma van de tweede bijeenkomst was bijna identiek aan dat van de eerste, op de inleiding na.
Ook voor deze tweede bijeenkomst was het programma opgebouwd rond de volgende vragen: Wat is preservation metadata, waar dient het voor en hoe kun je het gebruiken? In mijn vorige blog heb ik aandacht besteed aan de eerste twee vragen. In deze blog zal ik proberen meer aandacht te besteden aan hoe er bij de verschillende instellingen in de praktijk tegen preservation metadata wordt aangekeken.

Preservation Metadata: between theory and practice, Titia van der Werf, OCLC
De inleiding werd deze keer niet verzorgd door Rebecca Guenther, hoofd Editorial Committee Preservation Metadata bij The Library of Congress, maar door Titia van der Werf, Senior Program Officers bij OCLC Research. Titia’s presentatie bestond uit drie onderdelen: een algemene introductie van preservation metadata, vervolgens schonk zij aandacht aan het ontstaan en de werking van het PREMIS Data Dictionary en tot slot presenteerde zij als praktijkcasus The Preservation Health Check.

Wat is metadata? Metadata is informatie over een bepaald object en heeft verschillende functies. Het aantal functies breidt zich echter steeds meer uit als gevolg van het feit dat wij momenteel in de overgangsfase zitten van een analoge naar een digitale omgeving. Beheer van behoud van digitale collecties behoort inmiddels volgens Titia tot de structurele taken van collectiehoudende instellingen. In het veld is er echter volgens Titia nog geen consensus over wat dat dan precies inhoudt.
Titia ging regelmatig in op de manier waarop begrippen in de loop van het afgelopen decennium een andere betekenis hadden gekregen. Een belangrijk deel van de begripsverwarring kan daardoor worden verklaard. Kort gezegd was digital preservation en alles wat daarbij hoorde, eerst een louter technisch verhaal, maar in de loop der tijd zijn er steeds meer aspecten bij gekomen, zoals begrijpelijkheid, mogelijkheid tot hergebruik en validiteit. Uiteindelijk is hieruit het SPOT model ontstaan. Dit model bestaat uit zes belangrijke kenmerken van digital preservation en kan worden ingezet voor het uitvoeren van een risico-analyse.

In het deel van haar presentatie dat over PREMIS gaat, geeft zij een overzicht van de verschillende standaarden van metadata die in PREMIS worden beschreven en van het ontstaan van PREMIS. Enerzijds is er veel nauwkeurig beschreven in PREMIS, maar anderzijds wordt er ook veel overgelaten aan vrije interpretatie.

Tot slot gaat Titia in op de vraag wat er nu eigenlijk met al die metadata wordt gedaan. Metadatasystemen bijhouden kost veel tijd en geld, maar wat hebben we er nu aan? In samenwerking met Open Planets en de Bibliothèque Nationale de France is OCLC bezig om een zogenaamde Preservation Health Check te ontwikkelen, een manier om beheerders van repositories op eenvoudige wijze te ondersteunen bij het monitoren van de preservation status van de data in hun repository. Dit project loopt nog, maar lijkt zeker de moeite waard om in de gaten te houden!

Het Instituut voor Beeld & Geluid(B&G), Daniel Steinmeijer
De collectie van B&G bestaat enerzijds uit wat de omroepen produceren, het zognaamde AV-productiearchief: entertainment, nieuws en drama, en anderzijds aan wat kan worden geclassificeerd als nationaal erfgoed: amateurfilm, documentaires en fotocollecties. Sinds 2007 worden er alleen nog digitale originelen gearchiveerd waar een speciale workflow voor is ontwikkeld. Per jaar wordt er voor duizenden uren aan film gearchiveerd. Het archief bestaat momenteel uit 6 petabytes aan omroepmateriaal en 6 petabytes aan gedigitaliseerd materiaal.

De impact van verlies in digitale archieven is heel groot en daarom moet het risico daarop zo klein mogelijk worden gemaakt. Het is dan ook heel belangrijk om de IT-infrastructuur up-to-date te houden. Deze activiteit is ondergebracht in de jaarplannen en het meerjarenplan van B&G.
Bij B&G zijn verschillende projecten gestart voor digitale archivering waarbij OAIS een vereiste was. In het Project voor Digital Object Management requirements is onder meer een Preservation metadata dictionary en een Preservation workflow model ontwikkeld. Voor provenance-metadata en rechtenmetadata is PREMIS gebruikt. Daarnaast is er voor audio, video en foto’s gebruik gemaakt van technische metadata.
Specifiek aan het archief van B&G is dat de complete bestanden die worden aangeleverd, over het algemeen erg groot zijn, maar dat deze zodanig moeten worden gearchiveerd dat slechts een klein stukje daarvan kan worden uitgeleverd (bijvoorbeeld een fragment uit een documentaire of een film). Dat stelt specifieke eisen aan de opslag en ontsluiting.
Bij B&G hebben ze strenge richtlijnen opgesteld voor het aanleveren van informatie. Daarmee moet worden voorkomen dat er bij ingest discussie ontstaat over allerlei zaken. Dat is wel een streng, maar het werkt wel.

Conclusies:
* Als je een e-depot wilt opzetten, doe dan niet alles in één keer, maar maak kleine stapjes.
* Begin met dynamisch archief. Materiaal dat direct gebruikt wordt en waar vraag naar is en dus in de praktijk mee wordt gewerkt.
* Combineer waar mogelijk de korte termijn voordelen met de lange termijn oplossingen.

Spaanse rijschool of rodeo: het e-depot van het Nationaal Archief (NA), Mette van Essen
In de Spaanse rijschool is de dressuur er op gericht de bewegingen van het paard te perfectioneren, bij een rodeo gaat het er meer om dat de cowboy het paard kan temmen zonder dat het mooi hoeft te zijn om naar te kijken.
Bij archieven worden beleid en techniek sterk van elkaar gescheiden. Archieven zijn goed in het bedenken van de perfecte situatie. Het gevolg hiervan is dat er in de archiefsector een woud is ontstaan van standaarden en eisen waaraan voldaan moet worden bij het opzetten van een digitaal archief. Hoe bouw je in deze situatie een e-Depot? Het verhaal van het NA is er één van trial and error. Regelmatig moest men terug naar de tekentafel omdat de daar bedachte aanpak in de praktijk niet of niet goed bleek te werken. De kloof tussen wat kan in theorie en wat bruikbaar is in de dagelijkse praktijk, bleek groot. Op dit moment voldoet het e-Depot van het NA aan level 1 van PREMIS. Voor het metadataschema is MEDUSA gebruikt.

Enkele conclusies:
* Niet alleen denken maar ook doen!
* Focus op de grootste gemene deler en niet op de uitzonderingen.
* Zorg voor werkbaarheid in de praktijk.
* Het gaat er niet om ‘het meest perfecte e-Depot’ te bouwen.
* Vaardigheden van de medewerker zijn heel belangrijk.

Op weg naar duurzame metadata: de Koninklijke Bibliotheek (KB), Lian Wintermans
De KB had een nieuw depot en er moest een XML-schema voor dat depot gemaakt worden. Het nieuwe systeem van de KB moest aan een aantal uitgangspunten voldoen om er zeker van te zijn dat de informatie op een duurzame manier zou worden gearchiveerd en later, waar mogelijk, opnieuw gebruikt zou kunnen worden. Uitgangspunten daarbij waren onder meer dat het systeem gebaseerd zou zijn op het OAIS-referentiemodel, dat de metadata aan standaarden zou voldoen en dat de metadata even duurzaam zou worden bewaard als de objecten waarop ze betrekking hebben. Daarnaast zou het nieuwe systeem zo modulair mogelijk moeten worden opgezet.

Uiteindelijk bleek dat er voor het nieuwe e-Depot een heel nieuw metadatasysteem moest worden ontwikkeld. Een dergelijke ontwikkeling begint met business requirements: wat wil de organisatie met een bepaald systeem, een product of een dienst. Wat moet je weten om duurzame toegang te garanderen voor je materiaal?

Om een goed beeld te krijgen van diverse wensen bij diverse stakeholders worden zij bij het opzetten van een nieuw systeem eveneens aan tafel uitgenodigd. Daarmee krijgt de organisatie goed inzicht in wat er van het systeem wordt gevraagd en wat er dus nodig is. Dat is ook meteen de rode draad in het verhaal van Lian: als een organisatie goed weet wat gewenst is, wordt een oplossing een stuk overzichtelijker en eenvoudiger. Door allerlei stappen en onderdelen van het ontwikkelproces te benoemen kon het daadwerkelijk maken van het metadataschema uiteindelijk worden uitbesteed.

Preservation metadata voor certificering van Trusted Digital Repositories, Data Archiving and Network Services (DANS), Paula Witkamp
DANS heeft als missie het verlenen van duurzame toegang tot digitale onderzoeksinformatie. De functie van een data archief voor wetenschappelijke informatie is om de daarin opgeslagen data te kunnen hergebruiken bij nieuw onderzoek en te kunnen verifiëren. DANS slaat geen big data op. Dat doet SURF/SARA. DANS komt als archief van digitale wetenschappelijke data op de derde plaats.
De taak van DANS is alleen maar om te faciliteren. De data blijft eigendom van de leveranciers en wordt niet bewerkt, maar blijft in de vorm zoals deze is aangeleverd.
Ook DANS heeft ondervonden dat het heel belangrijk is om afspraken te maken over hoe de data wordt aangeleverd. Dat gebeurt nu steeds meer op organisatieniveau. Daarnaast kan worden geconstateerd dat de designated communities in opkomst zijn, zoals bijvoorbeeld CLARIN. Het gebeurt regelmatig dat afspraken over aanlevering van data al in deze communities worden gemaakt. Internationalisering van de afspraken wordt bij DANS dan ook steeds belangrijker. Tevens wordt de manier waarop men van plan is om het archief in de toekomst te gebruiken, ook veel belangrijker.

Essentieel voor een e-Depot is het vertrouwen: leveren gebruikers aan wat ze moeten aanleveren? Doen de repositories wat ze moeten doen? Doe wat je belooft en wees transparant. Om die reden is het systeem van certificering ook heel belangrijk. Er zijn diverse certificeringssystemen waarbij gemeten wordt wat er met elkaar als standaard is vastgelegd.

Als kenmerken van een betrouwbaar repository noemde Paula onder meer:
* het in stand houden van een repository moet onderdeel zijn van de missie van een organisatie
* de repository moet continu gemonitord worden
* er moeten regelmatig risico analyses worden uitgevoerd
* er moet een regelmatige cyclus van audit en/of certificering worden toegepast.

DANS hanteert een pragmatische benadering van het begrip preservation metadata: preservation metadata maakt bij DANS onderdeel uit van zowel de beschrijvende, technische als adminstratieve metadata en is opgeslagen in het op Fedora gebaseerde archiefsysteem van DANS.

Enkele conclusies:
* Als je je e-Depot wilt laten certificeren, dan is ondersteuning van de directie cruciaal.
* De hele organisatie moet bij het proces betrokken worden.
* Maak gebruik van het framework, een soort stappenplan: het is niet nodig om direct op alle punten een 10 te scoren.
De dag werd afgesloten met een levendige discussie. Over preservation metadata is het laatste woord nog lang niet gezegd.

Hieronder kun je de presentaties bekijken:
Presentatie Titia van der Werf / OCLC
Presentatie Daniel Steinmeier / B&G
Presentatie Mette van Essen / NA
Presentatie Lian Wintermans / KB
Presentatie Paula Witkamp / DANS

Categorised in:

Leave a Reply

Your email address will not be published. Required fields are marked *Translate »
Top