• nl
  • en
beeldband

Metadata

4 januari 2012 Gepubliceerd door 1 Commentaar

Metadata zijn van cruciaal belang voor duurzame toegankelijkheid en interoperabiliteit

Ieder digitaal bestand bestaat uit bits (enen en nullen). Die bits kunnen alleen begrepen worden als ze zijn voorzien van allerhande extra informatie, metadata genoemd. Metadata geven informatie over welke hardware en software gebruikt is, waar het bestand vandaan komt, hoe het in elkaar zit, wat ermee gebeurd is in het digitaal archief ,enzovoorts. Zonder metadata geen hergebruik!

http://mialnttf.tumblr.com/

Het OAIS-model definieert de soorten metadata die van belang zijn voor duurzame toegankelijkheid. Er zijn drie hoofdsoorten, die weer zijn onderverdeeld. Hier wordt het lastig om de begrippen goed te vertalen, dus zal ik de Engelse termen gebruiken.

  • Representation information: wat moet je weten om het bestand te kunnen begrijpen en te kunnen gebruiken (hardware, software, enz.)
  • Preservation description information: wat is het digitale bestand precies en waar komt het vandaan (referenties als bijv. ISBN, context informatie, informatie over toegangsrechten, informatie over veranderingen aan het bestand in het archief)
  • Packaging: de informatie die nodig is om het bestand en de diverse soorten metadata samen te brengen in een ‘package’.

Hoeveel metadata er nodig is hangt af van het beoogde gebruik en van de doelgroep, de designated community (zie ook: Strategie en beleid: voor wie doen we het?). Een voorbeeld:

bitstream: 01 06 2012 13.59

Voor een Nederlandse doelgroep anno 2012 zal duidelijk zijn wat hier staat: 1 juni 2012, 13.59 uur. Maar als het om klimatologische gegevens gaat die over 60 jaar nog gebruikt gaan worden en wellicht in Amerika, dan moet er allerlei toelichting bij: is de datum 1 juni of 6 januari? Is 2012 = Christelijke jaartelling, Joodse jaartelling, of …. Is 13.59: zomertijd of wintertijd; en in welke tijdzone?

Metadata: vaak bottleneck in het proces
Metadata vormen ook vaak een bottleneck in het proces. Het digitaal archief wil de benodigde metadata, maar de producent heeft vaak geen tijd of niet genoeg motivatie om al die metadata ook te leveren. En vervolgens moeten de systemen van de producent en het digitaal archief elkaar precies snappen, wat ook niet altijd lukt [zie, o.a. Seamus Ross’ verhaal over ingest, blogpost]. Wat zijn de mogelijkheden om die bottleneck te verhelpen? In zijn algemeenheid: zo vroeg mogelijk in het proces ingrijpen en een metadataschema opstellen en afspreken.

Daarin wordt vastgelegd welke informatie er in welke metagegevenselementen moet worden ondergebracht, en wat daarbij het verplichtingenregime is (de spelregels). Zonder zo’n schema is elke uitwisseling van informatie (hergebruik) een welhaast onmogelijke exercitie omdat er telkens opnieuw “mappings” (vertaalslagen) gemaakt moeten worden tussen bron- en doelsystemen.

Er zijn diverse manieren om de aansluiting tussen producent en archief in te richten:

  • Het ideaal: producent en digitaal archief maken goede afspraken over metadata en automatiseren de aansluiting. Daarvoor is nodig dat het digitaal archief goede contacten legt met de producenten, actief naar voren gaat in het proces, want duurzame toegankelijkheid begint bij creatie.
  • Adviezen van het digitaal archief aan de producent, bijvoorbeeld onderwijs in data management aan toekomstige wetenschappers.
  • Automatiseren van de aansluiting tussen producent en digitaal archief. Het Nationaal Archief werkt hieraan met de rijksoverheid.
  • En soms: roeien met de riemen die u hebt; achteraf metadata toevoegen. Dit is kostbaar, maar soms niet te vermijden.

 

Meer informatie

Cultureel erfgoed: een uitgebreid dossier over metadata bij Digitaal Erfgoed Nederland, http://www.den.nl/thema/37/metadata

Voor overheden/archieven: richtlijnen van het Nationaal Archief, en richtlijnen voor het e-Depot

Where to start when creating a metadata schema?, NISO

 

IA/update juni 2012, met dank aan Jorien Weterings, Nationaal Archief

Categorie :Geen categorie

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *Translate »
Top