• nl

Zoeken in gedistribueerde erfgoedinformatie

Steeds meer erfgoedinstellingen maken hun erfgoedinformatie online beschikbaar. En steeds vaker publiceren zij deze informatie als Linked Data, een methode om informatie gestructureerd aan te bieden. Maar hoe krijgen gebruikersapplicaties – zoals websites en apps – vervolgens toegang tot deze informatie? Hoe weten deze applicaties welke instelling welke informatie heeft om te presenteren aan gebruikers? Hier bestaan geen pasklare oplossingen voor. Daarom doet het Netwerk Digitaal Erfgoed onderzoek naar zoektechnieken die bijdragen aan de ontwikkeling van het zogeheten gedistribueerd netwerk van erfgoedinformatie.

Eerste resultaat: theoretisch model ‘Source selection’

Het Netwerk Digitaal Erfgoed heeft een eerste onderzoek laten uitvoeren naar de technische mogelijkheden voor de erfgoedsector. Dit onderzoek verkende de mogelijkheden van source selection, een zoekmethode om de meest relevante bronnen te selecteren die een zoekvraag kunnen beantwoorden. Vervolgens is een theoretisch model uitgewerkt waarmee source selection toegepast kan worden. Het model bestaat uit drie stappen:

  1.  Instellingen publiceren niet alleen hun erfgoedinformatie, maar ook samenvattingen van deze informatie. Een samenvatting bevat de belangrijkste kenmerken en maakt het mogelijk om snel inzicht te krijgen in het aanbod van een instelling, zonder dat alle informatie beschouwd moet worden. Een samenvatting wordt geautomatiseerd samengesteld en vervolgens als Linked Data ontsloten, net zoals de gebruikelijke informatie van instellingen.
  1. Instellingen maken kenbaar dat zij samenvattingen hebben. Dit doen ze door deze aan te melden bij een gezamenlijke voorziening, een register. Het register verzamelt de samenvattingen en maakt ze doorzoekbaar. Het register weet daardoor welke informatie bij welke instellingen beschikbaar is.
  1. Gebruikersapplicaties raadplegen het register bij het zoeken naar erfgoedinformatie. Bijvoorbeeld: stel dat een applicatie informatie over mode wil presenteren. Hiervoor bepaalt de applicatie eerst welke kenmerken verband houden met mode, zoals kledingsoorten of namen van ontwerpers. Vervolgens zoekt de applicatie in het register naar deze kenmerken. Het register gebruikt hiertoe zijn samenvattingen en geeft aan de applicatie terug welke instellingen meer informatie over de kenmerken hebben. De applicatie kan deze informatie daarna bij de betreffende instellingen opvragen.

Lees het hele rapport [PDF].

Het onderzoek is gedaan door IDLab, een samenwerking tussen onderzoekscentrum imec en de universiteiten van Antwerpen en Gent. IDLab is gespecialiseerd in internettechnologie en data science, en maker van innovatieve webtoepassingen zoals Linked Data Fragments en Comunica. Daarnaast is informatiewetenschapper Herbert Van de Sompel (Data Archiving and Networked Services – DANS) betrokken als adviseur. Van de Sompel is mede-bedenker van protocollen als Memento en ResourceSync.

Presentatie op SEMANTiCS-conferentie

De resultaten van het onderzoek zijn in september 2019 gepresenteerd bij SEMANTiCS, de toonaangevende Europese conferentie over semantische webtechnologie en kunstmatige intelligentie. Lees de onderzoekspaper [PDF] zoals die is ingediend voor de conferentie.

Vervolgonderzoek

De toepassing van source selection, volgens het model van het onderzoek, lijkt veelbelovend. Maar het roept ook nieuwe vragen op. Gaat deze benadering op grote schaal werken? Is het bruikbaar voor de Nederlandse erfgoedsector? Dit gaat uitgediept worden in een vervolgonderzoek naar de mogelijkheden van gedecentraliseerde Linked Data en de toepassing van Solid, een nieuwe manier om decentrale informatie op het web vindbaar en toegankelijk te maken. Dat onderzoek wordt gecoördineerd door de Universiteit Gent en de Koninklijke Bibliotheek (KB). Een onderzoeker wordt binnenkort aangetrokken.

Meer informatie

Wil je meer weten over het onderzoek? Neem contact op met Enno Meijers, domeinmanager van Netwerk Digitaal Erfgoed-Bruikbaar.
Translate »
Top