• nl
  • en
beeldband

Maatschappijkritisch of misschien zelfs post-truth? De opbouw van een actuele webcollectie bij de KB

11 oktober 2017 Gepubliceerd door Laat uw gedicht achter

De Koninklijke Bibliotheek is aan het bouwen aan een webcollectie om zo ook het online Nederlands cultureel erfgoed voor de toekomst te kunnen bewaren. Websites die zich uitspreken over actuele ontwikkelingen krijgen daarbij extra aandacht. Laurie Hasselt en Kees Teszelszky (beiden Koninklijke Bibliotheek) geven een tussentijdse update van dit project.

“De Koninklijke Bibliotheek (KB) streeft ernaar een zo representatief mogelijk deel van het Nederlandse web in haar webcollectie te bewaren. Het belangrijkste criterium om een website te selecteren en te archiveren is de waarde als Nederlands cultureel erfgoed. Het te verzamelen digitale object moet van belang zijn voor de bestudering van de Nederlandse geschiedenis en cultuur en actuele maatschappelijke trends, nu en in de toekomst. Bij de selectie wordt rekening gehouden met andere instellingen die websites archiveren, zoals het Nederlands Instituut voor Beeld en Geluid in Hilversum en het Documentatiecentrum Nederlandse Politieke Partijen in Groningen. Daarom verzamelt de KB geen sites van omroepen of politieke partijen.

Tekening gemaakt door Cathelijne Hoorn (KB)

Aanpassen selectiecriteria

Van 2012 -2016 is in het project “Webart” door Hugo Huurdeman en van 2016-2017 is door Kees Teszelszky onderzoek gedaan naar de selectie door de KB voor de webcollectie. Een uitkomst van beide onderzoeken was dat de selectiecriteria veranderd dienen te worden als de KB een representatieve collectie wil opbouwen van relevante websites die als historische bron van onze tijd kunnen worden gebruikt door historici in de toekomst. Tot nu toe bewaarde de KB vooral websites over geschiedenis of geschiedenisbronnen, zoals websites van musea, historische verenigingen en erfgoedinstellingen. Veel minder aandacht ging uit naar sites die in de toekomst als bron kunnen worden gebruikt van de geschiedenis. De belangrijkste oorzaak was een gebrek aan tijd en middelen: het totale Nederlandse nationale domein omvat meer dan acht miljoen websites. Het is bijzonder veel werk om hier een relevante en representatieve selectie van te maken.

Speciale webcollectie “Actuele websites”

Om aan de behoeftes van toekomstige onderzoekers tegemoet te komen, bouwt de KB nu een speciale webcollectie van “actuele websites” op. Deze collectie omvat sites uit het Nederlandse webdomein die een bron van of reflectie op een actueel en misschien zelfs wel omstreden fenomeen in de maatschappij zijn. Hierbij valt te denken aan maatschappijkritische, al dan niet extreme of onalledaagse denkbeelden, nepnieuws en sites van complotdenkers. Deze websites kunnen online voorbodes zijn van nieuwe ontwikkelingen in de maatschappij.

Zo is er sinds de verkiezing van Donald Trump als president van de Verenigde Staten veel geschreven over de rol van internetfora als 4chan en Reddit, waarop zijn aanhang zich verenigde en waardoor zijn populariteit tot ongekende hoogte kon stijgen. Hieruit blijkt des te meer dat websites een belangrijke rol spelen in maatschappelijke ontwikkelingen, en als zodanig zeer de moeite waard om bewaard te worden voor toekomstig onderzoek.

Tekening gemaakt door Cathelijne Hoorn (KB)

90 dagen online

Actuele born-digitalbronnen van ons bestaan zijn bijzonder vluchtig. De meeste webpagina’s op het web zijn gemiddeld maar 90 dagen online. Bovendien is het moeilijk om dergelijke bronnen in de oorspronkelijke context vast te leggen. Een kritisch commentaar op bijvoorbeeld een socialemediasite heeft weinig historische waarde als het medium waar dit is gepubliceerd niet is bewaard en als de bron waar de auteur op reageert niet bekend is. Als we websites archiveren waar dergelijke ideeën worden geuit, dan is het ook belangrijk om ook de context van deze ideeën en de site te bewaren.

Zorgvuldig selecteren

De KB-webcollectie is zorgvuldig tot stand gekomen. Op grond van een linkextractie van een wetenschappelijk proefschrift van Jelle van Buuren over complotdenkers en een artikel van wetenschappers, aangevuld met netwerkanalyses op het web en suggesties van diverse deskundigen, is een voorlopige selectie samengesteld van 500 relevante en actuele sites. Op dit moment wordt deze selectie kritisch bekeken, geanalyseerd en beschreven in een collectiebeschrijving en uiteindelijk voor zover mogelijk gearchiveerd.

Bonte stoet websites

Met de selectie van deze sites beoogt de KB allerminst volledigheid na te streven, maar wel representativiteit van het brede scala aan denkbeelden dat er vandaag de dag circuleert in Nederland. Dat levert een bonte stoet aan websites op: van anarchisten tot nationalisten en van ‘eindtijdpreppers’ tot aanhangers van de platte-aarde-theorie. Achter die ogenschijnlijke veelzijdigheid schuilt echter ook een gemene deler: het gros van de websites is kritisch ten aanzien van de overheid en vrijwel alles waar het predicaat ‘mainstream’ aan gegeven kan worden. Op veel websites wordt opgeroepen niet alles te geloven, vooral zelf onderzoek te doen of om ‘de ogen te openen’ of ‘wakker te worden’. In die zin kunnen de sites wellicht als post-truth opgevat worden, wat door het Oxford Dictionary in 2016 verkozen werd tot woord van het jaar en een toestand beschrijft waarin objectieve feiten minder invloed hebben op het vormen van de publieke opinie dan beroepen op emotie en persoonlijke overtuigingen. Met nadruk probeert de KB daarmee niet de waarheid te documenteren of te bepalen wat waar is en wat niet, maar eerder een spiegel van de tijd te bieden die laat zien hoe er vandaag de dag wordt omgegaan met het begrip waarheid.

Criteria vastleggen

Bij de opbouw van de collectie worden de suggesties voor verbetering van het proces van webarchivering uit de eerdere onderzoeken naar webarchivering bij de KB overgenomen. Zo wordt veel aandacht besteed aan het beschrijven van de gebruikte selectiecriteria en de uitsluitingscriteria, de documentatie van de gevolgde werkwijze en wordt ernaar gestreefd zoveel mogelijk contextinformatie van de te archiveren bronnen vast te leggen. Zo wordt de dataset verrijkt met extra metadata. Bovendien worden op de finale lijst van websites ook die sites vermeld die niet kunnen of niet mogen worden gearchiveerd om technische en juridische redenen. Op deze manier zal in de toekomst duidelijk worden wat de oorspronkelijke samenstelling is geweest van de collectie die de collectiespecialisten voor ogen hadden en wat hiertoe zou hebben behoord. De lijst van sites is daarom uiterst geschikt om in de toekomst te worden gebruikt als dataset voor onderzoek naar de actualiteit van Nederland op het web rond 2017.

Linkstructuur behouden

De data van de collectie wordt op verschillende manieren vastgelegd. Behalve dat de webadressen worden opgenomen in de lijst met uitgebreide beschrijvingen en de sites waar dat kan worden gearchiveerd, wordt tevens de onderlinge linkstructuur tussen de sites in de collectie bewaard. Hiermee zal in de toekomst duidelijk worden welke sites naar elkaar verwijzen en kan bovendien de linkwolk van deze collectie of de websfeer (het geheel aan hyperlinks tussen de sites van de collectie en naar andere sites buiten de collectie) worden gereconstrueerd. Dergelijke contextinformatie gaat meestal verloren als alleen een afzonderlijke website is gearchiveerd en deze wordt opgenomen in een webcollectie. Bovendien zal hiermee toch informatie kunnen worden vastgelegd over sites die niet gearchiveerd konden worden. Tot slot laat de netwerkanalyse zien welke sites een relatief zwaarder gewicht hebben in de collectie en waarschijnlijk belangrijker zijn, omdat hier vaker naar wordt verwezen.

Links en rechts

Als experiment zijn twee linkanalyses uitgevierd met de tool IssueCrawler van het Digital Humanities Initiative van ongeveer 20 sites in twee afzonderlijke categorieën: “rechts” georiënteerde sites en “links” georiënteerde sites. Hierbij worden alle links geanalyseerd die vanuit de geselecteerde sites naar andere sites lopen. De namen van sites die in de visualisatie worden getoond, zijn dus niet alleen de sites die zijn geselecteerd voor de collectie, maar zijn ook de sites waarnaartoe wordt verwezen. Ook sociale media als Twitter en buitenlandse sites worden gepresenteerd in de visualisatie.

De linkstructuur van de collectie “rechts” zag er als volgt uit:

 

De linkstructuur van de categorie “links” had het volgende uiterlijk:

Daar er evenveel sites zijn meegenomen in de beide analyses, valt op dat de “linkse” collectie veel meer onderlinge links kent. Het lijkt erop dat maatschappijkritische “linkse” sites veel meer verbindingen onderhouden met geestverwante sites dan de rechtse. Daarnaast lijkt het alsof de “linkse” sites veel meer vertakkingen naar het buitenland en een veel groter virtueel netwerk hebben. Ook ziet het ernaar uit dat de vredesbeweging een belangrijk thema is van de sites binnen deze collectie: veel sites verwijzen naar websites die de vrede als onderwerp hebben. Kortom: linkanalyse kan een belangrijk onderdeel van webarchivering zijn, omdat op deze manier contextinformatie kan worden bewaard die niet op een andere manier is vast te leggen.”

Voor meer informatie over het webarchief van de Koninklijke Bibliotheek kunt u kijken op de website van de KB. Heeft u verdere vragen, neem dan contact op met Kees Teszelszky. De KB werkt met andere partijen onder de vlag van NCDD/NDE samen in een landelijke expertgroep over webarchivering.

Gecategoriseerd in :

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *



Translate »
Top