Vier opvallende ontwikkelingen in webarchivering vanaf de IIPC Conference 2026
KB-collega's bezochten de IIPC Conference en namen deze inzichten mee.
Voor iedereen die zich met webarchivering bezighoudt, is het een jaarlijks weerzien: de Web Archiving Conference van de International Internet Preservation Coalition. Dit keer in Brussel. Van 20 tot en met 24 april stonden workshops, lezingen, posterpresentaties, werkgroepen en vergaderingen allemaal in het teken van webarchivering. Collega’s van de KB nationale bibliotheek waren erbij.
Wat AI betekent voor webarchivering
AI kreeg veel aandacht, met voor- en nadelen. AI-tools kunnen webarchieven van meer context voorzien, bijvoorbeeld door automatisch metadata toe te voegen. Of om voorspellingen te doen over de periode waarin een website is gemaakt, of wanneer er een grote update heeft plaatsgevonden.
‘Zo proberen we bij websites waarvan vaak alleen de harvestdatum bekend is, toch te achterhalen wanneer deze zijn gemaakt,’ vertelt Anouk Flinkert, stagiaire bij de KB en student Digital Humanities and Digital Knowledge aan de Universiteit van Bologna.
Maar AI brengt ook uitdagingen met zich mee. Websites worden steeds beter in het detecteren en blokkeren van AI-bots. Hierdoor kunnen organisaties worden geblokkeerd. Het automatisch ophalen van websites lukt dan niet altijd. Veel erfgoedorganisaties zien dit als een onwenselijke en weinig duurzame ontwikkeling.
Klimaatimpact meten
Er werden diverse onderzoeksresultaten en experimenten gedeeld. Een mooi voorbeeld: de Wasteback Machine van David Mahoney (University of Edinburgh). Deze tool meet de toenemende klimaatimpact van websites. ‘Een actueel onderwerp, nu websites steeds complexer, grafischer en AI-gegenereerd worden. Ze gebruiken daardoor meer data en energie,’ zegt Anouk.
Makkelijker data vinden
Organisaties bewaren websites in het WARC-formaat (Web-ARChive). Onderzoeker webarchivering Iris Geldermans noemt dit ‘een onoverzichtelijk bestand vol data en metadata. Het is moeilijk om ermee te werken en lastig te begrijpen voor onderzoekers.’ Daardoor is het vinden van de juiste data voor onderzoek een uitdaging.
Een tool die het vinden van de juiste data mogelijk makkelijk gaat maken is WARCbench, ontwikkeld door Rebecca Cremona van het Harvard Library Innovation Lab. Deze tool analyseert en bewerkt data uit WARC-bestanden. Hierdoor wordt het werken met grote hoeveelheden gearchiveerde websites eenvoudiger.
Kracht van samenwerking
De conferentie liet opnieuw zien dat de webarchiveringscommunity de nadruk legt op samenwerken, leren en delen. Verschillende disciplines komen samen om de soms steeds groter wordende obstakels aan te pakken. Specialisten en onderzoekers helpen elkaar en delen ervaringen en oplossingen.
Hoofd Collectievorming Jasper Faase: ‘Mooi om te zien dat in dit zich snel ontwikkelende werkveld met samenwerking, enthousiasme en vindingrijkheid zoveel wordt bereikt. Dit gebeurt vaak met beperkte middelen.’
Webarchivering ook thema op Werelddag
Wil je meer weten over de resultaten van dit congres, neem dan contact op met Sophie Ham (Sophie.Ham@KB.nl). Ook tijdens de Werelddag van de digitale duurzaamheid op 5 november is webarchivering weer een thema.