Trends in tools om digitale collecties te verwerken
Steeds meer divers digitaal materiaal stroomt de archieven van erfgoedinstellingen binnen. Omdat het veelal om grote hoeveelheden bestanden gaat, is een automatische verwerking daarvan noodzakelijk. Welke preserveringstools zetten de instellingen hierbij in? Deze en andere vragen legde Ania Molenda, projectleider Preserveringstools bij het Netwerk Digitaal Erfgoed, voor aan het erfgoedveld. De resultaten verwerkte ze in het rapport ‘The Use of Preservation Tools among Dutch Heritage Organizations’ dat vandaag wordt gepubliceerd.
In 2018 onderzocht Joost van der Nat of Nederlandse erfgoedinstellingen de beschikking hadden over een digitaal archief of een e-depot. De 27 partijen die deze vraag met ja beantwoordden, heeft Ania Molenda in 2019 voor een vervolgonderzoek benaderd. 22 instellingen, variërend van een bibliotheek en archief tot een museum, hebben een vragenlijst ingevuld over het gebruik van preserveringstools. Centraal stonden de tools die de instellingen toepassen bij het verwerken van digitale bestanden voordat ze in een archief of een e-depot opgenomen worden. Dit wordt pre-ingest en ingest genoemd.
(Pre-)ingest
In de ideale situatie maakt een erfgoedinstelling afspraken met archiefvormende partijen om digitaal materiaal volgens bepaalde richtlijnen aan te leveren, zegt Ania Molenda. ‘Kennisinstellingen bijvoorbeeld vragen onderzoekers om hun onderzoeksdata volgens bepaalde eisen aan te leveren. Dat heeft als voordeel dat het materiaal meteen de zogeheten ingest-fase in kan gaan. Of anders gezegd: het materiaal is al gereed voor opname in het archief. Overigens vindt er nog wel enige controle plaats. Met behulp van preserveringstools kun je bijvoorbeeld nagaan of het aangeleverde materiaal geen beschadigde bestanden bevat.’
Toch is de praktijk weerbarstig. Twee derde van de erfgoedinstellingen die aan het onderzoek deelnamen, gaf aan dat ze niet in staat zijn om zulke afspraken voor de aanlevering van materiaal te maken. ‘Particuliere archiefvormers bijvoorbeeld hebben niet altijd de mogelijkheid om het materiaal volgens bepaalde richtlijnen voor te bereiden.’ In dat geval moet een erfgoedinstelling in de pre-ingest het binnengekomen materiaal eerst nog voorbereiden voordat het kan worden opgenomen in het archief. ‘Met bepaalde preserveringstools kun je bijvoorbeeld nagaan of het te archiveren materiaal verborgen, beveiligde of moeilijk te identificeren bestanden bevat. De tools helpen ook met de ordening en beschrijving van het materiaal zodat de bestanden later makkelijk te vinden zijn in het archief.’
‘Met bepaalde preserveringstools kun je bijvoorbeeld nagaan of het te archiveren materiaal verborgen, beveiligde of moeilijk te identificeren bestanden bevat.’
Digitale duurzaamheid
Waarom is die voorbereiding van het te archiveren materiaal zo belangrijk? Ania: ‘Het heeft te maken met het duurzaam bewaren van je materiaal. En daarvoor heb je informatie over de bestanden nodig. Neem het voorbeeld van de bestandsformaten. Het ene bestandsformaat is nu eenmaal duurzamer dan het andere. En als erfgoedinstelling wil je alleen die bestandsformaten accepteren waarvan je weet dat je ze lang kunt bewaren.’
111 preserveringstools
In totaal hebben de onderzochte instellingen nu 111 verschillende preserveringstools in gebruik. Gemiddeld gebruikt een instelling tussen de een en tien tools. ‘Ze worden toegepast voor zowel pre-ingest als ingest,’ zegt Ania. Opvallend: in de gesprekken die archiefinstellingen hebben met de archiefvormers over het aan te leveren materiaal, worden de preserveringstools niet of nauwelijks ingezet om te kijken of het materiaal voldoet aan de eigen richtlijnen. Juist in deze fase zou je – samen met de archiefvormer – met deze tools alvast het op te nemen materiaal kunnen analyseren.’
Verder blijken de onderzochte archiefinstellingen nauwelijks preserveringstools te gebruiken voor het ontdubbelen, het identificeren van afhankelijkheden tussen bestanden en voor het identificeren van encryptie of met een wachtwoord beveiligde bestanden. Ania: ‘Veel instellingen willen zo’n encryptiedetectietool graag inzetten, want niemand wil beveiligde bestanden in zijn archieven opnemen. Maar vooralsnog is onbekend welke tool hiervoor het beste geschikt is.’
Nieuwe bestandsformaten
Ania vroeg de instellingen bovendien voor welke uitdagingen ze zich gesteld zien. ‘De collecties veranderen in rap tempo doordat instellingen bijvoorbeeld steeds vaker sociale media, websites en e-mail gaan verzamelen. Deze archiefobjecten hebben elk weer nieuwe bestandsformaten. En dat vraagt om andere tools om de sociale media et cetera te kunnen verzamelen en vervolgens te verwerken zodat ze veilig bewaard kunnen worden. Kortom, het aantal te gebruiken preserveringstools zal in de komende jaren toenemen.’
Van elkaar leren
Uit Ania’s onderzoek blijkt dat instellingen voor dezelfde zaken vaak andere termen gebruiken. ‘De ene instelling spreekt van een “archief”, de andere van een “collectie”. De ene organisatie noemt een proces “pre-ingest”, de andere “ingest”. Dat is omdat hun processen anders ingericht zijn en omdat ze bijvoorbeeld andere wettelijke verplichtingen hebben.’
Ook al staan vele instellingen nu voor heel uiteenlopende uitdagingen bij de inrichting van pre-ingest en ingest voor hun digitale collecties, ze kunnen volgens Ania in hun preserveringsprocessen vaak dezelfde tools gebruiken. ‘Als de instellingen zich van die verschillen meer bewust zijn, kunnen ze hierover met elkaar het gesprek aangaan en van elkaars ervaringen leren. En instellingen die gaan starten met het inrichten van pre-ingest en ingest, kunnen veel leren van collega-instellingen. Zij hoeven niet opnieuw het wiel uit te vinden.’
Vervolg project
Het project Preserveringstools krijgt een vervolg. ‘Nu we weten welke preserveringstools het erfgoedveld gebruikt en welke ze mist, gaan we kijken waar het Netwerk Digitaal Erfgoed ondersteuning kan bieden. Denk bijvoorbeeld aan hulp bij de doorontwikkeling van open source preserveringstools die voor meerdere instellingen interessant zijn, maar financiering missen. Of neem kennisontwikkeling en -deling, zoals het beschrijven van best practices. Op die manier kunnen we straks laagdrempelig kennis delen met instellingen die beginnen met de automatische verwerking van digitale collecties.’
Meer weten?
Lees het hele verslag van het onderzoek ‘The Use of Preservation Tools among Dutch Heritage Organizations‘. De details van de enquête zijn in te zien in de Appendixes.