Softwarearchivering
teeds meer archieven komen als ‘born digital’-bestanden bij erfgoedinstellingen binnen. Om deze toegankelijk te houden, moet in veel gevallen ook de bijbehorende software duurzaam bewaard blijven. Bovendien maken softwareprogramma’s inmiddels ook zelf deel uit van digitaal erfgoed. Hoe kan jouw organisatie aan de slag met softwarearchivering?
Waarom software archiveren?
Er zijn twee goede redenen om het archiefbeheer van software (softwaresustainability) structureel op te pakken. De eerste: software is onderdeel van ons digitaal erfgoed. Van eenvoudige tekstverwerkingssoftware tot complexe apps en games, samen vertellen ze het verhaal over de opkomst en ontwikkeling van de digitale technologie in de maatschappij.
Het gemiddelde softwareprogramma werkt zo’n zes tot acht jaar. Dit betekent dat data niet altijd toegankelijk blijft als de betreffende software (en hardware) niet meer werkt. Bijvoorbeeld onderzoekers kunnen gegevens dan niet meer inzetten voor analyse en vervolgonderzoek. En dat is de tweede reden om software te archiveren.
Praktisch bezwaren
Toch houden nog maar weinig Nederlandse erfgoedinstellingen zich hiermee bezig. En degenen die er ervaring mee hebben, nemen software vooralsnog mondjesmaat op in hun archieven. Dit komt omdat er verschillende uitdagingen zijn. Er is veel technische kennis nodig om bewaarde software ook ‘aan de praat te houden’. Bewaren alleen is immers niet genoeg, de software moet ook werken. Daarnaast is het niet altijd mogelijk om software ‘aan de praat’ te houden vanwege auteursrechtelijke belemmeringen. En dan is er nog de vraag welke software wel en welke niet te bewaren.

Programma Digitaal Erfgoed Houdbaar
Het thema softwarearchivering past in het programma Digitaal Erfgoed Houdbaar van het NDE. In dit programma werken erfgoedorganisaties samen aan het veiligstellen van hun digitale informatie.
Lees meer over dit programmaOnderzoek en kennis
Binnen het Netwerk Digitaal Erfgoed worden erfgoedinstellingen op weg geholpen om de eerste stappen te zetten met softwarearchivering. Patrick Aerts bracht in 2016 in kaart hoe het gesteld is met de softwaresustainability bij Nederlandse erfgoedinstellingen. Hij concludeerde dat softwarearchivering een complexe zaak is, maar dat de aandacht voor het onderwerp gelukkig snel toeneemt.
Vervolgens ging Jesse de Vos in gesprek met instellingen die al software in de collectie hebben opgenomen. Welke problemen komen zij tegen en waar ligt hun kennisbehoefte? Voor instellingen blijkt het belangrijk om software expliciet in het duurzaamheidsbeleid op te nemen en te investeren in IT-vaardigheden van archivarissen.
Emulation as a Service (EaaS)
Het bewaren en beschikbaar houden van oude software is nodig wanneer je emulatie als preserveringsstrategie gaat inzetten. Oftewel: het nabootsen van een browser in een andere computeromgeving. Hiermee is het mogelijk de verouderde hard- en softwareomgeving waarbinnen het bestand oorspronkelijk functioneerde, te simuleren op een hedendaags computersysteem.
Is digitale informatie complex, bijvoorbeeld als er veel dynamische aspecten zijn, dan is emulatie een logische oplossing. Zo zorgen webbrowsers ervoor dat websites getoond kunnen worden. Wanneer we websites archiveren, is het ook van belang te kijken naar de browsers die gebruikt worden. Vanuit het NDE-project Softwarearchivering is een onderzoeksrapport verschenen over het emuleren van webbrowsers.
Maar hoe maak je emulatie toegankelijk voor een grote groep archiefbewaarders die hiervoor niet de technische kennis in huis heeft? Daarvoor is er een EaaS-framework ontwikkeld, Emulation as a Service. Archiefbewaarders kunnen hiermee gemakkelijk emulatieomgevingen samenstellen, bewaren en delen.
Archiveren aan de server-kant
Bij het archiveren van websites blijkt dat er steeds meer dynamische sites bestaan, die lastig te bewaren zijn voor erfgoedinstellingen. Op dynamisch websites vinden er aan de achterkant, de serverzijde, allerlei bewerkingen plaats om gegevens op te halen, te presenteren en op te slaan. Deze bewerkingen bieden daarmee de gebruiker aan de voorkant, de clientzijde, een unieke ervaring. Denk aan interactieve websites met Flash-applicaties, of Javascript. De inhoud van een server kan bijvoorbeeld scripts, media en databases bevatten die worden beheerd door de makers van de website.
Om de dynamische websites die het web nu rijk is te kunnen bewaren, zouden erfgoedinstellingen de aandacht kunnen richten op de serverzijde in plaats van de huidige ‘crawling’-methodiek te gebruiken. Dit betekent dat een archief een websitebouwer of -beheerder benadert om de bestanden vanaf de server te ontvangen. Vanuit het NDE-project Softwarearchivering is een onderzoeksrapport gepubliceerd waarin dit nieuwe werkterrein wordt verkend.
Metadata nog een uitdaging
Jesse de Vos keek samen met Eoin O’Donohoe en Claudia Röck ook naar metadata om software te beschrijven. Alleen zo kun je later nagaan welke hard- en software je bijvoorbeeld nodig hebt om de software in de toekomst te laten draaien.
‘Er is geen pasklaar antwoord te geven op de vraag welke metadata een erfgoedinstelling precies moet vastleggen’, stelt Jesse. ‘Elke organisatie die zich met softwarearchivering bezighoudt, zal op basis van haar specifieke context, ambities, gebruikers en het te archiveren type software na moeten gaan welke metadata voor haar essentieel is. Het rapport biedt voor zo’n inventarisatie veel aanknopingspunten en laat ook zien hoe je deze kunt toepassen.’
Tot slot
Met dit rapport over metadata komt het project Softwarearchivering binnen het Netwerk Digitaal Erfgoed ten einde. ‘Een inventarisatie in 2019-2020 liet zien dat softwarearchivering in de Nederlandse erfgoedsector nog in de kinderschoenen stond,’ zegt Jesse. ‘We hopen dat de diverse verslagen en ervaringen vanuit dit project de sector een stap verder hebben kunnen helpen.’
Downloads
- Patrick Aerts, Software Sustainability (2016)
- Jesse de Vos e.a, Software-archivering en de Nederlandse erfgoedsector (2020)
- Eoin O’Donohoe, Emulation as a Service for heritage institutes. Test report (2020)
- Claudia Roeck, Web browser characterisation, emulation, and preservation (2021)
- Eoin O’Donohoe, Server-Side Web Archiving (2021)
- Eoin O’Donohoe; Claudia Röck; Jesse de Vos, Preservation Metadata for Software (2021)