Voor zijn impactanalyse gebruikt het Nationaal Archief FITS en C3PO. Hoe werken deze pre-ingest-tools?

16 september 2021


I

In een serie van vijf best practices vertellen erfgoedinstellingen welke preserveringstools ze gebruiken bij de (pre-)ingest. Oftewel bij het voorbereiden van digitale bestanden zodat ze voldoen aan de eisen voor duurzame archivering. In de laatste aflevering deelt het Nationaal Archief zijn ervaringen met de pre-ingest-tools FITS en C3PO. Ze worden gebruikt bij de impactanalyse van complexe digitale archieven.


Beeld: viarami via Pixabay

Beeld van een digitaal archief

Wanneer een organisatie een digitaal archief overdraagt, wil het Nationaal Archief (NA) graag aantal dingen weten: wat zit er precies in het archief, hoe is het geordend en gemetadateerd? En ook: hoe kan de overbrenging van het archief praktisch plaatsvinden?

Met een impactanalyse krijgt het NA hier uitgebreid zicht op. Bovendien maakt zo’n analyse duidelijk of er nog bepaalde maatregelen nodig zijn – en wie deze moet nemen. Zo kunnen er bijvoorbeeld versleutelde bestanden in het archief zitten, waar de aanleverende partij mee aan de slag moet.

Geen tussendoorklusje

Het NA maakt een impactanalyse altijd samen met de organisatie die het archief aanlevert. Het is zeker geen tussendoorklus. Meestal kost het een paar weken tot een paar maanden doorlooptijd en er zijn verschillende mensen met verschillende rollen bij betrokken.

Werk vergemakkelijken

Om de impactanalyse gemakkelijker te maken gebruikt het NA twee pre-ingest-tools, FITS en C3PO. FITS is een bundeling van afzonderlijke opensourcetools en laat zien welke bestandsformaten er in het digitaal archief zitten (identificatie) en of de bestanden voldoen aan de vereisten voor het bestandsformaat (validatie). Ook geeft FITS de kenmerken (technische metadata).

Omdat het niet zo eenvoudig is om de verkregen xml-bestanden met informatie te interpreteren, komt C3PO om de hoek kijken. C3PO staat voor ‘Clever, Crafty Content Profiling of Objects’.

C3PO zet de FITS-bestanden om en groepeert ze op verschillende manieren. Zo krijg je een profiel van een digitaal archief – en dus inzicht in de inhoud ervan. Bijzonder aan deze tool is dat de informatie op een inzichtelijke manier wordt gevisualiseerd: je ziet snel welke typen informatieobjecten (zoals pdf-bestanden, databases en software) er zijn, maar ook welke problemen nog opgelost moeten worden.

Niet makkelijk in gebruik, wel veel details

FITS en C3PO vragen van de gebruiker soms aardig wat (technische) ervaring om de tools werkend te krijgen en ook kennis om ze vervolgens in de praktijk te gebruiken.

Maar kun je met deze tools overweg, dan krijg je ook wat. De profielen van digitale archieven op basis van FITS en C3PO zijn heel gedetailleerd. Daardoor bewijzen deze twee tools vooral hun waarde bij de grootschalige instroom van complexe digitale archieven, oftewel archieven met vele bestandstypen.

Meer weten over de toepassing van beide tools, de geleerde lessen van het Nationaal Archief en de toekomstplannen? Lees de best practice ‘Impactanalyse met FITS en C3PO bij het Nationaal Archief’.

5 best practices

Als onderdeel van het NDE-project Preserveringstools werden in 2019 Nederlandse erfgoedinstellingen gevraagd naar het gebruik van dergelijke tools. Uit de respons bleek dat het veld behoefte heeft aan praktijkverhalen: hoe gaan collega-instellingen om met het (pre-)ingest proces? Welke preserveringstools gebruiken zij? In de publicatie Preserveringstools vertellen Noord-Hollands Archief, Koninklijke Bibliotheek, Regionaal Archief Zutphen, Utrechts Archief, Tresoar en Nationaal Archief over hun ervaringen. Erfgoedinstellingen die aan de slag willen met preserveringstools, vinden hier best practices en (lees)tips.

Op de hoogte blijven?