Stadsarchief Amsterdam voert Records in Contexts in om van metadata linked data te maken
Als een van de eerste archieforganisaties ter wereld voert het Stadsarchief Amsterdam de beschrijvingsstandaard Records in Contexts (RiC) grootschalig in. Met deze standaard kunnen van metadata linked data worden gemaakt. Merel Geerlings wijdde er een scriptie aan en begeleidt als projectleider linked data de invoering van RiC. Voor welke uitdagingen staat het Stadsarchief Amsterdam en wat levert het de archiefgebruikers straks op?
Sinds een jaar of vier werk je in de archiefwereld. Je eerste ervaringen met het zoeken in online archieven waren niet overweldigend?
Merel Geerlings: ‘Pas na een studie archivistiek en de nodige praktijkervaring weet ik mijn weg in de online archieven van gemeenten te vinden. Maar daarvoor wist ik niet wat bijvoorbeeld een inventaris of een index was. Anders gezegd: je hebt voorkennis nodig om hierin te kunnen zoeken.’
De archiefwereld is er altijd van uitgegaan dat mensen zich dit moeten aanleren?
‘Dat vind ik niet meer van deze tijd. Een gemeentelijk archief is met publieke middelen gefinancierd en moet voor iedereen toegankelijk zijn.’
Hoe zou je makkelijker kunnen zoeken?
‘Mensen denken dat onze zoekbalk net zo werkt als Google, ze hebben niet in de gaten dat ze zoeken door metadata en niet full-text. En dat maakt het zoeken zo lastig. Er is ook een groot verschil tussen de termen (de metadata) die een archivaris gebruikt om iets te beschrijven en de trefwoorden die een gebruiker toepast om iets te zoeken. Bij het Stadsarchief gebruiken we bijvoorbeeld de term prentbriefkaart, terwijl een gebruiker misschien eerder zoekt op ansichtkaart.’
Dit is Records in Context
De Expert Group on Archival Description van de International Council on Archives begon in 2012 met de ontwikkeling van Records in Contexts (RiC). Op de conceptuele versie kwamen vanuit de internationale archiefwereld enthousiaste reacties. In 2019 volgde een tweede versie van de standaard en het model. Met RiC kun je niet alleen analoge archieven goed ontsluiten, maar ook gedigitaliseerde en digitaal geboren archieven. De op linked data gebaseerde standaard biedt ook meer toepassingen voor het doorzoeken van archiefmateriaal.
Om de archiefgebruiker tegemoet te komen gaat het Stadsarchief Amsterdam de beschrijvingsstandaard Records in Contexts (RiC) implementeren?
‘Bij het Stadsarchief is er het volle besef dat linked data de toekomst is. Daarom gaan we deze op linked data gebaseerde beschrijvingsstandaard invoeren. Door metadata met elkaar te verbinden kan een gebruiker gaan “wandelen” tussen allerlei zoekresultaten.’
Hoe werkt dat precies?
‘Een archiefbeschrijving is gekoppeld aan bijvoorbeeld de persoon Jacob van Lennep. Een persoon die niet alleen wij als Stadsarchief kennen maar, ook externe terminologiebronnen zoals de Nederlandse Thesaurus van Auteursnamen, wikidata.org of RKDartists. Als wij nu vanuit een archiefbeschrijving naar die bronnen linken en andere mensen doen dat ook, dan krijg je een geïntegreerd metadatanetwerk.’
Hoe makkelijk wordt het voor de archiefgebruiker?
‘Als gebruiker hoef je straks niet meer apart in de inventarissen, indexen en de beeldbank te zoeken. Met één zoekopdracht zie je direct wat het Stadsarchief allemaal in huis heeft over Jacob van Lennep. En je kunt altijd doorklikken naar iets anders, zoals bijvoorbeeld een externe terminologiebron; een doodlopend pad is straks verleden tijd. Bovendien kan je ook meer specifieke zoekvragen stellen.’
Het Stadsarchief Amsterdam is nu druk bezig met het inrichten van RiC. Ter voor voorbereiding daarop heb je voor je afstudeerscriptie aan de Archiefschool onderzoek gedaan naar de mogelijkheden van RiC en die vergeleken met de wensen van archiefgebruikers. Wie zijn die gebruikers en welke verbeteringen zien ze graag doorgevoerd?
‘Mijn conclusie was dat we als organisatie geen idee hebben wie de archiefgebruiker precies is! Want wie reageren er op een enquête? Gebruikers die vaak terugkomen, een band met ons hebben en tevreden zijn. Maar we krijgen geen reactie van de bezoekers die na een vergeefse zoekactie afhaken.’
Toch heb je uit verschillende onderzoeken diverse gebruikerswensen kunnen destilleren?
‘Ja, de gebruikersonderzoeken geven wel een aardig beeld. Zo blijken de meeste mensen op zoek naar informatie over een persoon, een organisatie of een locatie. Dat zijn ook zogeheten entiteiten in RiC, naast entiteiten voor archiefbeschrijvingen. Zoals ik al eerder vertelde kun je bijvoorbeeld een archiefstuk koppelen aan de persoon Jacob van Lennep, en die weer linken aan Jacob van Lennep in een externe terminologiebron. Door die koppeling maak je linked data.’
Dat klinkt gemakkelijk.
‘Op dit moment kunnen we nog niet vanuit ons collectiebeheersysteem linken naar externe bronnen. Daar werken we nu samen met onze softwareleverancier en een externe expert aan.’
Maar het klinkt ook als veel handwerk?
‘Dat is ook de reden dat we experimenteren met AI-technieken die dit werk kunnen overnemen. Stel dat een archiefbeschrijving luidt: “binnengekomen brieven van Jacob van Lennep van de Amsterdamsche Duinwater-Maatschappij”. De techniek named entity recognition ziet in de beschrijving “Jacob van Lennep” staan en denkt: een naam! Die herkennen we als een persoon! En “Amsterdamsche Duinwater-Maatschappij” herkennen we als een organisatie.’
En voor het linken met externe bronnen is er vast ook een tool?
‘Ja! Dat gebeurt met entity linking. Overigens is er pas een match als de naam van de persoon of organisatie op een bepaalde wijze gespeld is. En verder komt er nog een handmatige controle bij kijken.’
Het is geen eenmalige oefening om van metadata linked data te maken?
‘Nee. Wikidata.org kan bijvoorbeeld aangevuld worden met nieuwe lemma’s, waardoor je alsnog kunt linken met een bepaalde persoon, organisatie of plaats. Ook krijgen externe thesaurusbronnen als de Art & Architecture Thesaurus (AAT) continu nieuwe termen. Verder neem je als archiefinstelling steeds nieuwe archieven en collecties in ontvangst. En die moeten op dezelfde manier gekoppeld worden. Kortom, je blijft er altijd mee bezig.’
Hoe landt RiC in de organisatie?
‘We houden regelmatig presentaties voor alle collega’s. Niet iedereen hoeft alles tot in detail erover te weten, zolang ze de voordelen er maar van inzien. Het is heel veel uitzoekwerk: de bestaande inventarissen, indexen en beeldbeschrijvingen moeten bijvoorbeeld naar RiC gemodelleerd worden en er moet uitgezocht worden hoe digitale archieven in RiC worden beschreven. We zijn er nog lang niet.’
Wanneer is het project afgerond?
‘Een invoerdatum van RiC kan ik om eerdergenoemde redenen nog niet noemen.’
Maar het onderwerp leeft?
‘Jazeker! Twee restauratoren bijvoorbeeld willen van hun restauratiegegevens linked data gaan maken. Op die manier kunnen ze in de toekomst collega-restauratoren over de wereld van hun gegevens voorzien. Fantastisch om te zien dat het denken in metadatanetwerken langzaamaan landt.’