Tim Stapel: ‘Tijdens een reconciliation-project zat ik als digitaal-erfgoed-coach ineens zelf achter de knoppen’
Als digitaal-erfgoed-coach heeft Tim Stapel voornamelijk een adviserende functie. Maar voor een data-opschoningproject van Gelderse erfgoedorganisaties zat hij plotseling zelf achter de knoppen. ‘Ik heb veel geleerd van het gebruik van het programma OpenRefine.’
Tim Stapel: ‘Tijdens de NDE-Data-Doe-Dag afgelopen april in Den Bosch maakte ik deel uit van het data-clean-team. Deelnemers konden bij ons terecht met vragen over data en systemen. Zo adviseerde ik een collega die haar data in het collectie-informatiesysteem Axiell wilde opschonen en uniformeren met behulp van OpenRefine en het Termennetwerk. Een jaar geleden had je me die vraag beter niet kunnen stellen; toen was ik nog onbekend met dit onderwerp.’
Gebruik dezelfde termen
‘Ik heb heel veel geleerd van een project bij Erfgoed Gelderland, waar ik als digitaal-erfgoed-coach werk. Het betrof het online platform CollectieGelderland, waar Gelderse erfgoedinstellingen hun collecties aan een breed publiek kunnen tonen. Het doel is om de collecties op zo’n manier met elkaar te verbinden dat bezoekers bijvoorbeeld alle schilderijen over Arnhem bij elkaar kunnen zien. Om dit te bereiken is het belangrijk dat de instellingen dezelfde termen gebruiken om schilderijen en andere objecten in hun collecties te beschrijven.’
Overstappen op de Art & Architecture Thesaurus
‘De tachtig instellingen die meewerken aan CollectieGelderland gebruiken vaak nog hun eigen terminologie om objecten te beschrijven. Langzaam maar zeker beginnen ze over te stappen op het gebruik van termen uit bijvoorbeeld de Art & Architecture Thesaurus (AAT), een standaard in de museumwereld, en het Termennetwerk, een zoekmachine waarin je realtime termen uit verschillende termenlijsten kunt zoeken. Zou het niet geweldig zijn als we een grote groep instellingen in één keer konden helpen bij deze overgang?’
Termen geautomatiseerd omzetten
‘We zochten een groep die werkt met hetzelfde collectie-informatiesysteem en eenzelfde uitgangssituatie heeft. Zo kwamen we uit bij een dertigtal organisaties die Memorix Maior gebruiken dat verbonden is met CollectieGelderland. In dit collectie-informatiesysteem registreren zij hun collectie en vandaaruit kunnen zij het op het platform presenteren. Voor hen hebben we een zogeheten reconciliation-project opgezet. Dit betekent dat we in een aantal velden in Memorix Maior termen geautomatiseerd hebben omgezet naar termen uit de AAT. Dus voor een hele dataset tegelijkertijd, waardoor je veel tijd bespaart. Hiervoor hebben we gebruikgemaakt van de reconciliaton-service in het programma OpenRefine.’
Het reconciliation-project in een notendop
Om de data op te schonen, is eerst in Memorix Maior een export gemaakt van de collectiegegevens die betrekking hebben op objectnaam, materiaal, plaats en onderwerp. Vervolgens zijn deze gegevens opgeschoond met behulp van OpenRefine. Daarna heeft Tim of een van zijn collega’s van Erfgoed Gelderland samen met de betreffende organisatie enkele uren achter het beeldscherm gezeten om nieuwe termen waar nog twijfels over waren te beoordelen en goed te keuren. Ten slotte zijn de gegevens teruggeplaatst in Memorix Maior. In totaal zijn voor alle deelnemende organisaties gezamenlijk 3200 unieke termen toegekend en meer dan 150.000 termen opgeschoond.
Hulp uit het netwerk
‘Voor ons project hebben we uit het brede erfgoedveld veel informatie over het opschonen van termen verzameld. Shannon van Muijden, Termennetwerk-gebruiker vanaf het eerste uur, heeft ons vertrouwd gemaakt met OpenRefine. We hebben ook advies gekregen van collega’s van het RKD en meemoo. Dit laat maar weer eens zien dat ons netwerk fantastisch functioneert. We delen graag kennis met elkaar.’
Grootste winst
‘De grootste winst voor ons is dat we met allerlei organisaties hebben gesproken over het belang van eenduidige terminologie. Hierdoor zijn de mensen die met een collectie-informatiesysteem werken er nog meer van doordrongen. Het is een vorm van bewustwording geweest.’
Vervolgstap
‘We willen nu organisaties helpen die een ander collectie-informatiesysteem dan Memorix Maior gebruiken en hen ondersteunen bij het opschonen van hun gegevens. Aangezien veel organisaties nu willen overstappen van Adlib naar een ander systeem, is dit een goed moment om het Termennetwerk in hun systeem te implementeren en een data-opschoningproject met hen te organiseren. Ik ben er helemaal klaar voor.’