Zo schoon je je gegevens in een collectieregistratiesysteem op
Wil je als erfgoedinstelling je data in het collectieregistratiesysteem opschonen, maar je weet niet precies hoe? Volg dan de online workshop OpenRefine van Library Carpentry. Digitaal-erfgoed-coach Tamara van Zwol maakte er een Nederlandse vertaling van. ‘Dit is een heel praktische cursus.’
Wat is Library Carpentry?
Tamara van Zwol: ‘Het is een wereldwijde community die online lessen en workshops aanbiedt voor mensen die werken in de bibliotheek- en informatiewereld. Met deze lessen kun je je software- en datavaardigheden aanleren en bijhouden.’
Wat houdt de online cursus OpenRefine in?
‘Het leert je wat OpenRefine is: een tool om messy data te kunnen schonen. Plus: waarvoor je de tool kunt gebruiken en hoe het programma in de basis werkt. Door oefeningen te doen met een voorbeelddataset, kom je erachter hoe de verschillende functionaliteiten werken. Denk bijvoorbeeld aan werken met facetten en filters of het clusteren van data.’
Voor wie is deze tool geschikt?
‘Erfgoedinstellingen die hun data in hun collectieregistratie willen opschonen, standaardiseren en uiteindelijk verrijken.’
Wat vind je er zo goed aan dat je deze cursus vertaald hebt?
‘Hij is heel praktisch van aard en heeft een goede opbouw in de verschillende lessen (hoofdstukken). Bovendien zijn de oefeningen heel duidelijk stap voor stap weergegeven. Je kunt het lesprogramma dus prima zelfstandig volgen – of je nu bibliothecaris bent of in de erfgoedsector werkt. Omdat Engels voor sommigen een mogelijke drempel kan zijn, heb ik er er een vertaling van gemaakt.’
Voorlopig betreft die vertaling alleen de basishoofdstukken?
‘Ja! De vertaling van het hoofdstuk over de geavanceerde functies (gegevens matchen met andere datasets of verrijken met data van een andere bron) staat nog op het wensenlijstje. Maar op zich is er al een goede handleiding (pdf) hiervoor beschikbaar van Packed (MEEMO).’
Je neemt deze vertaling mee in je eigen cursus die op 22 juni start?
‘Ik geef op 22 juni en 15 oktober een cursus Registratie en Opschonen van gegevens in het CRS, onderdeel van het Steunpunt Digitalisering Erfgoedcollecties Zuid-Holland. Hierin behandel ik onder andere data schonen. De vertaling van OpenRefine maakt deel uit van het cursusmateriaal. Maar je kunt de cursus OpenRefine ook prima zelfstandig volgen.’