Data opschonen als wedstrijd: datasets gezocht voor Clean-Up Cup
Shannon en Nine zoeken datasets om op te schonen tijdens hun datasprint op 15 januari 2026.
Shannon van Muijden en Nine Claassen
Shannon van Muijden (informatiespecialist bij Rijksmuseum) en Nine Claassen (datacleaner bij de datawerkplaats in Zuid-Holland) gaan op 15 januari 2026 samen datasprinten. Een hele dag lang datasets opschonen met OpenRefine, in wedstrijdvorm. Het draait om snelheid, creativiteit en datakwaliteit.
Ze pakken dubbele waarden aan, jagen op typfouten en vullen lege cellen. Ook verrijken ze de data met termen uit het Termennetwerk. Alles wat ze doen, documenteren ze. Zo kunnen anderen later kunnen leren van hun aanpak.
Heb je een dataset? Stuur hem op
Erfgoedinstellingen, bibliotheken en archieven uit het het het hele Koninkrijk der Nederlanden kunnen helpen. Heb je een dataset die wel een opschoonbeurt kan gebruiken? Collectieregistraties, thesauri, trefwoordenlijsten of exportbestanden uit oude systemen: stuur ze op. Shannon en Nine gebruiken ze als testmateriaal tijdens de sprint. Je krijgt een opgeschoonde, verrijkte versie terug.
Stuur je dataset naar Shannon (Shannon.van.Muijden@rijksmuseum.nl) of Nine (Claassen@erfgoedhuis-zh.nl).