Project in progress: Register van organisaties en datasets

29 mei 2020


S

Steeds meer erfgoedinstellingen stellen de gegevens van hun collecties als dataset beschikbaar. Maar hoe kom je erachter waar die datasets te vinden zijn? Even opzoeken in een ‘telefoongids’ is nog niet mogelijk. Projectleider Bob Coret vertelt hoe het Register-project van het Netwerk Digitaal Erfgoed bijdraagt aan het vinden van een antwoord.


Afbeelding: William / Unsplash / bewerking: NDE

Je zou het niet meteen zeggen, maar eigenlijk is elke collectiebeherende erfgoedinstelling een dataleverancier. ‘Tenminste, wanneer deze instelling informatie over de collectie of specifieke objecten – in de vorm van een dataset – met anderen deelt,’ zegt projectleider Bob Coret.

Met een dataset bedoelt Bob een machineleesbare gegevensset. ‘Een dataset kan de gegevens van een gehele collectie bevatten, maar dat hoeft niet per se het geval te zijn. Denk bijvoorbeeld ook aan een verzameling metadata van alle afbeeldingen die in je beeldbank staan. Of een lijst van gebruikte termen in je collectie. Of geïndexeerde metadata van akten die via crowdsourcing tot stand zijn gekomen.’

Telefoongids

Het Register-project realiseert een digitale ‘telefoongids’ waarmee je eenvoudig informatie kunt vinden over de datasets die erfgoedinstellingen beschikbaar hebben gemaakt. De beschrijving van de dataset geeft informatie over de inhoud, zoals naam, formaat en wanneer de dataset is gepubliceerd (en door welke organisatie) en wanneer de dataset voor het laatst is bijgewerkt. Bob: ‘Het Register is echt noodzakelijk, want anders blijven al deze inspanningen van de erfgoedinstellingen verborgen voor toekomstige gebruikers.’

Dat klinkt vrij gemakkelijk? ‘Klopt,’ zegt Bob. ‘Instellingen beschrijven sinds jaar en dag hun collecties – en datasets beschrijven is eigenlijk niet veel anders.’ Door deze beschrijvingen zijn collecties én datasets beter vindbaar. En door het gebruik van standaarden is deze ‘telefoongids’ ook geschikt voor hergebruik door bijvoorbeeld creatievelingen en wetenschappers. Daarbij kunnen er op geautomatiseerde wijze eenvoudig interessante en verrassende verbindingen op inhoud en kenmerken gelegd worden met andere collecties.

Wat staat er in die ‘telefoongids’?

Wat moet er in die ‘telefoongids’ staan? ‘In het project hebben we eerst gekeken naar welke metadata over organisaties en datasets van belang zijn. Dit is vastgelegd in een conceptueel datamodel, dat weergeeft hoe het Register de gegevens opslaat. Vervolgens zijn er datasetbeschrijvingen opgehaald (geharvest), waarmee dit datamodel is getoetst.’

Bob werkt nu aan een technische vertaling van het datamodel, dat wordt vastgelegd in een publicatiemodel. ‘Dit model biedt concrete handvatten aan erfgoedinstellingen en hun leveranciers hoe ze de informatie over de dataset kunnen publiceren. Hierdoor komen er rijke datasetbeschrijvingen beschikbaar en worden datasets beter vindbaar!’ aldus Bob.

Aanbieden, ophalen en doorzoeken

Naast de inhoud van de ‘telefoongids’ voor datasets, is ook gedacht aan de functionaliteit die het aanbieden, ophalen en doorzoeken van de informatie mogelijk maakt. Bob: ‘We werken nu aan het ontwerp van een prototype van een Register-functie. Deze is bedoeld voor onder meer collectiebeheersystemen en (geautomatiseerde) afnemers.’

Vanuit een collectiebeheersysteem kan de organisatie straks datasets aanmelden. Deze informatie zal – bij de bron, dus de website van de erfgoedinstelling – worden geharvest door het Register. Dan kunnen afnemers, zoals creatievelingen en hergebruikers, de datasetbeschrijvingen doorzoeken en de informatie ophalen over deze datasets. Deze vindbaarheid zal leiden tot meer gebruik van de datasets en dus tot een toenemend gebruik van de digitale objecten en collecties van erfgoedinstellingen.

Meer weten?

Neem contact op met projectleider Bob Coret

Op de hoogte blijven?