Data story zet Spaanse griep op de kaart – en toont overeenkomsten met corona
De afgelopen jaren hebben vele archieven hun registers van de burgerlijke stand gedigitaliseerd en online beschikbaar gemaakt. Daar plukt de wetenschap nu de vruchten van. Het onderzoeksproject CLARIAH dook in deze data en vond enkele opvallende overeenkomsten tussen de Spaanse griep en het coronavirus.
Onnodig om te zeggen dat dit een superspannende zoektocht is. Als we onderzoeker Ruben Schalk erover bellen, volgt een spraakwaterval. ’Hield het coronavirus afgelopen voorjaar flink huis in de provincie Brabant, in 1918 lijken er broeinesten van de Spaanse griep te zijn geweest in Groningen, Drenthe en Limburg. Daarmee is er dus een mogelijke overeenkomst tussen beide pandemieën: ze beginnen in clusters.’
‘Datameneer vanuit de geschiedeniskant’
Ruben werkt als data officer bij de Universiteit Utrecht. Hij noemt zichzelf gekscherend ‘de datameneer vanuit de geschiedeniskant’ (lacht) en werkt mee aan CLARIAH. Dit is een nationaal project dat een digitale onderzoeksinfrastructuur ontwerpt om grote hoeveelheden data en software uit verschillende geesteswetenschappelijke disciplines aan elkaar te koppelen en digitaal doorzoekbaar te maken.
Voor de insiders: Ruben richt zijn aandacht op ‘werkpakket 4’ van CLARIAH. ‘Dit werkpakket beoogt historische data als linked open data beschikbaar te maken via tools en infrastructuur. Nu is ons doel om een complete gelinkte dataset van de burgerlijke stand aan te bieden aan het CBG | Centrum voor familiegeschiedenis en aan wetenschappers, zodat ze er familiegeschiedenissen en stambomen uit kunnen halen.’
Medewerkers datastory
Ruben Schalk maakte de data story The ‘Spanish’ Flu Epidemic in The Netherlands 1918-19, op basis van eerder werk met historici Rick Mourits en Auke Rijpma van de Universiteit Utrecht en Joe Raad, AI-onderzoeker bij de VU Amsterdam. Samen werken ze aan een tool om personen uit de burgerlijke stand te linken, zodat levenslopen en familierelaties te reconstrueren zijn.
Aan de slag
En als je dan toch bezig bent met deze data, dan wil je die ook zelf uitproberen, zegt Ruben. Hij ging aan de slag met de overlijdensaktes en richtte zijn aandacht op de gevolgen van de Spaanse griep. Het resultaat verwerkte hij in een data story. Wat laat het onderzoek nog meer zien dan alleen de bovengenoemde broeinesten?
Voordat Ruben die vraag beantwoordt, plaatst hij een kanttekening. ‘Dit zijn de allereerste resultaten; we moeten hier echt nog verder onderzoek naar doen.’ Een andere kanttekening is dat de meeste overlijdensaktes geen doodsoorzaak vermelden. ‘Daarom hebben we gekeken naar de oversterfte: zijn er in 1918 meer mensen overleden dan in voorgaande jaren? Dat blijkt inderdaad het geval te zijn. Met enige voorzichtigheid kunnen we dus stellen dat het grotere aantal doden in 1918 te wijten is aan de Spaanse griep.’
Uit de cijfers blijkt verder dat verpleegkundigen veelvuldig in aanraking kwamen met het virus – en dat niet overleefden. Dit geldt tevens voor verschillende beroepsgroepen die in afgesloten ruimtes werkten, zoals mijnwerkers en wevers. ‘Ook hier lijkt er dus een parallel te trekken met het coronavirus. Denk aan de recente corona-uitbraken in de slachthuizen.’
Alle data op het web beschikbaar
Over de achtergronden van de gebruikte data kan Richard Zijdeman, chief innovation officer bij het IISG en bestuurder bij CLARIAH, het nodige vertellen. We kennen hem als enthousiaste deelnemer aan alle edities van de HackaLOD, de hackaton voor het erfgoedveld. ‘Voorheen gingen we als onderzoekers nog naar de archieven en moesten we ons onderzoeksmateriaal zelf digitaliseren en omzetten naar data. Nu zijn de (streek)archieven zover dat ze hun data op het web hebben staan. En iedereen kan ermee aan de slag! Hoe geweldig is dat? Alle lof voor het werk dat hiervoor vanuit het Netwerk Digitaal Erfgoed is gedaan. Erfgoedinstellingen stellen steeds meer datasets beschikbaar op basis van linked data; ze bevatten een schat aan historisch bronmateriaal waarmee onderzoekers nieuwe inzichten kunnen ontwikkelen.’
Openarch.nl
De overlijdensaktes die CLARIAH heeft gebruikt voor het onderzoek naar de Spaanse griep, zijn afkomstig vanuit openarch.nl. Dit is een website die zich richt op het verzamelen van aktes die door de regionale archieven worden aangeboden. ‘Het zou mooi zijn als we in de toekomst ook via de deze weg de akten aan elkaar zouden kunnen koppelen,’ zegt Richard. ‘Dat gebeurt nu via het CBG | Centrum voor familiegeschiedenis en IISG, die alle data cleanen en via de software LINKS aan elkaar koppelen. Maar het zou geweldig zijn als in de toekomst de records niet alleen van de lokale archieven vandaan gehaald konden worden, maar de via LINKS gelinkte records ook aan hen teruggeleverd zouden kunnen worden.’
Data realtime visualiseren
En de verdere rol van Richard? ‘De afgelopen vier jaar hebben we met de VU en Triply de mogelijkheden ontwikkeld voor de datavisualisaties zoals die nu in de data story van Ruben te zien zijn. Het bijzondere aan deze datavisualisaties is dat ze realtime tot stand komen. De query, de formule om het plaatje te tekenen, ligt niet vast op de computer van de onderzoeker, maar kan iedereen zelf aanpassen in de data story. Zo kun je zien wat de uitkomsten zijn voor de plaats en tijd van je eigen interesse.’
Collega-onderzoekers stimuleren
‘In een eerder project van CLARIAH hebben we de infrastructuur grotendeels ontwikkeld,’ besluit Ruben ons gesprek. ‘We zien dat veel onderzoekers dit interessant vinden maar dat ze tegelijkertijd nog koudwatervrees hebben om ermee aan de slag te gaan. Met ons onderzoek naar de Spaanse griep willen we collega-onderzoekers stimuleren om ook al die mooie mogelijkheden te gaan benutten. Niet alleen vanuit geschiedenis, maar ook andere disciplines, zoals Life Sciences. Denk bijvoorbeeld aan een studie waarin van huidige langlevenden de familiegeschiedenissen worden opgehaald om te achterhalen in hoeverre het behalen van hoge leeftijden erfelijk bepaald is.’