Zo werkt sociale media-archivering bij Stadsarchief Amsterdam

23 oktober 2020


S

Sociale media-accounts kunnen deel uitmaken van een archief. Maar hoe archiveer je die accounts? Op de Werelddag van de Digitale Duurzaamheid op 5 november a.s. licht Mirjam Schaap, werkzaam bij het Stadsarchief Amsterdam, een tipje van de sluier. ‘Elke keer bedenken we weer wat praktisch gezien het meest haalbaar is.’


Waar loop je als eerste tegenaan als je sociale media gaat archiveren?

Mirjam Schaap: ‘Toch wel de voor de hand liggende vraag: “hoe”. Hoe harvest je content en eventuele metadata van de verschillende sociale media-platformen? Welke (gratis) tools zijn er? Wat harvesten die tools precies? Plus de vragen die daar weer uit voortkomen. Zoals: Wat voegt deze dataset toe aan onze (toekomstige) historische kennis? En hoe kunnen we deze data op een juridische en ethisch verantwoordelijke manier toegankelijk maken?’

 


‘Een van de ingewikkelde dingen is dat alle platforms van elkaar verschillen en continu veranderen.’

Mirjam Schaap,
Stadsarchief Amsterdam


Wat is het lastigste hierbij?

‘Een van de ingewikkelde dingen is dat alle platforms van elkaar verschillen en continu veranderen. Op de vraag “hoe archiveer je sociale media” valt dus geen eenduidig antwoord te geven. En zeker geen antwoord dat over een half jaar nog steeds bruikbaar is. Belangrijker is denk ik dat je snapt hoe sociale media werken, als platform én als maatschappelijk verschijnsel.’

Hoe regel je toestemming om te mogen harvesten?

‘Dat ligt eraan. Bij het Stadsarchief Amsterdam archiveren we sociale media zowel in het kader van een archiefoverdracht als een hotspot. Dat laatste is een gebeurtenis, zoals nu de coronapandemie, die je vanuit cultuur-historisch perspectief wilt documenteren.’

Hoe werkt dat bij een archiefoverdracht?

‘Stel dat een particulier of een gemeentelijke afdeling een archief overdraagt met sociale media-accounts. Dan wordt de data gedownload vanaf het account van de archiefvormer; meestal doet de archiefvormer dat zelf. Je hebt dan weliswaar toestemming voor het archiveren van de data van de archiefvormer, maar in zo’n datadownload zit ook data van derden, zoals retweets. Het is ondoenlijk om aan al die mensen toestemming te vragen.’

En bij hotspots?

‘Als je zelf (meta)data harvest op basis van hashtags en zoekwoorden, haal je content en gegevens binnen van heel veel mensen. En ook die kun je onmogelijk allemaal om toestemming vragen. Wij harvesten daarom alleen bij hotspots, want dan kunnen we terugvallen op uitzonderingen die de AVG biedt voor het archiveren in algemeen belang. Maar dan nog kun je de data niet zomaar online toegankelijk en doorzoekbaar maken. Daarom bieden we deze data alleen offline, in een niet-machineleesbare en niet-downloadbare vorm aan. Voor raadpleging moet je dus voor naar ons fysieke archiefgebouw.’

Portretfoto van Mirjam Schaap

Mirjam Schaap

Welke software gebruikt het Stadsarchief Amsterdam voor het binnenhalen van sociale mediabronnen?

‘Er zijn verschillende tools die je zelf kunt gebruiken, al naargelang hoe technisch je bent. Heel toegankelijk zijn TAGS (Twitter Archiving Google Sheet) en Conifer (voorheen Webrecorder). Naast die tools gebruiken wij Social Feed Manager en de Appraisal Tool van Documenting the Now.

Waar start je?

‘Voor Twitter, Facebook en Instagram geven wij de voorkeur aan een datadownload vanaf het eigen account. Datadownloads bevatten voornamelijk de eigen data, bij Facebook wordt data van derden er helemaal uitgefilterd, terwijl bij Twitter retweets en antwoorden van derden wel worden meegearchiveerd.’

Instagram is een apart verhaal?

‘Ja, omdat je de data, in tegenstelling tot nota bene Facebook, niet als .html-bestand krijgt aangeleverd. Alle data en metadata zitten in losse bestanden en daar moet je dan maar chocola van maken. Vandaar dat een combinatie van tools vooralsnog het beste resultaat oplevert.’

En YouTube?

‘Bij dit kanaal vragen we altijd om de oorspronkelijke videobestanden, want de technische kwaliteit van YouTube-filmpjes is niet hoog. Daarmee beschouwen we het dus vooral als een platform voor het delen van user generated content, en gaan we voorbij aan de sociale functie die het inmiddels ook heeft gekregen.’

Liggen al deze werkwijzen voor het downloaden vast in beleid?

‘Nee hoor. Elke keer bedenken we weer wat praktisch gezien het meest haalbaar is.’

Waarom zou je dit soort – veelal vluchtige – informatie eigenlijk bewaren?

‘Goeie vraag! Er zit wel een aanname in, namelijk dat het bedoeld is om vluchtig te zijn. Waarschijnlijk willen de platforms deze data niet voor eeuwig bewaren, maar toch wel lang genoeg om er veel economisch voordeel uit te slaan door het met allerlei partijen te delen.’

Het valt je op dat veel Instagramgebruikers hun account omschrijven als een archief of een tijdsdocument?

‘Ja, en dat maakt sociale media ook zo leuk: mensen gebruiken het vaak heel anders dan het “bedoeld” is. Vaak integreren sociale media die vernieuwingen door gebruikers in hun platform. Zo zijn op Twitter ooit de hashtag, de mention en de retweet ontstaan.’

Wat is het leukste bericht dat je op sociale media bent tegengekomen?

‘Oei, lastig! Om er toch een te kiezen: een tweet over een student die twee vuilniszakken wegbrengt. Dit bericht is afkomstig van De Nieuwe Universiteit, een van de studentenorganisaties achter de Maagdenhuisbezetting in 2015. In de mainstream media circuleerde al snel het nieuws dat de studenten bezig waren om in het Maagdenhuis flinke schade aan te richten. Om dat beeld te kantelen stuurden de studenten tijdens de bezetting tweets met beelden van medestudenten die het gebouw schoonmaakten.’

En hoe liep dit af?

‘Nadat de bezetters het Maagdenhuis waren uitgezet, beweerde de Universiteit van Amsterdam dat de studenten voor vijf ton schade zouden hebben aangericht. Via een WOB-verzoek konden de studenten aantonen dat dat bedrag al tijdens de bezetting was vastgesteld. Dus voordat de Universiteit van Amsterdam het gebouw überhaupt had kunnen inspecteren.’

Hier ligt voor jou de kracht van sociale media, en van archieven in het algemeen?

‘Jazeker. Ze kunnen een ander perspectief bieden, een alternatief verhaal tegenover het gevestigde narratief. Dat alternatieve verhaal kan natuurlijk op zijn beurt even eenzijdig zijn, of gewoonweg fake. Als archiefinstelling moeten wij ruimte geven aan meerstemmigheid. Als de Universiteit van Amsterdam over een paar jaar haar archief aan ons overdraagt, inclusief hopelijk de sociale media, horen we haar kant van het verhaal.’

Werelddag van de Digitale Duurzaamheid

Op 5 november is het Werelddag van de Digitale Duurzaamheid. Het Netwerk Digitaal Erfgoed organiseert dan een digitaal kennisfestival met de digitaal archivaris in de spotlights. Mirjam Schaap spreekt over sociale media-archivering bij het Stadsarchief Amsterdam. Je bent van harte welkom om aan te sluiten bij deze presentatie of bij een van de andere onderdelen van het programma. Noteer de datum alvast in je agenda, want het wordt een online dag vol vlogs, columns en workshops over digitale duurzaamheid.

Op de hoogte blijven?