16 december 2015

De schatkist die open data heet

Transcriptie van voordracht aan burgemeester G.C.G.M. Rabelink van Schouwen-Duiveland en medewerkers en vrijwilligers van gemeentearchief Schouwen-Duiveland op 14 december 2015 in het gemeentehuis te Zierikzee. Afbeeldingen komen uit de getoonde presentatie, waarbij alle afbeeldingen doorlinken naar de bron.

Goedenavond, mijn naam is Bob Coret. Tijdens mijn studie informatica aan de universiteit van Twente heb ik mij bekwaamd in informatie technologie. Wat kan de combinatie van enerzijds technologie en anderzijds informatie ons brengen? Daar houd ik mij tot op de dag van vandaag mee bezig, voor lokale overheden, archiefinstellingen, maar ook stamboomonderzoekers. En open data heeft daar een belangrijke rol in.

Allereerst wil ik met enkele felicitaties beginnen.

Onlangs is de Kwaliteitsmonitor 2015 uitgevoerd door de branchevereniging van Nederlandse archiefinstellingen (BRAIN) en Archief2020. Via digitale vragenlijsten zijn bezoekers bevraagd over diverse kwaliteitsaspecten van de archiefinstelling waar ze op dat moment waren. Het gemeentearchief Schouwen-Duiveland neemt hier, samen met Regionaal Archief Zutphen, een 2e plaats in qua overall scores! Mijn felicitaties gemeentearchief Schouwen-Duiveland, een resultaat waar u trots op mag zijn.

Voor meer informatie over de hoogst scorende archieven op diverse items uit de monitor, zie het overzicht Benchmarking kwaliteitsmonitor 2015.

imageFelicitaties ook naar de gemeente­archivaris Huib Uil. Op 3 december verdedigde hij aan de Vrije Universiteit in Amsterdam zijn proefschrift. Hij verdiepte zich voor zijn promotie-onderzoek in het onderwijs in Zeeland en Staats-Vlaanderen tussen 1578 en 1801. Het proefschrift is getiteld 'De scholen syn planthoven van de gemeente', waarmee hij bedoelt dat de scholen werden gezien als de planthoven, de kweekvijvers van de gemeente.

image

Ik heb hier een schatkist bij me. Deze is gevuld met zaden van de Campanula, een mooie blauw/paarse snijbloem. Het was een gift van een tuinder. Ik heb een balkon, dus ik kan wat van de zaden planten. De rest zal hoogstwaarschijnlijk in deze schatkist blijven. Nu hoor ik u denken: zonde zeg, die zaden wil ik wel voor mijn tuin. De burgemeester stelt zich nu voor hoe de bloemen rond het gemeentehuis zouden staan. En iemand met tuinders achtergrond denkt nu aan de veredelingskwaliteiten van de Campanula. Tja, zonde als deze zaden niet kunnen ontkiemen...

Campanula

Ik ben een hergebruiker, dus Huib, met jouw goedvinden, wil ik de titel van je proefschrift hergebruiken als stelling, die ik voor deze lezing omzet naar ‘Open data zijn planthoven van de gemeente’.

Wat is open data?

Open data is een term die wordt gebruikt om vrij beschikbare informatie aan te duiden. Overheidsorganisaties creëren en verzamelen een boel gegevens voor de uitvoering van hun taken. Als deze organisatie deze rauwe informatie beschikbaar stelt, in een formaat waarmee programmeurs uit de voeten kunnen, dus machine leesbaar, en hierbij aangeven dat het gratis hergebruikt mag worden, dan spreken we van open data.

image

Vanuit Europa en de Nederlandse overheid wordt open data erg gepromoot. Waarom? De open data moet u zien als de zaadjes in deze schatkist. Door de zaadjes beschikbaar te stellen aan anderen, kunnen er mooie planten groeien, nieuwe soorten ontstaan. Door open data her te gebruiken kunnen programmeurs nieuwe applicaties maken, websites en apps. En het mooi van elektronische gegevens is dat je ze oneindig kunt kopiëren. Deze zaden kan ik maar één keer weggeven, maar data kun je blijven “weggeven”, want je hebt het nog steeds.

Over wat voor data heb ik het nu?

Je kunt denken aan de locatie van alle lantaarnpalen in de gemeente, de waterstanden van het Grevelingenmeer, prestatiegegevens van scholen, verkiezingsuitslagen, …

Kun je met dit soort data echt een app voor een smartphone maken?

Dat is het mooie van open data, anderen krijgen de beschikking over data die ze vanuit hun expertise, interesse gaan bekijken, om er wellicht mogelijkheden in te zien. Dat kan heel iets anders zijn dan je verwacht, bijvoorbeeld omdat de gegevens worden gecombineerd met andere gegevens, waardoor er weer iets nieuws en interessants ontstaat.

Wie weet is er nu een voedingsdeskundige in de zaal die het idee krijgt om deze zaden te combineren met yoghurt voor een gezond ontbijt.

Ik zal wat voorbeelden van open data gebruik de revue laten passeren.

Het Centraal Bureau voor de Statistiek biedt alle gemeentelijke begrotingen aan als open data. Op basis van deze data is de website OpenSpending.nl gemaakt. Hier kun je heel eenvoudig de begroting van een gemeente vergelijken met een andere gemeente, of een begroting van 2015 vergelijk met die van 2010.

image

Ook de begrotingen van Schouwen-Duiveland kun je op deze website bekijken en vergelijken. Zo viel het me op dat de begrootte baten voor Natuurbescherming in 2010 zo’n 4 miljoen waren en in 2015 maar 72 duizend euro. Ik dacht gelijk een goed doel voor mijn schatkist met zaden gevonden te hebben... Maar het verschil bleek vooral door opbrengsten van grondverkopen veroorzaakt te worden. Dit voorbeeld van open data gebruik laat een andere mooie eigenschap van open data zien: het zorgt voor transparantie.

image

De locaties van openbare toiletten leiden tot ‘Find a toilet’ apps. Gegevens van lantaarnpalen worden gebruikt in een app waarmee je een defecte lantaarnpaal kunt melden. Door de specifieke informatie over de lantaarnpaal kan een gemeente of provincie deze “Melding openbare ruimte” efficiënt afwikkelen. In Utrecht heb je een soortgelijke app voor bomen, de bomenspotter.

image

Op basis van gegevens van aardbevingen, ook beschikbaar als open data, zijn informatieve animaties gemaakt die gebruikt worden in het gasboringsdebat.

Een paar voorbeelden om aan te geven dat wellicht saai ogende data tot iets nieuws kunnen leiden.

Hierbij wil ik niet de verwachting scheppen dat alle open data ook wordt gebruikt, het kan ook zo zijn dan niemand er iets mee doet.

Een ander voorbeeld van open data in de genealogische hoek, die vele van u zal aanspreken.

Gemeentearchief Schouwen-Duiveland heeft de nadere toegang op de Burgerlijke Stand gepubliceerd als open data. Dus de openbare gegevens van geboorteakten, huwelijksakten en overlijdensakten, die u waarschijnlijk heeft helpen invoeren, kan ik als hergebruiker downloaden om hier mee te innoveren.

Ik was niet zo tevreden met de functionaliteit die de doorsnee website van archieven biedt. Als informaticus zag ik meer mogelijkheden, mijn handen jeukten. Met de open data kon ik nu mijn eigen website maken en proberen meer uit de data te halen, om nieuwe functionaliteit te bieden die onderzoekers op prijs stellen.

image

De gegevens van Schouwen-Duiveland zijn nu ook beschikbaar via de website Open Archieven, net als de gegevens van Stadsarchief Rotterdam, Erfgoed Leiden en omstreken, Regionaal Archief Tilburg, het Nationaal Archief, gemeentearchief Tholen, Stadsarchief Enschede, gemeentearchief Ede en nog enkele archieven.

De website is ook beschikbaar in het Engels, Duits en Frans, waarmee de gegevens direct voor een veel grotere groep onderzoekers toegankelijk is.

image

Toen ik de data “in handen” had zag ik dat er duidelijke relaties zaten in de gegevens. Neem nu een huwelijksakte, waarin naast het bruidspaar ook hun wederzijdse ouders worden genoemd. Vaak zie je dit soort gegevens op een archiefwebsite puur als tekst onder elkaar gepresenteerd. Op Open Archieven maak ik deze relaties inzichtelijk, door grafische elementen toe te voegen die doen denken aan een kwartierstaat. In één oogopslag zijn de relaties duidelijk.

image

Ook data van de Verenigde Oostindische Compagnie, deels afkomstig van het Zeeuws Archief, wordt gepresenteerd op Open Archieven. Deze gegevens beschrijven de reis die VOC opvarenden maakten, van vertrek bij Kamer Zeeland op een schip richting Batavia, tot aan de Kaap. Dit is een reis door de tijd, die presenteer je niet allen met tekst door alle datums onder elkaar te zetten. Nee, daar gebruik je een tijdlijn voor, zodat ook gelijk inzichtelijk wordt hoe lang de reis duurde.

image

Gegevens op websites worden vaak maar op één manier inzichtelijk gemaakt. Je zoekt op de naam en krijgt akten waar de naam in voorkomt. Maar als je alle data hebt kun je ook andere doorsnedes maken. Zo kun je bijvoorbeeld heel eenvoudig een overzicht maken van veelvoorkomende familienamen in een bepaalde plaats in een bepaalde tijdsperiode in grafiekvorm. Of bekijken wat veelvoorkomende beroepen zijn in een bepaald gebied in een bepaalde tijdsperiode. Informatief en handig voor onderzoek, zoals naar onderwijzers.

image

Ook andere relaties kon ik leggen vanuit de data op Open Archieven. Neem weer een huwelijksakte in gedachte. Als stamboomonderzoeker zult u bij het zien van de huwelijksakte de volgende zoekactie als bedacht hebben: wanneer zijn de ouders geboren en getrouwd, heeft het paar kinderen gekregen? Dit zijn de zoekacties die u dan handmatig op de archiefwebsite gaat uitvoeren. Open Archieven voert deze zoekacties automatisch uit en presenteert de links naar de gerelateerde geboorte- en huwelijksakten (zie voorbeeld). Open Archieven kan ook nog een stap verder gaan en alle bekende relaties weergeven. Het is geen magie, het is gebruik maken van beschikbare gegevens.

image

De historische persoonsgegevens kunnen ook aan andere bronnen gekoppeld worden. Het KNMI biedt de historische weergegevens aan als open data. Op Open Archieven kunt u nu op de datum van een akte klikken om te bekijken wat voor weer het was op de dag van de geboorte, huwelijk of overlijden. De weergegevens van die dag en dichtstbijzijnde weerstation in die tijd, wordt automatisch gekoppeld. Het levert een leuk stukje context op bij de akte.

Historische weer KNMI

Volkstelling gegevens van heel Nederland zijn ook beschikbaar als open data. Hierdoor kan Open Archieven bij bijvoorbeeld een geboorteakte uit 1849 vertellen dat Zierikzee toen 7.092 inwoners had, waarvan 40% Nederduitsch Hervormd en zo’n 13% Rooms Katholiek. Het biedt weer een stukje context over de geboorte.

Open volkstellingen

In bevolkingsregisters wordt ook vaak de straat genoemd. Zou het niet leuk zijn om de straat te bekijken op een historische kaart? Een groot deel van de thans beschikbare open data bestaat uit geografische informatie. Voor enkele plaatsen, zoals Leiden en Nijmegen, heb ik deze geografische informatie gecombineerd met een voor hergebruik beschikbaar gestelde historische kaart. Op Open Archieven kunt u daardoor nu klikken op de straatnaam die dan als lijn wordt weergegeven op een historische kaart van de stad.

Historische kaarten met straat markering

Ik denk met deze functies een mooie dienst te kunnen bieden aan stamboomonderzoekers. Ik hoop hier zelfs aan te kunnen verdienen! En om u gerust te stellen, ik verdien niet direct aan uw noeste arbeid. Deze data wordt immers gratis op de website van het gemeentearchief getoond en kan gratis als open data download worden. Niemand zal daarvoor betalen! Echter, ik heb tijd en geld geïnvesteerd om met de data iets te maken, een dienst, waar mensen wel voor willen betalen. Zo biedt Open Archieven de mogelijkheid om de data te downloaden in GEDCOM formaat die zo is in te lezen in uw stamboomprogramma. Uw zoekopdrachten kunnen in de gaten worden gehouden, wanneer er nieuwe zoekresultaten zijn krijgt u via e-mail een bericht.

image

Deze dienst blijkt meerwaarde te hebben, mensen willen ervoor betalen. Ik heb iets nieuws gemaakt met behulp van open data dat er anders waarschijnlijk niet was gekomen. Het budget van het gemeentearchief voor doorontwikkeling van hun website is beperkt. Het is ook niet de taak van een gemeentearchief  om te innoveren met hun gegevens, zij zijn de hoeders van de archiefbescheiden en stimuleren het gebruik van de archiefbescheiden. Het bieden van open data is één van de manieren waardoor het gebruik gestimuleerd kan worden. Het feit dat het archiefbescheiden niet op de eigen website wordt getoond maar op een andere website is niet van belang. Dat het wordt getoond of wordt gebruikt, dat telt.

Doordat de open data voor iedereen beschikbaar is kunnen vele mensen er iets mee doen, al dan niet commercieel. Je ziet dus enerzijds innovatie, in het geval van Open Archieven op het gebied van genealogie. En anderzijds zie je economische bedrijvigheid ontstaan, een punt dat onder andere oud eurocommissaris Neelie Kroes ook vaak noemt.

Neelie Kroes stelt: "Uw data is meer waard als u die weggeeft". De Europese Commissie heeft uitgerekend dat de directe en indirecte economische impuls van open data 140 miljard euro kunnen bedragen.

image

Tenslotte, nog een ander concreet voorbeeld van wat open data kan opleveren. Recent is een andere hergebruiker aan de slag gegaan met de open data van Erfgoed Leiden. Hij zette alle aktes op volgorde van aktenummer. Hierdoor konden heel eenvoudig fouten in aktenummers opgespoord worden, nummers die dubbel voorkwamen of overgeslagen nummers. Door deze actie werd ook duidelijk dat er een boel akten niet geïndexeerd waren of dat deze data niet op de website stonden. In een register liepen de aktenummers bijvoorbeeld door tot 1100, maar als je de scans bekeek liepen deze door tot 1500. De noeste arbeid van vrijwilligers moet natuurlijk wel compleet beschikbaar zijn.

Oftewel, open data kan ook leiden tot kwaliteitsverbetering van de data zelf! Ik zie dit ook op Open Archieven waar bij elke akte een prominente “Fout melden in gegevens” knop staat. De fouten die gebruikers van Open Archieven melden worden doorgesluisd naar de betreffende archiefinstelling die, als de fout blijkt te kloppen, de gegevens kan verbeteren. Open Archieven ontvangt later de verbeterde gegevens weer uit de vertrouwde bron: de archiefinstelling.



Ik hoop dat u allen open data ziet als zaadjes in deze schatkist, die juist door ze te delen meer waarde kunnen opleveren, oftewel: open data als planthoven van de gemeente.

Ik hoop dat de gemeente het voorbeeld van het gemeentearchief volgt en meer open data gaat bieden. Dat ook het gemeentearchief meer van haar digitale bronnen voor hergebruik beschikbaar gaat stellen. Open de schatkist met gegevens, laat de zaadjes ontkiemen, laat u verrassen!

Ik hoop dat u, vrijwilligers, als "producenten van open data" blij en trots zijn, dat uw data door anderen worden gebruikt in onderzoek èn hergebruikt worden voor ontwikkeling van nieuwe toepassingen!

Bedankt voor de open data.