22 september 2016

Waar zijn uw voorouders geboren? Een geo kwartierstaat toont het!

In een kwartierstaat worden de directe voorouders in mannelijke en vrouwelijke lijn van een proband (ook wel kwartierdrager genoemd) getoond. Veelal wordt een kwartierstaat weergegeven in een tekstuele of een meer grafische vorm:

image(klik afbeelding voor grote weergave)

Genealogie Online biedt via de Kwartierstaat PDF wizard ook de mogelijkheid om modern ogende kwartierstaten te maken die u kunt (laten) uitprinten (en te laten plastificeren om te dienen als placemat!)

image (klik afbeelding voor grote weergave)

Geografische gegevens in kwartierstaat

Wilt u een idee krijgen waar de voorouders zijn geboren dan kunnen de geboorteplaatsen op een kaart worden afgebeeld:

image (klik afbeelding voor grote weergave)

Een idee van de Amerikaanse genealogische blogger Paul Hawthorne, die de kwartierstaat en de geboorteplaatsen combineert, bleek erg populair. Het idee is simpel: in plaats van de namen worden de geboorteplaatsen (of provincies/landen) getoond, waarbij elke plaats een gekleurde achtergrond krijgt om nog makkelijker patronen te onderscheiden.

Ook Nederlandse bloggers als Peter Fasol (Een kaartje voor 6 generaties #MyColorfulAncestry) en Peter Miebies (De geografische kwartierstaat) schreven hier ook over, beide maakten hun eigen geografische kwartierstaat (onder de noemer #MyColorfulAncestry).

De “geo kwartierstaat” kan vrij eenvoudig in bijvoorbeeld Excel worden gemaakt. Genealogie Online heeft deze kwartierstaat weergave opgenomen in haar dienstverlening als onderdeel van het Plus en Premium abonnement. Op basis van een GEDCOM bestand en het “aanwijzen” van de proband (als zogenaamd startpunt) wordt er naast de tekstuele en grafische weergaven ook een geo kwartierstaat gemaakt.

Mijn eigen geo kwartierstaat, die door Genealogie Online automatisch is aangemaakt, ziet er als volgt uit:

image
(klik afbeelding voor grote weergave)

Wanneer de muis over een plaats wordt gehouden in de geo kwartierstaat wordt de naam, geboortejaar en -plaats getoond van de betreffende voorouder.

De geo kwartierstaat kan ook aangepast worden, er kan gekozen worden voor weergave van provincies of landen. Zo blijkt dat 76% van mijn voorouders in Zuid-Holland geboren te zijn, iets wat ik me nog nooit had gerealiseerd!

23 maart 2016

Let op met gebruik van andermans werk!

De hier afgebeelde foto is door mij deze zomer gemaakt, een mooi Nederlands landschap. Als maker van de foto heb ik automatisch het auteursrecht op dit originele 'werk'. Ik hoef het niet te registreren of te voorzien van een copyright teken ©.

Het auteursrecht geeft mij de volgende rechten: 
- het recht om het werk openbaar te maken
- het recht om het werk te verveelvoudigen
- persoonlijkheidsrechten, waaronder:
  • het recht me te verzetten tegen openbaarmaking van het werk zonder vermelding van mijn naam;
  • het recht me te verzetten tegen openbaarmaking van het werk onder een andere naam dan mijn naam;
  • het recht me te verzetten tegen wijzigingen in het werk, tenzij dit verzet in strijd met de redelijkheid en de billijkheid is;
  • het recht me te verzetten tegen misvorming, verminking of andere aantasting van het werk, die mijn goede naam kan schaden.
De begrippen 'openbaar maken' en 'verveelvoudigen' zijn overigens "technologieneutraal". Het maakt dus niet uit met behulp van welke techniek of welke middelen het openbaar maken of verveelvoudigen wordt gedaan.

Kortom, u mag niet zo maar bovenstaande foto in een boek opnemen of op uw website plaatsen!

Waarom deze waarschuwing? 

Stamboomonderzoekers verzamelen in het kader van hun genealogische onderzoek of vastlegging van de familiegeschiedenis informatie en ook beeldmateriaal. Voor persoonlijk gebruik is er geen probleem. Maar bij publicatie in boek of op website wordt het spannend. Bij stukken tekst, afbeeldingen, foto's enz. moet u zich afvragen wie de maker van een werk is. Als u dat niet zelf bent kunt u het niet publiceren, tenzij de auteur van het 'werk' meer dan 70 jaar geleden is overleden of dat de auteur (of rechthebbende) u toestemming heeft gegeven om het werk te publiceren.

Een voorbeeld: de foto hiernaast, van mijn betovergrootouders, is vermoedelijk gemaakt rond hun huwelijk in 1899. De fotograaf heeft het auteursrecht! Stel, het was een jonge fotograaf van 25 jaar en hij is oud 80 jaar geworden. Dus, 25 jaar in 1899 betekent overleden in 1954. Het auteursrecht vervalt dan pas in 2024!

Dat het "mijn" betovergrootouders zijn doet hier niets aan af. Ook het feit dat ik de scan (van de foto die ik fysiek in mijn bezit heb) zonder commerciële bedoeling in mijn stamboom heb staan is niet relevant. Als ik een klein gedeelte/uitsnede van de foto publiceer en de naam van de fotograaf opneem wijzigt dit niets aan de situatie. Ik heb de plicht om te onderzoeken of ik het auteursrecht niet schend. Als er auteursrecht op een werk zit mag het niet zonder toestemming gepubliceerd worden. En dat geldt ook voor u als stamboomonderzoeker en verenigingen!

Gevolgen inbreuk op auteursrecht

Archiefinstellingen met beeld- en krantencollecties, zoals het IISG, Stadsarchief Rotterdam en Erfgoed Leiden en omstreken, hebben bakzeil gehaald bij de rechtbank vanwege het publiceren van foto's en/of scans op hun website waarop auteursrecht rust.

Organisaties als Pictoright (behartigen de belangen van "visuele makers in Nederland") , Lira
("Auteursrechtorganisatie voor schrijvers en vertalers van gedichten, verhalen, essays, columns, novellen, romans, éénakters, toneelstukken, sketches, hoorspelen, tv-spelen, series en films voor tv, conferences en muziek-dramatische werken, zoals opera’s, operettes, musicals en nog veel meer....") en Brein ("Bestrijdt piraterij namens auteurs, producenten en distributeurs van muziek, film en interactieve software") komen in Nederland op voor de belangen van de "makers" en schuwen claims niet. En dan heb je ook de buitenlandse evenknieën van genoemde organisaties. Maar ook individuele makers kunnen u aanspreken op inbreuk op hun auteursrecht. En of je het nu wel of niet eens bent met deze wetgeving, ze staan in hun recht.

Als (amateur)genealoog bent u hiervan niet gevrijwaard! Let dus op welk materiaal u publiceert, vraag toestemming (of neem een licentie op het werk) bij de rechthebbende. Als u dit niet doet loopt u het risico dat een maker (of belangenorganisatie namens de maker) inbreuk op zijn/haar auteursrecht in uw publicatie constateert en dan een schadevergoeding vordert of u "vraagt" alsnog een licentievergoeding van honderden euro's te voldoen.

Heeft u teksten en/of afbeeldingen van derden gepubliceerd op bijvoorbeeld een website? Controleer dan nu of u deze wel mag publiceren!

Tip: Wilt u afbeeldingen van bijvoorbeeld een gebouw als kerk of kasteel opnemen ter illustratie, zoek dan via Google Afbeeldingen (via Zoekhulpmiddelen > Gebruiksrecht) naar afbeeldingen die u mag hergebruiken (vaak herkenbaar aan Creative Commons licentie). Nogmaals: dat een afbeelding (of tekst of video) op Internet staat of in de krant staat betekent niet automatisch dat u het in uw publicatie mag opnemen.

Lees meer over dit onderwerp op de website www.auteursrecht.nl.

08 februari 2016

De eroderende resultaten van het WieWasWie-project

Vandaag is de betaalmuur geactiveerd op de WieWasWie website. Helaas brengt het langverwachte betaalde abonnement de stamboomonderzoeker geen nieuwe functionaliteit, er is alleen minder gratis. Wat is er eigenlijk sinds de dag dat de website live ging op 2 juli 2012 (alweer 3 jaar, 7 maanden en 6 dagen geleden) voor gebruikers bij gekomen op de website? En hoe verhoudt dit zich tot de voorganger Genlias?

Gebruikersfuncties

De eerste kritiek die losbarstte toen de WieWasWie website live ging betrof een functie die Genlias wél had en stamboomonderzoekers niet wilden missen: zoeken op twee personen. Er werd zelf een heuse protestactie opgestart om Genlias in lucht te houden. Het zoeken op 2 personen kwam, waarschijnlijk mede door de genealogen-opstand, op 5 november 2012 beschikbaar op de WieWasWie website, Genlias bleef nog in de lucht tot 1 januari 2013. Dat juist deze functie achter de betaalmuur verdwijnt voelt dus wel een beetje als een opgestoken middelvinger.

De betaalmuur is wel de start van (eerlijkere) concurrentie. Andere aanbieders zoals Open Archieven, kunnen door betere/andere functionaliteit te bieden, sommige gratis andere betaald, proberen om een fijne zoekervaring te bieden en gebruikers daarmee verleiden om een abonnement te nemen voor nog meer functionaliteit. De betaalmuur levert het CBG niet alleen extra geld op (naast de bijdrage die archiefinstellingen betalen en de reclame inkomsten) voor beheer en hopelijk innovatie, het vormt ook een aansporing om te blijven verbeteren om niet al te ver op de concurrentie achter te raken.

(klik op de afbeelding om nog even met weemoed deze vergane website te bekijken)

Genlias was beschikbaar in het Nederlands en Engels. De Engelstalige gebruikers van WieWasWie moesten tot 28 januari 2014 (dus zo'n 1,5 jaar) wachten tot de WieWasWie website ook in het Engels beschikbaar was.

De WieWasWie website had toen het in 2012 live ging wel functies die Genlias niet had: links naar scans en het maken van een stamboom.

Voor het bekijken van de scans, die veelal gewoon op de website van de archiefinstellingen bekeken worden, moest je wel eerst inloggen. Gelukkig werd deze overbodige eis op 23 april 2015 losgelaten, zodat je ook zonder in te loggen de scans kunt bekijken.

Op 2 maart 2015 werd het einde van de stamboom (en resultaten delen) module aangekondigd "vanwege de focus op historische persoonsinformatie uit historische bronnen". Deze marketing taal (of gezwalk zoals ik het in een eerder artikel noemde) moest verbloemen dat de kwaliteit van de stamboom module onvoldoende was en dat ze hierin niet wilden investeren. De personen uit de stambomen werden uit de zoekresultaten gehaald en sinds 4 januari 2016 zijn de stamboomfuncties helemaal verdwenen. Doordat de exportfunctie niet van hoge kwaliteit was en het door CBG gegeven advies om de gegevens te importeren in StamboomNederland, is er waarschijnlijk data van stamboomonderzoekers verloren gegaan.

Netto resultaat zeer mager

Als we de gebruikersfuncties van de WieWasWie website vergelijken met Genlias, dan blijkt dat de miljoenen euro's die het WieWasWie-project verstookte dus een website heeft opgeleverd die (uiteindelijk) dezelfde functionaliteit biedt als Genlias, in een moderner jasje, plus de links naar scans (en wellicht 'favorieten').

Persoonlijk had ik gehoopt op meer. Immers, Genlias moest het veld ruimen omdat de 15 jaar oude website qua technologie niet meer "klaar voor de toekomst" was, uitbreidingen waren niet mogelijk. Je zou dus denken dat qua technologie de website WieWasWie een grote verbetering was. Ik heb de indruk dat de kosten in ieder geval lager zijn geworden voor de deelnemende archieven. Echter, sinds de live-gang van WieWasWie is de zoektechnologie (Solr)alweer vervangen door een andere technologie (ElasticSearch) - wederin op basis van verkregen subsidie. Is de technologie nu wel toekomst bestendig, klaar voor nieuwe functionaliteiten?

Collectie registratie systeem

Waar de meeste gebruikers alleen de 'voorkant' kennen van WieWasWie is er ook een 'achterkant', het zogenaamde collectie registratie systeem (CRS). In dit systeem kan een archiefinstelling de gegevens (nadere toegangen/indexen) invoeren. Naar mijn weten maken niet veel archiefinstellingen gebruik van deze functionaliteit, zij exporteren de gegevens uit hun eigen systeem wat dan ingelezen wordt in de database van WieWasWie, maar daarover later meer. 

Onder andere archiefinstellingen die deelnemen in WieWasWie hebben van mij een hergebruikverzoek ontvangen. Ik wil al hun data in machineleesbaar formaat ontvangen en deze bijvoorbeeld presenteren op Open Archieven zodat onderzoekers gegevens makkelijker kunnen vinden (door slim zoeken methode, waaronder zoeken op 2 personen) en meer informatie krijgen (door te zoeken naar gerelateerde akten en informatie te koppelen aan andere databronnen). Eén van de aangeschreven archiefinstellingen bleek gebruiker te zijn van het CRS en meldde mij dat zij een offerte op zouden vragen bij WieWasWie (dus CBG) voor het verkrijgen van de gegevens. De "offerte" verbaasde mij nogal, de offerte meldt dat er een exportfunctie gebouwd moest worden en dat er daarna nog een aanzienlijk tijd (en dus geld) nodig was voor het daadwerkelijk uitvoeren van de export. Uit betrouwbare bron weet ik dat WieWasWie bij de oplevering een exportfunctie had. Dus, of deze functie is ook onderweg gesneuveld, of de huidige exploitatiepartner heeft hier geen kennis van, of partijen proberen het deelbaar maken van gegevens te frustreren. Hoe dan ook, deze archiefinstelling lijkt dus niet over de eigen (door vele vrijwilligers gemaakte) indexen te kunnen beschikken bij WieWasWie. Schokkend.

Datamodel Archive 2 All (A2A)

Veel gebruikers zijn toch tevreden met WieWasWie. Waarom? Vanwege de gegevens! En laat die nu afkomstig zijn van de archiefinstellingen (dezelfde als sinds de start van WieWasWie, er zijn geen extra archiefinstellingen aangesloten!). Onderstaande grafiek laat zien dat de WieWasWie website (blauwe lijn) zo'n 110 miljoen persoonsvermeldingen presenteert. Ter vergelijking: in december 2012 bood Genlias zo'n 65 miljoen persoonsvermeldingen.

Doordat WieWasWie een de-facto data monopolie had, lopen zij zo ver voor op alternatieven als Archieven.nl (groene lijn) en Open Archieven (paarse lijn). Door de Wet hergebruik overheidsinformatie is WieWasWie echter haar monopolie positie kwijt. Open Archieven (en een ieder) kan nu beschikken over de data van de archiefinstellingen. De praktijk leert dat meer archiefinstellingen niet direct kunnen beschikken over hun eigen data, maar zeker welwillend zijn om de data voor een ieder herbruikbaar te maken als open data. Voor RHC's en Nationaal Archief is het principe van open data leidend. Voor Open Archieven is het streven om nog dit jaar het aantal persoonsvermeldingen op de WieWasWie website te overtreffen.

(klik op de afbeelding voor een grotere, interactieve versie van de grafiek)

Maar eerlijk is eerlijk, het WieWasWie-project heeft op dit vlak wel iets bijgedragen. En wel door een standaard te maken voor het uitwisselen van gegevens: het A2A model. Waar het in het Genlias tijdperk veel gehannes was om de door de vrijwilligers gemaakte indexen van het archief naar Genlias te krijgen is hierin door deze standaard de broodnodige stroomlijning gekomen. 

A2A mag dus best één van de kroonjuwelen van het WieWasWie-project genoemd worden. Het is dus jammer om te zien dat er sinds het opleveren van deze open standaard (versie 1.7 van 7 april 2011) niets aan deze standaard is verbeterd. Het CBG, dat formeel het A2A model beheert, heeft hier tot op heden geen tijd voor gehad. Erg jammer, want de standaard heeft potentie. 

Zo zijn er diverse projecten gaande om het notarieel archief te digitaliseren, dat moet dan toch in A2A gegoten worden? Er zit een basis in A2A om ook gegevens van objecten vast te leggen (denk aan huizen, boten, enz.), maar deze is nog niet uitgewerkt. Als gebruiker van A2A (ook Open Archieven maakt er gebruik van!) heb ik veel ervaring opgedaan met deze standaard, partijen als Picturae, DE REE en DeventIt die deze standaard ook in hun systeem hebben geïmplementeerd zullen ook ervaring hebben opgedaan. Van deze ervaring wordt geen gebruik gemaakt.

Het Beheer- en OntwikkelModel voor Open Standaarden (BOMOS) is een instrument dat helpt bij de inrichting van het beheer van open standaarden. In de beschrijving van BOMOS staat de volgende uitspraak waar ik het hartgrondig mee eens ben: "Een standaard die niet beheerd wordt is geen standaard!". Dat A2A niet wordt beheerd of zelfs wordt gepromoot is betreurenswaardig. Gelukkig wordt het A2A model nog wel gebruikt, door Nederlandse archiefinstellingen, Open Archieven en zelfs door partijen als Ancestry.com en MyHeritage (die ík heb gewezen op deze standaard).

Projectevaluatie

Het zou goed zijn voor de archiefsector en subsidieverstrekkers om het WieWasWie-project weer eens te evalueren. En dan niet zo zeer met de vraag of het project de resultaten heeft opgeleverd die beoogd waren. Maar meer focussen op de fase hierna: zijn de projectresultaten duurzaam geborgd bij de juiste partij zodat projectresultaten niet meer eroderen dan gewenst? In deze tijd, waar in de archiefsector veel aandacht is voor archiefinnovatie, lijken mij inzichten hierover van grote waarde.





Voor wie de voorgeschiedenis van het WieWasWie-project wil teruglezen, zie WieWasWie, een chronologisch overzicht (uit april 2012).

04 januari 2016

"Hier met die data!" maar dan genuanceerder via hergebruik verzoeken

Vandaag heb ik 17 archiefinstellingen een verzoek gestuurd op basis van de Wet hergebruik overheidsinformatie en de hierop aangepaste Archiefwet. Dit soort verzoeken kan overkomen als het binnenstormen van een studiezaal met het spandoek "Hier met die data!". In dit artikel enige nuancering en achtergrond bij de hergebruik verzoeken.

Bewerking van foto Herdenkingsavond Eindhoven, n.a.v. Hongaarse Opstand. Spandoek "Helpt Hongarije" (5 november 1956) van Wim van Rossem / Anefo onder CC-BY licentie van het Nationaal Archief (ook dit is open data!)


Lezers van deze blog weten dat ik een voorstander ben van open data. Waar bijvoorbeeld archiefinstellingen veel informatie bieden via hun website of portal, zie ik graag dat zij ook de achterliggende 'rauwe' data beschikbaar stellen. Met deze data kunnen ontwikkelaars aan de slag om nieuwe functionaliteit mee te maken, nieuwe inzichten halen uit analyse van datasets, combinaties maken met andere datasets, kortom leuke dingen mee doen, die ook voor (stamboom)onderzoekers nieuwe inzichten of diensten kan opleveren.

Bij open data is het de (archief)organisatie die vanuit het "geloof" in open data zelf gegevens in machine-leesbaar formaat beschikbaar stellen. Er zijn meer en meer archiefinstellingen die open data als natuurlijke uitvoering van hun missie zien. Open data krijgt ook steeds vaker een plaatsje in het jaarplan. Helaas blijft het echter nog vaak hangen in plannen en beleid.

De Wet hergebruik overheidsinformatie is ingegaan op 18 juli 2015 en biedt een ieder de mogelijkheid om een "met een publieke taak belaste organisatie" te vragen om data die zij hebben in een machine leesbaar formaat beschikbaar te stellen. De organisatie mag hier ten hoogste "marginale kosten" voor in rekening brengen en heeft maar enkele gronden om het verzoek af te wijzen, waaronder openbaarheid en privacy. 

Ik vraag al sinds lange tijd om de data bij archiefinstellingen:

  • In juni 2012 (alweer 3,5 jaar geleden) gaf ik op het jaarlijkse congres van de Koninklijke Vereniging van Archivarissen (KVAN) de presentatie Geef mij uw data - alstublieft. NB. in een andere presentatie op hetzelfde congres bood een archiefinstelling open data aan en ik stak mijn vinger op om mijn interesse aan te geven (ook deze archiefstelling zit nu in het rijtje van 17). 
  • Eind 2013/begin 2014 maakte ik gebruik van de WOB als middel om aan open data te komen
  • In mei 2014 riep ik de directeuren van de Regionale Historische Centra en Nationaal Archief op in een open brief om de historische persoonsgegevens vrij te geven als open data
  • In oktober 2015 was ik dagvoorzitter bij de door het Nationaal Archief georganiseerde studiemiddag Archieven en open data - en nu?
  • Tussendoor is ook e-mail en twitter ingezet om archieven te prikkelen op het gebied van open data. 
Een significatie toename van archieven die open data bieden bleef helaas uit. Met de hergebruik verzoeken hoop ik hierin verandering te brengen, zodat open data van de middellange termijn planningen naar de actielijst wordt verplaatst.

Mijn geduld raakte op door het nieuwsbericht van WieWasWie dat er in de loop januari 2016 een abonnement benodigd is voor het gebruiken van een deel van de functionaliteit. Voor de goede orde, ik ben niet tegen het abonnement! Nee, het nieuwsbericht van WieWasWie deed mij vooral beseffen dat archiefinstellingen eigenlijk al lange tijd de mogelijkheid hebben om data te leveren. Ze doen dit immers al weer 3,5 jaar door data aan te leveren aan WieWasWie. Waarom kunnen ze deze data wel aan het CBG leveren, maar niet aan u en mij? Waar open data mijns inziens de sleutel tot innovatie is, wordt de data nu slechts aan één (niet innovatieve) partij gegeven. Archiefinstellingen belemmeren hiermee een eerlijk speelveld en innovatie. Niemand is met een dergelijk beleid gebaat.

Ik vraag de archieven met de hergebruik verzoeken niet om iets dat ze niet hebben, het materiaal is openbaar en niet privacy gevoelig, van voldoende kwaliteit want gepubliceerd, het CBG ontvangt deze informatie al gratis en ook de techniek  en standaarden zijn voorhanden. Het enige wat ik vraag is om een "kopietje" van de data.

Ik hoop dat de 17 archiefinstellingen de data niet alleen aan mij bieden voor hergebruik op Open Archieven, maar dat ze het voor een ieder beschikbaar stellen als open data. Zodat een informatica student het kan gebruiken voor z'n bachelorscriptie, internationale partijen als MyHeritage en Ancestry het kunnen gebruiken voor hun matching functionaliteit, een genealogische vereniging het kan koppelen aan hun scanproject, een pensionado met technische achtergrond zinnige dingen kan zeggen over de datakwaliteit, enz. De reacties die ik kreeg  van vrijwilligers van archief Schouwen-Duiveland op de presentatie De schatkist die open data heet was dat zij blij waren dat de door hen ingevoerde (open) data ook daadwerkelijk gebruikt werd.

Met de hergebruikverzoeken wil ik dus zeggen: Kom op archieven, maak werk van open data! Het verzoek is ditmaal wel gekoppeld aan wettelijke kaders en beslistermijnen...

Voor diegenen die willen meehelpen om meer data beschikbaar te krijgen voor hergebruik sluit ik deze blog posting af met het sjabloon dat ik heb gebruikt voor de hergebruik verzoeken die ik heb gestuurd aan de archiefinstellingen (*):

{Archiefinstelling} biedt online diverse openbare aktes aan die via nadere toegangen (indexen) toegankelijk worden gemaakt. Het gaat hierbij onder andere om {opsomming bronnen}. De indexen bevatten de meta-data van de akten, waaronder historische persoonsgegevens, broninformatie en referenties naar scans.

Ik verzoek u om deze indexen krachtens artikel 14 van de Archiefwet te verstrekken langs elektronische weg, in een open en machinaal leesbaar formaat, waarbij het formaat voldoet aan formele open standaarden, overeenkomstig artikel 5, eerste lid, van de Wet hergebruik overheidsinformatie.

Voor meer informatie over de Wet hergebruik overheidsinformatie verwijs ik u naar de website van Open Overheid (http://goo.gl/Dto3RJ) en het informatieblad over hergebruik en open data van het Nationaal Archief (https://goo.gl/HkL1Lm).

Mocht u niet de aangewezen persoon zijn om mijn verzoek te beantwoorden, dan ga ik er vanuit dat u mijn verzoek doorstuurt aan de juiste persoon binnen uw organisatie.
Mocht u vragen hebben, of willen overleggen over hoe het best aan mijn verzoek om informatie tegemoet te komen, dan zie ik uw contactopname graag tegemoet.

(*) De volgende archiefinstellingen hebben vandaag een hergebruik verzoek ontvangen: Archief Eemland, Brabants Historisch Informatie Centrum, Drents Archief, Gelders Archief, Groninger Archieven, Haags Gemeentearchief, Historisch Centrum Leeuwarden, Historisch Centrum Overijssel, Nieuw Land Erfgoedcentrum, Noord-Hollands Archief, Regionaal Archief Alkmaar, Regionaal Archief Eindhoven, Regionaal Historisch Centrum Limburg, Stadsarchief Breda, Tresoar, Utrechts Archief en het Zeeuws Archief.

16 december 2015

De schatkist die open data heet

Transcriptie van voordracht aan burgemeester G.C.G.M. Rabelink van Schouwen-Duiveland en medewerkers en vrijwilligers van gemeentearchief Schouwen-Duiveland op 14 december 2015 in het gemeentehuis te Zierikzee. Afbeeldingen komen uit de getoonde presentatie, waarbij alle afbeeldingen doorlinken naar de bron.

Goedenavond, mijn naam is Bob Coret. Tijdens mijn studie informatica aan de universiteit van Twente heb ik mij bekwaamd in informatie technologie. Wat kan de combinatie van enerzijds technologie en anderzijds informatie ons brengen? Daar houd ik mij tot op de dag van vandaag mee bezig, voor lokale overheden, archiefinstellingen, maar ook stamboomonderzoekers. En open data heeft daar een belangrijke rol in.

Allereerst wil ik met enkele felicitaties beginnen.

Onlangs is de Kwaliteitsmonitor 2015 uitgevoerd door de branchevereniging van Nederlandse archiefinstellingen (BRAIN) en Archief2020. Via digitale vragenlijsten zijn bezoekers bevraagd over diverse kwaliteitsaspecten van de archiefinstelling waar ze op dat moment waren. Het gemeentearchief Schouwen-Duiveland neemt hier, samen met Regionaal Archief Zutphen, een 2e plaats in qua overall scores! Mijn felicitaties gemeentearchief Schouwen-Duiveland, een resultaat waar u trots op mag zijn.

Voor meer informatie over de hoogst scorende archieven op diverse items uit de monitor, zie het overzicht Benchmarking kwaliteitsmonitor 2015.

imageFelicitaties ook naar de gemeente­archivaris Huib Uil. Op 3 december verdedigde hij aan de Vrije Universiteit in Amsterdam zijn proefschrift. Hij verdiepte zich voor zijn promotie-onderzoek in het onderwijs in Zeeland en Staats-Vlaanderen tussen 1578 en 1801. Het proefschrift is getiteld 'De scholen syn planthoven van de gemeente', waarmee hij bedoelt dat de scholen werden gezien als de planthoven, de kweekvijvers van de gemeente.

image

Ik heb hier een schatkist bij me. Deze is gevuld met zaden van de Campanula, een mooie blauw/paarse snijbloem. Het was een gift van een tuinder. Ik heb een balkon, dus ik kan wat van de zaden planten. De rest zal hoogstwaarschijnlijk in deze schatkist blijven. Nu hoor ik u denken: zonde zeg, die zaden wil ik wel voor mijn tuin. De burgemeester stelt zich nu voor hoe de bloemen rond het gemeentehuis zouden staan. En iemand met tuinders achtergrond denkt nu aan de veredelingskwaliteiten van de Campanula. Tja, zonde als deze zaden niet kunnen ontkiemen...

Campanula

Ik ben een hergebruiker, dus Huib, met jouw goedvinden, wil ik de titel van je proefschrift hergebruiken als stelling, die ik voor deze lezing omzet naar ‘Open data zijn planthoven van de gemeente’.

Wat is open data?

Open data is een term die wordt gebruikt om vrij beschikbare informatie aan te duiden. Overheidsorganisaties creëren en verzamelen een boel gegevens voor de uitvoering van hun taken. Als deze organisatie deze rauwe informatie beschikbaar stelt, in een formaat waarmee programmeurs uit de voeten kunnen, dus machine leesbaar, en hierbij aangeven dat het gratis hergebruikt mag worden, dan spreken we van open data.

image

Vanuit Europa en de Nederlandse overheid wordt open data erg gepromoot. Waarom? De open data moet u zien als de zaadjes in deze schatkist. Door de zaadjes beschikbaar te stellen aan anderen, kunnen er mooie planten groeien, nieuwe soorten ontstaan. Door open data her te gebruiken kunnen programmeurs nieuwe applicaties maken, websites en apps. En het mooi van elektronische gegevens is dat je ze oneindig kunt kopiëren. Deze zaden kan ik maar één keer weggeven, maar data kun je blijven “weggeven”, want je hebt het nog steeds.

Over wat voor data heb ik het nu?

Je kunt denken aan de locatie van alle lantaarnpalen in de gemeente, de waterstanden van het Grevelingenmeer, prestatiegegevens van scholen, verkiezingsuitslagen, …

Kun je met dit soort data echt een app voor een smartphone maken?

Dat is het mooie van open data, anderen krijgen de beschikking over data die ze vanuit hun expertise, interesse gaan bekijken, om er wellicht mogelijkheden in te zien. Dat kan heel iets anders zijn dan je verwacht, bijvoorbeeld omdat de gegevens worden gecombineerd met andere gegevens, waardoor er weer iets nieuws en interessants ontstaat.

Wie weet is er nu een voedingsdeskundige in de zaal die het idee krijgt om deze zaden te combineren met yoghurt voor een gezond ontbijt.

Ik zal wat voorbeelden van open data gebruik de revue laten passeren.

Het Centraal Bureau voor de Statistiek biedt alle gemeentelijke begrotingen aan als open data. Op basis van deze data is de website OpenSpending.nl gemaakt. Hier kun je heel eenvoudig de begroting van een gemeente vergelijken met een andere gemeente, of een begroting van 2015 vergelijk met die van 2010.

image

Ook de begrotingen van Schouwen-Duiveland kun je op deze website bekijken en vergelijken. Zo viel het me op dat de begrootte baten voor Natuurbescherming in 2010 zo’n 4 miljoen waren en in 2015 maar 72 duizend euro. Ik dacht gelijk een goed doel voor mijn schatkist met zaden gevonden te hebben... Maar het verschil bleek vooral door opbrengsten van grondverkopen veroorzaakt te worden. Dit voorbeeld van open data gebruik laat een andere mooie eigenschap van open data zien: het zorgt voor transparantie.

image

De locaties van openbare toiletten leiden tot ‘Find a toilet’ apps. Gegevens van lantaarnpalen worden gebruikt in een app waarmee je een defecte lantaarnpaal kunt melden. Door de specifieke informatie over de lantaarnpaal kan een gemeente of provincie deze “Melding openbare ruimte” efficiënt afwikkelen. In Utrecht heb je een soortgelijke app voor bomen, de bomenspotter.

image

Op basis van gegevens van aardbevingen, ook beschikbaar als open data, zijn informatieve animaties gemaakt die gebruikt worden in het gasboringsdebat.

Een paar voorbeelden om aan te geven dat wellicht saai ogende data tot iets nieuws kunnen leiden.

Hierbij wil ik niet de verwachting scheppen dat alle open data ook wordt gebruikt, het kan ook zo zijn dan niemand er iets mee doet.

Een ander voorbeeld van open data in de genealogische hoek, die vele van u zal aanspreken.

Gemeentearchief Schouwen-Duiveland heeft de nadere toegang op de Burgerlijke Stand gepubliceerd als open data. Dus de openbare gegevens van geboorteakten, huwelijksakten en overlijdensakten, die u waarschijnlijk heeft helpen invoeren, kan ik als hergebruiker downloaden om hier mee te innoveren.

Ik was niet zo tevreden met de functionaliteit die de doorsnee website van archieven biedt. Als informaticus zag ik meer mogelijkheden, mijn handen jeukten. Met de open data kon ik nu mijn eigen website maken en proberen meer uit de data te halen, om nieuwe functionaliteit te bieden die onderzoekers op prijs stellen.

image

De gegevens van Schouwen-Duiveland zijn nu ook beschikbaar via de website Open Archieven, net als de gegevens van Stadsarchief Rotterdam, Erfgoed Leiden en omstreken, Regionaal Archief Tilburg, het Nationaal Archief, gemeentearchief Tholen, Stadsarchief Enschede, gemeentearchief Ede en nog enkele archieven.

De website is ook beschikbaar in het Engels, Duits en Frans, waarmee de gegevens direct voor een veel grotere groep onderzoekers toegankelijk is.

image

Toen ik de data “in handen” had zag ik dat er duidelijke relaties zaten in de gegevens. Neem nu een huwelijksakte, waarin naast het bruidspaar ook hun wederzijdse ouders worden genoemd. Vaak zie je dit soort gegevens op een archiefwebsite puur als tekst onder elkaar gepresenteerd. Op Open Archieven maak ik deze relaties inzichtelijk, door grafische elementen toe te voegen die doen denken aan een kwartierstaat. In één oogopslag zijn de relaties duidelijk.

image

Ook data van de Verenigde Oostindische Compagnie, deels afkomstig van het Zeeuws Archief, wordt gepresenteerd op Open Archieven. Deze gegevens beschrijven de reis die VOC opvarenden maakten, van vertrek bij Kamer Zeeland op een schip richting Batavia, tot aan de Kaap. Dit is een reis door de tijd, die presenteer je niet allen met tekst door alle datums onder elkaar te zetten. Nee, daar gebruik je een tijdlijn voor, zodat ook gelijk inzichtelijk wordt hoe lang de reis duurde.

image

Gegevens op websites worden vaak maar op één manier inzichtelijk gemaakt. Je zoekt op de naam en krijgt akten waar de naam in voorkomt. Maar als je alle data hebt kun je ook andere doorsnedes maken. Zo kun je bijvoorbeeld heel eenvoudig een overzicht maken van veelvoorkomende familienamen in een bepaalde plaats in een bepaalde tijdsperiode in grafiekvorm. Of bekijken wat veelvoorkomende beroepen zijn in een bepaald gebied in een bepaalde tijdsperiode. Informatief en handig voor onderzoek, zoals naar onderwijzers.

image

Ook andere relaties kon ik leggen vanuit de data op Open Archieven. Neem weer een huwelijksakte in gedachte. Als stamboomonderzoeker zult u bij het zien van de huwelijksakte de volgende zoekactie als bedacht hebben: wanneer zijn de ouders geboren en getrouwd, heeft het paar kinderen gekregen? Dit zijn de zoekacties die u dan handmatig op de archiefwebsite gaat uitvoeren. Open Archieven voert deze zoekacties automatisch uit en presenteert de links naar de gerelateerde geboorte- en huwelijksakten (zie voorbeeld). Open Archieven kan ook nog een stap verder gaan en alle bekende relaties weergeven. Het is geen magie, het is gebruik maken van beschikbare gegevens.

image

De historische persoonsgegevens kunnen ook aan andere bronnen gekoppeld worden. Het KNMI biedt de historische weergegevens aan als open data. Op Open Archieven kunt u nu op de datum van een akte klikken om te bekijken wat voor weer het was op de dag van de geboorte, huwelijk of overlijden. De weergegevens van die dag en dichtstbijzijnde weerstation in die tijd, wordt automatisch gekoppeld. Het levert een leuk stukje context op bij de akte.

Historische weer KNMI

Volkstelling gegevens van heel Nederland zijn ook beschikbaar als open data. Hierdoor kan Open Archieven bij bijvoorbeeld een geboorteakte uit 1849 vertellen dat Zierikzee toen 7.092 inwoners had, waarvan 40% Nederduitsch Hervormd en zo’n 13% Rooms Katholiek. Het biedt weer een stukje context over de geboorte.

Open volkstellingen

In bevolkingsregisters wordt ook vaak de straat genoemd. Zou het niet leuk zijn om de straat te bekijken op een historische kaart? Een groot deel van de thans beschikbare open data bestaat uit geografische informatie. Voor enkele plaatsen, zoals Leiden en Nijmegen, heb ik deze geografische informatie gecombineerd met een voor hergebruik beschikbaar gestelde historische kaart. Op Open Archieven kunt u daardoor nu klikken op de straatnaam die dan als lijn wordt weergegeven op een historische kaart van de stad.

Historische kaarten met straat markering

Ik denk met deze functies een mooie dienst te kunnen bieden aan stamboomonderzoekers. Ik hoop hier zelfs aan te kunnen verdienen! En om u gerust te stellen, ik verdien niet direct aan uw noeste arbeid. Deze data wordt immers gratis op de website van het gemeentearchief getoond en kan gratis als open data download worden. Niemand zal daarvoor betalen! Echter, ik heb tijd en geld geïnvesteerd om met de data iets te maken, een dienst, waar mensen wel voor willen betalen. Zo biedt Open Archieven de mogelijkheid om de data te downloaden in GEDCOM formaat die zo is in te lezen in uw stamboomprogramma. Uw zoekopdrachten kunnen in de gaten worden gehouden, wanneer er nieuwe zoekresultaten zijn krijgt u via e-mail een bericht.

image

Deze dienst blijkt meerwaarde te hebben, mensen willen ervoor betalen. Ik heb iets nieuws gemaakt met behulp van open data dat er anders waarschijnlijk niet was gekomen. Het budget van het gemeentearchief voor doorontwikkeling van hun website is beperkt. Het is ook niet de taak van een gemeentearchief  om te innoveren met hun gegevens, zij zijn de hoeders van de archiefbescheiden en stimuleren het gebruik van de archiefbescheiden. Het bieden van open data is één van de manieren waardoor het gebruik gestimuleerd kan worden. Het feit dat het archiefbescheiden niet op de eigen website wordt getoond maar op een andere website is niet van belang. Dat het wordt getoond of wordt gebruikt, dat telt.

Doordat de open data voor iedereen beschikbaar is kunnen vele mensen er iets mee doen, al dan niet commercieel. Je ziet dus enerzijds innovatie, in het geval van Open Archieven op het gebied van genealogie. En anderzijds zie je economische bedrijvigheid ontstaan, een punt dat onder andere oud eurocommissaris Neelie Kroes ook vaak noemt.

Neelie Kroes stelt: "Uw data is meer waard als u die weggeeft". De Europese Commissie heeft uitgerekend dat de directe en indirecte economische impuls van open data 140 miljard euro kunnen bedragen.

image

Tenslotte, nog een ander concreet voorbeeld van wat open data kan opleveren. Recent is een andere hergebruiker aan de slag gegaan met de open data van Erfgoed Leiden. Hij zette alle aktes op volgorde van aktenummer. Hierdoor konden heel eenvoudig fouten in aktenummers opgespoord worden, nummers die dubbel voorkwamen of overgeslagen nummers. Door deze actie werd ook duidelijk dat er een boel akten niet geïndexeerd waren of dat deze data niet op de website stonden. In een register liepen de aktenummers bijvoorbeeld door tot 1100, maar als je de scans bekeek liepen deze door tot 1500. De noeste arbeid van vrijwilligers moet natuurlijk wel compleet beschikbaar zijn.

Oftewel, open data kan ook leiden tot kwaliteitsverbetering van de data zelf! Ik zie dit ook op Open Archieven waar bij elke akte een prominente “Fout melden in gegevens” knop staat. De fouten die gebruikers van Open Archieven melden worden doorgesluisd naar de betreffende archiefinstelling die, als de fout blijkt te kloppen, de gegevens kan verbeteren. Open Archieven ontvangt later de verbeterde gegevens weer uit de vertrouwde bron: de archiefinstelling.



Ik hoop dat u allen open data ziet als zaadjes in deze schatkist, die juist door ze te delen meer waarde kunnen opleveren, oftewel: open data als planthoven van de gemeente.

Ik hoop dat de gemeente het voorbeeld van het gemeentearchief volgt en meer open data gaat bieden. Dat ook het gemeentearchief meer van haar digitale bronnen voor hergebruik beschikbaar gaat stellen. Open de schatkist met gegevens, laat de zaadjes ontkiemen, laat u verrassen!

Ik hoop dat u, vrijwilligers, als "producenten van open data" blij en trots zijn, dat uw data door anderen worden gebruikt in onderzoek èn hergebruikt worden voor ontwikkeling van nieuwe toepassingen!

Bedankt voor de open data.

16 september 2015

Extra kinderen vinden door open data

Doordat archieven hun genealogische gegevens (de nadere toegangen) als open data beschikbaar stellen kunnen programmeurs handige en mooie services voor stamboomonder­zoekers maken. Het aantal archieven dat open data biedt is nog beperkt, maar met de onlangs ingevoerde Wet hergebruik overheidsinformatie en onlangs aangepaste Archiefwet zal dit aantal snel stijgen!

Open Archieven biedt een zoekmachine voor historische persoonsgegevens. De gegevens zijn afkomstig van diverse archiefinstellingen die hun gegevens voor hergebruik beschikbaar hebben gesteld. Op basis van deze open data is een dienst neergezet die laat zien dat je met deze data meer kan dan archiefinstellingen nu doen:

  • akten worden zo weergegeven dat er recht wordt gedaan aan de inhoud/structuur van de informatie
  • er worden bij akten suggesties gegeven voor gerelateerde akten
  • er wordt gelinkt met externe bronnen zoals het Biografisch Portaal Nederland, Graftombe, de Oorlogsgravenstichting en online stambomen
  • er wordt context toegevoegd uit weer andere open data bronnen zoals de historische weerreeksen van het KMNI en de volkstellinggegevens
  • er wordt gelinkt naar scans bij andere organisaties
  • er wordt gelinkt naar historische kaarten op basis van straatgegevens van OpenStreetMaps

Open Archieven biedt op haar beurt ook diverse functies aan via een geautomatiseerde toegang (API) aan programmeurs. Zo maakt bijvoorbeeld Genealogie Online gebruik van de zoekfunctie van Open Archieven om haar gebruikers extra informatie te bieden in de vorm van “extra kinderen”.

Voor elke ouderkoppel in een publicatie op Genealogie Online wordt Open Archieven automatisch doorzocht op kinderen van dit ouderpaar. De zoekresultaten (=kinderen) worden vergeleken met de kinderen die de stamboom­onderzoeker al heeft beschreven in zijn of haar publicatie. Op deze manier kunnen er “extra kinderen” worden gevonden en kan de stamboom­onderzoeker het betreffende gezin in zijn of haar publicatie completer maken!

Genealogie Online biedt deze functie aan als onderdeel van de Scans zoeken service. Hieronder een schermafdruk van enkele “extra” gevonden kinderen zoals een Genealogie Online abonnee die te zien krijgt:

image

Het vinden van kinderen van ouderkoppels kan natuurlijk nu al via de vele archiefwebsites, handmatig... Maar, door open data, kan deze zoekactie naar kinderen geautomatiseerd worden wat voor genealogen tijdwinst betekent. En deze extra tijd kan weer in andere opzoekingen gestopt kan worden!