29 december 2013

Open data en het verdienmodel, het kan goed samengaan

In Wat worden de 3 belangrijkste archieftrends in 2014?” noemt archivaris Christian van der Ven de volgende trend die ik graag eens uitdiep:

3. Verdienmodellen zijn uit, open data is in
Archieven willen werk maken van open data, maar krijgen daarnaast steeds vaker de opdracht om geld te verdienen aan hun collecties. Van alles iets is feitelijk niets, keuzes worden duidelijker en scherper.

Voor het referentiekader even de definities.

Het verdienmodel

Een verdienmodel beschrijft de manier waarop een organisatie geld verdient. Dat kan bijvoor­beeld door de verkoop van goederen, het aanbieden van een dienst (via abonnement of betaling voor gebruik) of het aanbieden van reclamemogelijkheden.

Open data

Open data is data die vrij gebruikt kan worden, hergebruikt kan worden en opnieuw verspreid kan worden door iedereen - onderworpen enkel, in het uiterste geval, aan de eis tot het toe­schrijven en gelijk delen.

Open data versus het verdienmodel

Met de definities van beide termen in gedachten kan de conclusie zijn dat deze twee elkaar uitsluiten, dat je dus een keuze moet maken. Maar is dat wel zo? Welk archief verkoopt bijvoorbeeld index gegevens? Archieven willen nog wel eens de scans verkopen van akten of beeldcollectie. Open data betekent niet dat je ‘alles wat je hebt’ allemaal in machineleesbaar formaat op Internet zet, het is geen zwart-wit keuze!

Verdienen alleen voor bedrijven?

Dat archiefinstellingen de opdracht krijgen om te verdienen aan hun collectie zal bij sommigen de reactie oproepen “dat commerciële gedoe past alleen bij bedrijven, straks moeten we overal voor betalen”.

Sorry hoor, maar we betalen al overal voor, alleen de wijze waarop verschilt, de ene methode is alleen zichtbaarder dan anderen. Een boek koop je in de winkel door direct geld te overhandigen (fysiek danwel elektronisch). De archief­instelling­en betalen we indirect via de belasting. Het grappige is natuurlijk dat we met z’n allen liever minder belasting betalen, maar een toegangsprijs voor een archief is ook uit den boze…

Het gaat mij hierin niet om de politieke discussie. Ik denk dat als archiefinstellingen willen verdienen aan hun collectie (dit is een keuze), ze dit kunnen.

Om alvast een idee te opperen: de meeste archiefwebsites zijn alleen in het Nederlands beschikbaar. De niet-Nederlandse genealogen populatie met Nederlandse voorouders is een leuke doelgroep. Maak een maatwerk onderzoeksdienst voor de niet-Nederlanders. Je maakt gebruik van de eigen collectie die weer beter beschikbaar komt voor een niet-Nederlands publiek. Voor een dergelijke dienstverlening is een uurtarief vrij gebruikelijk!

Maar in dit artikel wil ik vooral betogen dat open data archiefinstellingen ook veel kan opleveren!

Anderen kunnen geld verdienen aan onze data?

Een veelgehoorde drempel bij organisaties die nadenken over open data is het feit dat andere personen/organisatie geld zouden kunnen verdienen met ‘hun’ data.

Als je al de eigenaar kunt zijn van data (wat meestal niet zo is, lees de blogpostings van Arnoud Engelfriet er nog maar eens op na) dan gaat het bij archieven vaak om openbare bronnen die met behulp van vele vrijwilligers zijn geïndexeerd. Naast het juridische en morele eigenaarschap wijs ik liever naar de missie statements van archieven die vaak reppen van het ‘aan een zo breed mogelijk publiek beschikbaar stellen van onze collectie’.

Als je wilt dat je collectie gezien/gebruikt wordt dan moet je toch juist anderen aanmoedigen en ondersteunen om de collectie te gebruiken?

Stel, ik download alle genealogische (open) data van Erfgoed Leiden en omstreken (verder ELO genoemd) en brand deze op DVD’s die ik voor 75 euro in een luxe box verkoop in een webshop en op genealogische beurzen. De licentie op de open data van ELO staat mij deze commerciële activiteit toe, sterker nog, ik denk dat ELO er zelfs blij mee zou zijn. Maar: gat in de markt, word ik rijk?

Rijk betekent dat ik meer verdien dan dat het kost, dus lage kosten en veel verkoop. Aan de kosten kant staan investeringen in infrastructuur, DVD brander, software om data te harvesten, bandbreedte, blanco DVD’s, tijd (die van mij of die van een andere in te huren partij of persoon), luxe boxes, maken webshop, enz.

Of de luxe box veel verkocht zal worden hangt af van de waarde die het voor de doelgroep heeft en andere aanbieders. Aan het ELO heb ik een grote ‘concurrent’, zij stellen de data namelijk via hun website gratis beschikbaar. Mijn doelgroep zal dus bestaan uit mensen zonder Internet en mensen die de complete set genealogische data willen hebben. Ik kan u verklappen dat de DVD box mij niet rijk gaat maken.

Met deze DVD box gedachte wil ik een aantal punten duidelijk maken:

  • wil je geld verdienen moet je ook investeren
  • wil je geld verdienen dan moet je een product of dienst bieden die voor anderen een waarde heeft (en dit product moet niet door anderen beter/sneller/goedkoper/gratis geboden)

Geld verdienen met open data

Het is mogelijk om geld te verdienen aan open data, je moet simpelweg iets met de data doen waardoor het waarde krijgt!

Om in de buurt van ELO te blijven een idee met potentieel. Er komt meer en meer data beschikbaar via de website van ELO. Als gebruiker wil je liever niet elke maand terugkomen om te kijken of er nieuwe resultaten zijn. Die je dan ook nog eens stuk voor stuk moet overtypen in je stamboomprogramma. Een dienst die voor gebruikers maandelijks kijkt of er nieuwe gegevens zijn en, als deze er zijn, automatisch e-mailt in GEDCOM formaat, zal voor veel genealogen een aantrekkelijk aanbod zijn.

Afhankelijk van de prijsstelling en kosten valt er geld te verdienen aan dit idee. Het ELO en elke andere archiefinstelling kan dit idee oppakken… Maar hoort dit soort diensten bij hun core business? Kunnen en willen archiefinstellingen hierin investeren? Zijn IT projecten de sterke kant van archiefinstellingen? Is het erg dat personen of organisaties buiten de archiefinstellingen het idee oppakken en geld verdienen?

Maar de hamvraag is denk ik meer: als een derde een dergelijk dienst maakt op basis van de open data van een archiefinstelling, verdient de archiefinstelling dan niets?

Door de dienst wordt de collectie getoond. Veel genealogen nemen niet genoegen met alleen de data, zij willen de akte zien wellicht zelfs kopen. Dus, de dienst zorgt voor websiteverkeer en wellicht zelfs scanverkoop (dus omzet). De archiefinstelling kan er dus indirect zeker aan verdienen!

Ik kan mij ook andere diensten voorstellen, die zorgen dat de kwaliteit van de data beter wordt (door analyses, visualisaties of crowd-sourcing) of rijker doordat deze gelinkt wordt met datasets of scans die elders beschikbaar zijn. Dit is wellicht geen omzet die je in euro’s uitdrukt, maar becijfer eens wat er wordt bespaard, hoeveel een dergelijk project zou kosten als de archiefinstelling deze zelf opzet?

Echte business

Even een voorbeeld uit de commerciële dienstverlening. Bol.com is vooral bekend van de online verkoop van boeken en CD’s/DVD’s. Maar de omzet (ruim 400 miljoen euro in 2012) komt uit steeds meer productgroepen.

Om de omzet te laten groeien zorgen ze er (onder andere) voor dat anderen hen helpen met de verkoop van producten.

De bol.com Open API geeft je toegang tot het complete aanbod van de grootste online winkel van Nederland. Gebruik bol.com data in je eigen concept of applicatie en verdien geld via het bol.com partnerprogramma.

Als ontwikkelaar kan ik dus eenvoudig alle boeken en software die relevant zijn voor genealogen en historici opnemen in mijn webwinkel. Bol.com bereikt hiermee weer een interessante doelgroep, de links leiden naar bol.com en wellicht verkoop. Bezoekers blij met het boekaanbod, Bol.com blij met de omzet en ik blij met de provisie die ik over de door mij genereerde omzet ontvang (en de overheid weer blij met de omzetbelasting)!

Bol.com snapt het!

Potentiële business

Laten we het voorbeeld van bol.com nu eens doortrekken naar de archiefsector. De website Militieregisters.nl is een webwinkel van diverse archiefinstellingen (op initiatief van Stadsarchief Amsterdam) die scans van militieregisters verkoopt. Als ‘webshop eigenaar’ wil je natuurlijk graag je omzet verhogen. Je zou natuurlijk het bol.com voorbeeld kunnen volgen: stel de index gegevens open beschikbaar zodat andere deze kunnen gebruiken.

Qua gebruiker van deze index gegevens denk dan bijvoorbeeld aan websites die genealogische gegevens van stamboomonderzoekers publiceren. Door deze gegevens te matchen met de index van militieregisters kan de website haar gebruikers suggesties doen in de trant van ‘je overgrootvader Adrianus van Hoog komt voor op Militieregisters.nl’.

Een dergelijke dienst, die in wezen persoonlijk gerichte reclame is die op prijs wordt gesteld, zal webverkeer naar militieregister.nl opleveren en waarschijnlijk ook extra omzet!

Snappen archieven dit?

Dienen of verdienen…

De overheid stimuleert archiefinstellingen om hun collecties ten gelde te maken. Dit begint denk ik met de constatering dat dienen iets anders is dan verdienen. Een andere gedachte, een andere mentaliteit, andere vaardigheden. Deze komen niet vanzelf, daaraan zal gewerkt moeten worden. Investeer hierin, betrek de juiste personen en/of instellingen, wees creatief.

Open data past mijns inziens goed in zowel het “dien” als “verdien” straatje. Let wel, ook open data vraagt om een investering, terwijl het geen garantie is voor meer verdienen.

Maar zoals ik in dit artikel heb laten zien kan open data leiden tot meer websiteverkeer, meer scanverkoop, een hogere kwaliteit van de data, nieuwe diensten, innovatie, nieuwe inzichten en visualisaties, economische activiteit, meer inzage/gebruik van de collectie, …

Dus archiefinstellingen: ga voor open data, de collectie verdient het!

05 november 2013

Open Archieven is op zoek naar uw bronbewerkingen en indexen

imageVeel van de genealogische gegevens die archieven onder de noemer Nadere toegang beschikbaar stellen aan hun bezoekers zijn tot stand gekomen door vele vrijwilligers. Echter, er zijn ook onderzoekers die bronnen indexeren, transcriberen en bewerken buiten het archiefsysteem. Wat gebeurt er met dit waardevolle materiaal?

Het werk van vrijwilligers

Veel archiefinstellingen maken gebruik van vrijwilligers om bronnen te ontsluiten. Zij werken dan direct in het archiefbeheersysteem of via een speciaal daartoe ontwikkeld programma.

Maar niet elke onderzoeker wilde of wil deze systemen gebruiken en indexeert met eigen middelen bronnen, bijvoorbeeld met behulp van Excel (een spreadsheet) of Word. Publiceren doet men op de eigen website of plaatst deze op een bronbewerkingen website als GeneaScript. De vrijwilligers van de website Van Papier Naar Digitaal gaan nog een stap verder door ook de bronnen te fotograferen en te publiceren en daarna te indexeren of transcriberen.

Het nadeel van dergelijke, her en der verspreidde, bronbewerkingen is dat deze niet makkelijk doorzoekbaar zijn. Google kan een boel vinden, maar gegevens uit een gecomprimeerde Access database zullen niet snel opduiken in de zoekresultaten van Google.

Ook de gebruikersvriendelijkheid van deze websites laat vaak te wensen over: veel passie en tijd gaat er in de bronbewerkingen zitten, maar qua technologie blijven deze websites ver achter. Eenvoudig doorzoeken, mooi meertalig presenteren, koppelen van gegevens en scans, duidelijke bronvermeldingen, exporteren naar PDF of GEDCOM, dat is er bij deze websites niet bij.

Open Archieven ook voor bronbewerkingen

Deze gemiste functies worden wel geboden door Open Archieven. De focus van Open Archieven was gericht op archieven en het voor hergebruik beschikbaar krijgen van hun historische persoonsgegevens. Sinds kort is deze focus echter verbreed: ook de bronbewerkingen van vrijwilligers verdienen een innovatieve zoekmachine en mooie presentatie!

De eerste 4 bronbewerkingen van vrijwilligers zijn nu via Open Archieven beschikbaar.

Volkstelling Rijnsburg 1840 en een historische kaart

Open Archieven is van start gegaan met alle genealogische gegevens van Erfgoed Leiden en omstreken (voorheen Regionaal Archief Leiden). De volkstelling van Rijnsburg van 1840 zit echter niet in die dataset. De scans hiervan zijn online wel beschikbaar via inventarisnummer 1284, Bevolkingsregister 1840-1845, maar het archief heeft geen index.

Joop Glasbergen heeft de volkstelling van Rijnsburg uit 1840 geïndexeerd. Met zijn toestemming zijn deze gegevens ingelezen door Open Archieven (voorbeeld).

Het leuke van een bevolkingsregister is dat er ook informatie in zit omtrent het ‘adres’. Zo ook in de volkstelling van Rijnsburg. Open Archieven wil dergelijke geografische informatie graag ‘op de kaart’ weergeven. Van de 18 straatnamen die in de volkstelling voorkomen is de positie van 10 straten nu bekend.

Als Open Archieven een straatnaam tegenkomt in een akte die bekend is dan wordt deze straatnaam voorzien van een link. Deze link leidt naar een historische kaart met een aanduiding waar de betreffende straat ligt.

image

Qua technologie wordt Google Maps gebruik, dus in- en uitzoomen en verplaatsen werken vertrouwd. Ook kan de transparantie van de historische kaart aangepast worden door een schuifje (rechtsboven) te verplaatsen waardoor de huidige kaart zichtbaar worden.

In het geval van Rijnsburg wordt er een kaart van 1813 gebruikt, een digitale kaart van omstreeks 1840 is helaas nog niet gevonden.

Index ref. dopen Tienhoven en FamilySearch scans

Door Kees Kooij is er een index gemaakt op de dopen (1740-1811) in Tienhoven. De index van dopen is, met toestemming, ingelezen in Open Archieven.

Uit het overzicht van digitaal beschikbare bronnen van Regionaal Historisch Centrum (RHC) Vecht en Venen blijkt dat het archief deze bron niet geïndexeerd ter beschikking heeft, wel hebben ze scans. Voor het raadplegen van deze scan moet je echter fysiek naar het RHC toe om aldaar via het DAIS systeem de scans te bekijken.

Om de gebruiker optimaal van dienst te zijn moet er in mijn optiek ook een scan van de akte of gescand register beschikbaar zijn. Zoals ik in Weet waar er online scans worden aangeboden! heb aangetoond zijn er vaak scans te vinden op FamilySearch, zo ook van de dopen uit Tienhoven en de eerder genoemde volkstelling van Rijnsburg. Door de bronbewerkingen te koppelen (plus het nodige handwerk) tonen de doopakten op Open Archieven nu ook een link naar de juiste afbeelding op FamilySearch (voorbeeld).

image

Index ref. trouwen Tienhoven en de temperatuur

Kees Kooij heeft ook geïndexeerd wie er is getrouwd tussen 1702 en 1811, ook deze gegevens zijn opgenomen in Open Archieven (voorbeeld).

Naast historische geografische informatie heeft Open Archieven ook de historische weergegevens van het KNMI ingelezen. Hierdoor kan Open Archieven voor bepaalde perioden ook informatie geven over de temperatuur.

Wanneer er weerinformatie beschikbaar is dan wordt de datum in de akte onderstreept. Klikken op de link brengt een scherm naar voren met de temperatuur rond die datum. Zo blijkt 10 februari 1751 een koude trouwdag te zijn geweest…

image


Aangegeven lijken in Alkemade en scans bij GaHetNa

Door Jos van Rijn is er een index gemaakt op de aangegeven lijken in Alkemade tussen 1738 en 1747. De bronbewerking is met toestemming opgenomen in Open Archieven (voorbeeld).

Ook bij deze bronbewerking is er gezocht naar scans van de betreffende akten. Noch de Groene Hart Archieven, noch FamilySearch heeft echter scans van deze bron… Maar het Nationaal Archief biedt via GaHetNa wel scans aan, deze zijn echter niet gekoppeld aan namen.

image

Open Archieven heeft deze bronbewerking weer slim (en met enig handwerk) gekoppeld aan scans.

Kien op bronvermeldingen

Nu Open Archieven scans toont van verschillende websites wordt er voor de duidelijkheid een logo getoond bij de afbeelding van de scan. Hierboven stonden al voorbeelden van FamilySearch en GaHetNa, hieronder een voorbeeld als de scan en informatie van dezelfde archiefinstelling afkomstig zijn (in dit geval Erfgoed Leiden en omstreken).

image

Open Archieven hecht grote waarde aan bronvermeldingen. Dus bij elke akte staat een bronvermelding die slaat op waar de originele akte gevonden kan worden. Als de scan van een andere locatie komt, dan wordt hier ook een andere bronvermelding getoond.

image

De akten op Open Archieven kunnen via het gegevensmandje ook in PDF en GEDCOM formaat gedownload worden. Wanneer een akte in GEDCOM formaat wordt gedownload dan komt zowel de bronvermelding als de link naar de scan beschikbaar in uw stamboomprogramma.

Bij alle akten op Open Archieven die zijn voortgekomen uit een bronbewerking van een vrijwilliger wordt uiteraard diens naam genoemd.

image

Bronbewerkingen en indexen gezocht

Heeft u bepaalde genealogische bronnen geïndexeerd en heeft u deze beschikbaar in een gestructureerd, digitaal formaat? Neem contact op!

Open Archieven presenteert uw bronbewerkingen graag, zodat de gegevens makkelijker vindbaar zijn en mooi worden gepresenteerd.

22 oktober 2013

Weet waar er online scans worden aangeboden!

imageTe vaak krijg ik van stamboom­onder­zoek­ers te horen dat ze niet verder zoeken als ze op WieWasWie geen scan zien. Dat is zonde, want zeker voor een bron als de Burgerlijke Stand is er vaak wel online een scan te vinden, je moet gewoon weten waar je moet zoeken.

Proef op de som

Om de huidige stand van zaken rondom gegevensverspreiding en beschikbaarheid van scans te beoordelen heb ik een steekproef opgezet. Ik heb bij 17 archiefstellingen een geboorte akte uit de Burgerlijke Stand uit hun collectiegebied gezocht in

  • WieWasWie
  • de website van het archief
  • archieven.nl

Het resultaat van deze steekproef is weergegeven in een uitbreide spreadsheet, waarin is aangegeven welk akte is gezocht, waar deze is gevonden en bovenal of er een scan is gevonden. Hieronder de korte samenvatting:

image

Klik op bovenstaande afbeelding om de complete spreadsheet in te zien. Hieronder staan de conclusies van de steekproef.

Beginnen met zoeken

Als je onderzoek doet in een bepaalde regio dan is de archiefwebsite vaak de logische start van de online zoektocht. Echter, niet alle archieven uit de steekproef bieden de geïndexeerde gegevens van de Burgerlijke Stand op hun website aan! De websites van Erfgoed Centrum Nieuwland en het Noord-Hollands Archief verwijzen direct naar WieWasWie voor 'hun' gegevens.

Bij sommige archiefwebsites moet je even goed zoeken. Bij RHC Limburg wordt er in eerste instantie verwezen naar Genlias (hier later meer over) en ook WieWasWie. Maar kies je op de website van RHC Limburg voor het “Zoeken in onze archieven en collecties” dan komt er ook een Personen tabblad te voorschijn waarmee op naam gezocht kan worden in de akten.

Bij Historisch Centrum Overijssel wordt er voor de Burgerlijke Stand gegevens verwezen naar WieWasWie, maar een zoekopdracht op Google leert, dat er wel een pagina op de archiefwebsite is om personen te doorzoeken. Een link naar deze pagina kan ik op de website van het HCO niet vinden.

Compleetheid WieWasWie

Van de 17 akten die ik initieel in de steekproef had kon ik er één niet vinden op WieWasWie. Een Harderwijker akte kon ik alleen op de website van het Gelders Archief (en archieven.nl) vinden, eigenaardig, daar het Gelders Archief wel gegevens van de Burgerlijke Stand van Harderwijk aanbiedt, maar niet alles? Voor het Gelders Archief heb ik om deze reden de steekproef met één akte uitgebreid, die wel op WieWasWie te vinden was.

De compleetheid van gegevens op WieWasWie moet ook op een ander vlak kritisch bekeken worden. Zo staan bij de akten op de websites van RHC Eindhoven en Archief Eemland ook aktenummers vermeld. Op WieWasWie staan bij dezelfde akten echter geen aktenummers (of in WieWasWie termen “documentnummers”) vermeld. NB: als WieWasWie deze aktenummers niet ontvangt van de archieven (bewust of onbewust), dan kan een intermediair website als WieWasWie deze ook niet tonen.

Uitgebreide functionaliteit

Sommige archiefwebsites gaan qua functionaliteit al verder dan (het huidige) WieWasWie. Zo is het bij de Groninger Archieven (AlleGroningers) en het Tresoar (AlleFriezen) mogelijk om de gegevens van de akte te downloaden in PDF en "GEDCOM" formaat (ik gebruik aanhalingstekens omdat de bestanden niet geheel aan de GEDCOM 5.5.1 standaard voldoen).

Ook bieden veel archiefwebsites “zoeken op twee (of meer) personen”, een functie die WieWasWie ook biedt maar deze hoogstwaarschijnlijk verplaatst naar het betaalde abonnement van WieWasWie.

Op naar de scans!

Doel van de steekproef was om de scans te (weten) vinden. Bij akten van de Groninger Archieven, Tresoar, RHC Eindhoven, Archief Alkmaar en het Brabants Historisch Informatie Centrum (BHIC) konden de scans van de akten op de WieWasWie website - na het overbodige verplichte inloggen - bekeken worden. Bij Stadsarchief Breda was de scan bij WieWasWie niet direct in te zien, deze kon echter wel gedownload worden (via de omslachtige e-mail route). Maar let wel: op de websites van deze archieven zijn de scans van de akten ook gewoon te bekijken, zonder inloggen!

Behalve dan bij het BHIC. Het BHIC heeft er voor gekozen om sommige akten op hun eigen website niet te linken naar de scan, en dezelfde akten op WieWasWie wel te voorzien van een link naar een scan (die vervolgens vanaf de BHIC website wordt getoond).

Bij akten van een 4-tal archieven zouden sommige onderzoekers - onterecht - zijn afgehaakt, hier vermeld WieWasWie namelijk niet dat er scans zijn. Dit betekent echter niet dat er geen scans zijn! Want ga je naar de website van het Gelders Archief, Drents Archief (Drenlias), Historisch Centrum Leeuwarden of Archief Eemland dan vind je van de betreffende akten wel scans!

De scans die bij het Gelders Archief beschikbaar waren worden overigens ook via Archieven.nl beschikbaar gesteld (hierover later meer).

Voor de akten van de volgende 7 archieven boden zowel de archiefwebsite zelf, archieven.nl als WieWasWie geen scans: Het Utrechts Archief, Zeeuws Archief, Stadsarchief Rotterdam, RHC Limburg, HC Overijssel, Erfgoed centrum Nieuwland en het Noord-Hollands Archief.

De zoektocht naar de scans houdt hier echter niet op!

Van alle 7 akten kon ik online scans vinden bij FamilySearch! De Nederlandse Burgerlijke Stand akten zijn bij FamilySearch niet geïndexeerd op naam, wel op type, plaats en jaartal. Heb je – via opzoekhulp GenVer – de juiste ingang op FamilySearch gevonden, dan moet je alleen nog even het register digitaal doorbladeren (en met het aktenummer in de hand kom je al snel op de juiste pagina).

Van alle 18 geboorte akten in de steekproef zijn dus online scans gevonden, op de archiefwebsite/archieven.nl, WieWasWie of FamilySearch.

Onderzoekshandleidingen en links

Veel archiefwebsites hebben een vorm van genealogische onderzoekshandleiding of lijstje met genealogisch relevantie links. Zoals eerder gezegd verwijst het RHC Limburg nog steeds op een enkele pagina naar Genlias, terwijl deze website toch al bijna een jaar geleden (met veel rumoer) is gestopt. Toch zie je ook op andere archiefwebsites nog Genlias genoemd staan, zoals bij Rijckheyt, Stadsarchief 's-Hertogenbosch, Streekarchief Voorne-Putten & Rozenburg, Waterlands Archief en zelfs Archieven.nl.

Een deel van de archieven die zijn bekeken in deze steekproef maken ook gebruik van archieven.nl. Maar van de 11 archiefinstellingen die actief zijn op archieven.nl presenteren maar 5 archieven hun Burgerlijke Stand gegevens. Wanneer er gezocht wordt naar personen op archieven.nl moet dit dus in het achterhoofd gehouden worden.

Het vreemde is overigens dat geen van deze archieven melding maakt van het feit dat de gegevens ook op archieven.nl staan, zij verwijzen alleen naar WieWasWie.

Verwijzen naar FamilySearch

Maar het meest in het oog springende aspect is toch wel dat geen van de archieven, met name die archieven die geen/weinig scans hebben, melding maken van de scans bij FamilySearch (enkele blogpostings daargelaten). Ik vind dit een gemis, archieven zouden hun bezoekers hier toch best op kunnen wijzen?

Als archief (of intermediair) zou je kunnen beginnen met een algemene opmerking over het bestaan van FamilySearch (en zoekhulpmiddel GenVer) en het feit dat zij een groot deel van de Burgerlijke Stand gescand hebben. Vermeld ook even dat de registers van de Burgerlijke Stand in tweevoud bijgehouden werden om verwarring te voorkomen.

Maar je zou als archief ook verder kunnen gaan qua dienstverlening. Je zou namelijk ook per akte een deeplink kunnen leggen naar de juiste afbeeldingen reeks bij FamilySearch!

Register via FamilySearch

Hoe dit er uit zou zien? Open Archieven geeft hier een voorbeeld van. In de proof of concept pagina is er bij een akte uit het Utrechts Archief een link gelegd naar het gescande register bij FamilySearch. Eenvoudig en gebruikersvriendelijk, toch?

Conclusie

Archieven bieden hun gegevens en scans op verschillende wijzen en plekken aan. Sommige gegevens en scans staan zelfs op plekken “buiten” het archief, denk aan FamilySearch, maar ook Van Papier Naar Digitaal.

Wees je als onderzoeker bewust van deze lappendeken, geef niet te snel op met zoeken en weet waar er online scans worden aangeboden.

En archieven: denk qua dienstverlening meer outside-in! Ik help u hier graag mee.

08 september 2013

Mijn wenslijst voor een genealogische zoekmachine van een archief

imageJe kunt wel eens dagdromen over de ideale genealogische zoekmachine van een archief. Je kunt daarna suggesties opsturen en wachten tot de archief­instelling (of het bedrijf die de software levert) inzicht of budget krijgt, of klagen, of het erbij laten zitten... Of je grijpt gewoon zelf de koe bij de horens. Op basis van een lijst van wensen en een complete genealogische data set van een archief (met ruim 4 miljoen persoonsvermelding­en), ben ik aan de slag gegaan om zo'n zoekmachine te maken.

Het resultaat is Open Archieven: een website die dient ter inspiratie, maar ook echt gebruikt kan worden!

Ik wil Google'n

Denk je aan zoeken op Internet dan denk je aan Google. Met één zoekveld ligt er een berg aan informatie aan je voeten. Hoewel het ogenschijn­lijk om een eenvoudig zoekveld gaat is het eigenlijk een krachtig zoekveld als je weet hoe je er mee om moet gaan. Wil je bijvoorbeeld zoeken naar vermeldingen van Coret op de GaHetNa website (van het Nationaal Archief) zonder resultaten waarin ook Bob voorkomt dan typ je in het Google zoekveld de zoekterm "coret site:www.gahetna.nl -bob". De zoekresultaten zijn hierna overigens nog te filteren op bijvoorbeeld resultaattype (Web/Images/Maps/Shopping/enz.), creatiedatum en wel/niet bezocht.

search_nl (alle afbeeldingen zijn links naar Open Archieven)

Voor Open Archieven wilde ik eenzelfde zoekveld. Net als Google één zoekveld op de startpagina. Om de kracht van het zoekveld aan te geven zijn er onder het zoekveld voorbeelden gegeven waar de mogelijkheden uitgelegd worden. Zoek je naar een Oudshoorn in relatie tot een Lagas die waarschijnlijk tussen 1900 en 1925 is getrouwd dat typ je in het Open Archieven zoekveld de zoekterm "oudshoorn & lagas 1900-1925".

Via filters kun je daarna de zoekresultaten verfijnen op brontype, plaats, rol en/of jaar.

filter_nl

Andere speciale zoekmogelijkheden omvatten:

  • uitsluiten van namen (-)
  • wildcards (*)
  • beschikbaarheid van een scan ($)
  • fonetisch zoeken (~)

I want to use the site too...
Je veux utiliser ce site aussi...
Ich möchte diese Website auch nutzen...

Veel van onze voorouders komen uit het buitenland of zijn naar het buitenland geëmigreerd. Stamboomonderzoek wordt dus al snel internationaal. Hieruit volgt voor mij dan al snel dat je een website als Open Archieven in verschillende talen moet maken. Alhoewel de inhoud van de akten en namen van de bronnen Nederlands zijn, kun je de rest van de website meertalig aanbieden.

Ik wil een goed leesbare website

De leesbaarheid van een website wordt voor een groot deel bepaald door lettertype, lettergrootte, grafische elementen (zoals icoontjes) en kleurgebruik. Open Archieven heeft gekozen voor een duidelijk lettertype die niet te klein wordt ingezet en ook nog eens aanpasbaar is qua grootte in de browser (via CTRL +/-).

De schermen van tablets en smartphones zijn een stuk kleiner dan die van een laptop of monitor van een PC. Een groeiend aantal Internetters gebruikt een tablet of smartphone om gegevens op te zoeken. Door dit gegeven mee te nemen in het ontwerpproces kun je vrij eenvoudig de gebruikersinterface van je website beschikbaar maken voor meerdere schermgroottes.

Open Archieven is dus ook goed op een smartphone en tablet te gebruiken. Op een klein scherm worden er bijvoorbeeld minder kolommen getoond in de zoekresultaten, zodat de rest leesbaar blijft. Door de webbrowser op een laptop of PC steeds smaller te maken zie je de weergave van Open Archieven automatisch aangepast worden aan de schermbreedte.

mobile_nl

Een oude en ogenschijnlijk vergeten browser functie is de alternatieve weergave van bezochte pagina’s (hyperlinks). Door een andere kleur voor niet bezochte en wel bezochte links te gebruiken help je de gebruiker in zijn of haar navigatie. Open Archieven gebruikt voor nog niet bezochte zoekresultaten een andere kleur (oranje) dan voor de bezochte zoekresultaten (donkergrijs). Door de verschillende kleuren hoef je niet zelf te onthouden wat je al wel en niet hebt bekeken.

Structuur aanbrengen in een pagina vergroot ook de leesbaarheid. Specifiek bij akten heeft Open Archieven de structurering versimpeld en verduidelijkt. Bij akten zijn er diverse gegevens beschikbaar, deze kun je gewoon onder elkaar zetten, maar dat is niet het meest leesbaar. Sommige informatie kun je samenvoegen om er ‘zinnen’ van te maken.

Dus niet:

….
Voornaam bruidegom: Wilhelmus Josephus
Achternaam bruidegom: Lugters
Beroep bruidegom: koopman
Geboorteplaats bruidegom: Ridderkerk
….

Maar:

….
Bruidegom
Wilhelmus Josephus Lugters, koopman, geboren te Ridderkerk
….

In aktes komen personen voor die een bepaalde relatie tot elkaar hebben, op basis van deze relaties kun je de gegevens ook ordenen. Door ook nog eens grafische elementen hierbij te voegen zie je in één oogopslag hoe de relaties liggen.

relationsview_nl

De grafische elementen die de koppels samenbrengen hebben nog een andere functie. Door op een dergelijk element te klikken wordt er gezocht naar deze twee personen. Het zoeken op 2 personen is een veel geuite wens door genealogen en met deze klikbare elementen is zo'n actie gebeurd in één muisklik!

Ik wil een leesbare afdruk kunnen maken

Heel veel stamboomonderzoekers printen de gegevens die ze op een archief of genealogische website vinden. Een website kan bepalen hoe de afdruk van een pagina eruit ziet. Sommige delen hoeven gewoonweg niet geprint te worden, denk aan de navigatie of deel-knoppen. Andere delen zijn juist alleen interessant voor de afdruk en niet het scherm, denk aan het web adres van de pagina.

Open Archieven zorgt dat de afdruk er goed uitziet.

Ik wil meerdere gegevens verzamelen

In de praktijk blijft het niet bij het opzoeken van één akte. Een onderzoeker zal meerdere interessante akten vinden die later verwerkt of nader uitgezocht moeten worden. Interessante akten wil je dus verzamelen. Hiervoor introduceert Open Archieven het gegevensmandje.

Op elke akte-pagina staat een knop waarmee de betreffende akte in het gegevensmandje gestopt kan worden. Het gegevensmandje toont de titels van alle akten die zijn verzameld, deze linken weer naar de akte-pagina’s.

Om met deze verzameling van akten verder te gaan zijn er twee uitvoer mogelijkheden:

  • Allereerst kunnen de akten gedownload worden in PDF formaat. Dit PDF document, dat voldoet aan de PDF/A standaard, kun je inzien via een PDF-lezer of afdrukken.
  • Ook kunnen de akten in het gegevensmandje gedownload worden in GEDCOM formaat. Dit bestand dat de persoons-, relatie- en brongegevens bevat, voldoet volledig aan de GEDCOM 5.5.1 standaard. Dit bestand kan eenvoudig ingelezen worden in een stamboomprogramma zodat er geen gegevens overgetypt hoeven te worden (dit is minder werk en voorkomt fouten bij overtypen).

Ik wil alleen inloggen als het echt moet

Websites zijn geneigd om snel bepaalde functionaliteit achter een login te plaatsen. Voor bepaalde persoonsgebonden activiteiten is dit wel nodig, maar voor heel veel acties is het overbodig en dus irritant.

Open Archieven biedt alle functionaliteit zonder dat er ingelogd hoeft te worden. Zoeken, inzien van de akten, inzien van de scans en zelfs het gegevensmandje kunnen allemaal gebruikt worden zonder inloggen.

Ik wil geholpen worden met bronvermeldingen

Een goed stamboomonderzoeker voorziet zijn gegevens/publicatie van bronvermeldingen, zodat  lezers kunnen zien waar de gegevens afkomstig van zijn. Dit vergroot de controleerbaarheid en dus de kwaliteit.

Alhoewel bronmeldingen van groot belang zijn schiet het noteren van bronvermeldingen er nog wel eens bij in. Vaak is het meer werk doordat het om verschillende tekst elementen gaat zijn die gekopieerd moeten worden van de akte pagina (als ze er al staan!).

Open Archieven helpt de onderzoeker door een duidelijk, consistente bronvermelding te tonen bij akten. Hierbij wordt gebruik gemaakt van de archiefbeschrijvingen, zodat ook de complete titels van archiefbronnen zichtbaar worden.

source_nl

Er wordt doorgelinkt naar de archiefbeschrijving op de archiefwebsite zodat ook achtergrond informatie (wanneer gevormd, door wie, waarom, ...) nagelezen kan worden.

Uiteraard worden de bronvermeldingen ook in het PDF bestand opgenomen (een korte en lange variant) en in het GEDCOM bestand. Bij het GEDCOM bestand wordt de GEDCOM 5.5.1 standaard gevolgd, dus bij een bepaald stuk informatie is er een referentie naar een bron en aktenummer, alle informatie van de bron wordt opgenomen en er wordt gemeld waar de bron zich bevind (het archief). Voor dit laatste worden de adresgegevens van het archief gebruikt die afkomstig zijn van de ArchiefWiki (deze informatie wordt als open data beschikbaar gesteld).

Ik wil suggesties naar relevante aanvullende gegevens

Op basis van de gegevens in een akte kunnen er diverse slimme suggestie worden gegeven, binnen de eigen archiefdataset en ook daarbuiten!

Om met de suggesties binnen de archiefdataset te beginnen. Bij een geboorte akte, waar het kind en ouders worden genoemd, wordt de huwelijksakte gezocht en getoond, daar staan immers ook het kind (dan in de rol van bruid of bruidegom) en ouders. Dit zelfde kan ook omgekeerd, dus vanaf de huwelijksakte naar een geboorte akte wijzen. Idem dito met de overlijdensaktes! Op deze manier kunnen er dus links naar andere relevante aktes gelegd worden.

sug_nl

Als er in de geboorteakte melding wordt gemaakt dat de persoon (een deel van) een tweeling is, dan wordt er van deze naam een slimme zoek link gemaakt zodat met twee klikken de akte van de tweelingzus of -broer naar voren wordt getoverd.

Buiten de muren van de archiefinstelling is ook veel interessante informatie beschikbaar die gebruikt kan worden om aanvullende suggesties te doen in relatie tot aktes. Als dergelijke services hun data/indexen als open data aanbieden of een zoekservice (API) bieden, dan valt er een koppeling te maken.

Open Archieven heeft nu twee van dergelijke 'externe bronnen' gekoppeld:

  • Bij overlijdensakten wordt op basis van naam en jaar gekeken of er informatie en/of foto van de begraafplaats of kerkhof is op de website Graftombe.nl.
  • De "hoofdpersonen" van een akten worden opgezocht in online stambomen. Het resultaat zijn relevante links naar het werk van stamboomonderzoekers op Genealogie Online.

gensug_nl

Ook bij de zoekresultaten worden suggesties gegeven naar andere websites. De zoekterm wordt losgelaten op Genealogie Online, het Stamboom Forum, de Stamboom Gids en de Historische Kranten collectie van de Koninklijks Bibliotheek.

cross_nl

Ik wil kunnen bijdragen

Stamboomonderzoekers hebben vaak veel specifieke kennis en ervaring en zijn bereid dit te delen met het archief en andere onderzoekers. Om dit te faciliteren heeft Open Archieven diverse mogelijkheden om een bijdrage te leveren aan akten.

Allereerst kunnen fouten gemeld worden. Het indexeren is mensenwerk dus daar kunnen fouten in worden gemaakt, gegevens worden door diverse systemen verwerkt waardoor fouten kunnen optreden. Via een eenvoudig formulier kan Open Archieven of het archief wiens data het is op de hoogte worden gesteld zodat de gegevens verbeterd kunnen worden.

Bij sommige akten valt een verhaal te vertellen. Er is dan ook per akte ruimte om opmerkingen of afbeeldingen te plaatsen. Hiervoor wordt een externe service gebruikt, want je hoeft niet alles zelf te maken!

disqus_nl

Als de akte gebruikt wordt in een bronvermelding in een online stamboom dan kan dit door de stamboomonderzoeker aangegeven worden bij de akte. Na een controle of de bronvermelding met link naar de akte inderdaad op de externe website staat zal Open Archieven een link naar de betreffende externe pagina bij de akte tonen die iedereen kan zien.

ref_nl

Ik wil weten wat er in zit

De weergave van de 'inhoudsopgave' op archiefwebsites is vaak een tekstuele opsomming of een compleet inventarissysteem. Je kunt de inhoud van de doorzoekbaar gemaakte gegevens ook visualiseren met interactieve grafieken.

Open Archieven toon eerst een taartdiagram van de archieven (is er nu nog één). Klik je op een taartpunt dan kom je op een taartdiagram met plaatsen waar het archief gegevens van heeft. Klik je hier op een taartpunt dan volgt een taartdiagram met de bronnen in de betreffende plaats. Klik je op een bron dan worden in een staafdiagram de aantallen per bron per jaar weergegeven, waarbij ook inzichtelijk wordt gemaakt welk deel wel en welk deel niet gedigitaliseerd is.

graph1_nl

Een andere interactieve weergave die Open Archieven toont op basis van de beschikbare gegevens, is de familienaam frequentie. Door het selecteren op type akte, plaats en tijdsperiode wordt getoond welke familienamen het meest voorkwamen.

freq_nl

Ik wil de akten kunnen delen

Sociale media maken het mogelijk om heel eenvoudig informatie te delen. Onderzoekers kunnen op Open Archieven hun gevonden akten delen via Facebook, Google+, Twitter, Pinterest en LinkedIn. Met één klik wordt er door het betreffende sociale netwerk gegevens over de akte opgehaald (waaronder kleine afdruk van akte en link) zodat u dat niet meer hoeft over te typen.

Het delen levert in de praktijk divers commentaar op. Het is leuk om bepaalde archiefvondsten te tonen aan je vrienden, familie en overige volgers! Een voorbeeld van delen van een akte op Facebook:

Facebook screenshot

Ik wil er tegen aan kunnen programmeren

Deze wens zullen niet veel mensen hebben, maar is wel belangrijk voor een website. Door de functies die je als website biedt ook aan te beiden aan andere ontwikkelaars (via een API) kun je de service die je biedt aan nog meer mensen bieden via andere websites of programma’s! Platforms als Twitter, Google en Facebook bieden API's aan, waardoor er een heleboel nuttige, leuke, handige applicaties en websites worden gemaakt, die tevens helpen in de groei van de website.

Open Archieven biedt via de Open Archives API diverse methodes die door andere ontwikkelaars gebruikt kunnen worden in hun website of programma.

Ik wil meer gegevens en scans

Open Archieven maakt gebruik van open data die door archieven beschikbaar wordt gesteld voor hergebruik. Open Archieven betaalt de archieven niet voor deze data, andersom, archieven hoeven Open Archieven ook niet te betalen als hun gegevens beschikbaar worden gesteld op Open Archieven (wat bij andere genealogische zoekmachines wel het geval is). Wil een archiefinstelling de eigen gegevens als open data beschikbaar stellen dan moeten zij hiervoor echter vaak wel een rekening betalen aan hun eigen software leverancier. Elk archief zal hierin dus een eigen keuze maken.

Conclusie

Met Open Archieven wil ik aantonen dat er door het voor hergebruik beschikbaar stellen van gegevens mooie, innovatieve initiatieven kunnen opbloeien. Ik hoop dat meer archieven het voorbeeld van Erfgoed Leiden en omgeving (voorheen Regionaal Archief Leiden) zullen volgen: zij stellen al hun genealogische data beschikbaar voor hergebruik. Als meer archieven dit doen kunnen particulieren, bedrijven en verenigingen mooie, handige, leuke dingen kunnen doen met de archiefdata!

Tenslotte, wat zijn uw wensen voor een genealogische zoekmachine voor archieven?

03 september 2013

GEDCOM bestanden die niet aan de GEDCOM standaard voldoen mogen de naam GEDCOM niet dragen!

imageAls we één liter melk kopen verwachten we één liter melk. Er zijn immers duidelijke afspraken gemaakt over wat één liter is. Het is een standaard die goed gedocumenteerd is. Zo weet enerzijds een producent hoeveel er in het pak moet en anderzijds weet de klant wat er in het pak zit. Gaat u naar het buitenland, dan is één liter nog steeds dezelfde hoeveelheid. Er zijn instrumenten die we kunnen gebruiken om het volume van één liter te meten. Zit er in een liter pak melk minder dan één liter dan protesteren we en geven we de leverancier op de kop.

Als we genealogische gegevens naar een GEDCOM bestand exporteren verwachten we dat bij importeren van het GEDCOM bestand alle gegevens hieruit compleet en juist worden geïmporteerd. Er zijn immers duidelijke afspraken gemaakt over hoe een GEDCOM bestand moet worden samengesteld en gelezen. Zo weet een programmeur die een GEDCOM export functie maakt precies hetzelfde als een programmeur die een GEDCOM import functie maakt. Krijg je een GEDCOM bestand van een buitenlandse kennis of website, dan praten we nog steeds over dezelfde GEDCOM afspraken. Er zijn tools die valideren of GEDCOM bestanden aan de GEDCOM standaard voldoen. Raken we tijdens een GEDCOM export/import gegevens kwijt, dan protesteren we vaak niet, we geven hoogstens de GEDCOM standaard de schuld als zijnde niet geschikt.

Ziet u de inconsistentie? Dat is niet alleen raar, het is verkeerd!

Niet voldoen aan de GEDCOM standaard heeft informatieverlies tot gevolg

Gebruikers van stamboomprogramma's (en -websites) moeten dan ook eisen van hun softwareproducent dat, als hun software zegt een GEDCOM bestand te kunnen schrijven, dit GEDCOM bestand volgens de GEDCOM standaard wordt weggeschreven. Immers, als een producent van GEDCOM niet volgens de standaard werkt dan is het vrij zeker dat als u dit bestand inleest in een ander stamboomprogramma (of -website) er gegevens verloren gaan! Als er niet aan de GEDCOM standaard wordt voldaan dan is de claim door een product dat GEDCOM export/import mogelijk is bedrieglijk.

Mijn stelling: GEDCOM bestanden die niet aan de GEDCOM standaard voldoen mogen de naam GEDCOM niet dragen!

Om gegevensverlies tegen te gaan zouden stamboomprogramma's met incomplete/incorrecte GEDCOM exports eigenlijk deze functie moeten verwijderen. Maar een goed stamboomprogramma dient natuurlijk wel een GEDCOM export (en import) functie te hebben, anders kunt u nooit meer ergens anders met uw genealogische gegevens aan de slag en dat wilt u ook niet. Ontwikkelaars moeten dus aangespoord worden om de GEDCOM standaard goed te verwerken in programmatuur en hierover duidelijk te communiceren.

Ontwikkelaars die vinden dat de GEDCOM standaard niet goed (genoeg) is: ondersteun het dan niet, dat is vele malen beter voor gebruikers dan het gebrekkig te ondersteunen en dus valse verwachtingen te scheppen over uitwisselbaarheid. Worden bepaalde GEDCOM constructies niet ondersteund meld dit dat. Wordt er tijdens de import ongeldige GEDCOM aangetroffen, meld dit aan de gebruiker. Ontwikkelaars die uitbreidingen hebben gedefinieerd (wat op zich mag binnen GEDCOM) dienen dit goed te documenteren en te communiceren, anders zullen andere programma's deze uitbreidingen niet kunnen inlezen en is er dus weer sprake van informatieverlies!

Een voorbeeld

Stel u heeft een overlijdensakte gevonden en voegt dit in uw stamboomprogramma toe. De gegevens worden geëxporteerd naar GEDCOM en de betreffende bron ziet er in GEDCOM formaat als volgt uit:

…..
0 @S23@ SOUR
1 TITL Overlijden Hendrika Jägers
2 TYPE WieWasWie
3 REF 21

1 REFN WIE30422548
2 TYPE WieWasWie
2 NOTE Archiefnaam: Het Utrechts Archief
2 NOTE Archief: 1221-1
2 NOTE Deel/Akte: 240
2 NOTE Inventarisnr.: 1992
2 NOTE Bron type: BS Overlijden

…..

In bovenstaand stuk GEDCOM zijn de rode delen niet volgens de GEDCOM standaard. Het is dan ook vrij zeker dat als u het inleest in een ander stamprogramma (of -website), de rode delen verloren gaan. In bovenstaand voorbeeld schort het overigens niet alleen aan de structuur (syntax) maar ook aan de inhoud (semantiek).

image

Wees zuinig op uw genealogische gegevens: eis dat geproduceerde GEDCOM bestanden aan de GEDCOM standaard voldoen, eis dat GEDCOM bestanden die aan de GEDCOM standaard voldoen correct en compleet worden ingelezen.

Genealogische organisaties die programma's maken, reviewen of aanbevelen dienen aan te geven of er aan de GEDCOM standaard wordt voldaan. Geven zij dit inzicht niet, dan berokkenen zijn hun leden/gebruikers schade toe! Het betekent immers dat de met veel moeite verzamelde en in het stamboomprogramma ingevulde gegevens niet compleet en correct naar een ander stamboomprogramma (of -website) kunnen worden overgebracht.

Controle op naleven van de GEDCOM standaard

Voor het liter pak melk zijn er instituten die toezien dat producten de juiste hoeveelheden leveren van de juiste kwaliteit. Er zijn helaas geen instituten die het voldoen aan de GEDCOM standaard controleren en dus stamboomprogramma's kunnen 'certificeren'. Hier ligt een mooie taak voor genealogische organisaties zoals bijvoorbeeld HCC!genealogie, NGV of CBG.

Of uw stamboomprogramma (of -website) een correct GEDCOM bestand exporteert kunt u voor een deel ook zelf controleren: door het geëxporteerde GEDCOM bestand aan te bieden aan de website GED-inline. Worden er fouten gerapporteerd door GED-inline ten aanzien van het GEDCOM bestand: maak daar melding van naar de producent van het stamboomprogramma en meld het op dit of uw eigen blog of op een stamboom forum.

Of het GEDCOM bestand compleet (dus of al uw gegevens er in zitten) is kan deze tool u niet vertellen. Ook weet u nog niet of een valide GEDCOM bestand goed wordt ingelezen door uw stamboomprogramma (of –website). Als u iets tegenkomt waaruit blijkt dat er niet aan de GEDCOM standaard wordt voldaan: meld het dan, blog erover, protesteer.

Bescherm de genealogische gegevens!

29 augustus 2013

Rouwbode – overlijdensberichten ontvangen per e-mail

imageAkten van overlijdensaangiften worden pas 50 jaar na het afsluiten van de registers openbaar. Er zijn natuurlijk ook andere bronnen waaruit eerder de gegevens van overlijdens kunnen worden gehaald, zoals de overlijdensberichten in kranten.

Er zijn diverse websites die dit soort bronnen doorzoekbaar maken, zoals Mensenlinq, familieberichtenonline en familieberichten op internet. Het nieuwe Rouwbode zegt overkoepelend te zijn aan deze websites en heeft een automatische zoekrobot, net zoiets als Online-Familieberichten.

De Rouwbode was in vroegere tijden diegene die iemands overlijden aan de deur van belanghebbenden aanzegde.

Wat is de bron?

Zoals uit de inleiding al blijkt zijn er al meerdere websites die overlijdensberichten beschikbaar stellen. De Rouwbode claimt overkoepeld te zijn aan deze websites en ook de overlijdensberichten uit de regionale papieren kranten te bevatten van de afgelopen 5 jaar.

Waar een website als Online-Familieberichten drijft op de hulp van vrijwilligers maakt de Rouwbode gebruik van de gegevens van het Overlijdensregister. Het Overlijdensregister is een commerciële dienst waar bedrijven gebruik van kunnen maken om hun eigen klantenbestanden te screenen op overledenen om hiermee bijvoorbeeld pijnvolle correspondentie te voorkomen. Hoe completer het Overlijdensregister, hoe waardevoller de dienst die zij kunnen bieden. De gegevens worden overgenomen uit de nationale en regionale kranten, maar helaas toont de Rouwbode deze bron niet bij overlijdensberichten.

De Rouwbode biedt deze zoek- en monitor service gratis aan particulieren. De Rouwbode toont hierbij uitsluitend de gegevens van de overledene, gegevens van de nabestaanden worden niet opgeslagen/getoond. Mocht eventueel een nabestaande de gegevens van een overledene willen verwijderen, dan is één bericht aan de Rouwbode voldoende.

Geattendeerd worden en zoeken

Waar de andere websites vooral zijn ingericht als zoekwebsite richt de Rouwbode zich meer op attenderingsfunctie. Als gebruiker kun je, na opgeven van je e-mail adres of inloggen via Facebook, een viertal zoekopdrachten opgegeven.

Dagelijks wordt automatisch gecontroleerd of er een overlijdensbericht is die voldoet aan de zoekopdrachten en stuurt deze dan per e-mail op. Een zoekopdracht bestaat hierbij uit drie onderdelen:

  • de achternaam (of deel daarvan)
  • de plaats (woonplaats of postcode) en een straal rondom deze plaats (landelijk zoeken is ook mogelijk)
  • het jaar van geboorte

Je kunt overigens ook een eenmalige, directe zoekopdracht invullen.

Focus en innovatie

De Rouwbode, die het levenslicht zag de mobiele app Kassiewijle, is niet puur gericht op genealogen. Dit blijkt niet alleen uit de mobiele aanpak (waar nu vanwege de gebruikersvraag minder aandacht voor is ten gunste van de website) maar ook uit de innovatieprioriteiten die het Groningse team achter de Rouwboude hebben gesteld:

  • Een Facebook koppeling zodat je, naast eenvoudig aanmelden, ook berichten van overledenen van vrienden van vrienden of uit Facebook-groepen waar je ook op bent geabonneerd krijgt.
  • Een LinkedIn koppeling, zodat je je kunt abonneren op overlijdensberichten van personen die gekoppeld zijn aan bedrijven.

Of iedereen zit te wachten op e-mail berichten met informatie over bekenden weet ik niet. Maar ik denk dat het voor genealogen in ieder geval een extra bron en handig hulpmiddel is!

Gewoon dus even naar http://www.rouwbode.nl/ gaan en proberen.

08 juli 2013

Digitaliseren op verzoek door Haags Gemeentearchief

Bron: WikiMedia Commons (http://commons.wikimedia.org/wiki/File:Haags_logo.jpg)Archiefinstellingen scannen veel materiaal zodat enerzijds kwetsbaar materiaal beschermd wordt en anderzijds burgers de mogelijkheid krijgen om digitaal stukken in te zien vanuit huis. Maar van de vele kilometers inventaris is nog lang niet alles gescand. Stelselmatig wordt er gescand, maar ook op verzoek scannen behoort bij steeds meer archieven tot de mogelijkheden.

Haags Gemeentearchief
Vandaag vond in het stadhuis van Den Haag de presentatie plaats van het Digitaliseren Op Verzoek initiatief van het Haags Gemeentearchief (HGA). Via de website van het HGA of op www.archieven.nl kan een verzoek worden ingediend voor digitaliseren van een inventarisnummer uit de archieven van het HGA. Bij ongeveer 240.000 inventarisnummers is het AanvraagicoonDigitaliseren Op Verzoek icoontje zichtbaar (hier rechts afgebeeld). Door het invullen van naam en e-mail wordt de aanvrager op de hoogte gehouden van de voortgang. Is het al eerder door iemand aangevraagd dan is het gewoon meteen te downloaden.

Heeft de Hofstad een primeur?
Omroep West meldde op 7 juli dat het Haags Gemeentearchief een primeur had met het digitaliseren. Dit kwam mij vreemd over (en voor mij reden om de presentatie bij te wonen): er zijn al meer archieven waar Digitaliseren Op Verzoek of Scanning On Demand onderdeel uitmaken van de dienstverlening. Archieven als Stadsarchief Amsterdam, Het Utrechts Archief, Regionaal Archief Leiden, Regionaal Archief Zutphen bieden deze service.

De archiefinstellingen steken de dienstverlening wel ieder op hun eigen wijze in. De één doet het digitaliseren in eigen beheer, de ander besteedt het uit. Bij de één komen ze ook beschikbaar voor anderen bezoekers (gratis of betaald), bij de ander worden ze na aflevering verwijderd. Ook de prijs van het scannen varieert, van 25 eurocent tot 5 euro per scan.

De Hofstad heeft een primeur!
foto door Bob Coret
En dit is waar de echte primeur zat: directeur van het HGA, Maarten Schenk, kondigde aan dat aan het Digitaliseren Op Verzoek voor de aanvrager geen kosten zijn verbonden. Digitaliseren Op Verzoek is dus gratis!

Een mooie service voor inwoners van Den Haag, ambtenaren, geïnteresseerden in Haags materiaal en ook stamboomonderzoekers. Maar het gratis aanbieden van de Digitaliseren Op Verzoek service is gewaagd. Zal er een stortvloed aan aanvragen komen? Blijven de kosten in de hand (want het is toch een kostbaar proces), ook op langere termijn? Het HGA zal hier goed over nagedacht hebben en ook hebben gekeken naar de andere archieven die deze dienst al aanbieden.
foto door Bob Coret
De techniek is al beproefd, de service is zelfs al sinds maart van dit jaar ‘stilletjes’ live gegaan! Met een toespraak door verantwoordelijk ICT wethouder Rabin Baldewsingh en de ondertekening van een dienstverlenings- overeenkomst tussen het Ministerie van Sociale Zaken (die een deel van het scan-werk uitvoert in hun scan-straat) en het HGA is Digitaliseren Op Verzoek vandaag ook ‘officieel’ live gegaan!

Meer informatie over Digitaliseren Op Verzoek is te vinden op de website van het HGA en op de website van DE REE (leverancier van archieven.nl).

24 juni 2013

Betekent nieuwe Europese privacy wet het einde van genealogisch onderzoek?

De Europese Commissie heeft begin dit jaar conceptteksten opgesteld die een uniforme Europese wetgeving voor gegevensbescherming tot stand moeten brengen. Het moet de lappendeken van de verschillende landen harmoniseren. De wetgeving zal direct van toepassing worden voor alle landen, het hoeft niet naar lokale wetten omgezet te worden. Omdat de wet van toepassing is op de gegevens van Europese inwoners is het ook direct van toepassing voor organisaties buiten de Europese Unie.

Je eigen privacy een groot goed

Als het aankomt op je eigen gegevens wil je niet dat allerlei bedrijven deze zo maar opslaan en er van alles mee doen, denk hierbij aan verzekeraars, Facebook, enz. Ook heb je liever dan de KPN/Ziggo/EnergieDirect/enz. jou gegevens verwijderen als je je abonnement daar opzegt.

Maar als genealogen wroeten we toch graag in de historische persoonsgegevens van anderen… De gemiddelde familiegeschiedenis bevat op z’n minst medische gegevens van het Rode Kruis van een in de Tweede Wereldoorlog gesneuvelde familielid, een foto van een familielid die in een Drentse armenkolonie zat, en een uitgebreide analyse van de verschillende geloven die voorouders hadden. Om nog maar even te zwijgen van het opkomende DNA onderzoek gericht op aantonen van verwantschap.

Welke gegevens zullen toekomstige genealogen in de archieven aantreffen?

Archivarissen trekken aan de bel

De beroepsvereniging van Nederlandse archivarissen KVAN en de branchevereniging van Nederlandse archiefinstellingen BRAIN volgen “met veel belangstelling en nog meer zorgen” de totstandkoming van deze EU Data Protection Regulation. Zij wijzen op onbedoelde, schadelijke neveneffecten van de verordening-in-wording:

Deze behelzen onder andere de voorwaarden dat personen in kwestie toestemming moeten geven voor de verwerking van hun persoonsgegevens, en dat persoonsgegevens uitsluitend nog geanonimiseerd of gepseudonimiseerd gebruikt mogen worden. Die voorwaarden zijn onhoudbaar voor de papieren archieven die archiefinstellingen beheren en maken deze daardoor in een klap waardeloos voor onderzoekers.

Ik ben geen jurist, maar volgens mij is bovenstaande in de Nederlandse wetgeving, specifiek de Wet Bescherming Persoonsgegevens, al lang het geval! Dit heet doelbinding:

Wanneer je persoonsgegevens verzamelt voor een specifiek doel, dan is het niet toegestaan om deze gegevens te gebruiken voor een ander doel. Tenzij de personen hiervoor toestemming hebben gegegeven. Deze permissie moet minimaal op papier staan of dubbel bevestigd in geval van elektronische toestemming. Dit alles om te bewijzen dat je de specifieke toestemming hebt verkregen van de betreffende persoon.

Het College Bescherming Persoonsgegevens heeft hieromtrent ook een informatieblad dat ingaat op de bewaartermijnen van persoonsgegevens in uw bestanden. Ik lees in de verordening-in-wording overigens niet dat een en ander met terugwerkende kracht voor bestaande historische archieven gaat gelden.

De Franse zusterorganisatie van de KVAN, Association des archivistes français, is een online petitie gestart: The European Parliament: Adjourn the adoption of the regulation about personal data. Hierin staat onder andere:

Did you recently graduate? Schools or universities will destroy your file. Did you sell your real estate property ? The land registry office will destroy every trace of your property. Are you no longer employed ? The organisation you worked for will delete every bit of information related to you.

Deze tekst spreekt over een toekomst die volgens mij in Nederland al lang werkelijkheid is (zie ook het eerder genoemde CPB informatieblad)!

Rather than reinforcing a secured preservation and a controlled access to our heritage, compliant with individual liberties, Europe will impose a collective amnesia for our own good.

Moeten overheidsorganisaties in Nederland niet al een selectie en vernietigingslijst hebben (zie ook Wettelijke eisen selectielijst)? Moeten bedrijven nu al niet gegevens vernietigen?

Voor de goede, ik het complete 132 pagina’s tellende PDF (download link)getiteld “VERORDENING VAN HET EUROPEES PARLEMENT EN DE RAAD betreffende de bescherming van natuurlijke personen in verband met de verwerking van persoonsgegevens en betreffende het vrije verkeer van die gegevens (algemene verordening gegevensbescherming)” nog niet geheel gelezen!!

Maar ik kan mij niet aan de indruk onttrekken dat we (archieven en genealogen) al een groot probleem hebben met de huidige WBP. Hoor graag van juristen/archiefinspecteurs dat ik ongelijk heb!

imageIk zeg het nog maar een keer, ik ben geen jurist. Maar het lijkt mij verstandig als we met z’n allen eens kennis opdoen en goed nadenken over onze privacy (nu, in de toekomst en in het verleden) in relatie tot archieven en genealogisch onderzoek. Ik hoop dat genealogische verenigingen als NVG, HCC!genealogie en HCC hierin bijdragen, de Ierse en Finse genealogische verenigingen uiten hun bedenkingen al.

Maar wel snel, want die ambtenaren in Europa zitten niet stil: ze willen de wet in 2014 implementeren.

Informatie verbinden en verrijken, voorbeelden van open data gebruik

Stamboomonderzoek draait om personen, de familierelaties en familiegeschiedenis. Het doel van Genealogie Online is om deze informatie op Internet te publiceren. Genealogen kunnen op een eenvoudige manier het resultaat van hun (lopende) onderzoek laten zien aan anderen. Ook krijgen ze op deze manier feedback en meer inzicht. Voor dit laatste wordt de genealogische informatie verbonden met andere databronnen. Dit artikel beschrijft het gebruik van open data om de genealogische gegevens in context te plaatsen.

Open linked data

Open data is volgens het Open Data Handboek:

…data die vrij gebruikt kan worden, hergebruikt kan worden en opnieuw verspreid kan worden door iedereen - onderworpen enkel, in het uiterste geval, aan de eis tot het toeschrijven en gelijk delen.

Steeds meer organisaties maken de informatie die zij hebben beschikbaar als open data. Organisaties als Wikipedia en KNMI deden dit al, maar steeds meer organisaties volgen. Zelfs de Europese Unie heeft open data geadopteerd! Door dit initiatief ontstaan er ook veel nieuwe kansen, zoals mogelijkheden om nieuwe websites of mobiele apps te maken.

Met “linked data” wordt de eigenschap beschreven dat de data aan elkaar gerelateerd kan worden. Als je data aan elkaar kan linken wordt het helemaal leuk! Op Genealogie Online wordt er op basis van drie elementen informatie aan elkaar geknoopt:

  • de familienaam
  • de datum
  • de plaats

Over de familienaam

Bij stamboomonderzoek komen verschillende familienamen voor. Genealogie Online ondersteunt de genealoog hierin met de Over de familienaam pagina, zie bijvoorbeeld de Over de familie Hollestelle pagina.

Deels bestaat deze pagina uit informatie die Genealogie Online put uit alle gepubliceerde gegevensverzamelingen. Deels zijn het links naar websites met meer informatie over de betreffende naam, zoals genealogen die de betreffende familienaam (onder)zoeken.

Familienamen kunnen op verschillende manieren geschreven worden, vooral als je dit over de eeuwen heen bekijkt. De open data bron die hierbij kan helpen is afkomstig van het Zeeuws Archief (in de persoon van Leo Hollestelle): een lijst met schrijfvarianten per familienaam. Ik heb deze bron ook opgenomen in de presentatie Geef mij uw data – alstublieft die ik voor archivarissen gaf, om aan te geven dat ook dit soort ogenschijnlijke eenvoudige lijstjes voor andere van grote waarden kan zijn! Genealogie Online gebruikt die op de Over de familienaam pagina’s en in de zoekmachine.

Over de dag

Een ander element waar informatie over verzameld kan worden is een datum/jaartal. Genealogie Online toonde al langer - op basis van datum van geboorte, huwelijk of overlijden – informatie uit Wikipedia. Zoals informatie over de regering, het koningshuis en andere historische gebeurtenissen. Deze informatie wordt nu ook op de Over de dag pagina’s getoond.

Het KNMI levert via haar website historische daggevens die terug gaan tot terug gaan tot 1701. Zo kan er bijvoorbeeld bij een huwelijk van voorouders worden aangegeven wat voor weer het was!

Onlangs zijn er twee nieuwe bronnen toegevoegd om een beeld te geven van het tijdsgewricht: kunst uit het Rijksmuseum en het Polygoon journaal.

Het Rijksmuseum stelt informatie over hun kunst als open data beschikbaar. Naast veel meta-informatie kun je ook de beelden bekijken. Zo kan er bijvoorbeeld getoond worden welke kunst werd gemaakt in 1880.

image Bron: Rijksmuseum, schilderij Willem Roelofs gemaakt in 1880

Open Beelden is een open mediaplatform die toegang biedt tot audiovisuele collectie die hergebruikt mogen worden. Zo biedt Open Beelden ook de Polygoon journaals aan. Op basis van een datum kan er nu (ongeveer) het bijbehorende Polygoon journaal getoond worden, zie bijvoorbeeld Over de dag dinsdag 4 maart 1941.

Over de plaats

Een derde element dat voorkomt in genealogische data zijn plaatsnamen. Genealogie Online maakt gebruikt van een open data set van internationale geografische informatie die wordt geleverd door Geonames.

Zoals beschreven in Genealogie en plaatsnamen wordt deze dataset onder andere gebruikt om de plaatsnamen te controleren: zijn de plaatsnamen door de stamboomonderzoeker goed (en uniek genoeg) geschreven? Als de plaatsnaam uniek is geïdentificeerd dan biedt Geonames ook gegevens als lengte- en breedtegraad en links naar Wikipedia.

Deze informatie wordt gebruikt op de Over de plaats pagina’s, zie bijvoorbeeld de Over de plaats Gouda pagina. Op basis van de identificerende Geonames ID kan er (via DBpedia) een beschrijvende tekst en foto opgehaald worden die gepresenteerd kan worden.

File:Gouda vanuit de lucht.jpg Bron: Wikipedia Commons, pagina Gouda

Genealogie Online probeert, met hulp van haar gebruikers, ook links te leggen naar archieven. Een andere mooie open data bron is de Archief Wiki. Door de plaatsnamen die vallen onder het werkgebied van een bepaald archief te koppelen (op basis van de Geonames ID’s) kan de stamboomonderzoeker bij een plaatsnaam verteld worden bij welke archiefinstelling hij/zij moet zijn voor broninformatie.

Een andere mooie bron die op de Over de plaats pagina’s wordt getoond is afkomstig van rijksmonumenten.info die op hun beurt weer informatie aggregeert van de Rijksdienst voor het Cultureel Erfgoed, Wikipedia en Flickr. Deze dataset is onder andere doorzoekbaar op breedte- en lengtegraad. Het resultaat: afbeeldingen van rijksmonumenten uit die buurt!

Open data, nieuwe mogelijkheden en inzichten

Dit artikel geeft enkele voorbeelden van hoe Genealogie Online gebruik maakt van open data om context te bieden aan stamboomonderzoekers.

Het mooie is, dat we pas aan het begin staan van de open data beweging. Hoe meer organisaties, waaronder archieven (zoals trendsetter Archief Leiden), hun data open beschikbaar stellen, hoe meer mogelijkheden er ontstaan. Dit alles moet passen binnen kaders als auteursrecht en privacy en ook ondersteund worden door de gebruikte IT systemen, maar dat zijn maar kleine drempels.

Open data kan leiden tot meer inzicht, nieuwe functionaliteiten, meer bedrijvigheid!

03 juni 2013

Ontwikkeling van de kwartiertijdbalk

De tijdbalk is een fraaie weergave van gebeurtenissen in de tijd. Een tijdbalk kan ook een nuttig instrument zijn omdat het nieuwe inzichten kan geven doordat er op een andere wijze gepresenteerd worden. Ook voor genealogen kan de tijdbalk van pas komen! Al een tijdje liep ik met het idee om de tijdbalk te combineren met een andere genealogische weergave, de kwartierstaat.

De tijdbalk

Een tijdbalk of een tijdlijn is een grafische weergave van een chronologische opvolging van gebeurtenissen of periodes. Het schema heeft de vorm van een balk en bezit tijdsaanduidingen met een inschrift of een bijschrift.

Je kunt zelf tijdbalken maken via bijvoorbeeld TimeToast, TimeRime of Tijdbalk.nl (waarvan hieronder een afbeelding). Bij deze websites moet je wel zelf de gegevens handmatig invoeren.

image

De tijdbalk in genealogie

Op Genealogie Online wordt de tijdbalk ingezet om inzicht te geven in het leven van een persoon. Hieronder een voorbeeld van Willem Frederik Lamoraal Boissevain. Het rode vlak geeft de levensduur aan, daaronder zijn ook grootouders, ouders, broers/zussen en kinderen in de tijdbalk gezet. Het geeft dus weer wat de persoon meemaakte qua geboortes en overlijdens en wie er in dezelfde tijd leefden.

image

De kwartierstaat

image

Een kwartierstaat is een weergave van kwartierdrager of proband (degene van wie men uitgaat) met alle directe voorouders in mannelijke en vrouwelijke lijn.

Alhoewel je in zowel de tekstuele als grafische kwartierstaat jaartallen kunt opnemen, is het lastig een beeld te krijgen van overlap. Hierdoor ontstond bij mij het idee voor het combineren van de kwartierstaat met de tijdbalk.

De kwartiertijdbalk

De kwartierstaat-tijdbalk of kwartiertijdbalk zou zowel de relaties tussen kind en ouders als de levensduur van de personen moeten weergeven. De volgende afbeelding is de eerste schets van die ik maakte van een kwartiertijdbalk. De balken geven de levensduur van de persoon weer, de lijnen geven de kind-ouder relaties weer.

timeline-pedigree

Alhoewel de combinatie klopt leest deze weergave wat lastig. Doordat de kwartierdrager links staat en dus ook de meest recente tijd is, beginnen de levensduurbalken bij het overlijden en eindigen ze bij de geboorte. Onlogisch… omdraaien dus!

Het eerste prototype

image

Na de eerste schets (nog in een tekenprogramma gemaakt) volgende een eerste prototype (hierboven weergegeven). Dit was een werkend prototype van de kwartierstaat-tijdbalk die je in de browser kunt bekijken!

In dit prototype zijn er ook verschillende balken, die er in de eerste schets nog niet zichtbaar waren. Van sommige voorouders is wellicht de geboortedatum of datum van overlijden niet bekend. Dit wordt weergegeven met een gestreept begin of einde. Ook kan het zijn dat de kwartiertijdbalk uitgaat van een levende persoon en dat er nog voorouders leven. In dat geval eindigt de balk met een driehoek. Tenslotte worden de balken roze of blauw gekleurd om het geslacht weer te geven.

Het tweede prototype

Waar je in een normale grafische kwartierstaat de generaties goed kunt onderscheiden was dit in het eerste prototype van de kwartiertijdbalk minder goed zichtbaar, je miste het. In het tweede prototype (hieronder weergegeven) is dit ondervangen door per generatie een aparte kleur te gebruiken voor de verbindingen.

image

De gegevensvereisten

Om een grafische kwartierstaat te maken heb je in principe alleen informatie nodig over de namen en de kind-ouder relaties. Een kwartiertijdbalk vereist meer: informatie over geboorte/doop en overlijden/begrafenis. Met deze tijdsinformatie kan pas een balk in de tijdbalk worden gezet. De tijdbalk kan omgaan met geschatte jaartallen, maar dan moet je wel jaartallen kunnen schatten.

Hiermee is er een extra uitdaging gekomen voor het ‘genereren’ van de gegevens set achter een kwartiertijdbalk. Ik probeer deze gegevens set te genereren vanuit een GEDCOM bestand. Wanneer er geen geboortedatum is wordt er gepoogd om een minimale geboortedatum te achterhalen. Dit kan bijv. door naar de trouwdatum te kijken en te stellen dat iemand dan minimaal 18 jaar is. Of naar de geboortedata van de kinderen. Eenzelfde set met schattingsregels is er opgesteld voor het bepalen van de overlijdensdatum.

Op basis van deze schattingen kunnen er alsnog balken in de kwartiertijdbalk getekend worden. Maar het kan zijn dat er geen data geschat kunnen worden, deze personen worden dan niet getoond in de kwartiertijdbalk!

De toekomst van de kwartiertijdbalk

Deze exercitie om van idee, via schetsen en prototypes, te komen tot een nieuw type genealogische weergave is erg leuk, vandaar ook dit artikel.

Er moet echter nog wel wat aan de techniek geschaafd worden, zo werken de weergaven bijvoorbeeld niet of zeer langzaam op tablets!

Ik hoop dat de techniek binnenkort bruikbaar wordt en dat deze nieuwe genealogische weergave binnenkort beschikbaar komt op Genealogie Online. Dan is er naast de kwartieren op de kaart ook een kwartiertijdbalk!

image

En wie weet, nemen ook andere stamboom programma’s en –websites deze nieuwe weergave over…