24 juni 2013

Betekent nieuwe Europese privacy wet het einde van genealogisch onderzoek?

De Europese Commissie heeft begin dit jaar conceptteksten opgesteld die een uniforme Europese wetgeving voor gegevensbescherming tot stand moeten brengen. Het moet de lappendeken van de verschillende landen harmoniseren. De wetgeving zal direct van toepassing worden voor alle landen, het hoeft niet naar lokale wetten omgezet te worden. Omdat de wet van toepassing is op de gegevens van Europese inwoners is het ook direct van toepassing voor organisaties buiten de Europese Unie.

Je eigen privacy een groot goed

Als het aankomt op je eigen gegevens wil je niet dat allerlei bedrijven deze zo maar opslaan en er van alles mee doen, denk hierbij aan verzekeraars, Facebook, enz. Ook heb je liever dan de KPN/Ziggo/EnergieDirect/enz. jou gegevens verwijderen als je je abonnement daar opzegt.

Maar als genealogen wroeten we toch graag in de historische persoonsgegevens van anderen… De gemiddelde familiegeschiedenis bevat op z’n minst medische gegevens van het Rode Kruis van een in de Tweede Wereldoorlog gesneuvelde familielid, een foto van een familielid die in een Drentse armenkolonie zat, en een uitgebreide analyse van de verschillende geloven die voorouders hadden. Om nog maar even te zwijgen van het opkomende DNA onderzoek gericht op aantonen van verwantschap.

Welke gegevens zullen toekomstige genealogen in de archieven aantreffen?

Archivarissen trekken aan de bel

De beroepsvereniging van Nederlandse archivarissen KVAN en de branchevereniging van Nederlandse archiefinstellingen BRAIN volgen “met veel belangstelling en nog meer zorgen” de totstandkoming van deze EU Data Protection Regulation. Zij wijzen op onbedoelde, schadelijke neveneffecten van de verordening-in-wording:

Deze behelzen onder andere de voorwaarden dat personen in kwestie toestemming moeten geven voor de verwerking van hun persoonsgegevens, en dat persoonsgegevens uitsluitend nog geanonimiseerd of gepseudonimiseerd gebruikt mogen worden. Die voorwaarden zijn onhoudbaar voor de papieren archieven die archiefinstellingen beheren en maken deze daardoor in een klap waardeloos voor onderzoekers.

Ik ben geen jurist, maar volgens mij is bovenstaande in de Nederlandse wetgeving, specifiek de Wet Bescherming Persoonsgegevens, al lang het geval! Dit heet doelbinding:

Wanneer je persoonsgegevens verzamelt voor een specifiek doel, dan is het niet toegestaan om deze gegevens te gebruiken voor een ander doel. Tenzij de personen hiervoor toestemming hebben gegegeven. Deze permissie moet minimaal op papier staan of dubbel bevestigd in geval van elektronische toestemming. Dit alles om te bewijzen dat je de specifieke toestemming hebt verkregen van de betreffende persoon.

Het College Bescherming Persoonsgegevens heeft hieromtrent ook een informatieblad dat ingaat op de bewaartermijnen van persoonsgegevens in uw bestanden. Ik lees in de verordening-in-wording overigens niet dat een en ander met terugwerkende kracht voor bestaande historische archieven gaat gelden.

De Franse zusterorganisatie van de KVAN, Association des archivistes fran├žais, is een online petitie gestart: The European Parliament: Adjourn the adoption of the regulation about personal data. Hierin staat onder andere:

Did you recently graduate? Schools or universities will destroy your file. Did you sell your real estate property ? The land registry office will destroy every trace of your property. Are you no longer employed ? The organisation you worked for will delete every bit of information related to you.

Deze tekst spreekt over een toekomst die volgens mij in Nederland al lang werkelijkheid is (zie ook het eerder genoemde CPB informatieblad)!

Rather than reinforcing a secured preservation and a controlled access to our heritage, compliant with individual liberties, Europe will impose a collective amnesia for our own good.

Moeten overheidsorganisaties in Nederland niet al een selectie en vernietigingslijst hebben (zie ook Wettelijke eisen selectielijst)? Moeten bedrijven nu al niet gegevens vernietigen?

Voor de goede, ik het complete 132 pagina’s tellende PDF (download link)getiteld “VERORDENING VAN HET EUROPEES PARLEMENT EN DE RAAD betreffende de bescherming van natuurlijke personen in verband met de verwerking van persoonsgegevens en betreffende het vrije verkeer van die gegevens (algemene verordening gegevensbescherming)” nog niet geheel gelezen!!

Maar ik kan mij niet aan de indruk onttrekken dat we (archieven en genealogen) al een groot probleem hebben met de huidige WBP. Hoor graag van juristen/archiefinspecteurs dat ik ongelijk heb!

imageIk zeg het nog maar een keer, ik ben geen jurist. Maar het lijkt mij verstandig als we met z’n allen eens kennis opdoen en goed nadenken over onze privacy (nu, in de toekomst en in het verleden) in relatie tot archieven en genealogisch onderzoek. Ik hoop dat genealogische verenigingen als NVG, HCC!genealogie en HCC hierin bijdragen, de Ierse en Finse genealogische verenigingen uiten hun bedenkingen al.

Maar wel snel, want die ambtenaren in Europa zitten niet stil: ze willen de wet in 2014 implementeren.

Informatie verbinden en verrijken, voorbeelden van open data gebruik

Stamboomonderzoek draait om personen, de familierelaties en familiegeschiedenis. Het doel van Genealogie Online is om deze informatie op Internet te publiceren. Genealogen kunnen op een eenvoudige manier het resultaat van hun (lopende) onderzoek laten zien aan anderen. Ook krijgen ze op deze manier feedback en meer inzicht. Voor dit laatste wordt de genealogische informatie verbonden met andere databronnen. Dit artikel beschrijft het gebruik van open data om de genealogische gegevens in context te plaatsen.

Open linked data

Open data is volgens het Open Data Handboek:

…data die vrij gebruikt kan worden, hergebruikt kan worden en opnieuw verspreid kan worden door iedereen - onderworpen enkel, in het uiterste geval, aan de eis tot het toeschrijven en gelijk delen.

Steeds meer organisaties maken de informatie die zij hebben beschikbaar als open data. Organisaties als Wikipedia en KNMI deden dit al, maar steeds meer organisaties volgen. Zelfs de Europese Unie heeft open data geadopteerd! Door dit initiatief ontstaan er ook veel nieuwe kansen, zoals mogelijkheden om nieuwe websites of mobiele apps te maken.

Met “linked data” wordt de eigenschap beschreven dat de data aan elkaar gerelateerd kan worden. Als je data aan elkaar kan linken wordt het helemaal leuk! Op Genealogie Online wordt er op basis van drie elementen informatie aan elkaar geknoopt:

  • de familienaam
  • de datum
  • de plaats

Over de familienaam

Bij stamboomonderzoek komen verschillende familienamen voor. Genealogie Online ondersteunt de genealoog hierin met de Over de familienaam pagina, zie bijvoorbeeld de Over de familie Hollestelle pagina.

Deels bestaat deze pagina uit informatie die Genealogie Online put uit alle gepubliceerde gegevensverzamelingen. Deels zijn het links naar websites met meer informatie over de betreffende naam, zoals genealogen die de betreffende familienaam (onder)zoeken.

Familienamen kunnen op verschillende manieren geschreven worden, vooral als je dit over de eeuwen heen bekijkt. De open data bron die hierbij kan helpen is afkomstig van het Zeeuws Archief (in de persoon van Leo Hollestelle): een lijst met schrijfvarianten per familienaam. Ik heb deze bron ook opgenomen in de presentatie Geef mij uw data – alstublieft die ik voor archivarissen gaf, om aan te geven dat ook dit soort ogenschijnlijke eenvoudige lijstjes voor andere van grote waarden kan zijn! Genealogie Online gebruikt die op de Over de familienaam pagina’s en in de zoekmachine.

Over de dag

Een ander element waar informatie over verzameld kan worden is een datum/jaartal. Genealogie Online toonde al langer - op basis van datum van geboorte, huwelijk of overlijden – informatie uit Wikipedia. Zoals informatie over de regering, het koningshuis en andere historische gebeurtenissen. Deze informatie wordt nu ook op de Over de dag pagina’s getoond.

Het KNMI levert via haar website historische daggevens die terug gaan tot terug gaan tot 1701. Zo kan er bijvoorbeeld bij een huwelijk van voorouders worden aangegeven wat voor weer het was!

Onlangs zijn er twee nieuwe bronnen toegevoegd om een beeld te geven van het tijdsgewricht: kunst uit het Rijksmuseum en het Polygoon journaal.

Het Rijksmuseum stelt informatie over hun kunst als open data beschikbaar. Naast veel meta-informatie kun je ook de beelden bekijken. Zo kan er bijvoorbeeld getoond worden welke kunst werd gemaakt in 1880.

image Bron: Rijksmuseum, schilderij Willem Roelofs gemaakt in 1880

Open Beelden is een open mediaplatform die toegang biedt tot audiovisuele collectie die hergebruikt mogen worden. Zo biedt Open Beelden ook de Polygoon journaals aan. Op basis van een datum kan er nu (ongeveer) het bijbehorende Polygoon journaal getoond worden, zie bijvoorbeeld Over de dag dinsdag 4 maart 1941.

Over de plaats

Een derde element dat voorkomt in genealogische data zijn plaatsnamen. Genealogie Online maakt gebruikt van een open data set van internationale geografische informatie die wordt geleverd door Geonames.

Zoals beschreven in Genealogie en plaatsnamen wordt deze dataset onder andere gebruikt om de plaatsnamen te controleren: zijn de plaatsnamen door de stamboomonderzoeker goed (en uniek genoeg) geschreven? Als de plaatsnaam uniek is geïdentificeerd dan biedt Geonames ook gegevens als lengte- en breedtegraad en links naar Wikipedia.

Deze informatie wordt gebruikt op de Over de plaats pagina’s, zie bijvoorbeeld de Over de plaats Gouda pagina. Op basis van de identificerende Geonames ID kan er (via DBpedia) een beschrijvende tekst en foto opgehaald worden die gepresenteerd kan worden.

File:Gouda vanuit de lucht.jpg Bron: Wikipedia Commons, pagina Gouda

Genealogie Online probeert, met hulp van haar gebruikers, ook links te leggen naar archieven. Een andere mooie open data bron is de Archief Wiki. Door de plaatsnamen die vallen onder het werkgebied van een bepaald archief te koppelen (op basis van de Geonames ID’s) kan de stamboomonderzoeker bij een plaatsnaam verteld worden bij welke archiefinstelling hij/zij moet zijn voor broninformatie.

Een andere mooie bron die op de Over de plaats pagina’s wordt getoond is afkomstig van rijksmonumenten.info die op hun beurt weer informatie aggregeert van de Rijksdienst voor het Cultureel Erfgoed, Wikipedia en Flickr. Deze dataset is onder andere doorzoekbaar op breedte- en lengtegraad. Het resultaat: afbeeldingen van rijksmonumenten uit die buurt!

Open data, nieuwe mogelijkheden en inzichten

Dit artikel geeft enkele voorbeelden van hoe Genealogie Online gebruik maakt van open data om context te bieden aan stamboomonderzoekers.

Het mooie is, dat we pas aan het begin staan van de open data beweging. Hoe meer organisaties, waaronder archieven (zoals trendsetter Archief Leiden), hun data open beschikbaar stellen, hoe meer mogelijkheden er ontstaan. Dit alles moet passen binnen kaders als auteursrecht en privacy en ook ondersteund worden door de gebruikte IT systemen, maar dat zijn maar kleine drempels.

Open data kan leiden tot meer inzicht, nieuwe functionaliteiten, meer bedrijvigheid!

03 juni 2013

Ontwikkeling van de kwartiertijdbalk

De tijdbalk is een fraaie weergave van gebeurtenissen in de tijd. Een tijdbalk kan ook een nuttig instrument zijn omdat het nieuwe inzichten kan geven doordat er op een andere wijze gepresenteerd worden. Ook voor genealogen kan de tijdbalk van pas komen! Al een tijdje liep ik met het idee om de tijdbalk te combineren met een andere genealogische weergave, de kwartierstaat.

De tijdbalk

Een tijdbalk of een tijdlijn is een grafische weergave van een chronologische opvolging van gebeurtenissen of periodes. Het schema heeft de vorm van een balk en bezit tijdsaanduidingen met een inschrift of een bijschrift.

Je kunt zelf tijdbalken maken via bijvoorbeeld TimeToast, TimeRime of Tijdbalk.nl (waarvan hieronder een afbeelding). Bij deze websites moet je wel zelf de gegevens handmatig invoeren.

image

De tijdbalk in genealogie

Op Genealogie Online wordt de tijdbalk ingezet om inzicht te geven in het leven van een persoon. Hieronder een voorbeeld van Willem Frederik Lamoraal Boissevain. Het rode vlak geeft de levensduur aan, daaronder zijn ook grootouders, ouders, broers/zussen en kinderen in de tijdbalk gezet. Het geeft dus weer wat de persoon meemaakte qua geboortes en overlijdens en wie er in dezelfde tijd leefden.

image

De kwartierstaat

image

Een kwartierstaat is een weergave van kwartierdrager of proband (degene van wie men uitgaat) met alle directe voorouders in mannelijke en vrouwelijke lijn.

Alhoewel je in zowel de tekstuele als grafische kwartierstaat jaartallen kunt opnemen, is het lastig een beeld te krijgen van overlap. Hierdoor ontstond bij mij het idee voor het combineren van de kwartierstaat met de tijdbalk.

De kwartiertijdbalk

De kwartierstaat-tijdbalk of kwartiertijdbalk zou zowel de relaties tussen kind en ouders als de levensduur van de personen moeten weergeven. De volgende afbeelding is de eerste schets van die ik maakte van een kwartiertijdbalk. De balken geven de levensduur van de persoon weer, de lijnen geven de kind-ouder relaties weer.

timeline-pedigree

Alhoewel de combinatie klopt leest deze weergave wat lastig. Doordat de kwartierdrager links staat en dus ook de meest recente tijd is, beginnen de levensduurbalken bij het overlijden en eindigen ze bij de geboorte. Onlogisch… omdraaien dus!

Het eerste prototype

image

Na de eerste schets (nog in een tekenprogramma gemaakt) volgende een eerste prototype (hierboven weergegeven). Dit was een werkend prototype van de kwartierstaat-tijdbalk die je in de browser kunt bekijken!

In dit prototype zijn er ook verschillende balken, die er in de eerste schets nog niet zichtbaar waren. Van sommige voorouders is wellicht de geboortedatum of datum van overlijden niet bekend. Dit wordt weergegeven met een gestreept begin of einde. Ook kan het zijn dat de kwartiertijdbalk uitgaat van een levende persoon en dat er nog voorouders leven. In dat geval eindigt de balk met een driehoek. Tenslotte worden de balken roze of blauw gekleurd om het geslacht weer te geven.

Het tweede prototype

Waar je in een normale grafische kwartierstaat de generaties goed kunt onderscheiden was dit in het eerste prototype van de kwartiertijdbalk minder goed zichtbaar, je miste het. In het tweede prototype (hieronder weergegeven) is dit ondervangen door per generatie een aparte kleur te gebruiken voor de verbindingen.

image

De gegevensvereisten

Om een grafische kwartierstaat te maken heb je in principe alleen informatie nodig over de namen en de kind-ouder relaties. Een kwartiertijdbalk vereist meer: informatie over geboorte/doop en overlijden/begrafenis. Met deze tijdsinformatie kan pas een balk in de tijdbalk worden gezet. De tijdbalk kan omgaan met geschatte jaartallen, maar dan moet je wel jaartallen kunnen schatten.

Hiermee is er een extra uitdaging gekomen voor het ‘genereren’ van de gegevens set achter een kwartiertijdbalk. Ik probeer deze gegevens set te genereren vanuit een GEDCOM bestand. Wanneer er geen geboortedatum is wordt er gepoogd om een minimale geboortedatum te achterhalen. Dit kan bijv. door naar de trouwdatum te kijken en te stellen dat iemand dan minimaal 18 jaar is. Of naar de geboortedata van de kinderen. Eenzelfde set met schattingsregels is er opgesteld voor het bepalen van de overlijdensdatum.

Op basis van deze schattingen kunnen er alsnog balken in de kwartiertijdbalk getekend worden. Maar het kan zijn dat er geen data geschat kunnen worden, deze personen worden dan niet getoond in de kwartiertijdbalk!

De toekomst van de kwartiertijdbalk

Deze exercitie om van idee, via schetsen en prototypes, te komen tot een nieuw type genealogische weergave is erg leuk, vandaar ook dit artikel.

Er moet echter nog wel wat aan de techniek geschaafd worden, zo werken de weergaven bijvoorbeeld niet of zeer langzaam op tablets!

Ik hoop dat de techniek binnenkort bruikbaar wordt en dat deze nieuwe genealogische weergave binnenkort beschikbaar komt op Genealogie Online. Dan is er naast de kwartieren op de kaart ook een kwartiertijdbalk!

image

En wie weet, nemen ook andere stamboom programma’s en –websites deze nieuwe weergave over…