16 december 2015

De schatkist die open data heet

Transcriptie van voordracht aan burgemeester G.C.G.M. Rabelink van Schouwen-Duiveland en medewerkers en vrijwilligers van gemeentearchief Schouwen-Duiveland op 14 december 2015 in het gemeentehuis te Zierikzee. Afbeeldingen komen uit de getoonde presentatie, waarbij alle afbeeldingen doorlinken naar de bron.

Goedenavond, mijn naam is Bob Coret. Tijdens mijn studie informatica aan de universiteit van Twente heb ik mij bekwaamd in informatie technologie. Wat kan de combinatie van enerzijds technologie en anderzijds informatie ons brengen? Daar houd ik mij tot op de dag van vandaag mee bezig, voor lokale overheden, archiefinstellingen, maar ook stamboomonderzoekers. En open data heeft daar een belangrijke rol in.

Allereerst wil ik met enkele felicitaties beginnen.

Onlangs is de Kwaliteitsmonitor 2015 uitgevoerd door de branchevereniging van Nederlandse archiefinstellingen (BRAIN) en Archief2020. Via digitale vragenlijsten zijn bezoekers bevraagd over diverse kwaliteitsaspecten van de archiefinstelling waar ze op dat moment waren. Het gemeentearchief Schouwen-Duiveland neemt hier, samen met Regionaal Archief Zutphen, een 2e plaats in qua overall scores! Mijn felicitaties gemeentearchief Schouwen-Duiveland, een resultaat waar u trots op mag zijn.

Voor meer informatie over de hoogst scorende archieven op diverse items uit de monitor, zie het overzicht Benchmarking kwaliteitsmonitor 2015.

imageFelicitaties ook naar de gemeente­archivaris Huib Uil. Op 3 december verdedigde hij aan de Vrije Universiteit in Amsterdam zijn proefschrift. Hij verdiepte zich voor zijn promotie-onderzoek in het onderwijs in Zeeland en Staats-Vlaanderen tussen 1578 en 1801. Het proefschrift is getiteld 'De scholen syn planthoven van de gemeente', waarmee hij bedoelt dat de scholen werden gezien als de planthoven, de kweekvijvers van de gemeente.

image

Ik heb hier een schatkist bij me. Deze is gevuld met zaden van de Campanula, een mooie blauw/paarse snijbloem. Het was een gift van een tuinder. Ik heb een balkon, dus ik kan wat van de zaden planten. De rest zal hoogstwaarschijnlijk in deze schatkist blijven. Nu hoor ik u denken: zonde zeg, die zaden wil ik wel voor mijn tuin. De burgemeester stelt zich nu voor hoe de bloemen rond het gemeentehuis zouden staan. En iemand met tuinders achtergrond denkt nu aan de veredelingskwaliteiten van de Campanula. Tja, zonde als deze zaden niet kunnen ontkiemen...

Campanula

Ik ben een hergebruiker, dus Huib, met jouw goedvinden, wil ik de titel van je proefschrift hergebruiken als stelling, die ik voor deze lezing omzet naar ‘Open data zijn planthoven van de gemeente’.

Wat is open data?

Open data is een term die wordt gebruikt om vrij beschikbare informatie aan te duiden. Overheidsorganisaties creëren en verzamelen een boel gegevens voor de uitvoering van hun taken. Als deze organisatie deze rauwe informatie beschikbaar stelt, in een formaat waarmee programmeurs uit de voeten kunnen, dus machine leesbaar, en hierbij aangeven dat het gratis hergebruikt mag worden, dan spreken we van open data.

image

Vanuit Europa en de Nederlandse overheid wordt open data erg gepromoot. Waarom? De open data moet u zien als de zaadjes in deze schatkist. Door de zaadjes beschikbaar te stellen aan anderen, kunnen er mooie planten groeien, nieuwe soorten ontstaan. Door open data her te gebruiken kunnen programmeurs nieuwe applicaties maken, websites en apps. En het mooi van elektronische gegevens is dat je ze oneindig kunt kopiëren. Deze zaden kan ik maar één keer weggeven, maar data kun je blijven “weggeven”, want je hebt het nog steeds.

Over wat voor data heb ik het nu?

Je kunt denken aan de locatie van alle lantaarnpalen in de gemeente, de waterstanden van het Grevelingenmeer, prestatiegegevens van scholen, verkiezingsuitslagen, …

Kun je met dit soort data echt een app voor een smartphone maken?

Dat is het mooie van open data, anderen krijgen de beschikking over data die ze vanuit hun expertise, interesse gaan bekijken, om er wellicht mogelijkheden in te zien. Dat kan heel iets anders zijn dan je verwacht, bijvoorbeeld omdat de gegevens worden gecombineerd met andere gegevens, waardoor er weer iets nieuws en interessants ontstaat.

Wie weet is er nu een voedingsdeskundige in de zaal die het idee krijgt om deze zaden te combineren met yoghurt voor een gezond ontbijt.

Ik zal wat voorbeelden van open data gebruik de revue laten passeren.

Het Centraal Bureau voor de Statistiek biedt alle gemeentelijke begrotingen aan als open data. Op basis van deze data is de website OpenSpending.nl gemaakt. Hier kun je heel eenvoudig de begroting van een gemeente vergelijken met een andere gemeente, of een begroting van 2015 vergelijk met die van 2010.

image

Ook de begrotingen van Schouwen-Duiveland kun je op deze website bekijken en vergelijken. Zo viel het me op dat de begrootte baten voor Natuurbescherming in 2010 zo’n 4 miljoen waren en in 2015 maar 72 duizend euro. Ik dacht gelijk een goed doel voor mijn schatkist met zaden gevonden te hebben... Maar het verschil bleek vooral door opbrengsten van grondverkopen veroorzaakt te worden. Dit voorbeeld van open data gebruik laat een andere mooie eigenschap van open data zien: het zorgt voor transparantie.

image

De locaties van openbare toiletten leiden tot ‘Find a toilet’ apps. Gegevens van lantaarnpalen worden gebruikt in een app waarmee je een defecte lantaarnpaal kunt melden. Door de specifieke informatie over de lantaarnpaal kan een gemeente of provincie deze “Melding openbare ruimte” efficiënt afwikkelen. In Utrecht heb je een soortgelijke app voor bomen, de bomenspotter.

image

Op basis van gegevens van aardbevingen, ook beschikbaar als open data, zijn informatieve animaties gemaakt die gebruikt worden in het gasboringsdebat.

Een paar voorbeelden om aan te geven dat wellicht saai ogende data tot iets nieuws kunnen leiden.

Hierbij wil ik niet de verwachting scheppen dat alle open data ook wordt gebruikt, het kan ook zo zijn dan niemand er iets mee doet.

Een ander voorbeeld van open data in de genealogische hoek, die vele van u zal aanspreken.

Gemeentearchief Schouwen-Duiveland heeft de nadere toegang op de Burgerlijke Stand gepubliceerd als open data. Dus de openbare gegevens van geboorteakten, huwelijksakten en overlijdensakten, die u waarschijnlijk heeft helpen invoeren, kan ik als hergebruiker downloaden om hier mee te innoveren.

Ik was niet zo tevreden met de functionaliteit die de doorsnee website van archieven biedt. Als informaticus zag ik meer mogelijkheden, mijn handen jeukten. Met de open data kon ik nu mijn eigen website maken en proberen meer uit de data te halen, om nieuwe functionaliteit te bieden die onderzoekers op prijs stellen.

image

De gegevens van Schouwen-Duiveland zijn nu ook beschikbaar via de website Open Archieven, net als de gegevens van Stadsarchief Rotterdam, Erfgoed Leiden en omstreken, Regionaal Archief Tilburg, het Nationaal Archief, gemeentearchief Tholen, Stadsarchief Enschede, gemeentearchief Ede en nog enkele archieven.

De website is ook beschikbaar in het Engels, Duits en Frans, waarmee de gegevens direct voor een veel grotere groep onderzoekers toegankelijk is.

image

Toen ik de data “in handen” had zag ik dat er duidelijke relaties zaten in de gegevens. Neem nu een huwelijksakte, waarin naast het bruidspaar ook hun wederzijdse ouders worden genoemd. Vaak zie je dit soort gegevens op een archiefwebsite puur als tekst onder elkaar gepresenteerd. Op Open Archieven maak ik deze relaties inzichtelijk, door grafische elementen toe te voegen die doen denken aan een kwartierstaat. In één oogopslag zijn de relaties duidelijk.

image

Ook data van de Verenigde Oostindische Compagnie, deels afkomstig van het Zeeuws Archief, wordt gepresenteerd op Open Archieven. Deze gegevens beschrijven de reis die VOC opvarenden maakten, van vertrek bij Kamer Zeeland op een schip richting Batavia, tot aan de Kaap. Dit is een reis door de tijd, die presenteer je niet allen met tekst door alle datums onder elkaar te zetten. Nee, daar gebruik je een tijdlijn voor, zodat ook gelijk inzichtelijk wordt hoe lang de reis duurde.

image

Gegevens op websites worden vaak maar op één manier inzichtelijk gemaakt. Je zoekt op de naam en krijgt akten waar de naam in voorkomt. Maar als je alle data hebt kun je ook andere doorsnedes maken. Zo kun je bijvoorbeeld heel eenvoudig een overzicht maken van veelvoorkomende familienamen in een bepaalde plaats in een bepaalde tijdsperiode in grafiekvorm. Of bekijken wat veelvoorkomende beroepen zijn in een bepaald gebied in een bepaalde tijdsperiode. Informatief en handig voor onderzoek, zoals naar onderwijzers.

image

Ook andere relaties kon ik leggen vanuit de data op Open Archieven. Neem weer een huwelijksakte in gedachte. Als stamboomonderzoeker zult u bij het zien van de huwelijksakte de volgende zoekactie als bedacht hebben: wanneer zijn de ouders geboren en getrouwd, heeft het paar kinderen gekregen? Dit zijn de zoekacties die u dan handmatig op de archiefwebsite gaat uitvoeren. Open Archieven voert deze zoekacties automatisch uit en presenteert de links naar de gerelateerde geboorte- en huwelijksakten (zie voorbeeld). Open Archieven kan ook nog een stap verder gaan en alle bekende relaties weergeven. Het is geen magie, het is gebruik maken van beschikbare gegevens.

image

De historische persoonsgegevens kunnen ook aan andere bronnen gekoppeld worden. Het KNMI biedt de historische weergegevens aan als open data. Op Open Archieven kunt u nu op de datum van een akte klikken om te bekijken wat voor weer het was op de dag van de geboorte, huwelijk of overlijden. De weergegevens van die dag en dichtstbijzijnde weerstation in die tijd, wordt automatisch gekoppeld. Het levert een leuk stukje context op bij de akte.

Historische weer KNMI

Volkstelling gegevens van heel Nederland zijn ook beschikbaar als open data. Hierdoor kan Open Archieven bij bijvoorbeeld een geboorteakte uit 1849 vertellen dat Zierikzee toen 7.092 inwoners had, waarvan 40% Nederduitsch Hervormd en zo’n 13% Rooms Katholiek. Het biedt weer een stukje context over de geboorte.

Open volkstellingen

In bevolkingsregisters wordt ook vaak de straat genoemd. Zou het niet leuk zijn om de straat te bekijken op een historische kaart? Een groot deel van de thans beschikbare open data bestaat uit geografische informatie. Voor enkele plaatsen, zoals Leiden en Nijmegen, heb ik deze geografische informatie gecombineerd met een voor hergebruik beschikbaar gestelde historische kaart. Op Open Archieven kunt u daardoor nu klikken op de straatnaam die dan als lijn wordt weergegeven op een historische kaart van de stad.

Historische kaarten met straat markering

Ik denk met deze functies een mooie dienst te kunnen bieden aan stamboomonderzoekers. Ik hoop hier zelfs aan te kunnen verdienen! En om u gerust te stellen, ik verdien niet direct aan uw noeste arbeid. Deze data wordt immers gratis op de website van het gemeentearchief getoond en kan gratis als open data download worden. Niemand zal daarvoor betalen! Echter, ik heb tijd en geld geïnvesteerd om met de data iets te maken, een dienst, waar mensen wel voor willen betalen. Zo biedt Open Archieven de mogelijkheid om de data te downloaden in GEDCOM formaat die zo is in te lezen in uw stamboomprogramma. Uw zoekopdrachten kunnen in de gaten worden gehouden, wanneer er nieuwe zoekresultaten zijn krijgt u via e-mail een bericht.

image

Deze dienst blijkt meerwaarde te hebben, mensen willen ervoor betalen. Ik heb iets nieuws gemaakt met behulp van open data dat er anders waarschijnlijk niet was gekomen. Het budget van het gemeentearchief voor doorontwikkeling van hun website is beperkt. Het is ook niet de taak van een gemeentearchief  om te innoveren met hun gegevens, zij zijn de hoeders van de archiefbescheiden en stimuleren het gebruik van de archiefbescheiden. Het bieden van open data is één van de manieren waardoor het gebruik gestimuleerd kan worden. Het feit dat het archiefbescheiden niet op de eigen website wordt getoond maar op een andere website is niet van belang. Dat het wordt getoond of wordt gebruikt, dat telt.

Doordat de open data voor iedereen beschikbaar is kunnen vele mensen er iets mee doen, al dan niet commercieel. Je ziet dus enerzijds innovatie, in het geval van Open Archieven op het gebied van genealogie. En anderzijds zie je economische bedrijvigheid ontstaan, een punt dat onder andere oud eurocommissaris Neelie Kroes ook vaak noemt.

Neelie Kroes stelt: "Uw data is meer waard als u die weggeeft". De Europese Commissie heeft uitgerekend dat de directe en indirecte economische impuls van open data 140 miljard euro kunnen bedragen.

image

Tenslotte, nog een ander concreet voorbeeld van wat open data kan opleveren. Recent is een andere hergebruiker aan de slag gegaan met de open data van Erfgoed Leiden. Hij zette alle aktes op volgorde van aktenummer. Hierdoor konden heel eenvoudig fouten in aktenummers opgespoord worden, nummers die dubbel voorkwamen of overgeslagen nummers. Door deze actie werd ook duidelijk dat er een boel akten niet geïndexeerd waren of dat deze data niet op de website stonden. In een register liepen de aktenummers bijvoorbeeld door tot 1100, maar als je de scans bekeek liepen deze door tot 1500. De noeste arbeid van vrijwilligers moet natuurlijk wel compleet beschikbaar zijn.

Oftewel, open data kan ook leiden tot kwaliteitsverbetering van de data zelf! Ik zie dit ook op Open Archieven waar bij elke akte een prominente “Fout melden in gegevens” knop staat. De fouten die gebruikers van Open Archieven melden worden doorgesluisd naar de betreffende archiefinstelling die, als de fout blijkt te kloppen, de gegevens kan verbeteren. Open Archieven ontvangt later de verbeterde gegevens weer uit de vertrouwde bron: de archiefinstelling.



Ik hoop dat u allen open data ziet als zaadjes in deze schatkist, die juist door ze te delen meer waarde kunnen opleveren, oftewel: open data als planthoven van de gemeente.

Ik hoop dat de gemeente het voorbeeld van het gemeentearchief volgt en meer open data gaat bieden. Dat ook het gemeentearchief meer van haar digitale bronnen voor hergebruik beschikbaar gaat stellen. Open de schatkist met gegevens, laat de zaadjes ontkiemen, laat u verrassen!

Ik hoop dat u, vrijwilligers, als "producenten van open data" blij en trots zijn, dat uw data door anderen worden gebruikt in onderzoek èn hergebruikt worden voor ontwikkeling van nieuwe toepassingen!

Bedankt voor de open data.

16 september 2015

Extra kinderen vinden door open data

Doordat archieven hun genealogische gegevens (de nadere toegangen) als open data beschikbaar stellen kunnen programmeurs handige en mooie services voor stamboomonder­zoekers maken. Het aantal archieven dat open data biedt is nog beperkt, maar met de onlangs ingevoerde Wet hergebruik overheidsinformatie en onlangs aangepaste Archiefwet zal dit aantal snel stijgen!

Open Archieven biedt een zoekmachine voor historische persoonsgegevens. De gegevens zijn afkomstig van diverse archiefinstellingen die hun gegevens voor hergebruik beschikbaar hebben gesteld. Op basis van deze open data is een dienst neergezet die laat zien dat je met deze data meer kan dan archiefinstellingen nu doen:

  • akten worden zo weergegeven dat er recht wordt gedaan aan de inhoud/structuur van de informatie
  • er worden bij akten suggesties gegeven voor gerelateerde akten
  • er wordt gelinkt met externe bronnen zoals het Biografisch Portaal Nederland, Graftombe, de Oorlogsgravenstichting en online stambomen
  • er wordt context toegevoegd uit weer andere open data bronnen zoals de historische weerreeksen van het KMNI en de volkstellinggegevens
  • er wordt gelinkt naar scans bij andere organisaties
  • er wordt gelinkt naar historische kaarten op basis van straatgegevens van OpenStreetMaps

Open Archieven biedt op haar beurt ook diverse functies aan via een geautomatiseerde toegang (API) aan programmeurs. Zo maakt bijvoorbeeld Genealogie Online gebruik van de zoekfunctie van Open Archieven om haar gebruikers extra informatie te bieden in de vorm van “extra kinderen”.

Voor elke ouderkoppel in een publicatie op Genealogie Online wordt Open Archieven automatisch doorzocht op kinderen van dit ouderpaar. De zoekresultaten (=kinderen) worden vergeleken met de kinderen die de stamboom­onderzoeker al heeft beschreven in zijn of haar publicatie. Op deze manier kunnen er “extra kinderen” worden gevonden en kan de stamboom­onderzoeker het betreffende gezin in zijn of haar publicatie completer maken!

Genealogie Online biedt deze functie aan als onderdeel van de Scans zoeken service. Hieronder een schermafdruk van enkele “extra” gevonden kinderen zoals een Genealogie Online abonnee die te zien krijgt:

image

Het vinden van kinderen van ouderkoppels kan natuurlijk nu al via de vele archiefwebsites, handmatig... Maar, door open data, kan deze zoekactie naar kinderen geautomatiseerd worden wat voor genealogen tijdwinst betekent. En deze extra tijd kan weer in andere opzoekingen gestopt kan worden!

01 juli 2015

Archieven: geef ons vaste URL’s!

image

Bij een bronvermelding neem ik bij voorkeur een link op naar de akte op de bronwebsite. Het maakt dat je later snel weer de akte kunt vinden, zo ook andere onderzoekers of bezoekers van de online genealogische publicatie. Maar hoe lang gaat zo’n link mee? Hoe lang duurt het voordat de link eindigt in een “Pagina niet gevonden” pagina?

Verouderde links

Eén van de links die ik in mijn onderzoek heb opgenomen is naar Streekarchiefdienst Hollands Midden (http://www.rsnet.nl/sahm/), helaas werkt deze link niet meer. Streekarchief Rijnlands Midden en Streekarchief Midden-Holland werkten samen onder de naam Groene Hart Archieven (http://www.groenehartarchieven.nl/), deze website verwijst nu naar 2 andere websites. Sinds enige tijd gaan deze twee instellingen namelijk weer hun eigen weg, het Streekarchief Midden-Holland is nu dan ook bereikbaar op http://www.samh.nl/.

Scans zoeken, een service van Genealogie OnlineNaast mijn eigen onderzoek, loop ik ook bij mijn professionele dienstverlening tegen dit soort verhuizingen aan. De Scans zoeken service van Genealogie Online geeft suggesties voor online scans bij archiefinstellingen (en FamilySearch, Graftombe, Online Begraafplaatsen, enz.) op basis van de op Genealogie Online gepubliceerde genealogische gegevens. Eén van de bronnen waar naar verwezen werd was Streekarchief Bommelerwaard, dit archief is opgegaan in Regionaal Archief Rivierenland. Naast een andere domeinnaam zijn ze ook gewisseld qua leverancier (dus de achterliggende techniek is ook anders). Deze verhuizing betekende dat de ruim 90 duizend links naar dit archief op Genealogie Online moesten worden aangepast …

Je kunt je dus afvragen: heeft het wel zin om URL’s op te nemen in een bronvermelding? Zijn de URL’s van online akten (en ook online stambomen) duurzaam genoeg?

Linkrot is het fenomeen waarbij op een internetpagina met links na enige tijd steeds meer aangeklikte links niet werken, omdat de doelpagina uit de lucht is, een andere naam heeft gekregen of omdat de webpagina of site niet meer bestaat. (bron: Wikipedia)

Wat kun je als onderzoeker doen?

Als je een niet werkende link hebt als onderzoeker, dan kun je de WayBackMachine proberen. Deze website probeert het internet te “archiveren” door geregeld kopieën te maken van websites. Hoe zag de website van Streekarchiefdienst Hollands Midden er in 2000 uit? Klik op onderstaande afbeelding om een “capture” van de website destijds te bekijken:

image

Helaas is er vaak maar een klein deel van een website beschikbaar bij de WayBackMachine, met name de pagina’s die via alleen via zoekfuncties bereikbaar zijn worden vaak niet gearchiveerd.

Naast het overnemen van de gegevens van een akte in het eigen stamboomprogramma en het downloaden van de scan is een eigen kopie maken van de webpagina ook aan te raden. Sla de pagina op door de “Opslaan als” functie van de browser te gebruiken of maak van de pagina een PDF door een service als Web2PDF.

Wat kunnen archieven doen?

Als archiefinstellingen hun gebruikers van dienst willen zijn dan gebruiken ze zogenaamde vaste URL’s, ook wel Persistent URL’s genoemd. Dit zijn links (internetadressen) die niet wijzigen, ook niet als de naam van de organisatie veranderd, organisaties samengaan of splitsen of er andere technologie voor de website wordt gebruikt.

Bij dit soort links wordt er veelal gebruik gemaakt van een onafhankelijke organisatie die de links beheert. Een archiefinstelling meldt alle links van bijv. aktes op de website aan bij deze organisatie. Voor elke link ontvangen ze een vaste URL, wat ook een link is, maar één die niet wijzigt en die gecommuniceerd kan worden aan onderzoekers!

Een voorbeeld

De VOC inschrijving van Daniël Coret is te vinden op http://www.gahetna.nl/collectie/index/nt00344/83412abb-b992-4a95-a950-3eeb8a3a6ee8. Deze pagina heeft als vaste URL het adres http://proxy.handle.net/10648/83412abb-b992-4a95-a950-3eeb8a3a6ee8. Je vindt dit soort vaste URL’s onderaan veel van de “akte” pagina’s op GaHetNa. Als je deze laatste link (handle.net) opent kom je terecht op de eerste link (bij gahetna.nl). De vaste URL is dus een doorverwijs service.

imageStel, het Nationaal Archief besluit om van hun www.gahetna.nl domein toch weer alles beschikbaar te maken via www.nationaalarchief.nl. In het proces van “verhuizen” van de website geven zij aan de beherende organisatie door dat http://proxy.handle.net/10648/83412abb-b992-4a95-a950-3eeb8a3a6ee8 naar een andere adres moet wijzen. Maar de vaste url blijft bestaan en verwijzen naar de akte!

Als ik als onderzoeker dus de vaste URL opneem in mijn onderzoek dan kan ik erop vertrouwen dat dit een duurzame link is, oftewel als ik over vele jaren deze link open dan kom ik bij de juiste akte terecht (die tegen die tijd op een andere website kan staan)!

Helaas, er zijn nog niet veel archiefinstellingen die hun gebruikers de vaste URL als service aanbieden.

Tot 1 juni 2015 kon je onderstaande tekst vinden op de Veelgestelde vragen pagina van WieWasWie (klik op het plaatje om de versie uit de WayBackMachine te halen):

image

Als ze de vaste URL niet kunnen garanderen dan is het goed dat deze belofte is weggehaald. Wellicht moet er zelfs gewaarschuwd worden dat links naar pagina’s niet duurzaam zijn? Aan de andere kant: het is eigenlijk betreurenswaardig dat er geen vaste URL’s worden geboden!

Mijn advies aan onderzoekers: vraag om vaste URL’s als deze niet worden geboden en gebruik vaste URL’s als deze wel worden geboden!

08 mei 2015

Hoe diskwalificeer en schoffeer je duizenden stamboomonderzoekers in 140 tekens?

Eric Hennekam, die onder andere schrijft voor Gen.magazine, het kwartaalblad van het CBG, heeft het niet zo op met stamboomonderzoekers die het resultaat van hun genealogisch onderzoek delen op Internet. Zo twitterde hij onlangs het volgende:

image

Met deze tweet worden de publicaties van vele duizenden stamboomonderzoekers op Genealogie Online gediskwalificeerd. Een onterechte schoffering!

Voor de goede orde, ik zeg niet dat alle publicaties foutloos zijn. De kwaliteit van publicaties varieert, maar hetzelfde kan gezegd worden over andere genealogische websites en over de papieren publicaties die het CBG sinds haar oprichting verzamelt.

Aan de ene kant van het spectrum heb je gevorderde genealogen die geschoold zijn in methodisch bronnenonderzoek, aan de andere kant heb je beginnende genealogen die ongericht alles verzamelen, daartussenin een zeer gevarieerde groep met een passie voor genealogie en familiegeschiedenis. En al deze genealogen mogen en kunnen hun gegevens publiceren!

Het delen van het resultaat van genealogisch onderzoek is 1 van de “Zeven pijlers”  die aangemoedigd wordt door het CBG en enkele genealogische verenigingen in het kader van de bevordering van de kwaliteit van het genealogisch onderzoek. Door je gegevens te delen kun je niet alleen anderen helpen, je helpt ook jezelf door anderen de mogelijkheid te geven om kritisch naar jouw genealogische gegevens te kijken en dus feedback te geven in de vorm van correcties en aanvullingen.

Een onderzoeker moet elk stukje informatie op waarde schatten (je zou toch denken dat Hennekam dit in de cursus, die hij bij het CBG verzorgt, uitdraagt). Voor genealogische publicaties geldt dan: zijn de gegevens voorzien van vermeldingen (en scans/links) van de originele bronnen, mooi dan kunnen die gecontroleerd worden.

Het bevorderen van bronvermeldingen is en blijft van groot belang, hetgeen ik onder andere doe via blogartikels als Bronvermelding hoort tot de grondregels van de genealogiebeoefening. Terecht dat “Verantwoord de bron van je informatie” ook 1 van de “Zeven pijlers” is.

Wat doet Genealogie Online aan kwaliteit?

Naast de duizenden stamboomonderzoekers zet Hennekam natuurlijk ook Genealogie Online in een kwaad daglicht. Alhoewel hij eerder ook zijn aversie uitsprak tegen websites als MyHeritage en Ancestry.com en na enige repliek ook tegen StamboomNederland van het CBG, kan ik alleen maar gissen naar de reden waarom Genealogie Online nu zo wordt genoemd. Te meer daar Genealogie Online veel actie onderneemt om de kwaliteit van de genealogische publicatie te bevorderen.
Wanneer er genealogische gegevens worden gepubliceerd op Genealogie Online dan worden er automatisch diverse consistentie controles uitgevoerd. Zo wordt er van elke persoon in de publicatie de geboorte-, doop-, trouw-, echtscheiding-, overlijdens-, cremeer- en begraafdata gecontroleerd ten opzichte van elkaar, qua leeftijd, ook in relatie tot de kinderen. De auteur van de publicatie kan de totaal lijst met meldingen bekijken, maar de meldingen worden ook getoond aan bezoekers van de publicatie!

Naast deze consistentie controle worden alle plaatsnamen tegen de geografische database Geonames gehouden om de auteur te wijzen op niet eenduidige plaatsnamen (welke Rijswijk?) of niet herkende plaatsnamen.

Ook krijgen de stamboomonderzoekers specifieke suggesties voor online scans bij archieven in Nederland en België en bij FamilySearch op basis van hun gegevens. Mochten er primaire bronnen ontbreken dan kan deze Scans zoeken service de stamboomonderzoeker helpen deze te vinden.
Bronvermeldingen en scans van akten worden, mits deze zijn aangeleverd, standaard gepubliceerd. Ook staat er op elke pagina vermeld wie de auteur is van de publicatie, inclusief de mogelijkheid om contact op te nemen met de auteur.

Wat doen andere stamboomsites aan kwaliteit?
  • Wat doet StamboomNederland, de website van het CBG, aan kwaliteit?
  • Wat doet www.stamboom.nl van HCC!Genealogie aan kwaliteit?
  • Wat doet de stamboomfunctionaliteit van het NGV aan kwaliteit?
  • Wat doet UwStamboomOnline aan kwaliteit?
  • Wat doet Mijn Genea aan kwaliteit?
Voor de goede orde, ik zeg niet dat bovengenoemde websites geen goede informatie kunnen bevatten. Wel wil ik de initiatiefnemers van bovengenoemde websites oproepen om genealogen te helpen om de kwaliteit te verbeteren. Door bijvoorbeeld überhaupt bronvermeldingen mogelijk te maken, door controles uit te voeren en de resultaten te delen en door continue voorlichting over de noodzaak van bronvermeldingen (en privacy).

Wat vindt u van de tweet van Hennekam?

06 maart 2015

Het gezwalk van WieWasWie

In een recent nieuwsbericht van WieWasWie wordt het einde van de stamboombouwfaciliteit van WieWasWie aangekondigd. In dit artikel wordt dit nieuwsbericht nader onder de loep genomen.

Nieuwe focus

In het nieuwsbericht wordt de nieuwe focus van het WieWasWie platform aangekondigd:

WieWasWie gaat zich volledig richten op het beschikbaar stellen van historische persoonsinformatie uit bronnen voor genealogisch onderzoek. In de loop van 2015 zal de stamboommodule van WieWasWie verdwijnen.

en

Vanwege de focus op historische persoonsinformatie uit bronnen en het grote aanbod van goede alternatieve stamboomprogramma’s en –websites, zal de stamboombouwfaciliteit uit WieWieWas verwijderd worden.

De website WieWasWie, opvolger van Genlias, is van archieven en gaat dus om de bronnen. Het "gaat zich" in de eerste quote wijst op een nieuwe koers. Maar laten we eerlijk zijn, de stamboombouwfaciliteit was slechts een afterthought van het WieWasWie projectteam waar noch de archieven noch het CBG bij waren betrokken. Het zwaartepunt lag altijd al bij de bronnen, de focus wordt dus vooral wat het altijd had moeten zijn. Focus op bronnen is goed!

Eisen aan een goed stamboomprogramma

Naast de andere focus worden ook eisen aan stamboomprogramma’s genoemd als reden voor het einde van de stamboombouwfaciliteit:

Het stamboomprogramma op WieWasWie vergt veel aanpassingen om aan de huidige eisen aan een dergelijk programma te voldoen.

Hier wordt gesuggereerd dat de eisen de laatste jaren zijn opgeschroefd, zonder hier enige voorbeelden of verwijzingen voor te geven. Maar heeft de stamboombouwfaciliteit ooit voldaan aan de gebruikerswensen of genealogische best-practices? Nee, qua functionaliteit was er veel mis, zoals ik al in 2011 in Stamboom bouwen beschreef.

Ook de gebruikte technologie blijkt te hebben bijgedragen in het besluit te stoppen met de stamboombouwfaciliteit:

Bovendien wordt Silverlight - noodzakelijk om het programma te kunnen draaien - niet langer door Microsoft ondersteund en doorontwikkeld.

Dit is een beetje rare redening. Immers, toen WieWasWie in 2012 live ging was dat met een stamboombouwfaciliteit op basis van een reeds verouderde versie van het open-source component Family.Show (uit 2009).

De ontwikkeling van Silverlight (de “Flash” technologie van Microsoft) was in 2011 al stopgezet ten voordele van HTML5. Dat Silverlight niet meer wordt ondersteund door Microsoft is overigens onjuist, deze eindigt pas  2021.

NB: dit artikel is gebaseerd op het nieuwsbericht dat via e-mail is gestuurd naar WieWasWie abonnees. Op de weblog van WieWasWie wordt ook melding gemaakt van het verdwijnen van de stamboombouwfunctionaliteit maar hierin is het deel over “huidige eisen” en Silverlight weggelaten.

Naast de slechte kwaliteit van de stamboombouwfaciliteit wordt er in het nieuwsbericht ook voorbij gegaan aan het feit dat er nooit draagvlak voor het component was, niet bij het CBG, die in die periode met een eigen stamboomwebsite bezig was (het feit dat de overheid tegelijkertijd, via twee ministeries, geld pompte in stamboomwebsites blijft me verbazen) en zich destijds uit het WieWasWie had teruggetrokken, en niet bij de archieven die er niet bij betrokken waren (zie reactie onderaan Stamboom bouwen).

Om nog maar te zwijgen over het feit dat er niet veel gebruik word gemaakt van de stamboombouwfaciliteit:

image

De 1237 stambomen met daarin 76222 personen (dd. 6-3-2015) stelt erg weinig voor. Reden hiervoor is wellicht omdat de stamboombouwfaciliteit volgens het projectteam – in eerste instantie –  vooral was bedoeld voor beginnende stamboomonderzoekers. Een “tweede instantie” is er nooit gekomen, naast het verwijderen van de GEDCOM import functie zijn er geen noemenswaardige verbeteringen of uitbreidingen in het stamboombouwfaciliteit  geweest in de afgelopen 3 jaar waardoor de stamboomonderzoekers de stamboombouwfaciliteit (met maximaal 500 personen per stamboom) links hebben laten liggen.

image

Starten of stoppen? Een eenvoudige vraag…

Van de regen in de drup?

Voor hen die een stamboom op WieWasWie hebben is er een handleiding beschikbaar:

We hebben een handleiding gemaakt voor het exporteren van je stamboom en het importeren ervan in StamboomNederland.nl.

Waar de promotie van StamboomNederland vandaan komt begrijp ik, het CBG is exploitatiepartner van WieWasWie èn eigenaar van StamboomNederland. Deze website, die alweer sinds september 2010 in de lucht is, is sindsdien ook niet verbeterd, ondanks kritiek op het product. Als het voldoen aan “huidige eisen” zo belangrijk is (kent u een tevreden StamboomNederland gebruiker?), waarom geldt dit dan niet voor StamboomNederland?

Maar, wat me nog het meest bevreemd is het feit dat het nieuwsbericht meldt dat de stambomen van StamboomNederland via WieWasWie beschikbaar komen:

De stambomen op StamboomNederland worden in de toekomst ook via WieWasWie doorzoekbaar.

Hè? Las ik niet net dat WieWasWie zich volledig gaat richten “op het beschikbaar stellen van historische persoonsinformatie uit bronnen"? Wordt de focus gelijk al weer losgelaten?

GEDCOM export

In een voetnoot van het nieuwsbericht staat overigens nog een nieuwtje:

* GEDCOM is een standaard bestandsformaat voor het opslaan en uitwisselen van genealogische gegevens. De GEDCOM-exportfunctie van WieWasWie is verbeterd om alle gegevens goed te kunnen verhuizen.

Helaas heb ik de verbeterde GEDCOM export niet kunnen testen, ik krijg op het moment van schrijven steeds een foutmelding. Jammer, ik was echt benieuwd of exploitatiepartij CBG en bouwer/beheerder Mindbus nu echt eens de GEDCOM standaard goed hebben geïmplementeerd – dat was voorheen namelijk zeker niet het geval - en zo hun gebruikers echt de kans bieden om al hun data op een goede wijze er uit te krijgen. Ik heb er niet veel vertrouwen in…image

De toekomst van WieWasWie

Alhoewel ik het dus goed vind dat de stamboombouwfaciliteit verdwijnt geeft het me tegelijkertijd een wat unheimlich gevoel. Dit wordt mede ingegeven door de laatste uitbreiding van WieWasWie: WatZitErin. Deze functie is op zich een verbetering ten opzichte van het Excel bestand dat geboden werd (via Dropbox, sic) om inzicht te verschaffen in beschikbare bronnen op WieWasWie. Echter, deze functionaliteit (op het wiewaswie.info domein) maakt geen onderdeel uit van het WieWasWie platform (op het wiewaswie.nl domein). Het is niet gemaakt door de bouwer/beheerder van WieWasWie – Mindbus – maar door de ontwikkelaar van Zoekakten.nl die ook in dienst is bij het CBG (voor wie hier over twijfelt: vergelijk de HTML broncode maar eens).

Het WieWasWie platform wordt dus enerzijds deels ontmanteld en nieuwe functies worden buiten het platform ontwikkeld. Ik hoop werkelijk dat dit geen trend is die doorzet, dat het noodzakelijk is, het zou toch zonde zijn van de miljoenen euro’s belastinggeld die in het WieWasWie platform zijn gepompt.



Update 8-3-2015

De "verbeterde GEDCOM export" van WieWasWie werkt vandaag. In Hoe het CBG gegevensverlies veroorzaakt een analyse. Hieronder de conclusie van de analyse:


Het bestand dat via de exportfunctie van de stamboombouwfunctionaliteit kan worden gedownload voldoet niet aan de GEDCOM specificatie (welke dan ook…) en mag dus geen GEDCOM bestand heten. Noem je het wel GEDCOM bestanden dan werk je moedwillig mee aan de onterecht negatieve beeldvorming van GEDCOM en bewijs je je gebruikers een slechte dienst.

In plaats van een handleiding hoe deze bestanden in StamboomNederland zijn te importeren zou het het CBG sieren om stamboomonderzoekers te waarschuwen voor mogelijk gegevensverlies door hun ondermaatse GEDCOM export (WieWasWie) en ondermaatse GEDCOM import (StamboomNederland).

17 februari 2015

Na crowdsourcing ook crowdfunding in de archiefsector?

imageHet indexeren van akten gebeurd al jaren door een grote schare van vrijwilligers. Was het ‘vroeger’ vooral bij het archief zelf, tegenwoordig kunnen vrijwilligers thuis op de computer meehelpen via VeleHanden, Open Archieven of FamilySearch Indexing. Het vrijwilligerswerk van weleer heet tegenwoordig crowdsourcing.

Een andere ‘trend’ wordt crowdfunding genoemd, hierbij wordt een donatie aan het publiek gevraagd voor het bereiken van een bepaald doel. Ook dit is op zich niets nieuws. Het Waterlands Archief berichtte over een 18e eeuwse crowdfundings-actie door de Purmerendse Lutheranen.

Je kunt je afvragen waarom archiefinstellingen niet meer aan crowdfunding doen. Het cynische antwoord is dat archieven dit niet hoefde vanwege de verschillende subsidies die hiervoor bestonden. Of, dat subsidies uit belasting wordt betaald en er dus 16 miljoen donateurs aan hebben bijgedragen. Maar voor archieven en genealogen liggen op het vlak van crowdfunding toch mogelijkheden om mooie nieuwe bronnen digitaal beschikbaar te krijgen.

Het Red een portret project van Stadsarchief Amsterdam is een voorbeeld van een crowdfunding project in de Nederlandse archiefsector. Er wordt gepoogd € 50.000 bij elkaar te krijgen om het archief van Fotostudio Merkelback te digitaliseren, ze hebben nu zo’n 69% van het streefbedrag binnen.

imageVoor een voorbeeld op het vlak van genealogie moeten we uitwijken naar Amerika. In het Preserve the Pensions project wordt getracht om genoeg geld bij elkaar te krijgen om de 7,2 miljoen pagina’s van de pensioen akten van de oorlog van 1812 te digitaliseren. Het streefbedrag van 3,7 miljoen dollar is al voor 50% binnen!

Dit project is geïniteerd door de Amerikaanse National Archives and Records Adminstration, de NARA. Maar, in plaats van zelf een crowdfunding campagne op te zetten en de crowd te motiveren benaderden zij de Federatie van (zo’n 500) Genealogische Verenigingen, de FGS. Het FGS koos, op advies van het NARA, de pensioen akten omdat deze één van de meest geraadpleegde bronnen was die nog niet op microfiche of digitaal beschikbaar was. Het FGS (waarom hebben we in Nederland nog steeds niet een dergelijke federatie?) heeft een community van zo’n 800.000 leden. De president van de FGS - D. Joshua Taylor – is ook nog eens presentator van Genealogy Roadshow (een televisieprogramma op PBS), publiciteit zit dus wel snor (hieronder zijn pitch). Een slimme aanpak dus van NARA.

Het digitaliseren (=fotograferen+indexeren) zal worden uitgevoerd door Fold3 (een onderdeel van Ancestry.com) en kost $0,48 per pagina (goed dat hier openheid over wordt gegeven, dat mis ik in Nederland) en zal gratis beschikbaar worden gesteld op de Fold3 website. Ook dient nog opgemerkt te worden dat voor elke gedoneerde dollar Ancestry.com ook een dollar doneert (matching).

Een slimme aanpak dus van NARA.In de blogposting Nederlandse archieven, kijk eens hoe het Amerikaanse NARA het aanpakt! sprak ik al mijn lof uit over het NARA. Het Preserve the Pensions project vind ik toch ook weer een knap staaltje omdenken uit de koker van het NARA!

24 januari 2015

De problemen van AlleDrenten.nl

Op 24 januari 2015 werd de website Drenlias.nl omgedoopt tot AlleDrenten.nl.

De bèta versie van de website was al enige tijd beschikbaar en ik had deze op 2 mei 2014 al onder de loep genomen in het artikel Nieuwe versie van DrenLias nader bekeken.

Het artikel bevatte complimenten, maar signaleerde ook problemen. Ik had gehoopt dat het Drents Archief en hun leverancier het advies ter harte had genomen en de problemen voor de lancering zouden oplossen. Maar als ik nu weer naar AlleDrenten.nl ga, dan zie ik nog dezelfde problemen!

Zoeken

Eén van de gesignaleerde problemen was dat het voor gebruikers onduidelijk is in welke bronnen de hoofdzoekfunctie zoekt. Je krijgt als gebruiker de indruk dat alle bronnen worden doorzocht. Helaas, dit is niet zo, je zult via het linker menu sommige bronnen afzonderlijk af moeten gaan, want de volgende bronnen worden bijvoorbeeld niet in de hoofdzoek-functie meegenomen:

  • Notarisrepetoria
  • Kolonistendatabase
  • Begraafregisters

In het voorgaande artikel schreef ik ook over het ontbreken van de zoeken op twee personen functie. Maar wat blijkt, deze functie is niet bij alle bronnen (en hoofdzoekfunctie) beschikbaar, bij sommige bronnen is de functie wel zichtbaar… verwarrend.

Scans

Het kopen van scans is verbeterd, alhoewel de Bestel pagina mij nog op het verkeerde been zette. De bestelpagina heeft het immers alleen over bestellen via e-mail, maar AlleDrenten.nl is voor de scans nu gekoppeld aan de winkelwagen van de website van het Drents Archief. Je kunt dus bij een scan op de ‘bestel scan’ knop klikken.

GEDCOM
Over de GEDCOM export was ik in het vorige artikel kort, ik verwees alleen naar GEDCOM bestanden die niet aan de GEDCOM standaard voldoen mogen de naam GEDCOM niet dragen!

In dit artikel wil ik wat dieper op de GEDCOM problemen ingaan. Laten we onderstaande embedde overlijdensakte van AlleDrenten.nl als voorbeeld nemen.

Als je van deze akte het GEDCOM download om te importeren in je stamboomprogramma dan krijg je onderstaande GEDCOM:

0 HEAD
1 SOUR DrenLias.nl
2 VERS 1.0
2 CORP Drents Archief
0 @I1@ INDI
1 NAME Antonia /Brizee/
1 SEX F
1 OCCU
1 FAMS @F1@
0 @I2@ INDI
1 NAME Johannes /van Krugten/
1 SEX M
1 OCCU bedrijfsleider
1 FAMS @F1@
0 @I3@ INDI
1 NAME Aart /van Krugten/
1 SEX M
1 OCCU kellner
1 FAMS @F1@
0 @I4@ INDI
1 NAME Maria Jacoba /Wassink/
1 SEX F
1 OCCU
1 FAMS @F1@
0 @F1@ FAM
1 HUSB @I3@
1 WIFE @I1@
1 CHIL @I4@
1 DEAT
2 PLAC Meppel
2 DATE 05-05-1950
0 TRLR

Bovenstaande “GEDCOM” voldoet ten eerste niet aan de standaard, zucht. De standaard is toch goed is beschreven en er zijn diverse validators die gebruikt kunnen worden om te controleren of er aan de standaard word voldaan!

Veel stamboomprogramma’s en websites zullen echter proberen er toch wat van te maken bij import. Als je bovenstaande GEDCOM echter “zo goed als” interpreteert dan worden de volgende feiten zichtbaar:

Het echtpaar Aart van Krugten (bedrijfsleider van beroep) en Antonia Brizee hadden een dochter genaamd Maria Jacoba Wassink. Johannes van Krugten was bedrijfsleider.

Eh? Deze akte ging toch over het overlijden van Johannes van Krugten? En Johannes was toch de zoon van Aart en Antonia en partner van Antonia?

En de akte gegevens bevatten toch ook de woonplaats, leeftijd en geboorteplaats van de overledene?

En waar is de bronverwijzing? Deze mist totaal…

De conclusie kan niet anders zijn dat de “GEDCOM” die AlleDrenten.nl biedt ongeldig, foutief en onvolledig is.

Drents Archief: ik zou - om jullie gebruikers te beschermen - de “GEDCOM” functie uitzetten en van de leverancier eisen dat zij deze functie naar behoren laten functioneren of geld terug betalen.

Beveiliging

Ik ging in het vorige artikel ook in op de beveiliging van de website. Alhoewel AlleDrenten.nl geen financiële of medische gegevens beveiligt, was èn is de beveiliging ver onder de maat: geen https bij overdracht privacy gevoelige informatie (ook al is dit alleen naam, e-mail en wachtwoord) en gebruikersnaam en wachtwoord komen plaintext tezamen in beeld en in de e-mail. Het versturen van e-mail uit iemands anders naam (bijv. medewerkers van het Drents Archief ;-) is ook nog steeds mogelijk.

Overpeinzing

Je vraagt je toch af wat er in de afgelopen 9 maanden is gebeurd aan de bèta van AlleDrenten. Wellicht waren er nog grotere problemen. Maar de door mij gemelde problemen staan niet eens op de Bekende problemen pagina?

Je gaat je hierdoor wel afvragen hoe het staat gesteld met de IT kennis van de leverancier en het opdrachtgeverschap van het Drents Archief.

Het geeft het gehuil in de 'promo' video toch een andere betekenis :-)