19 maart 2012

Wat zou jij doen met de genealogische data van een heel archief?

Stel je eens voor: je krijgt een groot deel van de genealogische data van het Brabant Historisch Informatie Centrum (BHIC) ter beschikking. Wat zou je er dan mee doen? Wat voor toepassing kan er gemaakt worden? Welke type vragen zie je graag beantwoord?

opendata

Open data

Het vrijelijk beschikbaar stellen van data voor hergebruik, bij voorkeur in een standaard formaat, wordt ook wel open data genoemd. Het zet de deur open naar nieuwe toepassingen, die de instelling (die de open data biedt) niet zelf hoeft te verzinnen, te realiseren en te bekostigen, maar waar de open data “hergebruiker” mee aan de slag kan om leuke, innovatieve en/of nuttige toepassingen van te maken.

Archiefdata achter betaalmuur of open?

De inventarissen van archieven en indexen op bronmateriaal zijn goede kandidaten om beschikbaar te stellen als open data. Veel van deze data is tot stand gekomen door archivarissen en vrijwilligers, op basis van geld van de overheid. Geld vragen voor deze overheidsinformatie is niet gepast. Maar geld vragen voor de scans is daarentegen wel redelijk. Zo kun je je voorstellen dat websites of mobiele apps die gebruik maken van deze open index data voor extra bezoekers aan de website van het archief zorgen die daar dan scans kopen. Dit extra geld kan weer in digitalisering gestopt worden!

Alhoewel er een frisse open data wind door Nederland waait, zie ook http://data.overheid.nl/, is de archiefsector nog wat huiverig. Er wordt wellicht meer in bedreigingen gedacht dan kansen. Ik zeg: mouwen opstropen en gewoon doen!

BHIC en ik aan het experimenteren

Als experiment heeft het BHIC mij toegang gegeven tot de data van de DTB, Burgerlijke Stand en Memories van Successie. Het is voor het BHIC een experiment om te kijken wat er bij open data komt kijken en wat het op zou kunnen leveren.

Christian van der Ven (BHIC) heeft hier vandaag ook op zijn blog De Digitale Archivaris.

Het verkrijgen van de data duurde een uur of vijf en leverde mij zo’n 1,7 GB aan XML data op. Ik heb nu dan ook de genealogische data van het BHIC! Tja, en wat moet je daar nu mee…?

Op zich zou ik nu dezelfde zoek/presentatie functionaliteit kunnen bieden als het BHIC doet. Maar daar schieten we niets mee op. De toepassingen van deze open data liggen elders.

Statistieken en visualisatie

Een eerste toepassingsgebied is om de data op diverse manieren te visualiseren. In een tweetal Proof-of-Concepts heb ik de BHIC data op verschillende manieren gepresenteerd.

treemapBij de eerste visualisatie wordt er inzichtelijk gemaakt wat voor type data van welke plaats en jaar er beschikbaar is. De treemap biedt de mogelijkheid om in te zoomen op een lager detail niveau.

Bij een tweede set van visualisaties is de data van dopen en geboorten bij de kop gepakt. Hier kun je dan een top 10 lijstje maken van familienamen of voornamen, per plaats (op Google Maps) of jaar. Of je kunt in grafiekvorm zetten hoeveel voornamen men in de loop van de tijd aan hun kinderen gaf (ik wist niet dat meerdere voornamen iets was dat pas tussen 1850 en 1900 een vlucht nam). Het aantal geboorten/dopen per maand door de jaren is in een bewegende grafiek weer te gaven (vooral leuk, maar nuttig?). De informatie in de dataset omtrent beroepen was niet heel uitgebreid, maar toch genoeg om er een tagcloud van te maken zodat je de belangrijkste beroepen in Brabant in één oogopslag ziet.

map

Het visualiseren van open data kan nieuwe inzichten opleveren, trends signaleren of vragen oproepen (waarom zijn er die maand zo veel mensen overleden?).

    Combineren

    Je kunt de open data ook combineren met andere (open) data. Denk dan bijvoorbeeld aan de genealogische gegevens op Genealogie Online, als je die “matched” met de data van een archief dan kan ik de stamboomonderzoeker direct verwijzen naar akten (en scans) die het archief ter beschikking stelt. Dit borduurt dus verder op de Scans zoeken service van Genealogie Online.

    Een andere leuke dataset om mee te combineren zijn de “Antieke reeksen” van het KNMI. Hiermee zou je kunnen bekijken of er een samenhang is tussen de gemiddelde temperatuur of luchtdruk en het aantal geboorten of begrafenissen.

    Functionaliteit

    Het bedenken van innovatieve toepassingen op basis van open data is uitdagend. Vanuit mijn achtergrond denk ik dan snel aan Monitor functionaliteit (een seintje als het BHIC nieuwe data heeft betreffende een bepaalde familienaam) of “vertaal” functionaliteit (de data in GEDCOM, Excel of PDF).

    Inspiratie

    Wat zou jij doen met de data van een archief? Heb je bepaalde zoekvragen die op dit moment niet beantwoord kunnen worden via de zoekmogelijkheden van een archiefinstelling? Of ben je benieuwd welke trends er uit de genealogische data te halen is? Zou je de data wel eens willen combineren met andere data sets die openbaar beschikbaar zijn?

    Graag hoor ik via reacties op deze blogposting jullie ideeën hoe we open archiefdata zouden kunnen hergebruiken!

    06 februari 2012

    RootsTech: familiegeschiedenis & technologie

    Van 2 tot en met 4 februari vond in het Amerikaans Salt Lake City de grote familiegeschiedenis en technologie conferentie RootsTech 2012 plaats. Zo’n 4.500 bezoekers bezochten deze conferentie, die deels ook direct via streaming video te bekijken was.

    Jay Verkler

    Op de eerste dag van de conferentie werd de key note presentatie gegeven door Jay Verkler, (vertrekkend) president en CEO van het door de Mormonen gesponsorde FamilySearch. In deze presentatie besprak hij de elementen van een community framework, die van belang zijn bij genealogie.

    frm

    De video registratie van de eerste RootsTech dag (donderdag) die dus start met Jay Verkler kun je via de RootsTech website bekijken, een aanrader!

    HistoricalData by Google

    Tijdens deze presentatie kregen ook Robert Gardner en Dave Barney (beide van Google!) het woord. Zij zijn bezig geweest om een schema te maken voor historische data (Record, Event, Family en Person). Door dit schema voor microdata te gebruiken op websites kunnen zoekmachines en ontwikkelaars de inhoud van de websites beter begrijpen. De microdata zoals gedefinieerd op Historical-data.org wordt nu onder andere door FamilySearch.org, Geni.com, WeRelate.org, Mocavo.com en GenealogieOnline.nl geboden. Het is nog wachten op zoekmachines en ontwikkelaars die er gebruik van gaan maken. Binnenkort zal ik hier nog een blogposting aan wijden!

    GEDCOM X

    Tijdens deze editie van RootsTech is trouwens ook een nieuwe GEDCOM aangekondigd: GEDCOM X! Meer over de in ontwikkeling zijnde GEDCOM X via FamilySearch releases GEDCOM X van Tamura Jones.

    Tim Sullivan

    Op de 3e dag van de RootsTech presentatie was er een panel discussie met Ancestry directeuren. De discussie werd geleid door Tim Sullivan, de president en CEO van Ancestry.com. In de discussie ging het onder andere over het mobiel gebruik (12% van het verkeer naar Ancestry.com verloopt via een smartphone of Internet tablet!), DNA, handschriftherkenning en de nieuwe census viewer.

    De video registratie van de derde RootsTech dag (zaterdag) die dus start met Tim Sullivan kun je via de RootsTech website bekijken, ook een aanrader!

    Video’s en presentatie

    Op de RootsTech website vind je ook de registratie van de 2e dag. Binnenkort zullen de video’s per presentatie beschikbaar komen (nu zit er nog “wachttijd” tussen de presentaties omdat het om de complete registratie gaat van één zaal). De syllabi van de presentatie zijn allemaal te downloaden via de Downloads pagina.

    Naar de conferentie?

    Helaas was ik er zelf niet bij, volgend jaar wellicht?

    Rob van Drie (CBG) was er wel, over zijn ervaring heeft hij op zijn weblog geschreven:

    04 januari 2012

    Kwartierstaat in moderne stijl

    In december 2011 hield het Regionaal Archief Tilburg een wedstrijd rondom kwartierstaten. De prijs was een sier-kwartierstaat gemaakt door illustratrice Geertje Aalders. Deze prent is mooi (u kunt ‘m bij het RAT bestellen!), maar niet mijn smaak. Het zette mij aan om enkele moderne ontwerpen voor een kwartierstaat te maken!

    Groot formaat kwartierstaat voor aan de muur

    Het idee van een kwartierstaat voor aan de muur (formaat A3, dus 42 cm bij 29,7 cm) staat mij wel aan, voor jezelf of cadeau. Het intrigeert toch altijd om de namen van je eigen of iemands anders directe voorouders opgesomd te zien. Ik wilde een modern ogende kwartierstaat op A3 formaat. Met deze gedachte ben ik aan de slag gegaan…

    Van 5 tot en met 7 generaties

    Het resultaat van de creatieve uitspatting is een kwartierstaat voor respectievelijke 5 generaties, 6 generaties en 7 generaties:

    Elke van de ontwerpen is beschikbaar in 3 kleurvarianten.

    Van ontwerp naar wizard

    Deze moderne kwartierstaten heb ik samengebracht in een nieuwe dienst op Genealogie Online: de Kwartierstaat PDF Wizard. Via een wizard wordt de persoonlijke kwartierstaat gegenereerd. Dit kan op basis van gegevens die gepubliceerd staan op Genealogie Online, upload van een tekstbestand of handmatige invoer van de 31, 63 of 127 namen. Klik op één van de bovenstaande afbeeldingen om een voorbeeld te zien van het resultaat!

    Let op: deze functie is exclusief voor Genealogie Online Premium en Stamboom Forum Premium abonnementhouders!

    30 december 2011

    Stamboom Forum – jaaroverzicht 2011

    Met het nieuwe jaar in zicht ontstaat altijd de behoefte om terug te kijken. In deze periode zie je dan ook altijd allerhande lijstjes en infographics. Vorig jaar heb ik me gewaagd aan een infographic over het Stamboom Forum in 2010, dit jaar hou ik het bij enkele statistieken en lijstjes. Een terugblik op een goed 2011!

    Grootste veranderingen

    • Naast het gratis Stamboom Forum abonnement is er nu ook een betaald Premium abonnement met meer functionaliteit en service.
    • De nieuwe service Archiefplanner, waarbij je je archiefbezoek kunt vastleggen, is gelanceerd.
    • De look-and-feel van het Stamboom Forum (en alle zuster websites) is vernieuwd.
    • Single-sign-on (inloggen op Stamboom Forum, Stamboom Gids, Familie Archivaris en Genealogie Online is geïntegreerd) en social login (via Google, Facebook, Twitter, enz.) zijn toegevoegd.

    Enkele statistieken

    • Dit jaar hebben zich 10 duizend nieuwe abonnees geregistreerd. Het totaal aantal abonnees is nu 43 duizend.
    • Er zijn dit jaar ruim 6 duizend berichten geplaatst in de forums, hierbij zijn zo’n 43 duizend reacties geplaatst.
    • Het Stamboom Forum telde 2,0 miljoen bezoeken (dit was vorig jaar 1,9 miljoen) door 1,1 miljoen unieke bezoekers (waarvan 87% uit Nederland en 6% uit België) die samen bijna 11 pagina’s bekeken.
    • Van alle bezoeken werd er 3,25% via een mobiel bekeken, een grote stijging ten opzichte van vorig jaar toen maar 0,81% mobiel werd bekeken (opmerkelijk!!). Voor een derde van de mobiele bezoeken werd een iPad gebruikt.
    • Bij het gebruik van browsers zijn ook verschuivingen waar te nemen: 66% van de bezoeken wordt gedaan via Internet Explorer (dit was vorig jaar nog 74%), via Firefox 15% (ongewijzigd) en via Chrome 11% (was 6%).
    • Er zijn 422 zoekplaatjes geplaatst (het totaal is 1.153) waar 580 reacties op kwamen.
    • Er zijn 17 duizend nieuwe familienamen toegevoegd aan het Wie (onder)zoekt wie? register, dat nu ruim 84 duizend familienamen bevat.
    • Er zijn 123 vriendendiensten toegevoegd door leden, waardoor het totaal op 622 komt.
    • Er zijn 96 genealogische evenementen gemeld.

    Meest bekeken berichten in 2011

    Berichten met de meeste reacties

    06 december 2011

    Genealogie en de kerstman

    Reclame voor genealogische producten zijn wij in Nederland niet zo gewend. In Amerika zijn ze hier een stapje verder in, te meer daar er grote bedrijven zijn die zich op genealogen en historici richten.


    Hieronder een leuk voorbeeld van Ancestry.com, waar – met humor – door de Kerstman het product wordt aangeprezen. Al op 24 november werden deze video’s gespot door Tamura Jones (@tamurajones) maar ik wilde even wachten met deze blogposting totdat Sinterklaas het land weer had verlaten…


    De "director's cut" (een aantal commercials achter elkaar)



    De "achter de schermen" versie


    22 november 2011

    MyHeritage koopt FamilyLink en WorldVitalRecords

    Het nieuws dat het Israëlische online familienetwerk MyHeritage het Amerikaanse bedrijf FamilyLink en daarmee WorldVitalRecords koopt, verraste mij op een aantal punten wel.

    Groei door acquisities

    Dat MyHeritage weer een acquisitie doet is niet verrassend. Deze aankoop is al weer hun zevende sinds 2007. In de laatste jaren hebben zij software producten (waaronder een backup-dienst) en diverse (sociale) familienetwerken (waaronder Verwandt, ZOOOF en Kindo.com) overgenomen. Door deze strategie is MyHeritage flink gegroeid.

    Niet alleen alleen user generated content

    Wat wel verrassend is, is dat er met deze aankoop ook – voor het eerst – een grote hoeveelheid historische gegevens is aangeschaft. Tot nu toe bood MyHeritage alleen de mogelijkheid om je stamboom te maken, dus gegevens (informatie over zo’n 861 miljoen personen) en afbeeldingen (zo’n 132 miljoen) kwamen van de gebruikers (zo’n 60 miljoen).

    Onderdeel van FamilyLink is de website WorldVitalRecords, deze is in 2006 opgericht door Paul Allen en enkele andere oud-werknemers van Ancestry.com. WorldVitalRecords biedt – op basis van een betaalabonnement - toegang tot veel Amerikaans en enig Brits bronmateriaal:

    • Over 158 million digitized images, including US and UK Censuses
    • Over 300 million names from birth, marriage and death records
    • Over 75 million names from military records
    • Over 100 million pages of newspapers, 1739 to present
    • One of world's largest historical map collections with 1.5 million maps
    • More than 8,000 high school, college and military yearbooks
    • More than 30 million tombstone photos

    Het is nog even afwachten hoe MyHeritage deze historische informatie gaat inzetten: los of geïntegreerd zodat gebruikers automatisch links krijgen naar scans, zoals de Scans zoeken service van Genealogie Online.

    Voet op Amerikaanse bodem

    MyHeritage heeft kantoren en personeel in Israël, Australië en Europe. Met de aankoop van FamilieLink krijgen ze nu ook een kantoor in Amerika en wel in Provo (in de staat Utah). Saillant detail is dat MyHeritage hiermee eigenlijk de buurman van Ancestry.com wordt! Onderstaande afbeelding van Google Maps toont links boven het kantoor van Ancestry.com (360 West 4800 North, Provo, Utah 84604 – bij de groene A) en rechtsonder huist FamilyLink (4778 N 300 W Suite 230, Provo, Utah 84604 – bij de groene B). WorldVitalRecords is overigens 10 minuten rijden van deze locaties.

    provo

    Met deze strategische aankoop door MyHeritage gaan ze de duidelijk de concurrentie aan met Ancestry.com. Het beurs genoteerde Ancestry.com is vooral sterk in bronmateriaal die via abonnementen beschikbaar worden gemaakt. Daarnaast hebben zij met Mundia een vehikel om stambomen te maken en te delen (informatie over bijna 3 miljard personen). Het wordt interessant te zien hoe deze competitie tussen deze twee bedrijven zich gaat ontvouwen!