23 april 2014

Wetenschappelijke onderzoeksprojecten relevant voor genealogie

De Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) stimuleert kwaliteit en vernieuwing in de wetenschap. Een drietal projecten die relevant zijn voor de genealogie, waaronder 2 uit het Continuous Access To Cultural Heritage (CATCH) programma, wil ik in dit artikel belichten.

LINKing System for historical family reconstruction (LINKS)

Het LINKS project, onder leiding van prof. dr. Kees Mandemakers (IISG), loopt al sinds 2009. In het blogartikel Genlias doorspitten om automatisch verbanden te leggen tussen voorouders schreef ik hier al over. Het project nadert zijn afronding.

Ik heb informeel al leuke resultaten gezien: een algoritme die (op een laptop) in enkele minuten de gehele “Genlias database” doorlicht om kwartierstaten uit de Burgerlijke Stand akten te construeren. Hierbij dient wel opgemerkt te worden dat het linken vooral bedoeld is voor het creëren van een dataset die gebruikt wordt voor onderzoek naar historische demografie en de sociale en economische geschiedenis.

Open ArchievenNB. Open Archieven legt reeds links tussen personen op basis van akten van de BS en DTB (voorbeeld) en geeft suggesties voor relevante akten (voorbeeld).

Mining Social Structures from Genealogical Data (MISS)

Het MISS project is een samenwerking tussen de universiteiten van Maastricht en Eindhoven en het Brabants Historisch Informatie Centrum (BHIC), onder leiding van dr. Karl Tuyls.

Dit project werkt aan het afleiden van identiteiten van personen en sociale structuren vanuit grote collecties genealogische data. Hiertoe onderzoeken ze de toepassing van een combinatie van data mining, machine learning en human computation technieken.

Ik heb zitting in de gebruikerscommissie van het MISS project. Deze gebruikerscommissie waakt ervoor dat de onderzoeker bij de uitvoering van zijn onderzoek het potentiële toepassingsaspect niet uit het oog verliest, voorziet projectleiders, projectuitvoerders en de programmacommissie van informatie, en ziet erop toe dat resultaten van het project goed benut worden.

Nature or Nurture? (VIDI)

Een team van de Universiteit Utrecht doet, onder leiding van prof. dr. Tine de Moor, onderzoek naar zaken als huwelijkspatronen, historische ouderenzorg, levensverwachting, et cetera. Daarbij wordt niet zo zeer gekeken naar het individu (wie trouwt met wie, wie wordt hoe oud?), maar wordt geprobeerd om op basis van grote hoeveelheden gegevens bepaalde patronen te ontdekken en te verklaren.

Voor dit onderzoek zijn veel genealogische gegevens nodig. Om het onderzoeksteam hierin te ondersteunen roept Genealogie Online haar gebruikers op om hun GEDCOM bestanden te delen met de wetenschap!

Genealogie voor wetenschap

Onder de titel Genealogie voor wetenschap zijn er door Genealogie Online voorwaarden gesteld waaraan wetenschappelijke organisaties die gebruik willen maken van de genealogische gegeven op Genealogie Online moeten voldoen. Eén van de belangrijkste voorwaarden is dat Genealogie Online het GEDCOM bestand van een stamboomonderzoeker alleen ter beschikking stelt als de stamboomonderzoeker hier uitdrukkelijk toestemming voor heeft gegeven.

Universiteit Utrecht is de eerste wetenschappelijke organisatie waar Genealogie Online een overeenkomst mee heeft gesloten.

Alhoewel wetenschappelijk onderzoek vaak niet “consument-klare” producten oplevert specifiek voor genealogen, denk ik wel dat deze onderzoeken de genealogie ten goede komen. Zowel in de verkregen inzichten in historische demografie, kwaliteitstoetsing en methodieken die stamboomprogramma’s kunnen adopteren.

Mag uw GEDCOM bestand gebruikt worden voor genealogisch onderzoek?

14 maart 2014

Familie in Beeld

Sinds 14 maart ligt de nieuwste uitgave van Familie in Beeld, een tijdschrift over familiegeschiedenis en stamboomonderzoek, in de winkel. Het is alweer de 4e uitgave van hoofdredacteur en uitgever Wim Kros.
image
Uw stamboom uitzoeken, dàt is één. Maar er is iets moois van te maken, dat is twee… en daar gaat het bij ‘Familie in Beeld’ om.

Naast uiteenlopende informatie over het stamboomonderzoek zelf laat het blad een nieuwe manier zien om uw familiegeschiedenis vast te leggen. Er staan veel ideeën, tips, technieken en werkbeschrijvingen in om al uw stamboomgegevens in combinatie met (oude) familiefoto’s, documenten, knipsels en teksten te verwerken tot een rijk gedocumenteerd kwartierstaat-album. Waardevol voor u zelf, maar zeker ook voor uw nageslacht!

Bij het maken van zo’n kwartierstaat-album wordt uitgegaan van het royale A3-formaat, waarop prachtige lay-outs gemaakt kunnen worden. In elke uitgave van ‘Familie in Beeld’ zitten zogenaamde knipvellen, waarmee u uw eigen album lay-outs kunt illustreren, en een uitneembare A3-poster om zelf in te vullen, met daarop bijvoorbeeld een gezinsblad, sierkwartierstaat in de vorm van een stamboom, een kwartierstaatschema, enzovoort.

Het tijdschrift verschijnt 4 keer per jaar, kost € 5,95 en is te koop (of te bestellen als het uitverkocht is) bij de goed gesorteerde tijdschriftenwinkel.

Warm aanbevolen.

image

07 maart 2014

De spelregels bij cultureel ondernemerschap

Vanaf 1 mei biedt het innovatieve Archief Eemland de website Het bewaren waard, waarmee het een economische activiteit ontplooit. Alhoewel de overheid cultureel ondernemerschap stimuleert,  heb ik - als ondernemer - een dubbel gevoel bij het Amersfoortse initiatief.

Waar is de vernieuwing?

De website Het bewaren waard biedt Amers-foorters de mogelijkheid om hun verzameling (historische) foto's en andere waardevolle documenten uit de ‘schoenendoos’ online te delen met andere Amersfoorters.

Dit concept is niet echt ‘verrassend digitaal’ te noemen. Het online plaatsen van je foto’s kan bijvoorbeeld via de website Flickr, inclusief reageer functionaliteit.

Familie ArchivarisEen website die meer gericht is op familie- geschiedenis is Familie Archivaris. Ook hier kun je foto’s/scans en verhalen kwijt in een (besloten) digitaal archief. De ‘familie archivaris’ kan familieleden uit nodigen om te participeren in het familiearchief: zij kunnen het familiearchief inzien, vullen met materiaal, verhalen schrijven bij materiaal en commentaar toevoegen!

Het door Archief Eemland gehanteerde beeld van de schoenendoos toont grote gelijkenis met het product Shoebox van Ancestry.com. Shoebox is een app voor de smartphone om het materiaal uit de ‘schoenendoos’ in de stamboom te krijgen.

Core business van het archief

Een unique selling point waar Archief Eemland mee schermt is dat het materiaal gelijk veilig bewaard wordt voor de toekomst. En dan worden niet alleen de digitale representaties bedoeld.

Tijdens het congres van de Koninklijke Vereniging van Archivarissen in Nederland (KVAN) in 2012 werd het project al gepresenteerd, toen nog onder de werktitel Publieksarchieven.nl. Wat mij van deze presentatie is bijgebleven, is vooral het aspect van het fysiek opslaan van de archieven van particulieren.

Bij de presentatie van Het Bewaren Waard komt dit aspect er nog wat bekaaid af. Pas na uitleg over het digitaal krijgen van het materiaal  en het delen van het materiaal, wordt er kort melding gemaakt dat er een fysieke schoenendoos aange-vraagd kan worden voor opslag in het nieuwe depot van Archief Eemland.

Voorwaarde voor de fysieke opslag van familie-archieven (dat op zich ook al op meerdere plekken mogelijk is, een goede bron hiervoor is http://www.familiearchieven.nl/) is dat het materiaal eerst is ge-upload, beschreven en openbaar moet zijn gemaakt. Deze voorwaarden maakt het opnemen van het materiaal in de collectie van Archief Eemland een stuk gemakkelijker. Hier zit het stukje vernieuwing in.

Financiering van het project

Archief Eemland probeert met deze nieuwe dienst meer historisch Amersfoorts materiaal te acquireren. Hun taak - beheren en vindbaar maken van archieven en collecties - vatten ze met Het bewaren waard ruim op.

Alhoewel het concept dus niet heel vernieuwend is heeft Archief Eemland toch vele fondsen kunnen overtuigen om een financiële bijdrage te doen in de ontwikkeling van de nieuwe dienst: Mondriaan Fonds, VSBfonds, Prins Bernard Cultuurfonds, AmersfoortBreed, BNG Cultuurfonds en kfHein Fonds.

Archief Eemland gaat commercieel

De aanleiding voor deze blog-posting was het nieuwsbericht dat Het Bewaren Waard het freemium model gaat hanteren. Het freemium model is een populair bedrijfmodel, Genealogie Online en het Stamboom Forum hanteren ook dit model.

Het woord freemium is een combinatie de 2 woorden: free (=gratis) en premium (=hoogwaardig). Bij dit model bied je een deel van de dienst/product gratis aan en moeten gebruikers voor extra’s betalen. Het opslaan van foto’s en video’s is bij Het bewaren waard gratis tot 1 GB, daarboven zal er een abonnement genomen moeten worden.

Deze vorm van cultureel ondernemen door een publieke instelling doet bij mij vraagtekens rijzen.

Ondernemers, die in de meeste gevallen geen beroep kunnen doen op financiële bijdragen van fondsen of subsidies en dus zelf moeten investeren (en risico nemen), zien nu een overheidsorganisatie als concurrent op het toneel verschijnen.

Let wel, concurrentie is op zich goed! Het houdt partijen scherp, ze moeten een goed product tegen een goede prijs leveren om klant te krijgen en te behouden.

Een culturele instelling als het Archief Eemland kan echter risicoloos (op basis van eigen inbreng, dus publiek geld, en fondsen) een product maken en biedt de basis dan ook nog eens gratis aan. Waar een ondernemer voor bepaalde onder-steuning iemand moet inhuren maakt Archief Eemland een medewerker vrij (dus publiek geld!) om te ondersteunen bij het scannen en uploaden.

Wet Markt en Overheid geeft gedragregels

Sinds 1 juli 2012 is de Wet Markt en Overheid van kracht. Het doel van deze wet is om oneerlijke
concurrentie door overheidsorganisaties met marktpartijen te voorkomen en om zo een gelijkwaardig speelveld te creëren.

Het in concurrentie treden met marktpartijen wordt in deze wet als economische activiteit geduid. Als sprake is van economische activi- teiten, dan moeten de integrale kosten van deze producten en diensten worden doorberekend aan de afnemers van deze producten en diensten.

Hoe past het freemium model van Het bewaren waard op de Wet Markt en Overheid?

De kosten voor de opslagruimte (waar Archief Eemland gewoon een factuur van Picturae voor krijgt) en ontwikkeling, beheer en onderhoud van de dienst (waar Archief Eemland gewoon facturen van Picturae en Zicht Online voor ontvangt) worden niet doorberekend aan de klanten.

Vanuit de publieke taak kan een archief een deel van de diensten gratis aanbieden, aan andere diensten hangt een prijskaartje. Maar met Het bewaren waard en de keuze voor freemium wordt er een markt betreden, waar voor een overheids-organisatie gedragsregels gelden.

03 februari 2014

De links die je vanuit akten kunt leggen

imageWanneer er op een archiefwebsite gegevens van een akte worden getoond dan zijn de namen binnen deze akte veelal links (web koppelingen), zodat er eenvoudig en snel naar die betreffende naam gezocht kan worden. Open Archieven laat zien dat akten aan veel diverse informatiebronnen gekoppeld kunnen worden en daarmee dus verrijkt kunnen worden.

Links naar zoekacties

Ook op Open Archieven worden de namen van de personen tot ‘zoekactie link’ gemaakt. Maar krachtiger zijn de ‘zoekactie links’ die bij de koppels worden getoond. Zoeken op twee personen is een veel gebruikte en gevraagde functie die je ook direct vanuit de akte kan aanbieden, daar worden immers bij diverse type akten relaties tussen personen getoond.

Hieronder een voorbeeld van een huwelijksakte, waar je met één klik op een ‘relatie harkje’ de ouders van bruidegom of bruid kunt zoeken (om zo de broers en zussen van bruid of bruidegom te vinden) of het bruidspaar kunt zoeken (om hun kinderen te vinden).

imageKlik op de afbeelding om de akte op Open Archieven te bekijken.

Veelal zijn de persoonsnamen in akten goed te identificeren omdat deze in een apart veld staan. Soms staan er ook namen in het opmerkingen veld. Zo kan er bijvoorbeeld melding gemaakt worden van een tweeling zus/broer. Open Archieven herkent de vermelding van tweelingen waardoor ook de naam in het opmerkingen veld tot een zoekactie gemaakt kan worden.

imageKlik op de afbeelding om de akte op Open Archieven te bekijken.

De zoekactie naar de tweeling zus/broer is echter niet puur een zoekactie op naam. De zoekactie kan slimmer gemaakt worden door informatie te gebruiken die in de akte voorhanden is, bijvoorbeeld het jaartal en de achternaam van de moeder. Een dergelijke slimme zoekactie levert in de meeste gevallen direct de gezochte tweeling zus/broer.

Links naar andere akten

De informatie over de ouders in de akten kan ook gebruikt worden ook meer informatie over de betreffende persoon te vinden. Wanneer bijvoorbeeld bij een overlijdensakte de ouders genoemd staan kan hiermee vaak ook de geboorte- en huwelijksakte gevonden worden. Open Archieven voert deze zoekactie on-the-fly uit en toont de resultaten als links naar de andere akten.

imageKlik op de afbeelding om de akte op Open Archieven te bekijken.

Dit principe van zoeken naar gerelateerde akten en dus personen kun je ook meerdere keren herhalen. Dit is was de ‘Links Explorer’ op Open Archieven doet. Na het klikken op het ‘Links Explorer’ icoontje (hier rechts afgebeeld) dan opent er een scherm en worden, vanuit de akte waar je bent, andere akten gezocht om op deze wijze een relatienetwerk van personen te tonen. Dit schema toont ouder-kind relaties met een (bloed)rode lijn en huwelijken met een oranje lijn.

imageKlik op de afbeelding om de akte op Open Archieven te bekijken, klik daarna op het Links Explorer icoontje.


De informatie die in akten wordt getoond kun je ook slim gebruiken om zoekacties in andere informatiebronnen uit te voeren.

Links naar biografieën

Met een naam en een geboortedatum/plaats of overlijdensdatum/plaats kun je via het Biografisch Portaal van Nederland opzoeken of er van een persoon een biografie bekend is. Open Archieven voert deze zoekactie automatisch uit zodat er onder de akte links naar biografieën getoond kunnen worden. Het voorbeeld hieronder is te zien onder de doopakte van Hendrik Constatijn Cras op Open Archieven.

imageKlik op de afbeelding om de akte op Open Archieven te bekijken.

Links naar grafzerken

Er zijn diverse websites die informatie bieden over grafzerken, zoals Graftombe.nl en Online-Begraafplaatsen.nl. Bij geboorte- en overlijdensakten doorzoekt Open Archieven deze bronnen. Wanneer er een link is te maken is wordt deze op de bekende wijze:

imageKlik op de afbeelding om de akte op Open Archieven te bekijken.

Links naar online stambomen

Bovenstaand voorbeeld laat ook zien dat Open Archieven de (hoofd)persoon van de akte opzoekt in online stambomen, specifiek Genealogie Online. Andersom geeft Genealogie Online hints omtrent scans van genealogische gebeurtenissen bij archieven via de Scans zoeken service.

Link naar het weer

Met de combinatie datum en plaatsnaam kan er in de Historische weerreeksen van het KNMI worden opgezocht of er metingen zijn. Als deze er zijn kan het weer op en rond de betreffende datum in grafiekvorm worden weergegeven.

imageKlik op de afbeelding om de akte op Open Archieven te bekijken, klik daarna op de datum 13 september 1746.

Link naar een kaart

Met name bevolkingsregisters bevatten ook straatnamen die interessant zijn. Een onderzoeker wil graag willen weten waar de betreffende straat lag. Open Archieven kent nu van Leiden en Rijnsburg een groot deel van de (historische) straatnemen en heeft van deze twee steden ook oude kaarten. Met deze informatie kan dan de betreffende straat (met een dikke oranje lijn) op de historische kaart weergegeven worden.

imageKlik op de afbeelding om de akte op Open Archieven te bekijken, klik daarna op de straatnaam Hogewoerd.

Link naar scan

Als een archief van bepaalde akten geen scan heeft betekent dit niet dat er geen scans zijn (zie ook Weet waar er online scans worden aangeboden!). Wanneer Open Archieven nieuwe open data opneemt van archiefinstellingen of particulieren (zie ook Open Archieven is op zoek naar uw bronbewerkingen en indexen) dan wordt er ook gekeken waar er scans beschikbaar zijn en of deze te koppelen zijn.

Zo worden er op Open Archieven scans van FamilySearch getoond bij akten van Regionaal Historisch Centrum Vecht en Venen, scans van GaHetNa bij akten van Groene Hart Archieven en scans van Van Papier Naar Digitaal bij akten van Regionaal Archief Alkmaar!

Verrijkte informatie tonen

Zoals in dit artikel is aangetoond hoeft een akte niet ‘kaal’ getoond. Veel aktes kunnen verrijkt worden met (links naar) een of meerdere informatiebronnen. Met deze verrijking wordt Open Archieven een nog fijner onderzoekshulpmiddel.

image


Over Open Archieven

Open Archieven is een initiatief van Bob Coret die de innoverende kracht van open data en services toont. De genealogische zoekmachine is beschikbaar in het Nederlands, Engels, Duits en Frans. Volg Open Archieven op Google+ of Twitter.

09 januari 2014

Van scan naar rijk informatie object

imageVeel archiefinstellingen bieden via hun website scans aan van akten. Aan de aflevering van deze gratis of betaalde scans wordt helaas geen aandacht besteed. Terwijl dit zo eenvoudig is te realiseren en zo waardevol is voor de ontvanger.

Mijn droom

Laat ik u meenemen in mijn droom hoe scans afgeleverd zouden kunnen worden.

De downloadlink op de archiefwebsite levert mij een gecomprimeerd (ZIP) bestand op. Als ik dubbelklik op dit bestand om de inhoud te bekijken wordt ik blij verrast.

Het ZIP bestand bevat een drietal bestanden, een JPG (de scan), een HTML bestand website en een GEDCOM bestand, allen met dezelfde naam. Spannend!

image

De scan

De naam van de bestanden is niet zo belangrijk, want in één oogopslag zie ik de document eigenschappen van de scan (ook wel meta-data genoemd, oftewel informatie over het bestand).

Ik zie gelijk dat het de scan betreft van de huwelijksakte van Joannes Coret en Adriana Catharina de Hoogh, afkomstig van het Regionaal Archief Tilburg. Deze informatie zit in de scan (het JPG bestand) verwerkt. Als ik het bestand dus deel met iemand anders, of zelf later het bestand wil terugzoeken, dan is de informatie nog steeds beschikbaar.

Het HTML bestand

Als ik op het 2e bestand klik, het HTML bestand, dan wordt mijn browser geopend en zie ik alle informatie van de akte, zoals dat ook op de website van het Regionaal Archief Tilburg stond bij deze akte.

De meeste onderzoekers zullen de informatie verwerken in het stamboomprogramma of publicatie in tekstverwerker. Het HTML bestand bevat ook een bronvermelding van de akte die zo gebruikt kan worden en een link naar archiefwebsite.

Het GEDCOM bestand

Het derde bestand bevat alle informatie die ook is te lezen in het HTML bestand, maar dan in het GEDCOM formaat dat door mijn stamboom- programma wordt begrepen. In één keer heb ik de informatie uit de akte in mijn stamboom-programma, inclusief nette bronvermelding!

Scan

Wat een mooi cadeau!

We zijn de gegaan van een ‘kale’ scan (die je moet inzien om te kijken wat het ook al weer was, en dan maar hopen dat je je aantekeningen hiervan nog kunt vinden of de originele website, en die je later nooit goed kunt terug vinden), naar een rijk informatie object.

Doordat de meta-data in de scan is verwerkt kan ik heel makkelijk de scan identificeren en zoeken. Ik hoef bestanden niet meer te hernoemen of te rubriceren in mapjes. Wil ik bijvoorbeeld de BS Huwelijksakten vinden dan kan ik deze via de Windows Verkenner met de zoekopdracht “labels:BSH” eenvoudig terugvinden.

Alle informatie staat in het HTML bestand, die heb ik dus ook later nog (zonder dat ik weer naar de archiefwebsite hoef te gaan) ter beschikking. Het verwerken van (een deel) van de informatie in mijn stamboomprogramma is door het valide GEDCOM bestand een fluitje van een cent.

Een technische uitdaging?

Techniek staat bovenstaande droom niet in de weg. Documenteigenschappen zijn een standaard functie van Windows. Niet alle bestanden kunnen extra informatie in zich bergen, maar bestanden als JPG (in EXIF formaat) en PDF bijvoorbeeld wel. De zoekfunctie van Windows kijkt ook in de documenteigenschappen.

Qua documenteigenschappen van scans stel ik het volgende voor:

  • Titel: type akte, datum en plaatsnaam
  • Onderwerp: hoofdpersonen in akte
  • Auteurs: naam van de archiefinstelling
  • Opmerkingen: (p)url van de akte
  • Labels: afkorting type akte, plaatsnaam

image

Alle informatie die wordt geboden is beschikbaar in het archiefsysteem (want wordt op de website getoond). De ‘download scan’ functie hoeft alleen maar de extra informatie in het JPG bestand erbij te zetten, de akte informatie in een HTML bestand te plaatsen, de akte informatie te vertalen naar GEDCOM en deze drie bestanden te comprimeren tot één ZIP bestand dat ‘met een strik’ afgeleverd kan worden.

Als ik dan om één ding mag vragen…

Bovenstaande droom hoeft niet gelijk volgende week volledig gerealiseerd te worden door de (leveranciers van de) archiefinstellingen. Maar ik hoop dat de archiefinstellingen de waarde van meta-data inzien en de meta-data in JPG (en PDF) bestanden gaan verwerken!

29 december 2013

Open data en het verdienmodel, het kan goed samengaan

In Wat worden de 3 belangrijkste archieftrends in 2014?” noemt archivaris Christian van der Ven de volgende trend die ik graag eens uitdiep:

3. Verdienmodellen zijn uit, open data is in
Archieven willen werk maken van open data, maar krijgen daarnaast steeds vaker de opdracht om geld te verdienen aan hun collecties. Van alles iets is feitelijk niets, keuzes worden duidelijker en scherper.

Voor het referentiekader even de definities.

Het verdienmodel

Een verdienmodel beschrijft de manier waarop een organisatie geld verdient. Dat kan bijvoor­beeld door de verkoop van goederen, het aanbieden van een dienst (via abonnement of betaling voor gebruik) of het aanbieden van reclamemogelijkheden.

Open data

Open data is data die vrij gebruikt kan worden, hergebruikt kan worden en opnieuw verspreid kan worden door iedereen - onderworpen enkel, in het uiterste geval, aan de eis tot het toe­schrijven en gelijk delen.

Open data versus het verdienmodel

Met de definities van beide termen in gedachten kan de conclusie zijn dat deze twee elkaar uitsluiten, dat je dus een keuze moet maken. Maar is dat wel zo? Welk archief verkoopt bijvoorbeeld index gegevens? Archieven willen nog wel eens de scans verkopen van akten of beeldcollectie. Open data betekent niet dat je ‘alles wat je hebt’ allemaal in machineleesbaar formaat op Internet zet, het is geen zwart-wit keuze!

Verdienen alleen voor bedrijven?

Dat archiefinstellingen de opdracht krijgen om te verdienen aan hun collectie zal bij sommigen de reactie oproepen “dat commerciële gedoe past alleen bij bedrijven, straks moeten we overal voor betalen”.

Sorry hoor, maar we betalen al overal voor, alleen de wijze waarop verschilt, de ene methode is alleen zichtbaarder dan anderen. Een boek koop je in de winkel door direct geld te overhandigen (fysiek danwel elektronisch). De archief­instelling­en betalen we indirect via de belasting. Het grappige is natuurlijk dat we met z’n allen liever minder belasting betalen, maar een toegangsprijs voor een archief is ook uit den boze…

Het gaat mij hierin niet om de politieke discussie. Ik denk dat als archiefinstellingen willen verdienen aan hun collectie (dit is een keuze), ze dit kunnen.

Om alvast een idee te opperen: de meeste archiefwebsites zijn alleen in het Nederlands beschikbaar. De niet-Nederlandse genealogen populatie met Nederlandse voorouders is een leuke doelgroep. Maak een maatwerk onderzoeksdienst voor de niet-Nederlanders. Je maakt gebruik van de eigen collectie die weer beter beschikbaar komt voor een niet-Nederlands publiek. Voor een dergelijke dienstverlening is een uurtarief vrij gebruikelijk!

Maar in dit artikel wil ik vooral betogen dat open data archiefinstellingen ook veel kan opleveren!

Anderen kunnen geld verdienen aan onze data?

Een veelgehoorde drempel bij organisaties die nadenken over open data is het feit dat andere personen/organisatie geld zouden kunnen verdienen met ‘hun’ data.

Als je al de eigenaar kunt zijn van data (wat meestal niet zo is, lees de blogpostings van Arnoud Engelfriet er nog maar eens op na) dan gaat het bij archieven vaak om openbare bronnen die met behulp van vele vrijwilligers zijn geïndexeerd. Naast het juridische en morele eigenaarschap wijs ik liever naar de missie statements van archieven die vaak reppen van het ‘aan een zo breed mogelijk publiek beschikbaar stellen van onze collectie’.

Als je wilt dat je collectie gezien/gebruikt wordt dan moet je toch juist anderen aanmoedigen en ondersteunen om de collectie te gebruiken?

Stel, ik download alle genealogische (open) data van Erfgoed Leiden en omstreken (verder ELO genoemd) en brand deze op DVD’s die ik voor 75 euro in een luxe box verkoop in een webshop en op genealogische beurzen. De licentie op de open data van ELO staat mij deze commerciële activiteit toe, sterker nog, ik denk dat ELO er zelfs blij mee zou zijn. Maar: gat in de markt, word ik rijk?

Rijk betekent dat ik meer verdien dan dat het kost, dus lage kosten en veel verkoop. Aan de kosten kant staan investeringen in infrastructuur, DVD brander, software om data te harvesten, bandbreedte, blanco DVD’s, tijd (die van mij of die van een andere in te huren partij of persoon), luxe boxes, maken webshop, enz.

Of de luxe box veel verkocht zal worden hangt af van de waarde die het voor de doelgroep heeft en andere aanbieders. Aan het ELO heb ik een grote ‘concurrent’, zij stellen de data namelijk via hun website gratis beschikbaar. Mijn doelgroep zal dus bestaan uit mensen zonder Internet en mensen die de complete set genealogische data willen hebben. Ik kan u verklappen dat de DVD box mij niet rijk gaat maken.

Met deze DVD box gedachte wil ik een aantal punten duidelijk maken:

  • wil je geld verdienen moet je ook investeren
  • wil je geld verdienen dan moet je een product of dienst bieden die voor anderen een waarde heeft (en dit product moet niet door anderen beter/sneller/goedkoper/gratis geboden)

Geld verdienen met open data

Het is mogelijk om geld te verdienen aan open data, je moet simpelweg iets met de data doen waardoor het waarde krijgt!

Om in de buurt van ELO te blijven een idee met potentieel. Er komt meer en meer data beschikbaar via de website van ELO. Als gebruiker wil je liever niet elke maand terugkomen om te kijken of er nieuwe resultaten zijn. Die je dan ook nog eens stuk voor stuk moet overtypen in je stamboomprogramma. Een dienst die voor gebruikers maandelijks kijkt of er nieuwe gegevens zijn en, als deze er zijn, automatisch e-mailt in GEDCOM formaat, zal voor veel genealogen een aantrekkelijk aanbod zijn.

Afhankelijk van de prijsstelling en kosten valt er geld te verdienen aan dit idee. Het ELO en elke andere archiefinstelling kan dit idee oppakken… Maar hoort dit soort diensten bij hun core business? Kunnen en willen archiefinstellingen hierin investeren? Zijn IT projecten de sterke kant van archiefinstellingen? Is het erg dat personen of organisaties buiten de archiefinstellingen het idee oppakken en geld verdienen?

Maar de hamvraag is denk ik meer: als een derde een dergelijk dienst maakt op basis van de open data van een archiefinstelling, verdient de archiefinstelling dan niets?

Door de dienst wordt de collectie getoond. Veel genealogen nemen niet genoegen met alleen de data, zij willen de akte zien wellicht zelfs kopen. Dus, de dienst zorgt voor websiteverkeer en wellicht zelfs scanverkoop (dus omzet). De archiefinstelling kan er dus indirect zeker aan verdienen!

Ik kan mij ook andere diensten voorstellen, die zorgen dat de kwaliteit van de data beter wordt (door analyses, visualisaties of crowd-sourcing) of rijker doordat deze gelinkt wordt met datasets of scans die elders beschikbaar zijn. Dit is wellicht geen omzet die je in euro’s uitdrukt, maar becijfer eens wat er wordt bespaard, hoeveel een dergelijk project zou kosten als de archiefinstelling deze zelf opzet?

Echte business

Even een voorbeeld uit de commerciële dienstverlening. Bol.com is vooral bekend van de online verkoop van boeken en CD’s/DVD’s. Maar de omzet (ruim 400 miljoen euro in 2012) komt uit steeds meer productgroepen.

Om de omzet te laten groeien zorgen ze er (onder andere) voor dat anderen hen helpen met de verkoop van producten.

De bol.com Open API geeft je toegang tot het complete aanbod van de grootste online winkel van Nederland. Gebruik bol.com data in je eigen concept of applicatie en verdien geld via het bol.com partnerprogramma.

Als ontwikkelaar kan ik dus eenvoudig alle boeken en software die relevant zijn voor genealogen en historici opnemen in mijn webwinkel. Bol.com bereikt hiermee weer een interessante doelgroep, de links leiden naar bol.com en wellicht verkoop. Bezoekers blij met het boekaanbod, Bol.com blij met de omzet en ik blij met de provisie die ik over de door mij genereerde omzet ontvang (en de overheid weer blij met de omzetbelasting)!

Bol.com snapt het!

Potentiële business

Laten we het voorbeeld van bol.com nu eens doortrekken naar de archiefsector. De website Militieregisters.nl is een webwinkel van diverse archiefinstellingen (op initiatief van Stadsarchief Amsterdam) die scans van militieregisters verkoopt. Als ‘webshop eigenaar’ wil je natuurlijk graag je omzet verhogen. Je zou natuurlijk het bol.com voorbeeld kunnen volgen: stel de index gegevens open beschikbaar zodat andere deze kunnen gebruiken.

Qua gebruiker van deze index gegevens denk dan bijvoorbeeld aan websites die genealogische gegevens van stamboomonderzoekers publiceren. Door deze gegevens te matchen met de index van militieregisters kan de website haar gebruikers suggesties doen in de trant van ‘je overgrootvader Adrianus van Hoog komt voor op Militieregisters.nl’.

Een dergelijke dienst, die in wezen persoonlijk gerichte reclame is die op prijs wordt gesteld, zal webverkeer naar militieregister.nl opleveren en waarschijnlijk ook extra omzet!

Snappen archieven dit?

Dienen of verdienen…

De overheid stimuleert archiefinstellingen om hun collecties ten gelde te maken. Dit begint denk ik met de constatering dat dienen iets anders is dan verdienen. Een andere gedachte, een andere mentaliteit, andere vaardigheden. Deze komen niet vanzelf, daaraan zal gewerkt moeten worden. Investeer hierin, betrek de juiste personen en/of instellingen, wees creatief.

Open data past mijns inziens goed in zowel het “dien” als “verdien” straatje. Let wel, ook open data vraagt om een investering, terwijl het geen garantie is voor meer verdienen.

Maar zoals ik in dit artikel heb laten zien kan open data leiden tot meer websiteverkeer, meer scanverkoop, een hogere kwaliteit van de data, nieuwe diensten, innovatie, nieuwe inzichten en visualisaties, economische activiteit, meer inzage/gebruik van de collectie, …

Dus archiefinstellingen: ga voor open data, de collectie verdient het!