18 december 2006

Na toegankelijke websites ook toegankelijke data!

Op de overheidswebsite van Drempels Weg valt het volgende te lezen:

Het project Drempels Weg is gestart in maart 2001 op initiatief van het ministerie van VWS. Sinds april 2002 voert het Landelijk Bureau Toegankelijkheid de leiding over Drempels Weg. Het project is opgezet met als doel internet toegankelijker te maken. Met name voor mensen met een handicap, maar niet alleen voor hen. Een toegankelijk internet komt uiteindelijk iedere internetgebruiker ten goede.

Ik zou graag zien dat onder de doelgroep van Drempels Weg ook de volgende groep wordt inbegrepen: website- en softwareontwikkelaars.

(Overheids)websites zouden hun informatie niet alleen goed dienen te presenteren (dus ook zodat minder validen de website goed kunnen gebruiken) maar de data zou ook via API's (=Application Programming Interface) beschikbaar moeten worden gesteld! Bouwers van genealogische diensten zouden erg gebaat zijn als data van bijvoorbeeld archiefdiensten via een API bevraagd zou kunnen worden!

Een voorbeeld
De diensten Genlias Monitor en Digitale Stamboom Monitor halen informatie van de Genlias en de Digitale Stamboom sites via een methode die "webscraping" wordt genoemd. Uit de HTML pagina's die de websites "uitspugen" wordt door middel van webscraping informatie gehaald zodat hiermee een nieuwe dienst kon worden gevormd: in dit geval notificatie aan gebruikers als er nieuwe bronnen beschikbaar zijn. Deze methode is erg fragiel: als de webmaster iets aan de layout wijzigt dan heb je kans dat de data al niet meer is te extraheren uit de bronpagina. Daarnaast geldt dat je niet altijd data uit een website kunt extraheren omdat er niet genoeg structuur is te herkennen (dit geldt bijvoorbeeld voor de ISIS sites). Wat mij en andere genealogische website ontwikkelaars zou helpen is een interface (=een afspraak over de wijze van vragen stellen en antwoorden geven) om genealogische databronnen te bevragen. Zo kan ik me ook voorstellen dat een (offline) programma als GensDataPro via een API relevante data ophaalt en invoegt in de stamboomgegevens van de stamboomonderzoeker.

Voorbeelden van API's zijn er genoeg, kijk maar eens op http://www.programmableweb.com/apilist/bymashups Zoals uit deze lijst valt op te maken zijn het ook de "grote jongens" als Google, Yahoo, Amazon en Microsoft die de mogelijkheid bieden om hun data/diensten op een programmeerbare wijze te gebruiken. Het resultaat is dat er vele zogenaamde "mashups" ontstaan: samenstellingen, nieuwe diensten die gebruik maken van bestaande diensten. Deze push for openness wordt ook wel een trend genoemd (zie ook onderstaand figuur). Internetgebruikers zijn mijn inziens erg gebaat bij deze trend.

Bij deze API's denk ik overigens niet alleen aan de vraag kant. Ook voor de aanbod kant kan ik me API's voorstellen. Er zijn immers in den lande verschillende initiatieven om gegevens digitaal te maken: archiefinstellingen, vrijwilligers (denk ook aan Van Papier naar Digitaal), maar ook stamboomonderzoekers!

In de toekomst kijken
Hoewel je je kunt voorstellen dat de diverse organisaties hun eigen data ontsluiten via een API en dat er sites komen die dit alles weer aggregeren (dus mashups) ziet mijn ideaal plaatje er toch uit als een centrale dataopslag, of beter: Basisregistratie Genealogie. Een centrale voorziening die wordt gevoed door overheid (vanuit GBA en archieven) en particulieren (foto's, publicatie, transcripties) en welke wordt bevraagd door websites (van archieven, websitebouwers, commercieel of gratis) en stamboomprogramma's.

Wellicht dat bovenstaande een idee is voor het Stroomlijning basisgegevens programma. Maar ik realiseer mij dat een derlijke basisregistratie het nodige werk (organisatie/afspraken) en geld vergt (maar wellicht minder dan als een ieder zelf het wiel uitvindt). Dus in de komende 10 jaar zie ik dit nog niet van de grond komen, helaas...

Om weer wat meer met beide benen op de grond te komen, wil ik eindigen waarmee ik dit verhaal ben begonnen: Drempels weg, ook voor ontwikkelaars! Want, "een toegankelijk internet komt uiteindelijk iedere internetgebruiker ten goede."

13 december 2006

Reclamevrij

Genealogische websites (diensten) maken is voor mij een hobby die in de (late) avonduurtjes wordt bedreven. Om dit alles leuk te houden qua kosten heb ik veelal reclame uitingen op de websites geplaatst. Met wisselend resultaat overigens. Als je zelf adverteerders gaat zoeken kost dit veel tijd. Nederlandse sites als M4N en Linki zijn marktplaatsen voor reclameruimte aanbieders en vragers. Wat je dan nog moet doen is zelf de relevante advertenties voor je doelgroep zoeken en de betreffende codes in je website incorporeren. Dan heb je ook nog Google Adsense, die neemt nog meer werkt uit handen: op basis van de content van een pagina presenteert Google "relevante" advertenties. Uiteraard in de hoop dat hoe relevanter de reclame is er meer gebruikers op de reclame klikken (pay-per-click) en eventueel daarna een product aanschaffen (par-per-lead/pay-per-sale). Het sleutelwoord is relevant. In de praktijk zijn de advertenties op genealogische websites niet echt relevant. Als het nou nog relevant was dan zou je het als "service" kunnen zien. Maar, meestal zijn gewoon schreeuwende reclame uitingen ... En zoals ik al eerder betoogde: Ancestry is big business, genealogie is not (yet?)!

Reclame op websites schrikt sommige mensen ook af. Zeker op een site als Genealogie Online hebben mensen mij aangegeven dat zijn het niet prettig vinden dat "hun publicatie" wordt vergezeld met reclame. Alhoewel de consensus in de discussie over reclame op het Stamboom Forum toch lijkt te zijn dat "we" dit moeten accepteren, weet ik dat er genealogen zijn die om deze reden ervan af hebben gezien om te publiceren op Genealogie Online.

Reclame is hoe dan ook irritant: op TV (ik kijk steeds minder), in zo'n gratis (regionale) krant (ook die lees ik om die reden minder) en ook op websites. En als websitebeheerder merk je ook dat er ineens tijd gaat zitten in optimalisatie van je site ten behoeve van de reclame inkomsten. Ik vind dat je een goede website (commercieel of niet) best mag promoten, veelal geldt er hoe meer gebruikers hoe succesvoller de site/service wordt (sneeuwbal effect). De verleiding om dit te doen onder iemands anders zijn naam wordt dan zelfs groot, er aan toegeven (persoonlijk of door grote bedrijven in consumenten fora) is dom.

Waarom die schreeuwende/irritante/afschrikwekende/irrelevante reclame dan niet weghalen hoor ik u denken... Bij mij is dit kwartje in ieder geval wel gevallen.

Ik ga dan ook, in eerste instantie als proef, de reclame uitingen van al mijn websites verwijderen. Enerzijds scheelt dit tijd en "ruimte" op scherm. Anderzijds scheelt die wel inkomsten. Ik hoop erop dat mijn andere "bron van inkomsten" iets toeneemt: donaties.

Pfff, dat lucht op... reclamevrij...

05 december 2006

Commercie op genealogisch Internet

In de discussiegroep soc.genealogy.benelux wordt er nog al eens afgegeven op commercieel getinte oproepen. Maar volgens mijn geldt er nog steeds: Ancestry is big business, genealogie is not (yet?)!

Illustratief vind ik een posting op het Archief Forum vandaag:

Noord-Ierland: 1 miljoen geboorte-, huwelijks-, overlijdens- en censusregisters online
Counties Antrim, Armagh, Down, Fermanagh, Londonderry and Tyrone. Slechts een deel is gratis raadpleegbaar. Volledige toegang tot de database kost £49.99 per jaar. Ga naar: www.emeraldancestors.com

Geld verdienen aan genealogie en Internet kun je grofweg in drie categorieën verdelen:

  1. Broninformatie - geld verdienen aan het ontsluiten van genealogische broninformatie
  2. Internetservices - geld verdienen aan services die genealogen via/op Internet worden geboden
  3. Programmatuur - geld verdienen aan stamboomprogrammatuur

Ik wil deze alle drie is langslopen.

Broninformatie

Het schikbeeld van betalen voor broninformatie is toch wel Amerika, vele waardevolle bronnen zitten verstopt achter abonnementen. Grootste aanbieder is Ancestry.com (tegenwoordig trouwens ook Engeland, Canada, Australië en Duitsland). Bij Ancestry.com kost het duurste abonnement zo'n $35/maand. Voor dat bedrag krijg je onder andere toegang tot "U.S. census, birth, marriage, death, immigration, military records, and more." Veel van deze bronnen zijn toegankelijk tot op het niveau van scans van de bronnen!

Gelukkig hoeven we voor onze broninformatie in Nederland niet te betalen. Sites als Genlias en de Digitale Stamboom Monitor ontsluiten hun databases zonder noodzaak van abonnementen. Keerzijde is echter wel dat deze instellingen (archieven) weinig tot geen geld hebben voor innovatie en digitalisering! Het bijhouden met de groeiende vulling van database en aantal bezoeker heeft de eerste prioriteit. Wat nu al de Nederlandse archieven eens geld gingen vragen (£49.99 per jaar?) voor de additionele service die zie bieden? Wat bieden deze extra inkomsten de instellingen voor mogelijkheden, en dus, wat biedt dat ons gebruikers voor extra's? Of blijven we in Nederland leunen op (lovenswaardige maar kleinschalige) projecten als "van papier naar digitaal"?

De vraag is natuurlijk wel of instellingen überhaupt digitaal willen. Is men hier bang voor teruglopende bezoekersaantallen (so what?)? Hoe gaan de archieven in het buitenland hier mee om?

Internetservices

Op Internet worden diverse services aangeboden aan genealogen. Denk hierbij bijvoorbeeld eens aan de publicatie sites voor stambomen. Ook hier heb je - als je naar Nederland kijkt - gratis en betaalde varianten. Gratis zijn Genealogie Online (sinds kort reclamevrij), StamboomOnderzoek.com (enige reclame en bijdrage voor plaatsen foto's) en uiteraard NGV's stamboom site. De eerste twee zijn particuliere initiatieven, de derde een verenigingsinitiatief. Een "commerciële" site is UwStamboomOnline, u betaald hier 5 euro per maand. Ik heb commercieel hier express tussen aanhalingstekens gezet, want hoe commercieel is dit nu eigenlijk? Ok, als alle 259 publicaties betaalde klanten zijn is dit op jaarbasis ruim 15 duizend euro, maar is dit big business? Wat ik mij afvraag is bij welke van genoemde sites de meeste innovatie is en dus: is betaald beter? Als we naar de aantallen publicaties kijken dan steken Genealogie Online en NGV's stamboom site qua aantal ver uit boven Uw Stamboom Online...

Programmatuur

Als we naar de Nederlandse stamboomprogramma's kijken dan zien we eenzelfde beeld als bij de Internetservices. Je hebt de gratis varianten zoals Aldfaer en Geneaal. En je hebt de betaalde varianten zoals GensDataPro (60 euro voor NGV-leden en 70 euro voor niet leden), Pro-Gen (50 euro), Legacy (standaard editie is gratis, en de DeLuxe editie kost ongeveer 24 euro) en HazaData (40/80/120 euro).

Als ik dan kijk naar het gebruik door Genealogie Online gebruikers zie ik de volgende top 3:
  1. Aldfaer (265 auteurs = 43%)
  2. PRO-GEN (126 auteurs = 21%)
  3. GensDataPro (53 auteurs = 9%)

We zien dus een grote hang naar gratis (donaties worden gewaardeerd). Zouden de betaalde producten genoeg binnenhalen om van big business te spreken? Kun je je normale baan opzeggen?

Conclusie

Zoals ik in de inleiding al zei: Ancestry is big business, genealogie is not (yet?)! In Amerika is de doelgroep vele malen groter, daar valt geld te verdienen. Hier zie je ook heel veel broninformatie beschikbaar komen, inclusief scans! In Nederlands geldt Not: Ik vraag me af of er in Nederland genoeg volume is om commercieel aantrekkelijke producten en diensten op te zetten op het vlak van genealogie. En wil de Nederlander wel betalen als er goede/afdoende gratis alternatieven zijn? Maar wellicht geldt in Nederland ook Not Yet: Geld vragen/verdienen is niet per definitie commercieel! Het biedt de organisaties/personen mogelijkheden tot uitbreiding en innovatie. En zijn gebruikers hier niet mee gediend?