18 december 2006

Na toegankelijke websites ook toegankelijke data!

Op de overheidswebsite van Drempels Weg valt het volgende te lezen:

Het project Drempels Weg is gestart in maart 2001 op initiatief van het ministerie van VWS. Sinds april 2002 voert het Landelijk Bureau Toegankelijkheid de leiding over Drempels Weg. Het project is opgezet met als doel internet toegankelijker te maken. Met name voor mensen met een handicap, maar niet alleen voor hen. Een toegankelijk internet komt uiteindelijk iedere internetgebruiker ten goede.

Ik zou graag zien dat onder de doelgroep van Drempels Weg ook de volgende groep wordt inbegrepen: website- en softwareontwikkelaars.

(Overheids)websites zouden hun informatie niet alleen goed dienen te presenteren (dus ook zodat minder validen de website goed kunnen gebruiken) maar de data zou ook via API's (=Application Programming Interface) beschikbaar moeten worden gesteld! Bouwers van genealogische diensten zouden erg gebaat zijn als data van bijvoorbeeld archiefdiensten via een API bevraagd zou kunnen worden!

Een voorbeeld
De diensten Genlias Monitor en Digitale Stamboom Monitor halen informatie van de Genlias en de Digitale Stamboom sites via een methode die "webscraping" wordt genoemd. Uit de HTML pagina's die de websites "uitspugen" wordt door middel van webscraping informatie gehaald zodat hiermee een nieuwe dienst kon worden gevormd: in dit geval notificatie aan gebruikers als er nieuwe bronnen beschikbaar zijn. Deze methode is erg fragiel: als de webmaster iets aan de layout wijzigt dan heb je kans dat de data al niet meer is te extraheren uit de bronpagina. Daarnaast geldt dat je niet altijd data uit een website kunt extraheren omdat er niet genoeg structuur is te herkennen (dit geldt bijvoorbeeld voor de ISIS sites). Wat mij en andere genealogische website ontwikkelaars zou helpen is een interface (=een afspraak over de wijze van vragen stellen en antwoorden geven) om genealogische databronnen te bevragen. Zo kan ik me ook voorstellen dat een (offline) programma als GensDataPro via een API relevante data ophaalt en invoegt in de stamboomgegevens van de stamboomonderzoeker.

Voorbeelden van API's zijn er genoeg, kijk maar eens op http://www.programmableweb.com/apilist/bymashups Zoals uit deze lijst valt op te maken zijn het ook de "grote jongens" als Google, Yahoo, Amazon en Microsoft die de mogelijkheid bieden om hun data/diensten op een programmeerbare wijze te gebruiken. Het resultaat is dat er vele zogenaamde "mashups" ontstaan: samenstellingen, nieuwe diensten die gebruik maken van bestaande diensten. Deze push for openness wordt ook wel een trend genoemd (zie ook onderstaand figuur). Internetgebruikers zijn mijn inziens erg gebaat bij deze trend.

Bij deze API's denk ik overigens niet alleen aan de vraag kant. Ook voor de aanbod kant kan ik me API's voorstellen. Er zijn immers in den lande verschillende initiatieven om gegevens digitaal te maken: archiefinstellingen, vrijwilligers (denk ook aan Van Papier naar Digitaal), maar ook stamboomonderzoekers!

In de toekomst kijken
Hoewel je je kunt voorstellen dat de diverse organisaties hun eigen data ontsluiten via een API en dat er sites komen die dit alles weer aggregeren (dus mashups) ziet mijn ideaal plaatje er toch uit als een centrale dataopslag, of beter: Basisregistratie Genealogie. Een centrale voorziening die wordt gevoed door overheid (vanuit GBA en archieven) en particulieren (foto's, publicatie, transcripties) en welke wordt bevraagd door websites (van archieven, websitebouwers, commercieel of gratis) en stamboomprogramma's.

Wellicht dat bovenstaande een idee is voor het Stroomlijning basisgegevens programma. Maar ik realiseer mij dat een derlijke basisregistratie het nodige werk (organisatie/afspraken) en geld vergt (maar wellicht minder dan als een ieder zelf het wiel uitvindt). Dus in de komende 10 jaar zie ik dit nog niet van de grond komen, helaas...

Om weer wat meer met beide benen op de grond te komen, wil ik eindigen waarmee ik dit verhaal ben begonnen: Drempels weg, ook voor ontwikkelaars! Want, "een toegankelijk internet komt uiteindelijk iedere internetgebruiker ten goede."