08 februari 2016

De eroderende resultaten van het WieWasWie-project

Vandaag is de betaalmuur geactiveerd op de WieWasWie website. Helaas brengt het langverwachte betaalde abonnement de stamboomonderzoeker geen nieuwe functionaliteit, er is alleen minder gratis. Wat is er eigenlijk sinds de dag dat de website live ging op 2 juli 2012 (alweer 3 jaar, 7 maanden en 6 dagen geleden) voor gebruikers bij gekomen op de website? En hoe verhoudt dit zich tot de voorganger Genlias?

Gebruikersfuncties

De eerste kritiek die losbarstte toen de WieWasWie website live ging betrof een functie die Genlias wél had en stamboomonderzoekers niet wilden missen: zoeken op twee personen. Er werd zelf een heuse protestactie opgestart om Genlias in lucht te houden. Het zoeken op 2 personen kwam, waarschijnlijk mede door de genealogen-opstand, op 5 november 2012 beschikbaar op de WieWasWie website, Genlias bleef nog in de lucht tot 1 januari 2013. Dat juist deze functie achter de betaalmuur verdwijnt voelt dus wel een beetje als een opgestoken middelvinger.

De betaalmuur is wel de start van (eerlijkere) concurrentie. Andere aanbieders zoals Open Archieven, kunnen door betere/andere functionaliteit te bieden, sommige gratis andere betaald, proberen om een fijne zoekervaring te bieden en gebruikers daarmee verleiden om een abonnement te nemen voor nog meer functionaliteit. De betaalmuur levert het CBG niet alleen extra geld op (naast de bijdrage die archiefinstellingen betalen en de reclame inkomsten) voor beheer en hopelijk innovatie, het vormt ook een aansporing om te blijven verbeteren om niet al te ver op de concurrentie achter te raken.

(klik op de afbeelding om nog even met weemoed deze vergane website te bekijken)

Genlias was beschikbaar in het Nederlands en Engels. De Engelstalige gebruikers van WieWasWie moesten tot 28 januari 2014 (dus zo'n 1,5 jaar) wachten tot de WieWasWie website ook in het Engels beschikbaar was.

De WieWasWie website had toen het in 2012 live ging wel functies die Genlias niet had: links naar scans en het maken van een stamboom.

Voor het bekijken van de scans, die veelal gewoon op de website van de archiefinstellingen bekeken worden, moest je wel eerst inloggen. Gelukkig werd deze overbodige eis op 23 april 2015 losgelaten, zodat je ook zonder in te loggen de scans kunt bekijken.

Op 2 maart 2015 werd het einde van de stamboom (en resultaten delen) module aangekondigd "vanwege de focus op historische persoonsinformatie uit historische bronnen". Deze marketing taal (of gezwalk zoals ik het in een eerder artikel noemde) moest verbloemen dat de kwaliteit van de stamboom module onvoldoende was en dat ze hierin niet wilden investeren. De personen uit de stambomen werden uit de zoekresultaten gehaald en sinds 4 januari 2016 zijn de stamboomfuncties helemaal verdwenen. Doordat de exportfunctie niet van hoge kwaliteit was en het door CBG gegeven advies om de gegevens te importeren in StamboomNederland, is er waarschijnlijk data van stamboomonderzoekers verloren gegaan.

Netto resultaat zeer mager

Als we de gebruikersfuncties van de WieWasWie website vergelijken met Genlias, dan blijkt dat de miljoenen euro's die het WieWasWie-project verstookte dus een website heeft opgeleverd die (uiteindelijk) dezelfde functionaliteit biedt als Genlias, in een moderner jasje, plus de links naar scans (en wellicht 'favorieten').

Persoonlijk had ik gehoopt op meer. Immers, Genlias moest het veld ruimen omdat de 15 jaar oude website qua technologie niet meer "klaar voor de toekomst" was, uitbreidingen waren niet mogelijk. Je zou dus denken dat qua technologie de website WieWasWie een grote verbetering was. Ik heb de indruk dat de kosten in ieder geval lager zijn geworden voor de deelnemende archieven. Echter, sinds de live-gang van WieWasWie is de zoektechnologie (Solr)alweer vervangen door een andere technologie (ElasticSearch) - wederin op basis van verkregen subsidie. Is de technologie nu wel toekomst bestendig, klaar voor nieuwe functionaliteiten?

Collectie registratie systeem

Waar de meeste gebruikers alleen de 'voorkant' kennen van WieWasWie is er ook een 'achterkant', het zogenaamde collectie registratie systeem (CRS). In dit systeem kan een archiefinstelling de gegevens (nadere toegangen/indexen) invoeren. Naar mijn weten maken niet veel archiefinstellingen gebruik van deze functionaliteit, zij exporteren de gegevens uit hun eigen systeem wat dan ingelezen wordt in de database van WieWasWie, maar daarover later meer. 

Onder andere archiefinstellingen die deelnemen in WieWasWie hebben van mij een hergebruikverzoek ontvangen. Ik wil al hun data in machineleesbaar formaat ontvangen en deze bijvoorbeeld presenteren op Open Archieven zodat onderzoekers gegevens makkelijker kunnen vinden (door slim zoeken methode, waaronder zoeken op 2 personen) en meer informatie krijgen (door te zoeken naar gerelateerde akten en informatie te koppelen aan andere databronnen). Eén van de aangeschreven archiefinstellingen bleek gebruiker te zijn van het CRS en meldde mij dat zij een offerte op zouden vragen bij WieWasWie (dus CBG) voor het verkrijgen van de gegevens. De "offerte" verbaasde mij nogal, de offerte meldt dat er een exportfunctie gebouwd moest worden en dat er daarna nog een aanzienlijk tijd (en dus geld) nodig was voor het daadwerkelijk uitvoeren van de export. Uit betrouwbare bron weet ik dat WieWasWie bij de oplevering een exportfunctie had. Dus, of deze functie is ook onderweg gesneuveld, of de huidige exploitatiepartner heeft hier geen kennis van, of partijen proberen het deelbaar maken van gegevens te frustreren. Hoe dan ook, deze archiefinstelling lijkt dus niet over de eigen (door vele vrijwilligers gemaakte) indexen te kunnen beschikken bij WieWasWie. Schokkend.

Datamodel Archive 2 All (A2A)

Veel gebruikers zijn toch tevreden met WieWasWie. Waarom? Vanwege de gegevens! En laat die nu afkomstig zijn van de archiefinstellingen (dezelfde als sinds de start van WieWasWie, er zijn geen extra archiefinstellingen aangesloten!). Onderstaande grafiek laat zien dat de WieWasWie website (blauwe lijn) zo'n 110 miljoen persoonsvermeldingen presenteert. Ter vergelijking: in december 2012 bood Genlias zo'n 65 miljoen persoonsvermeldingen.

Doordat WieWasWie een de-facto data monopolie had, lopen zij zo ver voor op alternatieven als Archieven.nl (groene lijn) en Open Archieven (paarse lijn). Door de Wet hergebruik overheidsinformatie is WieWasWie echter haar monopolie positie kwijt. Open Archieven (en een ieder) kan nu beschikken over de data van de archiefinstellingen. De praktijk leert dat meer archiefinstellingen niet direct kunnen beschikken over hun eigen data, maar zeker welwillend zijn om de data voor een ieder herbruikbaar te maken als open data. Voor RHC's en Nationaal Archief is het principe van open data leidend. Voor Open Archieven is het streven om nog dit jaar het aantal persoonsvermeldingen op de WieWasWie website te overtreffen.

(klik op de afbeelding voor een grotere, interactieve versie van de grafiek)

Maar eerlijk is eerlijk, het WieWasWie-project heeft op dit vlak wel iets bijgedragen. En wel door een standaard te maken voor het uitwisselen van gegevens: het A2A model. Waar het in het Genlias tijdperk veel gehannes was om de door de vrijwilligers gemaakte indexen van het archief naar Genlias te krijgen is hierin door deze standaard de broodnodige stroomlijning gekomen. 

A2A mag dus best één van de kroonjuwelen van het WieWasWie-project genoemd worden. Het is dus jammer om te zien dat er sinds het opleveren van deze open standaard (versie 1.7 van 7 april 2011) niets aan deze standaard is verbeterd. Het CBG, dat formeel het A2A model beheert, heeft hier tot op heden geen tijd voor gehad. Erg jammer, want de standaard heeft potentie. 

Zo zijn er diverse projecten gaande om het notarieel archief te digitaliseren, dat moet dan toch in A2A gegoten worden? Er zit een basis in A2A om ook gegevens van objecten vast te leggen (denk aan huizen, boten, enz.), maar deze is nog niet uitgewerkt. Als gebruiker van A2A (ook Open Archieven maakt er gebruik van!) heb ik veel ervaring opgedaan met deze standaard, partijen als Picturae, DE REE en DeventIt die deze standaard ook in hun systeem hebben geïmplementeerd zullen ook ervaring hebben opgedaan. Van deze ervaring wordt geen gebruik gemaakt.

Het Beheer- en OntwikkelModel voor Open Standaarden (BOMOS) is een instrument dat helpt bij de inrichting van het beheer van open standaarden. In de beschrijving van BOMOS staat de volgende uitspraak waar ik het hartgrondig mee eens ben: "Een standaard die niet beheerd wordt is geen standaard!". Dat A2A niet wordt beheerd of zelfs wordt gepromoot is betreurenswaardig. Gelukkig wordt het A2A model nog wel gebruikt, door Nederlandse archiefinstellingen, Open Archieven en zelfs door partijen als Ancestry.com en MyHeritage (die ík heb gewezen op deze standaard).

Projectevaluatie

Het zou goed zijn voor de archiefsector en subsidieverstrekkers om het WieWasWie-project weer eens te evalueren. En dan niet zo zeer met de vraag of het project de resultaten heeft opgeleverd die beoogd waren. Maar meer focussen op de fase hierna: zijn de projectresultaten duurzaam geborgd bij de juiste partij zodat projectresultaten niet meer eroderen dan gewenst? In deze tijd, waar in de archiefsector veel aandacht is voor archiefinnovatie, lijken mij inzichten hierover van grote waarde.





Voor wie de voorgeschiedenis van het WieWasWie-project wil teruglezen, zie WieWasWie, een chronologisch overzicht (uit april 2012).