14 mei 2012

Archiefwebsites op de tablet en smartphone

Tilburg op de kaart op de tabletToegankelijkheid is volgens Digitaal Erfgoed Nederland: “De eigenschap van een website om een zo breed mogelijke groep van gebruikers ten dienste te zijn.” In dit artikel staat de toegankelijkheid van websites in de erfgoedsector centraal. Heel concreet: kan ik websites van archieven ook goed op mijn tablet en smartphone bekijken?

Mobiele toekomst

Het gebruik van Internet verschuift van de PC naar mobiele apparaten. Op RootsTech 2012 gaf Tim Sullivan, de CEO van Ancestry.com, aan, dat al 12% van het verkeer naar hun website (zo’n 1 miljard pageviews per maand) van een smartphone of Internet tablet komt. Op een website als Genealogie Online (zo’n 8 miljoen pageviews per maand) zie ik het mobiele gebruik al naar de 7% kruipen!

Het is dus zaak dat websites ook toegankelijk moeten zijn (of gemaakt moeten worden) voor het publiek met mobiele apparaten, of zijn ze het al?

Mobiele apparaten

Voor de test van toegankelijkheid van websites van archieven heb ik de volgende apparaten gebruikt:

  • Smartphone > Samsung Galaxy Nexus (1280x720 pixels, 4.65 inch scherm, Android 4.0, Android browser)
  • Tablet > iPad (2048x1536 pixels, 9.7 inch scherm, iOS 5.1, Safari browser)
  • Laptop > HP DV7 (1920x1080 pixel, 17.3 inch scherm, Windows 7, Chrome browser)

Een bonte rij met specificaties, bijna op elke vlak anders. Onderstaande afbeelding toont hoe de drie apparaten de publiekswebsite van het Nationaal Archief, GaHetNa, weergeven.

GaHet na op laptop, tablet en smartphone GaHetNa op laptop, tablet en smartphone – klik voor vergroting

Ander manier van bekijken en bedienen

Zoals je aan bovenstaande foto ziet worden de letters steeds kleiner, de leesbaarheid gaat dus ook snel achteruit. Je kunt inzoomen, maar bij elke pagina moet je opnieuw inzoomen…

Stadsarchief Amsterdam op smartphone Stadsarchief Amsterdam op smartphone – klik voor vergroting

Naast de leesbaarheid wordt het ook lastiger om op de links te klikken zoals bovenstaand voorbeeld laat zien (en zulke dikke vingers heb ik niet). Met inzoomen wordt de tekstlink groter, maar verlies je weer de informatie die in dit geval links op de betreffende regels staat (dus waar klik ik nu op?).

Stadsarchief Amsterdam op smartphone Stadsarchief Amsterdam op smartphone – klik voor vergroting

Alternatieve presentatie?

Om de presentatie van een website voor kleinere schermen, die trouwens niet persé lagere resoluties hebben, te verbeteren zijn er twee alternatieven (het maken van een app laat ik even buiten beschouwing).

Ten eerste kun je een speciale “mobiele” versie maken van een website zoals bijvoorbeeld GaHetNa doet via m.gahetna.nl (ook te bekijken door op het telefoon icoontje te klikken rechtsboven in de website).

Mobiele versie GaHetNa  Mobiele versie GaHetNa – klik voor vergroting

Niet alleen wordt het een stuk leesbaarder op het kleine scherm, ook heb je – als website eigenaar - controle op welke inhoud je wel en niet aanbiedt. Dit kan handig zijn, maar als gebruiker moet je wel weten dat niet de gehele GaHetNa website in de mobiele variant beschikbaar is!

Waar je voor een mobiele variant ook aan de inhoud komt (in ieder geval andere sjablonen) kun je ook gebruik maken van responsive design. Hierbij wordt de presentatie automatisch aangepast (los van de inhoud) aan bijvoorbeeld de beschikbare schermgrootte. Voordeel van deze variant is dat je maar één versie van de inhoud nodig hebt en hoeft te beheren.  

Responsive design op Genealogie Online  Responsive design op Genealogie Online – klik voor vergroting 

De website van Genealogie Online ziet er verschillend uit op de drie testapparaten. Waar er op de laptop twee kolommen zichtbaar zijn zie je op de tablet dat deze onder elkaar komen. Op de smartphone hebben het logo, de taalkeuze en de navigatiebalk plaats gemaakt voor een uitklaplijst.

Je kunt de werking van responsive design op Genealogie Online (en alle zusterwebsites) zelf bekijken (op een PC/laptop) door het browservenster te verkleinen. Resultaat van deze aanpassing in presentatie (CSS) is dat de bezoekers van Genealogie Online die via smartphone of tablet ‘binnenkomen’ ook een leesbare website zien. In de presentatie kun je ook knoppen wat groter maken en witruimte tussen pagina nummers groter zodat het klikken met een vinger makkelijker wordt.

Wanneer er geen mobiele variant van een website wordt aangeboden of de website geen responsive design heeft dan zijn al veel websites erg lastig leesbaar en bruikbaar op een smartphone!

Andere browsers

Was het testen van websites in de verschillende browsers (die allen vaak net iets anders doen/reageren) al een opgaaf, met de smartphones en tablets komt er weer extra testwerk bij.

Testen van de website van het Brabants Historisch Informatie Centrum leert bijvoorbeeld dat de scroll-balk die je in het middelste blok vaak krijgt op de tablet niet wordt getoond. Resultaat is dat de werking van de website ernstig wordt belemmerd (op de smartphone is er ook geen scrollbar maar kun je wel door de lijst swipen).

Website BHIC op laptop Website BHIC op laptop – klik voor vergroting

Website BHIC op tablet Website BHIC op tablet – klik voor vergroting

Een ander aspect waar websitebouwers gretig gebruik van hebben gemaakt zijn de zogenaamde “on mouse overs”. Als de muisaanwijzer in een browser boven een bepaald element ‘hangt’ wordt er bijvoorbeeld een uitklapmenu getoond (zoals in de BHIC en GaHetNa websites) of wordt er een uitleg gegeven via een tooltip wat bijvoorbeeld bepaalde icoontjes betekenen.

Icoontjes op Archieven.nl op laptop
Icoontjes op Archieven.nl op laptop

Bij de touchscreens van smartphones en tablets werkt deze “on mouse over” techniek niet tot zeer slecht: je hebt geen muisaanwijzer! Vaak wordt de vingeraanraking geïnterpreteerd als een klik! Dus het uitklapmenu werkt waarschijnlijk niet en de informatie informatie die als help bij het icoontje hoort wordt niet getoond.

Flash

Op archiefwebsites wordt heel wat gedigitaliseerd materiaal ontsloten zoals akten, foto’s en kranten. Om deze te laten zien en de mogelijkheid te bieden in te zoomen of de afbeeldingen donkerder of lichter te maken wordt er vaak gebruik gemaakt van een viewer die gebruik maakt van een extra Flash plug-in. Hoewel Flash op PC’s veelal is geïnstalleerd is dit op de iPad gewoonweg niet beschikbaar (bij Android moet je er moeite voor doen om het te installeren en kost het een extra klik om de Flash inhoud te activeren).

Wil je met je iPad bijvoorbeeld een akte inzien bij het Streekarchief Bommelerwaard dan krijg je de melding dat je een Flash plug-in nodig hebt (en verder niets, geen fallback!).

Scan inzien Bommelerwaard op tablet  Scan inzien Bommelerwaard op tablet – klik voor vergroting

Het kan ook anders. Zo detecteert de website van GaHetNa of de Flash plug-in beschikbaar is, zo niet dan wordt er geen viewer getoond maar – als fallback – de afbeelding. Ook wordt er (standaard) een download link gegeven om de scan in te zien. Helaas is de kwaliteit veel lager, dus het detailniveau dat je kunt zien via de viewer, is hoger dan bij de als download beschikbaar gestelde afbeelding.

Beeldmateriaal GaHetNa via laptop  Beeldmateriaal GaHetNa via laptop – klik voor vergroting

Beeldmateriaal GaHetNa via tablet Beeldmateriaal GaHetNa via tablet – klik voor vergroting

Als je trouwens met het Nationaal Archief hierover wil chatten kom je net op één van de weinige (of enige?) pagina’s die niet goed toegankelijk is (Flash component zonder fallback).

Er is nog een alternatief voor de Flash viewer en dat is door gebruik te maken van de mogelijkheden die HTML en Javascript bieden. Via de website van gemeentearchief Wassenaar kun je daardoor wel tot op detailniveau inzoomen (helaas werkt de slider dan weer niet op de tablet en smartphone).

Viewer archief Wassenaar op tablet Viewer archief Wassenaar op tablet – klik voor vergroting

Dat Flash op z’n retour is zie je ook bij websites als YouTube en Scribd. Waar deze services eerst video’s en documenten toonden (en ook laten embedden) met een Flash component zie je dat hier nu ook HTML5 varianten worden aangeboden die een betere toegankelijkheid bieden. Gebruik je dus op je website externe services, controleer of deze al een HTML5 variant bieden!

Rijkere beleving

Dat smartphones en tablets niet beperkte websites opleveren toont het Regionaal Archief Tilburg (in navolging van Amersfoort) met Tilburg op de kaart. Deze website werkt naar mijn smaak zelfs beter op een tablet doordat je eenvoudig navigeert op de kaart met je vinger, kunt zoomen door te pinchen (=standaard Google Maps) en kunt swipen door de lijsten die aan de rechterkant worden getoond. Een mooie manier om archiefmateriaal beschikbaar te stellen! Helaas, de YouTube video’s (Flash) werken niet op de tablet…

Tilburg op de kaartTilburg op de kaart op tablet – klik voor vergroting

Conclusie

Bij de (door)ontwikkeling van websites moet rekening gehouden worden met de gebruikers met een smartphone en tablet. Deze nieuw devices bieden nieuwe uitdagingen op het vlak van toegankelijkheid. In het algemeen moet er actie worden ondernomen om de eigen website goed leesbaar te krijgen op een smartphone of tablet. Niet alles hoeft te werken, maar bied een leesbaar geheel met, waar nodig, een goed alternatief (een fallback). Bepaalde gebruikte technieken kunnen beter niet meer gebruikt worden, nieuwe technieken bieden alternatieven.

 

Genealogie GazetPS. dit artikel is ook te lezen via de Genealogie Gazet. Dit is een online inspiratie magazine over stamboom-onderzoek, familiegeschiedenis en archieven. Alleen beschikbaar op smartphone en tablet!

17 april 2012

Vindbaarheid van afbeeldingen uit beeldbanken

google_vindenVindbaarheid is volgens Digitaal Erfgoed Nederland: “het digitaal beschikbaar stellen van informatie over erfgoed op basis van gangbare technologie, zodanig dat deze zonder kennis vooraf kan worden hergebruikt door zowel mens als machine” (bron: DE BASIS). In dit artikel staat de vindbaarheid van materiaal in beeldbanken centraal. Concreet: is het beeldmateriaal van archieven ook via Google te vinden?

Google en Google Afbeeldingen

Google’s zoekmachine is heel uitgebreid, naast de algemene zoekfunctie kun je ook specifiek zoeken naar afbeeldingen, video’s, boeken, plaatsen. Kun je algemene zoekopdrachten beperken qua locatie, taal en periode, de afbeeldingen kun je beperken op formaat, kleur, type (gezicht, foto, tekening) en je kunt zelfs een afbeelding aanbieden om soortgelijke afbeeldingen te vinden. Een ideaal hulpmiddel dus voor de (stamboom)onderzoeker.

Voor een viertal archieven is bekeken hoe het staat met de vindbaarheid van hun beeldmateriaal. En dan niet via de zoekmachine op hun eigen site, maar via Google!

Archief Leiden

Via een zevental collecties biedt Archief Leiden toegang tot het beeldmateriaal dat zij ter beschikking hebben, waaronder de eigen RAL collectie met zo’n 125 duizend kaarten, foto’s en prenten.

Schoondergang Conservenfabriek

Eén van de foto’s (helaas met watermerk) is een afbeelding van de Soondergang Conservernfabriek. Wanneer je in Google zoekt op “Andijvie vullen in 3-liter blikken” (dit staat in de beschrijving van de foto), dan is er één zoekresultaat. Mooi, Google heeft de betreffende afbeelding geïndexeerd!

Helaas, wanneer je op het zoekresultaat in Google klikt kom je niet op de juiste pagina, maar ook een print versie van de pagina die direct de Print dialoog van de browser activeert! Van dit euvel hebben meer archiefwebsites die dezelfde software gebruiken last.

Wanneer je in Google Afbeeldingen zoekt naar Schoondergang Conservenfabriek dan vind je heel wat afbeeldingen van de betreffende fabriek op de Archief Leiden website (en ook op andere websites). Eigenlijk tot mijn grote verbazing, want wanneer je zoekt naar site:www.archiefleiden.nl (dus betekent: geef alle afbeeldingen van het domein www.archiefleiden.nl) dan worden er maar 369 afbeeldingen gevonden. Voor site:www.regionaalarchiefleiden.nl zijn er 363 zoekresultaten. Maar zoeken op site:www.leidenarchief.nl toont wel zo’n 8.040 resultaten! Advies: ga voor één domeinnaam en verwijs van de andere/oude naar die ene.

Zeeuw Archief

Het Zeeuws Archief is druk doende om haar beeldmateriaal collectie van meer dan 100 duizend foto’s, prenten, tekeningen en prentbriefkaarten te digitaliseren. Om dit moment zijn er zo’n 37 duizend afbeeldingen doorzoekbaar en in te zien via haar website (die hiervoor gebruik maakt van Archieven.nl).

De afbeelding (na op het Zeeuws Archief te hebben gezocht op spinazie) die via Google teruggevonden moest worden was er één van vier mannen die spinazie aan het dorsen zijn met een maaidorsmachine op landbouwgrond bij Westkapelle (ook hier met watermerk). Helaas, via Google en Google Afbeeldingen is de betreffende afbeelding niet vinden.

De zoekopdracht site:www.zeeuwsarchief.nl  levert bij Google Afbeeldingen slechts 475 zoekresultaten. site:www.archieven.nl levert zo’n 93.600 resultaten op, dus wellicht is het geduld hebben, totdat de spiders van Google ook de afbeeldingen van het Zeeuws Archief aldaar hebben geïndexeerd.

Gemeentearchief Rotterdam

De Beeld en geluid sectie op de website van Gemeentearchief Rotterdam (GAR) biedt toegang tot ruim 108 duizend afbeeldingen. Een prentbriefkaart van Bleiswijk. Warmoeziersbedrijven (zonder watermerk!) was de te vinden afbeelding op Google. De prentbriefkaart was terug te vinden, maar op een andere website (randenberg.com), geen versie op de GAR website. Een andere foto (Distributiekraak Nijkerk - ration office raid at Nijkerk) was wel vindbaar, ook via Google Afbeeldingen. De zoekopdracht site:gemeentearchief.rotterdam.nl levert op Google Afbeeldingen zo’n 62.600 afbeeldingen, dus een deel zal gewoon nog geïndexeerd moeten worden.

Wat wel opvalt is dat de zoekresultaten niet leiden naar de pagina van de betreffende foto, maar naar een zoekresultaatpagina op de GAR website waar de gezochte foto er dan één van is. Dit is natuurlijk niet handig, je wilt direct op de detailpagina komen!

GaHetNa (Nationaal Archief/Spaarnestad Photo)

De Afbeeldingen sectie op GaHetNa geeft toegang tot ruim 500 duizend foto’s en ruim 6 duizend kaarten.

Het m.s. Oranje voor het vervoer van repatrianten aangemeerd in de haven van Tan…

De foto van m.s. Oranje in de haven van Tandjong Priok op GaHetNa (zonder watermerk!) wordt goed gevonden met Google Afbeeldingen. Wanneer je op een zoekresultaat klikt kom ke op de GaHetNa website op de pagina die over de betreffende pagina gaat. Zoals hoort het! Ter informatie: site:www.gahetna.nl levert op Google Afbeeldingen 327 duizend resultaten.

Deelbaarheid

Een aspect die de vindbaarheid van afbeeldingen positief beïnvloed is de mate waarin het delen mogelijk gemaakt cq. gestimuleerd wordt. In dit artikel zijn twee afbeeldingen opgenomen, simpel weg omdat Archief Leiden en GaHetNa het mogelijk maken om makkelijk een afbeelding te embedden, inclusief link terug naar de detailpagina op de betreffende pagina.

Het adres van een afbeelding (de detailpagina) is ook van belang. Onderzoekers zullen dit adres moeten noteren en opnemen in hun onderzoek. De “mooie URL” van de afbeelding bij Archief Leiden is http://archiefleiden.nl/lei:col4:dat611:id127. Ter vergelijking de niet-gebruikersvriendelijke URL van de afbeelding bij het GAR: http://collecties.gemeentearchief.rotterdam.nl/publiek/detail.aspx?xmldescid=2861366&tag=afbeeldingen;beeld;geluid;algemeen;video;film;bestellen&view=lijst&volgnummer=0&positie=4&beschrijvingssoort=1122%201090%201137%201182%201272%201302%201242%201197%201227%201152%201167%201287%201212%201257&doc_beschrijvingssoort=1227&[ARGS_PLACEHOLDER] (het merendeel is overigens overbodig).

Het directe adres van de afbeelding van het Zeeuws Archief (of Archieven.nl)? Helaas, het is niet mogelijk om direct te linken naar een afbeelding bij Zeeuws Archief…

Bij GaHetNa gaan ze nog een stapje verder dan Archief Leiden. Hier hebben ze gekozen voor het gebruiken van persistente URL’s. De URL van de hierboven getoonde afbeelding op GaHetNa is http://proxy.handle.net/10648/aee6392e-d0b4-102d-bcf8-003048976d84 Het adres is dus losgekoppeld van www.gahetna.nl! De “proxy.handle.net” website weet wat het juiste adres is van de afbeelding en stuurt de gebruiker daar heen. Als nu in de toekomst de website van het Nationaal Archief een andere (domein)naam krijgt dan wordt dit doorgegeven aan de “proxy.handle.net” website waardoor alle adressen blijven werken.

Pinterest

Als je het over delen van afbeeldingen hebt dan denk je wellicht direct aan de nieuwe service (of hype?) Pinterest. Pinterest is een virtueel prikbord waarbij gebruikers foto’s en afbeeldingen kunnen delen. Het doel van Pinterest is om iedereen hun interesses visueel te laten delen. De installatie van een button in een browser maakt het makkelijk om de afbeeldingen te delen (te pinnen) op je eigen board. Anderen kunnen de re-pinnen of voorzien van commentaar, heel sociaal.

Zoals mijn eigen Genealogie board laat zien kun je van alle hierboven genoemde archieven de afbeeldingen te pinnen (en grappig genoeg via Pinterest kun je dan weer de afbeelding embedden, ook die van het Zeeuws Archief en Gemeentearchief Rotterdam). Toch gaat het pinnen niet overal goed. Bij het Gemeentearchief Rotterdam kun je op de detailpagina van een afbeelding de afbeelding gewoon pinnen. Na het klikken op de Pinterest knop wordt de afbeelding getoond, deze kun je dan aanklikken om te pinnen, zo hoort het.

Bij de Archief Leiden en GaHetNa is het niet direct mogelijk om te pinnen. Dit komt doordat er een op Flash gebaseerde viewer wordt gebruikt. De work-around is om via de zoekresultaatpagina van de betreffende website te pinnen. Wil je een afbeelding van het Zeeuws Archief pinnen dan moet je dit via Archieven.nl doen (en ook daar is het alleen mogelijk via de zoekresultaten pagina).

Conclusie

Voor archieven (en hun leveranciers): een goede zoekmachine op de eigen website volstaat niet in het goed vindbaar maken van de (beeld)collectie van archieven. Zorgdragen dat zoekmachines als Google het materiaal kunnen indexeren (Search Engine Optimization) is ook erg belangrijk.

Archief
Leiden

Zeeuws Archief

Gem.arch. Rotterdam

GaHetNa

Vindbaarheid via Google

matig
(door print)

slecht
(tijdelijk?)

redelijk

(niet detail)

goed

URL

mooi

geen directe URL mogelijk

niet
mooi

persistent

Embedden

ja

nee

nee

ja

Watermerk

ja

ja

nee

nee

Pinterest

via zoek
resultaaten scherm

via zoek
resultaten archieven.nl

ja

via zoek
resultaten

Voor (stamboom)onderzoekzoekers: Google vindt veel, maar niet alles. Gebruik dus ook de zoekmachines die de archieven zelf bieden.

04 april 2012

Nederlandse archieven, kijk eens hoe het Amerikaanse NARA het aanpakt!

NARA LogoOp 2 april is in Amerika de volkstelling (‘Census’) van 1940 online beschikbaar gekomen. Een mooie (en zeer gewilde) bron voor genealogen. Dit artikel is vooral gericht op de Nederlandse archiefdiensten. Want hoe pakt deze operatie uit voor het Amerikaanse Nationale Archief?

Voor Amerikanen is de census essentieel voor hun stamboomonderzoek, zie Tamura Jones’ USA 1940 Census artikel voor meer informatie over deze bron.. De 16e volkstelling, die informatie geeft over ruim 132 miljoen Amerikanen uit 48 staten, mocht na 72 jaar openbaar gemaakt worden. Het National Archives and Records Administration (NARA) heeft de 4.745 microfilm rollen gedigitaliseerd, wat heeft geresulteerd in zo’n 3,8 miljoen afbeeldingen, goed voor 20 TeraBytes aan data. Qua digitaliseringskosten moet je dan denken aan een bedrag tussen de $300.000 en $500.000.

Het hosten van dit materiaal, dus opslag en bandbreedte en ontwikkelen van een website met zoekfunctionaliteit kost natuurlijk ook een aardige zak met duiten, tenzij je gewoon vraagt aan marktpartijen om dit gratis te doen en door het materiaal te verkopen…

Via een Request For Information (RFI) heeft het NARA in juni 2011 aan marktpartijen gevraagd om een ‘no-cost contract to provide managed hosting and online access to digital images of the 1940 Census’. Het contract is uiteindelijk gegund aan Inflection, het moederbedrijf van Archives.com. Sinds 2 april jongstleden is de 1940 Census door dit partnerschap via 1940census.archives.gov beschikbaar.

Maar de census is ook gewoon te koop! Via de Products pagina van NARA’s Archives.gov (niet te verwarren met het commerciële Archives.com) kun je de complete set microfilm rollen kopen voor $580.750. De complete digitale variant kun je via een eenvoudig formulier kopen voor maar $200.000. Wil je alleen de census van bepaalde staten dan kan dat ook.

Maar ja, wie legt die enorme bedrag neer voor deze bron? Op dit moment al zeker 5 bedrijven:

  • Ancestry.com
  • FamilySearch
  • FindMyPast
  • MyHeritage
  • RootsPoint.com

Waarom bedrijven dit hebben gekocht? Het is een hele populaire bron dus het is een lokkertje voor gebruikers van hun eigen diensten. Zij kunnen de census bijvoorbeeld via “smart matching” aan gepubliceerde stambomen linken.

Hoe populair de bron was had ook het NARA verkeerd ingeschat. In hun RFI stond als requirement dat de website 10 miljoen hits per dag aan moest kunnen (en 25.000 concurrent user). In de eerste 3 uur dat de website live was kreeg de website zo’n 22,5 miljoen hits (1,9 miljoen gebruikers) te verduren. Ook al gebruikt Archives.com de schaalbare service Amazon S3 als opslag, de site werd op z’n knieën gebracht door de ruim 100.000 verzoeken per seconde (voor afbeeldingen van meer dan 10MB). Archives.com schreef hierover: "We were expecting a flood, but we got a tsunami."

De partijen die de Census hebben aangekocht zijn de afgelopen dagen druk bezig geweest om de harddisks op te halen en de afbeeldingen via hun eigen websites beschikbaar te krijgen. Ancestry.com is één van de eerste die alles gratis op hun website aanbied, ook hun servers hadden het moeilijk om de aanloop van publiek te verwerken.

Voor de goede orde, we hebben het hier over de afbeeldingen en meta-informatie (vooral locatiegegevens, staat, plaats, enz.). De census is nog niet geïndexeerd op naam!

Maar ook daar wordt aan gewerkt. Archives.com organiseert, samen met findmypast en FamilySearch, het 1940 U.S. Census Community Project om deze bron te transcriberen (zou het NARA de index data krijgen?). Maar sommige bedrijven organiseren ook zelf het indexeren, zoals MyHeritage, die deze bron trouwens ook toegankelijk maakt op iPhone, iPad en Android!

Bovenstaande klinkt bijna te mooi om waar te zijn: een belangrijke bron waar het Amerikaanse Nationale Archief waarschijnlijk goed geld aan verdiend en dus kan investeren in nieuwe digitaliseringsprojecten, die geïndexeerd wordt en die op diverse plekken gratis wordt aangeboden aan genealogen met extra services op diverse platformen.

Tja, en dan de hamvraag: zou zoiets ook in Nederland werken?

03 april 2012

WieWasWie, een chronologisch overzicht

imageMedio april 2012 zal de website WieWasWie beschikbaar worden gesteld aan het publiek. De eerste voorbereidingen voor deze opvolger van Genlias begonnen in 2007, toen nog met als werktitel MijnVoorouders. Dit artikel poogt een feitelijk overzicht te geven van de belangrijkste mijlpalen en spelers in de ontwikkeling van dit vernieuwde landelijke platform voor historisch persoonsonderzoek.

 

1996-2006 Voorgeschiedenis

De geschiedenis van GenLias (een samentrekking van Genealogie en Lias) begint in 1996 toen het plan Familiegeschiedenis tot 1780 werd gelanceerd, één van de vernieuwingsprojecten van de toen nog sterk gecentraliseerde rijksarchiefdienst. In 1997 werd er voor het project Digitale Sleutel tot familiegeschiedenis het ministerie van Onderwijs, Cultuur & Wetenschap  (OC&W) zo’n 500 duizend gulden beschikbaar gesteld uit het Actieprogramma Elektronisch Snelwegen. De Genlias website is sinds juni 1998 online, eerst via www-lias.rad.archief.nl en sinds maart 2002 via www.genlias.nl.

 

2007 Voorverkenning

Het feit dat Genlias niet robuust genoeg was, niet de gewenste functionaliteit & informatieproducten bood en hoge beheerskosten kende vormden de aanleiding voor een voorverkenning.

Eind 2007 voerde ITHAKA in opdracht van Stichting Archiefprogrammatuur (STAP) een online onderzoek onder (potentiële) gebruikers van genealogische websites getiteld Online stamboomonderzoek: gebruikerservaringen, wensen en betalingsbereidheid.

Over Stichting Archiefprogrammatuur (STAP)

STAP is in 1989 door de erfgoedinstellingen opgericht. STAP richt zich op het beheer, ontwikkeling en exploitatie van landelijke samenwerkingsprojecten binnen de erfgoedsector met een technologiecomponent. Voorbeelden van reeds gerealiseerde projecten zijn WatWasWaar (historische informatie over topografische locaties in Nederland), de Archiefkaart (gebruikerspas voor toegang archieven) en ABS Archeion (archiefinformatiesysteem). STAP is een aanbestedende dienst, zij wordt namelijk gefinancierd door meer dan dertig erfgoedinstellingen en het ministerie van Onderwijs, Cultuur en Wetenschap.

In dezelfde periode deed Daidalos in opdracht van STAP een technologische verkenning naar de technologische mogelijkheden voor de vernieuwing van Genlias. Het beoogde vernieuwde Genlias kreeg als werktitel MijnVoorouders.

 

2008 Visievorming

In april 2008 organiseerde STAP een bijeenkomst omtrent MijnVoorouders. Zij presenteerde een conceptvisie waarin Nederlandse erfgoedinstellingen met vereende kracht een nieuw landelijk platform voor historisch persoonsonderzoek wilden realiseren. Deze visie was opgesteld in samenspraak met vertegenwoordigers van de beoogde deelnemers, dit waren onder andere de deelnemers van Genlias, de Digitale Stamboom, gebruikers van software van Isis en Pictura en het Centraal Bureau voor Genealogie (CBG). Betrokken besluitvormers konden hun terugkoppeling geven op de visie en het accorderen, zodat aangevangen kon worden  met een verwervingstraject voor subsidie.

 

2009 Subsidie en aanbesteding

De totaal benodigde investering om het project MijnVoorouders te realiseren, gecalculeerd over 5 jaar, bedroeg 4 miljoen euro. Financiering van dit budget zou deels mogelijk zijn op basis van eigen bijdragen van deelnemende archieven en het genereren van inkomsten. Voor het andere deel wilde men gebruik maken van subsidie regelingen, waarbij een PRIMA aanvraag van zo'n 2 miljoen het grootste deel vormde. Deze projectsubsidie vanuit de interdepartementale subsidieregeling PRIMA van het ministerie van OC&W werd toegekend voor vijf jaar (2008-2013).

In september 2009 organiseerde STAP de presentatie van de eerste fase van het project MijnVoorouders. Het doel van de bijeenkomst voor deelnemende instellingen was om de resultaten van de eerste projectfase te presenteren en alle betrokkenen de gelegenheid te geven vragen te stellen en te reageren. Tijdens deze bijeenkomst werden ook het functioneel model, de huisstijl met userinterface (incl. folder), de communicatie- & marketingstrategie, het businessmodel waarin ook het concept van de one-stop-shop wordt geïntroduceerd (een terugverdienmodel is een verplichting vanuit de PRIMA regeling) en de usabilitytest gepresenteerd. Ook kregen een 3-tal “gebruikers” tijd in het programma om hun visie te delen, zowel Eric Hennekam, Arnold Vonk als Bob Coret deden dat in eigen stijl.

Waar in de vooraankondiging van genoemde bijeenkomst nog werd gesproken over MijnVoorouders bracht de uitnodiging aan deelnemers een nieuwe naam: WieWasWie. Leuk detail: in de subsidieaanvraag van MijnVoorouders werd in één van de use cases gesproken over het televisieprogramma “Wie Was Wie”.

In oktober 2009 werd WieWasWie via een Europese aanbesteding aanbesteed, partij hadden 2 maanden de tijd om hun offerte in te dienen. Eind november kon STAP beginnen met de beoordeling van de offertes van 6 bedrijven(combinaties). Enkele weken later kregen de aanbieders de kans zichzelf en hun aan bieding te presenteren aan de stuurgroep.

 

2010 Start ontwerp en bouw

Begin februari 2010 werden er een viertal werkgroepen ingesteld met deelnemers van de deelnemende archieven. Zij zouden zich buigen over Communicatie & PR, Usability & Design, Content & Collectie en Datamodel, Standaarden & Migratie.

De bouw kon echter nog niet aanvangen. STAP wilde in het aanbestedingstraject gunnen aan het consortium DEVENTit / Gridline / Q42 / Fabrique. De combinatie HintTech / Mindbus had echter bezwaar gemaakt, omdat GridLine, één van de partijen in het consortium, in 2009 in opdracht van STAP het technisch bestek had geschreven en een kostenraming had gemaakt (die niet in de aanbesteding aan partijen was verstrekt). In april 2010 deed de rechtbank in Amsterdam uitspraak in dit kort geding in het voordeel van HintTech / Mindbus. STAP mocht niet overgaan tot gunning aan de combinatie. STAP gunde de opdracht (met een waarde van vier ton) aan HintTech en Mindbus zodat eind mei 2010 de bouw van start kon gaan.

In een kick-off zijn alle partijen aan de slag gegaan om een kleine honderd functionaliteiten van WieWasWie te detailleren. Ook werd op de deelnemersdag besproken wat WieWasWie praktisch en zakelijk voor archieven betekent.

Ook werd er een rechtenonderzoek gestart naar de juridische aspecten van het beschikbaar stellen en (door)verkopen van digitaal erfgoed. In augustus 2010 werd door de Mondriaan Stichting een bedrag van 15 duizend euro toegekend ten behoeve van dit Rechtenonderzoek Digitaal Erfgoed en Cultureel ondernemen. In juni 2011 werden de resultaten van dit onderzoek gepresenteerd op het webblog van STAP.

 

2011 Bouw en reorganisatie

In februari 2011 werden er HTML-pagina's van het design van WieWasWie opgeleverd door Zicht. Na goedkeuring van het projectteam begonnen HintTech en MindBus met de technische implementatie hiervan.

image

Ook op een ander vlak was er voortgang: eind april vond de eerste datamigratie plaats. De collectie van het VOC werd met succes getransporteerd naar het platform. Aansluitend startte MindBus met de datamigratie van de deelnemers van de Digitale Stamboom. Een en ander vond plaats op basis van het binnen het project ontwikkelde A2A (=Archive To Archive) communicatiemodel.

In augustus 2011 moest STAP na intensief testen concluderen dat nog niet alle functionaliteit voldoende werkte. Het testen van het collectieregistratiesysteem (het deel  van WieWasWie dat door archieven wordt gebruikt) en de gebruikersacceptatietest werden enkele weken uitgesteld. Eind september 2011 werd het startsignaal gegeven voor de eindgebruikerstest van WieWasWie waar een 50-tal vrijwilligers aan meededen.

Na het afsluiten van de gebruikerstest, begin oktober 2010, kondigde het STAP bestuur aan dat het STAP bestuur werd uitgebreid, zodat het bestuur meer draagvlak in het veld kon creëren en bovendien STAP kon klaarmaken voor een verdere ontwikkeling. Omdat dit meer tijd kostte en invloed had op de ontwikkeling van projecten die door STAP werden geleid besloot het STAP bestuur de lancering van WieWasWie uit te stellen.

Eén van de wijzigingen die werd doorgevoerd was dat het STAP projectteam van Amsterdam verhuisde naar het Nationaal Archief in Den Haag, ook kreeg STAP een nieuwe interim directeur (vanuit het Nationaal Archief).

 

2012 Live-gang en exploitatie

In januari 2012 werd gemeld dat STAP in gesprek was met het CBG over het beheer en exploitatie van WieWasWie. Overigens werd hier al in juni 2011 naar gehint in een brief over Informatie- en communicatietechnologie van de staatssecretaris van OC&W en minister van Binnenlandse Zaken (BZK). Hierin werd geschreven dat de collecties en dienstverlening op gebied van de genealogie door het Nationaal Archief zou worden ondergebracht bij het CBG. De rijksbijdrage aan het CBG - vanaf 2012 zo'n 1,8 miljoen euro per jaar - zou primair worden ingezet voor beheer en onderhoud van de ontwikkelde digitale infrastructuur zoals WieWasWie.

Medio april 2012 gaat WieWasWie live. Dit zal een mooi moment zijn voor STAP (projectteam, bestuur en deelnemende archieven) en voor de Nederlandse genealoog! 

De toekomst zal leren of:

  • WieWasWie een robuust platform is dat grote gebruikersaantallen aan kan;
  • het CBG geëquipeerd is om de exploitatie van WieWasWie uit te voeren;
  • het via een abonnement betalen voor scans gehandhaafd blijft of dat er op den duur ook voor zoekresultaten & informatie betaald moet worden;
  • de scans van de Burgerlijke Stand die FamilySearch gratis beschikbaar stelt op zwart gaan voor de Nederlandse genealoog of niet;
  • de ontwikkeling van WieWasWie niet stopt maar door gaat, zowel qua functionaliteit als scans van akten;
  • het aantal archieven dat gebruik maakt van WieWasWie gaat groeien;
  • de gebruikers tevreden zijn met de opvolger van Genlias (en de Digitale Stamboom).

image

Heeft u aanvullingen of correcties op deze chronologie? Ik hoor ze graag via de reacties!

19 maart 2012

Wat zou jij doen met de genealogische data van een heel archief?

Stel je eens voor: je krijgt een groot deel van de genealogische data van het Brabant Historisch Informatie Centrum (BHIC) ter beschikking. Wat zou je er dan mee doen? Wat voor toepassing kan er gemaakt worden? Welke type vragen zie je graag beantwoord?

opendata

Open data

Het vrijelijk beschikbaar stellen van data voor hergebruik, bij voorkeur in een standaard formaat, wordt ook wel open data genoemd. Het zet de deur open naar nieuwe toepassingen, die de instelling (die de open data biedt) niet zelf hoeft te verzinnen, te realiseren en te bekostigen, maar waar de open data “hergebruiker” mee aan de slag kan om leuke, innovatieve en/of nuttige toepassingen van te maken.

Archiefdata achter betaalmuur of open?

De inventarissen van archieven en indexen op bronmateriaal zijn goede kandidaten om beschikbaar te stellen als open data. Veel van deze data is tot stand gekomen door archivarissen en vrijwilligers, op basis van geld van de overheid. Geld vragen voor deze overheidsinformatie is niet gepast. Maar geld vragen voor de scans is daarentegen wel redelijk. Zo kun je je voorstellen dat websites of mobiele apps die gebruik maken van deze open index data voor extra bezoekers aan de website van het archief zorgen die daar dan scans kopen. Dit extra geld kan weer in digitalisering gestopt worden!

Alhoewel er een frisse open data wind door Nederland waait, zie ook http://data.overheid.nl/, is de archiefsector nog wat huiverig. Er wordt wellicht meer in bedreigingen gedacht dan kansen. Ik zeg: mouwen opstropen en gewoon doen!

BHIC en ik aan het experimenteren

Als experiment heeft het BHIC mij toegang gegeven tot de data van de DTB, Burgerlijke Stand en Memories van Successie. Het is voor het BHIC een experiment om te kijken wat er bij open data komt kijken en wat het op zou kunnen leveren.

Christian van der Ven (BHIC) heeft hier vandaag ook op zijn blog De Digitale Archivaris.

Het verkrijgen van de data duurde een uur of vijf en leverde mij zo’n 1,7 GB aan XML data op. Ik heb nu dan ook de genealogische data van het BHIC! Tja, en wat moet je daar nu mee…?

Op zich zou ik nu dezelfde zoek/presentatie functionaliteit kunnen bieden als het BHIC doet. Maar daar schieten we niets mee op. De toepassingen van deze open data liggen elders.

Statistieken en visualisatie

Een eerste toepassingsgebied is om de data op diverse manieren te visualiseren. In een tweetal Proof-of-Concepts heb ik de BHIC data op verschillende manieren gepresenteerd.

treemapBij de eerste visualisatie wordt er inzichtelijk gemaakt wat voor type data van welke plaats en jaar er beschikbaar is. De treemap biedt de mogelijkheid om in te zoomen op een lager detail niveau.

Bij een tweede set van visualisaties is de data van dopen en geboorten bij de kop gepakt. Hier kun je dan een top 10 lijstje maken van familienamen of voornamen, per plaats (op Google Maps) of jaar. Of je kunt in grafiekvorm zetten hoeveel voornamen men in de loop van de tijd aan hun kinderen gaf (ik wist niet dat meerdere voornamen iets was dat pas tussen 1850 en 1900 een vlucht nam). Het aantal geboorten/dopen per maand door de jaren is in een bewegende grafiek weer te gaven (vooral leuk, maar nuttig?). De informatie in de dataset omtrent beroepen was niet heel uitgebreid, maar toch genoeg om er een tagcloud van te maken zodat je de belangrijkste beroepen in Brabant in één oogopslag ziet.

map

Het visualiseren van open data kan nieuwe inzichten opleveren, trends signaleren of vragen oproepen (waarom zijn er die maand zo veel mensen overleden?).

    Combineren

    Je kunt de open data ook combineren met andere (open) data. Denk dan bijvoorbeeld aan de genealogische gegevens op Genealogie Online, als je die “matched” met de data van een archief dan kan ik de stamboomonderzoeker direct verwijzen naar akten (en scans) die het archief ter beschikking stelt. Dit borduurt dus verder op de Scans zoeken service van Genealogie Online.

    Een andere leuke dataset om mee te combineren zijn de “Antieke reeksen” van het KNMI. Hiermee zou je kunnen bekijken of er een samenhang is tussen de gemiddelde temperatuur of luchtdruk en het aantal geboorten of begrafenissen.

    Functionaliteit

    Het bedenken van innovatieve toepassingen op basis van open data is uitdagend. Vanuit mijn achtergrond denk ik dan snel aan Monitor functionaliteit (een seintje als het BHIC nieuwe data heeft betreffende een bepaalde familienaam) of “vertaal” functionaliteit (de data in GEDCOM, Excel of PDF).

    Inspiratie

    Wat zou jij doen met de data van een archief? Heb je bepaalde zoekvragen die op dit moment niet beantwoord kunnen worden via de zoekmogelijkheden van een archiefinstelling? Of ben je benieuwd welke trends er uit de genealogische data te halen is? Zou je de data wel eens willen combineren met andere data sets die openbaar beschikbaar zijn?

    Graag hoor ik via reacties op deze blogposting jullie ideeën hoe we open archiefdata zouden kunnen hergebruiken!

    06 februari 2012

    RootsTech: familiegeschiedenis & technologie

    Van 2 tot en met 4 februari vond in het Amerikaans Salt Lake City de grote familiegeschiedenis en technologie conferentie RootsTech 2012 plaats. Zo’n 4.500 bezoekers bezochten deze conferentie, die deels ook direct via streaming video te bekijken was.

    Jay Verkler

    Op de eerste dag van de conferentie werd de key note presentatie gegeven door Jay Verkler, (vertrekkend) president en CEO van het door de Mormonen gesponsorde FamilySearch. In deze presentatie besprak hij de elementen van een community framework, die van belang zijn bij genealogie.

    frm

    De video registratie van de eerste RootsTech dag (donderdag) die dus start met Jay Verkler kun je via de RootsTech website bekijken, een aanrader!

    HistoricalData by Google

    Tijdens deze presentatie kregen ook Robert Gardner en Dave Barney (beide van Google!) het woord. Zij zijn bezig geweest om een schema te maken voor historische data (Record, Event, Family en Person). Door dit schema voor microdata te gebruiken op websites kunnen zoekmachines en ontwikkelaars de inhoud van de websites beter begrijpen. De microdata zoals gedefinieerd op Historical-data.org wordt nu onder andere door FamilySearch.org, Geni.com, WeRelate.org, Mocavo.com en GenealogieOnline.nl geboden. Het is nog wachten op zoekmachines en ontwikkelaars die er gebruik van gaan maken. Binnenkort zal ik hier nog een blogposting aan wijden!

    GEDCOM X

    Tijdens deze editie van RootsTech is trouwens ook een nieuwe GEDCOM aangekondigd: GEDCOM X! Meer over de in ontwikkeling zijnde GEDCOM X via FamilySearch releases GEDCOM X van Tamura Jones.

    Tim Sullivan

    Op de 3e dag van de RootsTech presentatie was er een panel discussie met Ancestry directeuren. De discussie werd geleid door Tim Sullivan, de president en CEO van Ancestry.com. In de discussie ging het onder andere over het mobiel gebruik (12% van het verkeer naar Ancestry.com verloopt via een smartphone of Internet tablet!), DNA, handschriftherkenning en de nieuwe census viewer.

    De video registratie van de derde RootsTech dag (zaterdag) die dus start met Tim Sullivan kun je via de RootsTech website bekijken, ook een aanrader!

    Video’s en presentatie

    Op de RootsTech website vind je ook de registratie van de 2e dag. Binnenkort zullen de video’s per presentatie beschikbaar komen (nu zit er nog “wachttijd” tussen de presentaties omdat het om de complete registratie gaat van één zaal). De syllabi van de presentatie zijn allemaal te downloaden via de Downloads pagina.

    Naar de conferentie?

    Helaas was ik er zelf niet bij, volgend jaar wellicht?

    Rob van Drie (CBG) was er wel, over zijn ervaring heeft hij op zijn weblog geschreven: