02 oktober 2011

De capaciteit van WieWasWie’s Stamboom bouwen

www-uploadBij het testen van programmatuur bekijk je ook wat de capaciteit is. Voor de gebruikerstest van het Stamboom bouwen deel van WieWasWie heb ik gebruik gemaakt van GedFan: GEDCOM Fan Creator. Het beantwoord de vraag: wat is de grootste kwartierstaat die (het stamboomprogramma of) de website kan importeren, verwerken, tonen, bewerken en weer exporteren?

Gegenereerde GEDCOM bestanden

Tamura Jones heeft het programma GedFan ontwikkeld. Dit programma genereert valide, minimale GEDCOM bestanden die bestaan uit personen uit een kwartierstaat met het gespecificeerde aantal generaties. Zo bestaat een GEDCOM bestand met fan value 4 dus uit 4 generaties, oftewel 15 personen: de kwartierdrager (“One”), de 2 ouders (“Two” en “Three”), de 4 grootouders (“Four”, “Five”, …) en de 8 grootouders. Een GEDCOM met 16 generaties bevat 65.535 personen. In deze minimale bestanden zitten overigens geen gebeurtenissen, bronnen, afbeeldingen, notities, …

Deze GEDCOM FAN bestanden dienen als import om een stamboomprogramma of –website te testen. Het grootste bestand dat goed wordt verwerkt bepaalt de maximale fan value van het stamboomprogramma of -website. In het artikel The Fan Value en GedFan worden testmethode en –programma nader beschreven. In het artikel Some GEDCOM Fan Values worden enkele resultaten van tests getoond, die variëren van 16- tot een fan value van 23.

Snelheid import

Het uploaden van GEDCOM bestanden naar WieWasWie tot FAN 11 – van 2.047 personen en 317KB – gaat redelijk snel (binnen 1 minuut). Hierna lopen de tijden snel op: het FAN 15 - van 32.767 personen en ruim 5 MB groot - duurt ruim 4,5 uur om te verwerken. Dat is geen acceptabele tijd, geduld om grotere bestanden te testen had ik niet… Een fan value van 15 wordt dus niet gehaald.

Ter vergelijking: hetzelfde FAN 15 bestand wordt door Genealogie Online in 31 seconden ingelezen. Nog een vergelijking: het stamboomprogramma Aldfaer (versie 4.2) kan het 128 keer zo grote FAN 18 bestand - van 262.143 personen en 53 MB groot – inlezen in 8 minuut 20 seconden!

aldfaer-fan18

Weergave gegevens

De fan value wordt niet alleen gedefinieerd door de grootte van het grootste geïmporteerde bestand, de gegevens moeten na import ook te bekijken en bewerken zijn. Het bewerken in de tekstuele interface van WieWasWie werkt op zich wel. Maar, WieWasWie heeft een viewer die de stamboom (of in het geval van deze tests: kwartierstaat) in grafische vorm weergeeft (zie ook Stamboom bouwen via WieWasWie, van de familie of de voorouders?). Een FAN 10 bestand – van 10 generaties, oftewel 1.023 personen - wordt pas na 3,5 minuut (!)  weergegeven… Het lijkt erop dat alle gegevens worden geladen, ook al worden maar enkele personen getoond.

image

Correctheid GEDCOM import/export

Oplettende lezers zullen nu roepen: ik zie in de viewer geen kwartierstaat? Inderdaad. De valide GEDCOM 5.5.1 bestanden die GedFan heeft gegenereerd blijken niet goed geïnterpreteerd te worden, alleen de vaderlijke lijnen zijn overgebleven na import! Het FAN 1 bestand - dus met 1 persoon wordt - flauw genoeg - correct weergegeven, waardoor de maximale fan value op 1 komt.

Helaas we zijn er nog niet… Het exporteren van de gegevens door WieWasWie levert een GEDCOM op die niet volledig voldoet aan de GEDCOM 5.5 (of 5.5.1) standaard doordat bijvoorbeeld de verplichte header velden ontbreken. Alhoewel dit niet betekent dat stamboomprogramma’s het GEDCOM bestand niet kunnen inlezen is er wel een grote kans op gegevens verlies. En juist door onjuiste en/of incomplete GEDCOM implementaties van stamboomprogramma’s en genealogische websites krijgt de GEDCOM standaard – ten onrechte – een slechte naam!

De fan value van WieWasWie komt door het niet voldoen aan de GEDCOM standaard op een waarde van 0 (ook volgens Tamura Jones).

Al met al een mooi uitdaging voor STAP en haar leveranciers om deze testresultaten (en methodiek) op te pakken en één en ander aan het Stamboom bouwen onderdeel van WieWasWie te verbeteren vóór live-gang. Te meer daar het aantal toegestane  personen in de stamboom groter wordt bij elke abonnementsvorm van WieWasWie, met een onbeperkt aantal in het premium abonnement…

01 oktober 2011

WieWasWie: helpinformatie, beloning en beveiliging

www-betaNa het doorlichten van de Zoek personen functionaliteit van WieWasWie en daarna het Stamboom bouwen deel stond eigenlijk de Resultaten delen functie op de agenda voor een blogposting. Maar deze week is mij meer opgevallen…

Help!

Tijdens het bekijken van (het openbare deel) van de WieWasWie beta site zie je op diverse plekken bepaalde woorden onderstreept met een stippellijn. Als je met de muis over een dergelijke link “hangt” dan zie je in de tooltip de uitleg van de term. Mooi!

www.voc

Bekijk je een document (zoekresultaat) dan zie je in de rechter kolom een beschrijving van de bron, met link naar meer informatie. Netjes!

Tenslotte is er heel wat informatie over stamboom- en bronnenonderzoek. Ik vermoed hier de input van “kennispartner” Centraal Bureau voor de Genealogie!

  • Over stamboomonderzoek
    • Soorten stambomen
    • Stappenplan
    • Familienamen
    • Stamboom links
  • Wegwijzer bronnenonderzoek
    • Burgerlijke stand
    • Bevolkingsregister
    • DTB-registers
    • Memories van successie
    • Notariële archieven
    • Scheepssoldijboeken (VOC)
    • Kadaster

Beloning van (vrijwilliger) inzet!

Alle betatesters van WieWasWie worden beloond met een Basis abonnement op WieWasWie en de meest actieve betatesters krijgen zelfs een Premium abonnement. Een heel mooi gebaar! Het toont dat de vrijwillige inspanning wordt gewaardeerd (de beloning was op voorhand overigens niet bekend).

Maar ook ander vrijwilligerswerk wordt gestimuleerd en beloond! Er is een punten systeem opgezet waarbij vrijwilligers punten krijgen (toe te kennen door de archieven waar de vrijwilligers actief zijn) voor het overnemen van namenlijsten en het indexeren (of transcriberen) van akten. Wanneer er genoeg punten zijn behaald dan ontvangt de vrijwilliger gratis een Premium abonnement voor 3 maanden!

Ik hoop dat in de toekomst het vrijwilligerswerk nog meer via de WieWasWie website gaat lopen en wordt gefaciliteerd, dus dat een ieder eenvoudig kan meewerken aan het ontsluiten van materiaal, zoals bijvoorbeeld Regionaal Archief Leiden of Stadsarchief Amsterdam met VeleHanden doet. Crowd sourcing, ik geloof erin!

Goed gevoel over de beveiliging?

Bij de lancering van de nieuwe site van het Gemeentearchief Rotterdam kreeg ik geen goed gevoel over de beveiliging. De eerste indruk van de beveiliging van WieWasWie is goed!

Registratie en login zijn gerealiseerd zoals je verwacht van een moderne web applicatie. Ik mis alleen nog https (de beta site werkt wel via https, maar na inloggen wordt je niet van http naar https verwezen), waardoor de communicatie tussen browser en WieWasWie server versleuteld wordt om zodoende gevoelige informatie extra te beveiligingen (waaronder je e-mailadres en wachtwoord).

Waar de e-mails van het GAR bij mij nog steeds in de spam folder terecht komen is dit bij de nette e-mails van WieWasWie niet het geval, doordat de server die de mail verstuurd via DNS is gekenmerkt als valide zender en door een goed afzender adres.

De betatest van WieWasWie loopt nog tot 3 oktober, dus ik blijf zoeken naar gaten (die ik dan niet hier zal melden)! Het gaat immers om user generated content en privacy gevoelige informatie, die mag niet zo maar ongeautoriseerd aangepast of ingezien worden.