17 februari 2015

Na crowdsourcing ook crowdfunding in de archiefsector?

imageHet indexeren van akten gebeurd al jaren door een grote schare van vrijwilligers. Was het ‘vroeger’ vooral bij het archief zelf, tegenwoordig kunnen vrijwilligers thuis op de computer meehelpen via VeleHanden, Open Archieven of FamilySearch Indexing. Het vrijwilligerswerk van weleer heet tegenwoordig crowdsourcing.

Een andere ‘trend’ wordt crowdfunding genoemd, hierbij wordt een donatie aan het publiek gevraagd voor het bereiken van een bepaald doel. Ook dit is op zich niets nieuws. Het Waterlands Archief berichtte over een 18e eeuwse crowdfundings-actie door de Purmerendse Lutheranen.

Je kunt je afvragen waarom archiefinstellingen niet meer aan crowdfunding doen. Het cynische antwoord is dat archieven dit niet hoefde vanwege de verschillende subsidies die hiervoor bestonden. Of, dat subsidies uit belasting wordt betaald en er dus 16 miljoen donateurs aan hebben bijgedragen. Maar voor archieven en genealogen liggen op het vlak van crowdfunding toch mogelijkheden om mooie nieuwe bronnen digitaal beschikbaar te krijgen.

Het Red een portret project van Stadsarchief Amsterdam is een voorbeeld van een crowdfunding project in de Nederlandse archiefsector. Er wordt gepoogd € 50.000 bij elkaar te krijgen om het archief van Fotostudio Merkelback te digitaliseren, ze hebben nu zo’n 69% van het streefbedrag binnen.

imageVoor een voorbeeld op het vlak van genealogie moeten we uitwijken naar Amerika. In het Preserve the Pensions project wordt getracht om genoeg geld bij elkaar te krijgen om de 7,2 miljoen pagina’s van de pensioen akten van de oorlog van 1812 te digitaliseren. Het streefbedrag van 3,7 miljoen dollar is al voor 50% binnen!

Dit project is geïniteerd door de Amerikaanse National Archives and Records Adminstration, de NARA. Maar, in plaats van zelf een crowdfunding campagne op te zetten en de crowd te motiveren benaderden zij de Federatie van (zo’n 500) Genealogische Verenigingen, de FGS. Het FGS koos, op advies van het NARA, de pensioen akten omdat deze één van de meest geraadpleegde bronnen was die nog niet op microfiche of digitaal beschikbaar was. Het FGS (waarom hebben we in Nederland nog steeds niet een dergelijke federatie?) heeft een community van zo’n 800.000 leden. De president van de FGS - D. Joshua Taylor – is ook nog eens presentator van Genealogy Roadshow (een televisieprogramma op PBS), publiciteit zit dus wel snor (hieronder zijn pitch). Een slimme aanpak dus van NARA.

Het digitaliseren (=fotograferen+indexeren) zal worden uitgevoerd door Fold3 (een onderdeel van Ancestry.com) en kost $0,48 per pagina (goed dat hier openheid over wordt gegeven, dat mis ik in Nederland) en zal gratis beschikbaar worden gesteld op de Fold3 website. Ook dient nog opgemerkt te worden dat voor elke gedoneerde dollar Ancestry.com ook een dollar doneert (matching).

Een slimme aanpak dus van NARA.In de blogposting Nederlandse archieven, kijk eens hoe het Amerikaanse NARA het aanpakt! sprak ik al mijn lof uit over het NARA. Het Preserve the Pensions project vind ik toch ook weer een knap staaltje omdenken uit de koker van het NARA!

24 januari 2015

De problemen van AlleDrenten.nl

Op 24 januari 2015 werd de website Drenlias.nl omgedoopt tot AlleDrenten.nl.

De bèta versie van de website was al enige tijd beschikbaar en ik had deze op 2 mei 2014 al onder de loep genomen in het artikel Nieuwe versie van DrenLias nader bekeken.

Het artikel bevatte complimenten, maar signaleerde ook problemen. Ik had gehoopt dat het Drents Archief en hun leverancier het advies ter harte had genomen en de problemen voor de lancering zouden oplossen. Maar als ik nu weer naar AlleDrenten.nl ga, dan zie ik nog dezelfde problemen!

Zoeken

Eén van de gesignaleerde problemen was dat het voor gebruikers onduidelijk is in welke bronnen de hoofdzoekfunctie zoekt. Je krijgt als gebruiker de indruk dat alle bronnen worden doorzocht. Helaas, dit is niet zo, je zult via het linker menu sommige bronnen afzonderlijk af moeten gaan, want de volgende bronnen worden bijvoorbeeld niet in de hoofdzoek-functie meegenomen:

  • Notarisrepetoria
  • Kolonistendatabase
  • Begraafregisters

In het voorgaande artikel schreef ik ook over het ontbreken van de zoeken op twee personen functie. Maar wat blijkt, deze functie is niet bij alle bronnen (en hoofdzoekfunctie) beschikbaar, bij sommige bronnen is de functie wel zichtbaar… verwarrend.

Scans

Het kopen van scans is verbeterd, alhoewel de Bestel pagina mij nog op het verkeerde been zette. De bestelpagina heeft het immers alleen over bestellen via e-mail, maar AlleDrenten.nl is voor de scans nu gekoppeld aan de winkelwagen van de website van het Drents Archief. Je kunt dus bij een scan op de ‘bestel scan’ knop klikken.

GEDCOM
Over de GEDCOM export was ik in het vorige artikel kort, ik verwees alleen naar GEDCOM bestanden die niet aan de GEDCOM standaard voldoen mogen de naam GEDCOM niet dragen!

In dit artikel wil ik wat dieper op de GEDCOM problemen ingaan. Laten we onderstaande embedde overlijdensakte van AlleDrenten.nl als voorbeeld nemen.

Als je van deze akte het GEDCOM download om te importeren in je stamboomprogramma dan krijg je onderstaande GEDCOM:

0 HEAD
1 SOUR DrenLias.nl
2 VERS 1.0
2 CORP Drents Archief
0 @I1@ INDI
1 NAME Antonia /Brizee/
1 SEX F
1 OCCU
1 FAMS @F1@
0 @I2@ INDI
1 NAME Johannes /van Krugten/
1 SEX M
1 OCCU bedrijfsleider
1 FAMS @F1@
0 @I3@ INDI
1 NAME Aart /van Krugten/
1 SEX M
1 OCCU kellner
1 FAMS @F1@
0 @I4@ INDI
1 NAME Maria Jacoba /Wassink/
1 SEX F
1 OCCU
1 FAMS @F1@
0 @F1@ FAM
1 HUSB @I3@
1 WIFE @I1@
1 CHIL @I4@
1 DEAT
2 PLAC Meppel
2 DATE 05-05-1950
0 TRLR

Bovenstaande “GEDCOM” voldoet ten eerste niet aan de standaard, zucht. De standaard is toch goed is beschreven en er zijn diverse validators die gebruikt kunnen worden om te controleren of er aan de standaard word voldaan!

Veel stamboomprogramma’s en websites zullen echter proberen er toch wat van te maken bij import. Als je bovenstaande GEDCOM echter “zo goed als” interpreteert dan worden de volgende feiten zichtbaar:

Het echtpaar Aart van Krugten (bedrijfsleider van beroep) en Antonia Brizee hadden een dochter genaamd Maria Jacoba Wassink. Johannes van Krugten was bedrijfsleider.

Eh? Deze akte ging toch over het overlijden van Johannes van Krugten? En Johannes was toch de zoon van Aart en Antonia en partner van Antonia?

En de akte gegevens bevatten toch ook de woonplaats, leeftijd en geboorteplaats van de overledene?

En waar is de bronverwijzing? Deze mist totaal…

De conclusie kan niet anders zijn dat de “GEDCOM” die AlleDrenten.nl biedt ongeldig, foutief en onvolledig is.

Drents Archief: ik zou - om jullie gebruikers te beschermen - de “GEDCOM” functie uitzetten en van de leverancier eisen dat zij deze functie naar behoren laten functioneren of geld terug betalen.

Beveiliging

Ik ging in het vorige artikel ook in op de beveiliging van de website. Alhoewel AlleDrenten.nl geen financiële of medische gegevens beveiligt, was èn is de beveiliging ver onder de maat: geen https bij overdracht privacy gevoelige informatie (ook al is dit alleen naam, e-mail en wachtwoord) en gebruikersnaam en wachtwoord komen plaintext tezamen in beeld en in de e-mail. Het versturen van e-mail uit iemands anders naam (bijv. medewerkers van het Drents Archief ;-) is ook nog steeds mogelijk.

Overpeinzing

Je vraagt je toch af wat er in de afgelopen 9 maanden is gebeurd aan de bèta van AlleDrenten. Wellicht waren er nog grotere problemen. Maar de door mij gemelde problemen staan niet eens op de Bekende problemen pagina?

Je gaat je hierdoor wel afvragen hoe het staat gesteld met de IT kennis van de leverancier en het opdrachtgeverschap van het Drents Archief.

Het geeft het gehuil in de 'promo' video toch een andere betekenis :-)

30 december 2014

Genealogische webinars

image

Op 10 december 2014 verzorgde het HCC!genealogie haar eerste 2 webinars! Live kon er meegekeken worden naar de presentaties van Cor van Rooij  (Kennismaking met genealogie) en John Glaser (Internet als bron voor genealogie). Ik keek mee en doe verslag van de technische kant van het verhaal.

Wat is een webinar?

Wikipedia geeft de volgende definitie van een webinar:

Een online seminar of webinar is een lezing, workshop, college of soortgelijke presentatie of vorm van kennisoverdracht die plaatsvindt via het internet. Het neologisme "webinar" is een portmanteau(woordcombinatie) van de woorden "web" (dat wil zeggen world wide web) en "seminar". Deelnemers kunnen het seminar rechtstreeks op hun eigen computer volgen en de spreker(s) zien en horen.

Dus terwijl Cor, John en publiek fysiek in Kunstengebouw Cultura in Ede waren konden geïnteresseerden thuis via Internet meekijken. Voor het bekijken van imagede het webinar moest eerst (eenmalig en gratis) software geïnstalleerd worden van GoToMeeting. Op zich geen grote drempel, maar tegenwoordig zijn er voldoende alternatieve die puur webgebaseerd zijn en waar dus geen software voor geïnstalleerd hoeft te worden.

image

De software maakt het mogelijk om de grootte van de twee schermen (één met de live video en één met de bijbehorende presentatie) te verkleinen en te vergroten. Helaas was deze mogelijkheid er bij de presentatie van John niet, daar was alleen de presentatie zichtbaar (maar dit komt goed, lees maar verder).

Er hebben 30 personen live naar beide webinars gekeken. Alhoewel dit geen grote aantallen zijn is dit slechts het begin. Want de opnames van de twee webinars zijn nu ook online te bekijken:

De afspeelmogelijkheid wordt geboden door de HCC!seniorenacademie en is gratis voor alle kijkers. Hier heb je verder geen extra software voor nodig om te kijken, alleen een browser. Je ziet in de weergave links de video (ja, ook van John!) en rechts de presentaties (die overigens ook te downloaden zijn).

image

Online video

Ik schreef al in 2007 (Genealogie TV) over de mogelijkheden van online video en riep in 2008 (Stamboom TV) de genealogische verenigingen op om er mee aan de slag te gaan. Anno 2014 kan er denk ik wel iets aan toegevoegd worden: interactie!

Want de webinars van HCC!genealogie waren erg eenrichtingsverkeer (terwijl de software meer mogelijkheden biedt) en je dus eigenlijk van een webcast moet spreken. Het verschil tussen een webinar en een webcast is dat er bij een webcast ook fysiek publiek aanwezig is. Een webinar is een seminar met uitsluitend online publiek. Interactieve webinars daarentegen maken contact over en weer mogelijk, waardoor deelnemers door middel van vraag-en-antwoordsessies kunnen participeren.

Volgende webinars

Als u webcasts van HCC!genealogie heeft bekeken en de smaak te pakken heeft kunt u bijvoorbeeld eens kijken in het overzicht van Upcoming webinars van Legacy Family Tree. De presentaties gaan over diverse genealogische onderwerpen, veelal om 8 of 9 ‘s avonds (Nederlandse tijd) en zijn in het Engels. Voor de oplettende lezer: er staat ook een Nederlandse spreker tussen!

19 november 2014

Over auteursrecht en licenties (het is niet eng)

Met het nieuws dat de commerciële genealogische dienstverlener MyHeritage nog actiever wordt in Nederland zie je her en der berichten van mensen die bang zijn dat gegevens “gejat” en commercieel uitgebuit zullen worden, want in de voorwaarden staat zoiets als:

Door inhoud op de Website te publiceren, verleent u ons een royalty-vrije, wereldwijde, eeuwigdurende en niet exclusieve licentie om de inhoud te hosten, te kopiëren, te publiceren en te distribueren.

Graag leg ik u uit waarom dergelijke passages in voorwaarden van dienstverleners nu eenmaal moeten en dat het niet eng is.


Door de bomen het bos zien …
Säfsen/Zweden, 18 augustus 2014 (door Bob Coret)

Waarom een licentie verlenen?

De foto hierboven is door mij persoonlijk gemaakt, ik heb hiermee automatisch het auteursrecht (in het Engels copyright) op dit creatieve werk. Het betekent dat ik het alleenrecht heb om het beschermde werk (de foto) openbaar te maken en het alleenrecht heb om het te verveelvoudigen (lees: te publiceren). U mag bovenstaande foto dus niet zo maar op uw website plaatsen of gebruiken in uw boek!

Nu moet u weten dat deze webblog technisch mogelijk wordt gemaakt door Blogger van Google. Via Blogger kan ik teksten en afbeeldingen makkelijk op Internet plaatsen. Maar de dienstverlener mag niet zo maar auteursrechtelijk beschermd materiaal publiceren. Hiervoor dien je als rechthebbende toestemming te geven. Dit doet Google via haar servicevoorwaarden, waar te lezen valt:

Wanneer u inhoud uploadt naar, toevoegt aan, opslaat in, verzendt naar of ontvangt in of via onze Services, verleent u Google (en degenen met wie we samenwerken) een wereldwijde licentie om dergelijke inhoud te gebruiken, te hosten, op te slaan, te reproduceren, aan te passen, afgeleide werken daarvan te maken (zoals afgeleide werken als gevolg van vertalingen, aanpassingen of andere wijzigingen die we aanbrengen om ervoor te zorgen dat uw inhoud beter werkt met onze Services), te communiceren, te publiceren, openbaar uit te voeren, openbaar weer te geven en te distribueren. De rechten die u verleent in deze licentie, zijn bedoeld voor het beperkte doel om onze Services uit te voeren, te promoten en te verbeteren en om nieuwe Services te ontwikkelen.

Ik heb het auteursrecht op bovenstaande foto (en dit artikel) maar geef door het accepteren van de servicevoorwaarden Google dus toestemming aan Google om het te publiceren - dat is ook wat ik wil - en Google mag het niet publiceren zonder een dergelijke licentie!

Terug naar de voorwaarden uit de inleiding die afkomstig zijn van MyHeritage. Onderdeel van de dienst van MyHeritage is het publiceren van genealogische gegevens en afbeeldingen. Omdat u als stamboomonderzoeker het auteursrecht heeft op de stamboom (alhoewel je dit volgens jurist Arnoud Engelfriet niet zo maar kan zeggen) moet u MyHeritage (of andere genealogische dienst) een licentie verstrekken door het accepteren van de voorwaarden, anders mogen ze simpelweg uw gegevens niet publiceren en als gebruiker van een dergelijke dienst wilt u dit wel!

Blijf ik de eigenaar?

Dat er überhaupt wordt geciteerd uit voorwaarden (de kleine lettertjes, of in het Engels terms of service) in discussies is goed, dit soort juridische documenten zijn nu eenmaal belangrijk omdat het de rechten en plichten beschrijft. Wat alleen jammer is dat, of de tekst niet goed wordt begrepen en uitgelegd (vandaar bovenstaande uitleg over licenties), of dat er selectief wordt gelezen of geciteerd uit de voorwaarden.

Zo staat er in de voorwaarden van Google boven de hierboven geciteerde paragraaf de volgende regel:

U behoudt alle intellectuele-eigendomsrechten die u met betrekking tot die inhoud heeft. Kort gezegd: wat van u is, blijft van u.

En in de service voorwaarden van MyHeritage is ook te lezen:

Inhoud die op familiesites gepubliceerd wordt is eigendom van de persoon die de inhoud heeft gecreëerd, wordt gecontroleerd door de Webmaster van de familiesite waarop hij ingezonden is, en wordt door ons gehost volgens de voorwaarden van deze Overeenkomst.

Als u een licentie geeft om te publiceren doet dit niets af aan wie de eigenaar is, bovenstaande zinnen benadrukken dit nogmaals. Dus nogmaals: Blogger wordt niet de eigenaar van de foto (en dit artikel) en MyHeritage wordt niet de eigenaar van de geüploade stambomen en afbeeldingen!

Gebruik de Creative Commons licentie

Het geven van een licentie op een beschermd werk kan ook op een andere manier, de zogenaamde Creative Commons licentie.

Ook met een Creative Commons licentie behoudt u al uw rechten, maar geeft u aan anderen (proactief) toestemming om uw werk te verspreiden, met anderen te delen of bij sommige licenties ook om het werk te bewerken.

Op deze blog is een Creative Commons Naamsvermelding-NietCommercieel-GelijkDelen Creative Commons Licenselicentie van toepassing. Dit betekent (in het kort) dat het u vrij staat deze tekst (en foto!) te kopiëren, te verspreiden en te bewerken onder de voorwaarde van naamsvermelding, dat het niet commercieel wordt gebruikt (dus een krant of tijdschrift mag het niet zo maar publiceren) en dat als het werk geremixt of veranderd wordt het nieuwe werk onder dezelfde licentie beschikbaar moet worden gesteld.

Ik doe dit bewust en weloverwogen! Als auteur wil ik graag dat anderen mijn werk delen en gebruiken, zodat het werk, met mijn naam als auteur, meer mensen bereikt en ik daardoor meer kennis krijg door de feedback en "doorontwikkelingen" op het werk.

Tja, en lees in de voorgaande zin in plaats van "werk" nu eens “stamboom”...

Willen we als stamboomonderzoekers niet graag dat veel mensen de stamboom kunnen bekijken, we er feedback over krijgen en als er gegevens worden overgenomen een bronvermelding wordt gebruikt? Wordt het niet eens tijd dat we Creative Commons licenties bij onze stambomen plaatsen als we publiceren?

09 oktober 2014

De kracht van zoeken op naam varianten

Als genealoog weet je dat namen – voornamen en familienamen – op verschillende wijzen geschreven kunnen worden. Dit betekent dat bij het zoeken via zoekmachines ook de naam varianten meegenomen moeten worden.

Er zal eerst gekeken moeten worden wat een zoek­machine kan: is het alleen zoeken op exact voorkomen van de naam of is er ook een mogelijk­heid om op synoniemen te zoeken (controleer welke dit zijn!) of nog beter, kun je ook fonetisch zoeken?

Open Archieven biedt de mogelijkheid om fonetisch te zoeken door het ~ teken op te nemen voor de naam in de zoekopdracht. Een zoektocht op ~Zoodsma levert bijvoorbeeld resultaten op met de namen Zosma, Jousma en Cosma. Het levert dus een verbreding op van de zoekopdracht, vooral in combinatie met andere zoektermen is dit nuttig.

Bij Open Archieven wordt er ook automatisch doorgezocht naar gerelateerde akten. Ook hier wordt rekening gehouden met naam varianten. Hieronder een mooi voorbeeld: een geboorteakte die automatisch gelinkt is (ter herkennen aan het oranje paperclipje) met de overlijdensakte. Het feit dat Hillegonda Petronella Louisa bij geboorte Janschen (met sch) heette en bij overlijden Janssen (met dubbel s) is voor Open Archieven geen probleem om de aktes te koppelen.

image

Ook de functie die bij de ouders alle gebeurtenissen van hun kinderen toont (op te roepen door te klikken op het = symbooltje) gebruikt de fonetisch zoekwijze zoals hieronder wordt getoond.

image

Opvallend in de opsomming van kinderen is dat het eerste kind een andere familienaam heeft dan het tweede kind. Als je echter de scan van de doopakte van Bartholomina Claudina Maria Schmidt bekijkt dan lijkt het om een indexeringsfout te gaan. Het mooie van fonetisch en slim zoeken op basis van de naam van de ouders is dat je deze dochter met andere achternaam toch vindt.

Een onderzoeker kan echter niet blind vertrouwen op de zoekresultaten en onderliggende techniek. Bij de overlijdensakte van Hillegonda wordt bijvoorbeeld noch de geboorteakte gevonden noch de doopakte van haar zusje.

image

Reden voor het niet vinden van de akten is dat de vader in deze akte een extra naam heeft (Marinus). Op dit moment vindt de zoekmachine van Open Archieven Bartholomeus Johan wel genoeg lijken op Bartolomeus Marinus Johan, maar niet andersom.

Het koppelen van aktes en fonetisch zoeken zijn standaard functies van Open Archieven.

11 juli 2014

Help mee met het op naam doorzoekbaar maken

Een tweetal mooie genea­logi­sche bron vormen de gezins­kaarten en woning­kaarten. Via Open Archieven kunt u helpen deze bronnen te indexeren zodat ze doorzoekbaar worden op naam.

Gezinskaarten Delft

De gezinskaarten maken onderdeel uit van het bevolkingsregister. De gezinskaarten zijn een rijke bron aan informatie. Naast familienaam en voornamen staat er per persoon het geslacht, de “positie” in het gezin, geboorteplaats en -datum, burgerlijke staat en de godsdienst.

image

Archief Delft toont de gezinskaarten van de periode 1909 tot en met 1938 gratis via de Digitale Stamboom Delft. De series zijn doorbladerbaar en geordend op de naam van het hoofd van het gezin, dus nog niet doorzoekbaar op naam...

Woningkaarten Nijmegen

Waar de gezinskaarten uitgaan van het gezin, gaan de woningkaarten uit van adressen. Van elk adres in Nijmegen in de periode 1920 tot en met 1946 is een kaart met de bewoners beschikbaar. Veelal staat er alleen een opsomming van namen en voornamen. Soms is er meer informatie opgenomen zoals geboortedatum en –plaats en beroep, maar dit zijn uitzonderingen. Dat het adres op de kaart staat  maakt een boel goed. Het geeft antwoord op de intrigerende vraag: waar woonden onze voorouders?

image

Regionaal Archief Nijmegen maakt de woningkaarten gratis beschikbaar via hun Digitale Studiezaal. Ze zijn hier geordend op adres, dus nog niet doorzoekbaar op naam...

Doorzoekbaar maken op naam

Om bovengenoemde bronnen te doorzoeken heeft u nu veel geduld en geluk nodig. Zou het niet fijn zijn als deze bronnen gewoon op naam doorzoekbaar zouden zijn?

Om dit te bereiken moeten de kaarten geïndexeerd worden. Dus van elke kaart dient elke regel informatie digitaal gemaakt te worden.

Open Archieven heeft hiervoor een laagdrempelig systeem opgezet waardoor u kunt meehelpen om deze bronnen te doorzoekbaar te maken.

U start door één van de indexeringsprojecten te selecteren. U krijgt nu een willekeurige kaart te zien, u kunt deze vergroten en verkleinen. Boven de kaart staan invoer regels waar u de informatie in kunt zetten. Een extra invoerregel krijgt u via de knop ‘Extra regel’. Bent u klaar met het invullen van alle regels informatie klikt u op ‘Opslaan’ en krijgt u weer een nieuwe kaart voorgeschoteld.

De invulinstructie geeft u aanwijzingen voor het indexeren en ook tips om snel via het toetsenbord te werken.

image

Om de kwaliteit van de uiteindelijke index te borgen wordt elke kaart minimaal 2 maal geïndexeerd. Als er 2 maal dezelfde informatie is ingevoerd - door verschillende personen - dan is de invoer goed. Immers, de kans dat 2 personen dezelfde fout maken is zeer klein.

Probeer ook eens om enkele kaarten te indexeren!