30 december 2014

Genealogische webinars

image

Op 10 december 2014 verzorgde het HCC!genealogie haar eerste 2 webinars! Live kon er meegekeken worden naar de presentaties van Cor van Rooij  (Kennismaking met genealogie) en John Glaser (Internet als bron voor genealogie). Ik keek mee en doe verslag van de technische kant van het verhaal.

Wat is een webinar?

Wikipedia geeft de volgende definitie van een webinar:

Een online seminar of webinar is een lezing, workshop, college of soortgelijke presentatie of vorm van kennisoverdracht die plaatsvindt via het internet. Het neologisme "webinar" is een portmanteau(woordcombinatie) van de woorden "web" (dat wil zeggen world wide web) en "seminar". Deelnemers kunnen het seminar rechtstreeks op hun eigen computer volgen en de spreker(s) zien en horen.

Dus terwijl Cor, John en publiek fysiek in Kunstengebouw Cultura in Ede waren konden geïnteresseerden thuis via Internet meekijken. Voor het bekijken van imagede het webinar moest eerst (eenmalig en gratis) software geïnstalleerd worden van GoToMeeting. Op zich geen grote drempel, maar tegenwoordig zijn er voldoende alternatieve die puur webgebaseerd zijn en waar dus geen software voor geïnstalleerd hoeft te worden.

image

De software maakt het mogelijk om de grootte van de twee schermen (één met de live video en één met de bijbehorende presentatie) te verkleinen en te vergroten. Helaas was deze mogelijkheid er bij de presentatie van John niet, daar was alleen de presentatie zichtbaar (maar dit komt goed, lees maar verder).

Er hebben 30 personen live naar beide webinars gekeken. Alhoewel dit geen grote aantallen zijn is dit slechts het begin. Want de opnames van de twee webinars zijn nu ook online te bekijken:

De afspeelmogelijkheid wordt geboden door de HCC!seniorenacademie en is gratis voor alle kijkers. Hier heb je verder geen extra software voor nodig om te kijken, alleen een browser. Je ziet in de weergave links de video (ja, ook van John!) en rechts de presentaties (die overigens ook te downloaden zijn).

image

Online video

Ik schreef al in 2007 (Genealogie TV) over de mogelijkheden van online video en riep in 2008 (Stamboom TV) de genealogische verenigingen op om er mee aan de slag te gaan. Anno 2014 kan er denk ik wel iets aan toegevoegd worden: interactie!

Want de webinars van HCC!genealogie waren erg eenrichtingsverkeer (terwijl de software meer mogelijkheden biedt) en je dus eigenlijk van een webcast moet spreken. Het verschil tussen een webinar en een webcast is dat er bij een webcast ook fysiek publiek aanwezig is. Een webinar is een seminar met uitsluitend online publiek. Interactieve webinars daarentegen maken contact over en weer mogelijk, waardoor deelnemers door middel van vraag-en-antwoordsessies kunnen participeren.

Volgende webinars

Als u webcasts van HCC!genealogie heeft bekeken en de smaak te pakken heeft kunt u bijvoorbeeld eens kijken in het overzicht van Upcoming webinars van Legacy Family Tree. De presentaties gaan over diverse genealogische onderwerpen, veelal om 8 of 9 ‘s avonds (Nederlandse tijd) en zijn in het Engels. Voor de oplettende lezer: er staat ook een Nederlandse spreker tussen!

19 november 2014

Over auteursrecht en licenties (het is niet eng)

Met het nieuws dat de commerciële genealogische dienstverlener MyHeritage nog actiever wordt in Nederland zie je her en der berichten van mensen die bang zijn dat gegevens “gejat” en commercieel uitgebuit zullen worden, want in de voorwaarden staat zoiets als:

Door inhoud op de Website te publiceren, verleent u ons een royalty-vrije, wereldwijde, eeuwigdurende en niet exclusieve licentie om de inhoud te hosten, te kopiëren, te publiceren en te distribueren.

Graag leg ik u uit waarom dergelijke passages in voorwaarden van dienstverleners nu eenmaal moeten en dat het niet eng is.


Door de bomen het bos zien …
Säfsen/Zweden, 18 augustus 2014 (door Bob Coret)

Waarom een licentie verlenen?

De foto hierboven is door mij persoonlijk gemaakt, ik heb hiermee automatisch het auteursrecht (in het Engels copyright) op dit creatieve werk. Het betekent dat ik het alleenrecht heb om het beschermde werk (de foto) openbaar te maken en het alleenrecht heb om het te verveelvoudigen (lees: te publiceren). U mag bovenstaande foto dus niet zo maar op uw website plaatsen of gebruiken in uw boek!

Nu moet u weten dat deze webblog technisch mogelijk wordt gemaakt door Blogger van Google. Via Blogger kan ik teksten en afbeeldingen makkelijk op Internet plaatsen. Maar de dienstverlener mag niet zo maar auteursrechtelijk beschermd materiaal publiceren. Hiervoor dien je als rechthebbende toestemming te geven. Dit doet Google via haar servicevoorwaarden, waar te lezen valt:

Wanneer u inhoud uploadt naar, toevoegt aan, opslaat in, verzendt naar of ontvangt in of via onze Services, verleent u Google (en degenen met wie we samenwerken) een wereldwijde licentie om dergelijke inhoud te gebruiken, te hosten, op te slaan, te reproduceren, aan te passen, afgeleide werken daarvan te maken (zoals afgeleide werken als gevolg van vertalingen, aanpassingen of andere wijzigingen die we aanbrengen om ervoor te zorgen dat uw inhoud beter werkt met onze Services), te communiceren, te publiceren, openbaar uit te voeren, openbaar weer te geven en te distribueren. De rechten die u verleent in deze licentie, zijn bedoeld voor het beperkte doel om onze Services uit te voeren, te promoten en te verbeteren en om nieuwe Services te ontwikkelen.

Ik heb het auteursrecht op bovenstaande foto (en dit artikel) maar geef door het accepteren van de servicevoorwaarden Google dus toestemming aan Google om het te publiceren - dat is ook wat ik wil - en Google mag het niet publiceren zonder een dergelijke licentie!

Terug naar de voorwaarden uit de inleiding die afkomstig zijn van MyHeritage. Onderdeel van de dienst van MyHeritage is het publiceren van genealogische gegevens en afbeeldingen. Omdat u als stamboomonderzoeker het auteursrecht heeft op de stamboom (alhoewel je dit volgens jurist Arnoud Engelfriet niet zo maar kan zeggen) moet u MyHeritage (of andere genealogische dienst) een licentie verstrekken door het accepteren van de voorwaarden, anders mogen ze simpelweg uw gegevens niet publiceren en als gebruiker van een dergelijke dienst wilt u dit wel!

Blijf ik de eigenaar?

Dat er überhaupt wordt geciteerd uit voorwaarden (de kleine lettertjes, of in het Engels terms of service) in discussies is goed, dit soort juridische documenten zijn nu eenmaal belangrijk omdat het de rechten en plichten beschrijft. Wat alleen jammer is dat, of de tekst niet goed wordt begrepen en uitgelegd (vandaar bovenstaande uitleg over licenties), of dat er selectief wordt gelezen of geciteerd uit de voorwaarden.

Zo staat er in de voorwaarden van Google boven de hierboven geciteerde paragraaf de volgende regel:

U behoudt alle intellectuele-eigendomsrechten die u met betrekking tot die inhoud heeft. Kort gezegd: wat van u is, blijft van u.

En in de service voorwaarden van MyHeritage is ook te lezen:

Inhoud die op familiesites gepubliceerd wordt is eigendom van de persoon die de inhoud heeft gecreëerd, wordt gecontroleerd door de Webmaster van de familiesite waarop hij ingezonden is, en wordt door ons gehost volgens de voorwaarden van deze Overeenkomst.

Als u een licentie geeft om te publiceren doet dit niets af aan wie de eigenaar is, bovenstaande zinnen benadrukken dit nogmaals. Dus nogmaals: Blogger wordt niet de eigenaar van de foto (en dit artikel) en MyHeritage wordt niet de eigenaar van de geüploade stambomen en afbeeldingen!

Gebruik de Creative Commons licentie

Het geven van een licentie op een beschermd werk kan ook op een andere manier, de zogenaamde Creative Commons licentie.

Ook met een Creative Commons licentie behoudt u al uw rechten, maar geeft u aan anderen (proactief) toestemming om uw werk te verspreiden, met anderen te delen of bij sommige licenties ook om het werk te bewerken.

Op deze blog is een Creative Commons Naamsvermelding-NietCommercieel-GelijkDelen Creative Commons Licenselicentie van toepassing. Dit betekent (in het kort) dat het u vrij staat deze tekst (en foto!) te kopiëren, te verspreiden en te bewerken onder de voorwaarde van naamsvermelding, dat het niet commercieel wordt gebruikt (dus een krant of tijdschrift mag het niet zo maar publiceren) en dat als het werk geremixt of veranderd wordt het nieuwe werk onder dezelfde licentie beschikbaar moet worden gesteld.

Ik doe dit bewust en weloverwogen! Als auteur wil ik graag dat anderen mijn werk delen en gebruiken, zodat het werk, met mijn naam als auteur, meer mensen bereikt en ik daardoor meer kennis krijg door de feedback en "doorontwikkelingen" op het werk.

Tja, en lees in de voorgaande zin in plaats van "werk" nu eens “stamboom”...

Willen we als stamboomonderzoekers niet graag dat veel mensen de stamboom kunnen bekijken, we er feedback over krijgen en als er gegevens worden overgenomen een bronvermelding wordt gebruikt? Wordt het niet eens tijd dat we Creative Commons licenties bij onze stambomen plaatsen als we publiceren?

09 oktober 2014

De kracht van zoeken op naam varianten

Als genealoog weet je dat namen – voornamen en familienamen – op verschillende wijzen geschreven kunnen worden. Dit betekent dat bij het zoeken via zoekmachines ook de naam varianten meegenomen moeten worden.

Er zal eerst gekeken moeten worden wat een zoek­machine kan: is het alleen zoeken op exact voorkomen van de naam of is er ook een mogelijk­heid om op synoniemen te zoeken (controleer welke dit zijn!) of nog beter, kun je ook fonetisch zoeken?

Open Archieven biedt de mogelijkheid om fonetisch te zoeken door het ~ teken op te nemen voor de naam in de zoekopdracht. Een zoektocht op ~Zoodsma levert bijvoorbeeld resultaten op met de namen Zosma, Jousma en Cosma. Het levert dus een verbreding op van de zoekopdracht, vooral in combinatie met andere zoektermen is dit nuttig.

Bij Open Archieven wordt er ook automatisch doorgezocht naar gerelateerde akten. Ook hier wordt rekening gehouden met naam varianten. Hieronder een mooi voorbeeld: een geboorteakte die automatisch gelinkt is (ter herkennen aan het oranje paperclipje) met de overlijdensakte. Het feit dat Hillegonda Petronella Louisa bij geboorte Janschen (met sch) heette en bij overlijden Janssen (met dubbel s) is voor Open Archieven geen probleem om de aktes te koppelen.

image

Ook de functie die bij de ouders alle gebeurtenissen van hun kinderen toont (op te roepen door te klikken op het = symbooltje) gebruikt de fonetisch zoekwijze zoals hieronder wordt getoond.

image

Opvallend in de opsomming van kinderen is dat het eerste kind een andere familienaam heeft dan het tweede kind. Als je echter de scan van de doopakte van Bartholomina Claudina Maria Schmidt bekijkt dan lijkt het om een indexeringsfout te gaan. Het mooie van fonetisch en slim zoeken op basis van de naam van de ouders is dat je deze dochter met andere achternaam toch vindt.

Een onderzoeker kan echter niet blind vertrouwen op de zoekresultaten en onderliggende techniek. Bij de overlijdensakte van Hillegonda wordt bijvoorbeeld noch de geboorteakte gevonden noch de doopakte van haar zusje.

image

Reden voor het niet vinden van de akten is dat de vader in deze akte een extra naam heeft (Marinus). Op dit moment vindt de zoekmachine van Open Archieven Bartholomeus Johan wel genoeg lijken op Bartolomeus Marinus Johan, maar niet andersom.

Het koppelen van aktes en fonetisch zoeken zijn standaard functies van Open Archieven.

11 juli 2014

Help mee met het op naam doorzoekbaar maken

Een tweetal mooie genea­logi­sche bron vormen de gezins­kaarten en woning­kaarten. Via Open Archieven kunt u helpen deze bronnen te indexeren zodat ze doorzoekbaar worden op naam.

Gezinskaarten Delft

De gezinskaarten maken onderdeel uit van het bevolkingsregister. De gezinskaarten zijn een rijke bron aan informatie. Naast familienaam en voornamen staat er per persoon het geslacht, de “positie” in het gezin, geboorteplaats en -datum, burgerlijke staat en de godsdienst.

image

Archief Delft toont de gezinskaarten van de periode 1909 tot en met 1938 gratis via de Digitale Stamboom Delft. De series zijn doorbladerbaar en geordend op de naam van het hoofd van het gezin, dus nog niet doorzoekbaar op naam...

Woningkaarten Nijmegen

Waar de gezinskaarten uitgaan van het gezin, gaan de woningkaarten uit van adressen. Van elk adres in Nijmegen in de periode 1920 tot en met 1946 is een kaart met de bewoners beschikbaar. Veelal staat er alleen een opsomming van namen en voornamen. Soms is er meer informatie opgenomen zoals geboortedatum en –plaats en beroep, maar dit zijn uitzonderingen. Dat het adres op de kaart staat  maakt een boel goed. Het geeft antwoord op de intrigerende vraag: waar woonden onze voorouders?

image

Regionaal Archief Nijmegen maakt de woningkaarten gratis beschikbaar via hun Digitale Studiezaal. Ze zijn hier geordend op adres, dus nog niet doorzoekbaar op naam...

Doorzoekbaar maken op naam

Om bovengenoemde bronnen te doorzoeken heeft u nu veel geduld en geluk nodig. Zou het niet fijn zijn als deze bronnen gewoon op naam doorzoekbaar zouden zijn?

Om dit te bereiken moeten de kaarten geïndexeerd worden. Dus van elke kaart dient elke regel informatie digitaal gemaakt te worden.

Open Archieven heeft hiervoor een laagdrempelig systeem opgezet waardoor u kunt meehelpen om deze bronnen te doorzoekbaar te maken.

U start door één van de indexeringsprojecten te selecteren. U krijgt nu een willekeurige kaart te zien, u kunt deze vergroten en verkleinen. Boven de kaart staan invoer regels waar u de informatie in kunt zetten. Een extra invoerregel krijgt u via de knop ‘Extra regel’. Bent u klaar met het invullen van alle regels informatie klikt u op ‘Opslaan’ en krijgt u weer een nieuwe kaart voorgeschoteld.

De invulinstructie geeft u aanwijzingen voor het indexeren en ook tips om snel via het toetsenbord te werken.

image

Om de kwaliteit van de uiteindelijke index te borgen wordt elke kaart minimaal 2 maal geïndexeerd. Als er 2 maal dezelfde informatie is ingevoerd - door verschillende personen - dan is de invoer goed. Immers, de kans dat 2 personen dezelfde fout maken is zeer klein.

Probeer ook eens om enkele kaarten te indexeren!

02 mei 2014

Nieuwe versie van DrenLias nader bekeken

imageHet Drents Archief heeft deze week een beta versie van een nieuw DrenLias beschikbaar gesteld. Beta staat hierbij voor een in ontwikkeling zijnde versie. Het is dus niet de finale versie maar geeft een goede indruk en nodigt mij in ieder geval uit om een kritische blik te werpen en het Drents Archief (en andere archieven) van feedback te voorzien.

Responsive design
De melding dat de beta versie van het nieuwe DrenLias beschikbaar was via http://beta.drenlias.nl/ las ik via Twitter op mijn smartphone. Ik opende de website en had gelijk een goede eerste indruk, naast een rustige en moderne vormgeving, paste de website zich namelijk aan het kleinere scherm van mijn smartphone aan. Door deze zogenaamde responsive design kun je de website dus goed gebruiken op zowel smartphone, tablet als desktop computer. Bravo!

Op de akte pagina is het response design naar mijn smaak echter doorgeslagen. De informatie van de akten wordt in blokken getoond die worden gepositioneerd naar gelang er ruimte is. Hieronder een tweetal voorbeelden vandezelfde akte bij verschillende schermbreedtes.

image
image

Als gebruiker moet je dus steeds zoeken waar welke informatie staat en dit is ook nog eens afhankelijk van de breedte van het scherm.

Maar eigenlijk zit mijn ongenoegen dieper. De volgorde van de imageveldnaam-waarde blokken lijkt wel willekeurig alsof er geen relatie is tussen de blokken. Maar die relatie is er juist wel! Een huwelijksakte heeft een bruidspaar en beide echtelieden hebben ouders. Deze structuur kun je toch visualiseren ter ondersteuning van de gebruiker?
Nu wil het toeval dat ik een Franse gast had die ik de nieuwe website wilde laten zien. Maar helaas, net als de ‘oude’ DrenLias is de nieuwe versie alleen in het Nederlands beschikbaar.

Zoeken

De belangrijkste functie van de personen database DrenLias is natuurlijk zoeken.
image
Eerste vraag die ik hierbij heb is waar gaan we (op de startpagina) nu in zoeken? Net als de ‘oude’ Drenlias is er geen integrale zoekfunctie die in alle bronnen zoekt, er moet per ‘setje’ van bronnen gezocht worden.
Er is een verdeling in “Na 1800” en “1600-1811”. Aan de jaartallen in het zoekformulier te zien gaan we in de eerste zoeken. Echter, de “Na 1800” categorie is onderverdeeld in Burgerlijke Stand, Bevolkingsregister en Veenhuizen/Ommerschans (NB: nog niet alle bronnen zijn beschikbaar in de beta). Het zoeken via het zoekformulier op de homepage lijkt echter alleen de Burgerlijke Stand en Bevolkingsregister te doorzoeken (en dus niet de Signaleringskaarten). Dit zal voor veel gebruikers niet duidelijk zijn, waardoor gebruikers bepaalde gegevens wellicht niet zullen vinden.

Ik weet nog steeds niet precies waar in wordt gezocht. Een zoekactie via snelzoeken op familienaam Brans levert 72 resultaten. Zoek ik via Gespecificeerd zoeken op Brans dan krijg ik 127 resultaten. Zoek ik op de oude DrenLias (via Alle bestanden) dan krijg ik 138 resultaten. Tenslotte levert zoeken op WieWasWie met het Drents Archief als filter 133 persoonsvermeldingen met Brans op.

Verfijnen van de zoekopdracht

De nieuwe DrenLias heeft het specificeren van de zoekvraag in tweeën geknipt. Na de eerste ‘grove’ zoekactie kom je bij de zoekresultaten waar je de zoekvraag nader kunt specificeren:

image

Hier kun je bijvoorbeeld de zoekmethode voor naamsvarianten instellen. Van de bekende ‘Bevat’, ‘Begint met’, ‘Eindigt op’ en ‘Letterlijk’, tot het nieuwe ‘Initialen’ (heb ik nog niet elders gezien!) en ‘Leeg’ (waarom zou je zoekveld willen deactiveren?). Synomiemen of Klinkt als ontbreekt.

Een functie die de ‘oude’ DrenLias wel heeft en de nieuwe niet is ‘Zoeken op twee personen’. Dit is opvallend, de opstand van genealogen tegen deze omissie bij WieWasWie dreunt nog steeds na…

Wat je bij moderne zoekmachines verwacht zijn de filter mogelijkheden. Dus de zoekresultaten beperken op soort, plaats, rol en periode. De eerste indruk die ik kreeg was dat je alleen op Plaats kon filteren. Echter filteren op Soort staat helemaal boven aan de pagina (waarom niet in de Filter op: regel?). Volgens de helpteksten moet je ook kunnen filteren op Rol of Periode, maar die heb ik nog niet kunnen vinden.
Wellicht dat dit nog komt, er zitten nog wel meer kleine onvolkomenheden in de beta. Zo moet de aktelijst weer te geven zijn in tekst of lijst vorm, maar de links hebben geen effect. Voor het selecteren van alle akten wordt een printer icoontje gebruikt. En wil je printen dan krijg je de melding dat een afdruk bij het Drents Archief 10 eurocent kost, drukken op OK of Annuleren leidt beide tot het verdwijnen van het Print scherm.

image

Ook de scans werken op het moment van schrijven niet of langzaam. Maar dit heb ik eerder wel zien werken en dat zag er goed uit: een viewer die geen gebruikt maakt van Flash (dus op alle devices werkt) en ook bladeren door het register mogelijk maakt (mooi!). Het aanpassen van het contrast geeft alleen rare effecten.

Delen en feedback melden

image

Zoals je van een nieuwe website mag verwachten worden gebruikers uitgenodigd om fouten te melden, reacties te geven, de akte te delen via sociale media en de akte in te sluiten (embedden)  op de eigen website als een YouTube filmpje (zie voorbeeld hieronder, dat is geen plaatje maar ‘live’ van de DrenLias site).

Bij elke akte staat ook het Internet adres (dit staat ook in de adresbalk van de browser, maar ok). Het grappige hieraan is dat een deel van dit adres overbodig (en manipuleerbaar) is. De volgende adressen leiden alle naar dezelfde akte:
Hoogstwaarschijnlijk is de gedachte dat http://beta.drenlias.nl/akte/jantje-buiter/854790 een meer leesbaar en dus gebruikersvriendelijk adres is als http://beta.drenlias.nl/akte/854790. Tja.

Scans

Je kunt dus veel met de akten, dat is ook makkelijk gemaakt. Maar in wezen is DrenLias natuurlijk een webwinkel die scans verkoopt à € 1,- per stuk (excl. € 6,- administratiekosten en de portokosten). Je zou dus verwachten dat het aankoop proces is geoptimaliseerd. Het tegengestelde lijkt het geval. Als je een scans wilt kopen moet je handmatig een e-mailtje sturen, waarbij men op de help pagina schrijft (en ik citeer letterlijk) “Het is daarbij van belang dat u precies aangeeft van welke akte(n) u een kopie zou willen bestellen.” Onbegrijpelijk. Waarom niet bij elke akte simpelweg een Koop knop (in het gedeelte waar ook Delen, Insluiten en E-mail staat)? Denk als BOL.com!

GEDCOM

De akten kunnen ook gedownload worden in “GEDCOM” formaat. Waarom ik de aanhalingstekens gebruik valt te lezen in een eerder blog artikel: GEDCOM bestanden die niet aan de GEDCOM standaard voldoen mogen de naam GEDCOM niet dragen!

Beveiliging

Je mag anno 2014 van web bureaus verwachten dat zij de best practices op het gebied van beveiliging kennen en toepassen. Helaas X-Interactive heeft op dit terrein nog wat te leren.

Wanneer er persoonsgegevens ‘over de lijn’ gaan dan ben je bij wet verplicht deze goed te beveiligen. Een minimale beveiligingsmaatregel is om de communicatie tussen browser en server te versleutelen (https), zodat onbevoegden niet gegevens als e-mail en wachtwoord kunnen onderscheppen. Dat mist in de huidige beta.
Ook is het geen slim idee om wachtwoorden te tonen in e-mail (bij registratie en wachtwoord vergeten), zeker niet in combinatie met de gebruikersnaam (bij DrenLias het e-mail adres). Als iemand het e-mail onderschept of ziet op een scherm zijn in één klap beide gegevens bekend. Een wachtwoord moet je niet (plain-text) in een e-mail zetten! Of de wachtwoorden goed worden opgeslagen (dus minimaal als een gesalte hash) kan ik niet controleren.

Als je je wachtwoord vergeten bent kun je een nieuw wachtwoord aanvragen bij DrenLias. Helaas gaat het hier ook weer fout. Allereerst doordat in het e-mail die je ontvangt zowel gebruikersnaam als wachtwoord staat. Verder kan iedereen deze aanvraag om het wachtwoord te resetten aanvragen, je kunt dus anderen pesten door hun wachtwoord te resetten. Normaal krijg je via zo’n wachtwoord vergeten e-mail een link naar de website waar je een nieuw wachtwoord kunt invullen. Op deze manier blijft het oude wachtwoord geldig totdat een nieuwe wordt ingevoerd!

Een andere beginnersfout is de E-mail functie bij de akten. Deze is bedoeld om bekende te wijzen op een akte op DrenLias.

image

Er zijn echter geen drempels ingebouwd, zoals een Captcha. Als spammers deze functie ontdekken kunnen ze geheel geautomatiseerd, anoniem spam versturen naar een ieder. De e-mail bevat een DrenLias kop, maar de afzender en zender van de e-mail komen direct uit het formulier. Je kunt dus een mailtje sturen alsof het van de webmaster van DrenLias afkomstig is. Tenslotte lijkt er geen enkele filtering op de inhoud van de mail te worden toegepast (bijv. op Javascript!).

Op enkele plaatsen wordt de gebruikersinvoer niet goed ‘schoon gemaakt’ waardoor Cross Site Scripting mogelijk is en er technische fouten optreden die ook nog eens te veel informatie geven, bijvoorbeeld over Solr (de gebruikte zoektechnologie).

Tenslotte nog een positief puntje. Er is geen cookie-waarschuwing of cookie-melding. Dit is wettelijk verplicht, maar zo vervelend…. Of de cookie-melding bewust niet wordt getoond (burgerlijke ongehoorzaamheid!) of niet weet ik niet, maar ik vind deze omissie zeer gebruiksvriendelijk!

WieWasWie

Het Drents Archief is deelnemer in WieWasWie. De vraagt rijst dus waarom ze investeren in een nieuwe eigen website (en dus voor twee websites betalen). Ik vermoed dat dit deels te maken heeft met het feit dat het Drents Archief meerdere brontypen heeft zoals de Signalementskaarten en Bezaaide Landen, die WieWasWie (nog steeds) niet aankan.

Maar het blijft vreemd waarom er op DrenLias met geen enkel woord wordt gerept over WieWasWie. Een deel van de gegevens wordt immers op zowel Drenlias als WieWasWie getoond. Waarbij dan wel opgemerkt dient te worden dat bij akten op Drenlias wel een akte wordt getoond en WieWasWie niet (vergelijk bijvoorbeeld deze akte en deze akte).

Tenslotte

Aan (archief)organisaties die bezig zijn of gaan met een nieuwe website: huur naast een partij die ‘bouwt’ ook externe hulp in voor zowel (review op) ontwerp als ook testen!

23 april 2014

Wetenschappelijke onderzoeksprojecten relevant voor genealogie

De Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) stimuleert kwaliteit en vernieuwing in de wetenschap. Een drietal projecten die relevant zijn voor de genealogie, waaronder 2 uit het Continuous Access To Cultural Heritage (CATCH) programma, wil ik in dit artikel belichten.

LINKing System for historical family reconstruction (LINKS)

Het LINKS project, onder leiding van prof. dr. Kees Mandemakers (IISG), loopt al sinds 2009. In het blogartikel Genlias doorspitten om automatisch verbanden te leggen tussen voorouders schreef ik hier al over. Het project nadert zijn afronding.

Ik heb informeel al leuke resultaten gezien: een algoritme die (op een laptop) in enkele minuten de gehele “Genlias database” doorlicht om kwartierstaten uit de Burgerlijke Stand akten te construeren. Hierbij dient wel opgemerkt te worden dat het linken vooral bedoeld is voor het creëren van een dataset die gebruikt wordt voor onderzoek naar historische demografie en de sociale en economische geschiedenis.

Open ArchievenNB. Open Archieven legt reeds links tussen personen op basis van akten van de BS en DTB (voorbeeld) en geeft suggesties voor relevante akten (voorbeeld).

Mining Social Structures from Genealogical Data (MISS)

Het MISS project is een samenwerking tussen de universiteiten van Maastricht en Eindhoven en het Brabants Historisch Informatie Centrum (BHIC), onder leiding van dr. Karl Tuyls.

Dit project werkt aan het afleiden van identiteiten van personen en sociale structuren vanuit grote collecties genealogische data. Hiertoe onderzoeken ze de toepassing van een combinatie van data mining, machine learning en human computation technieken.

Ik heb zitting in de gebruikerscommissie van het MISS project. Deze gebruikerscommissie waakt ervoor dat de onderzoeker bij de uitvoering van zijn onderzoek het potentiële toepassingsaspect niet uit het oog verliest, voorziet projectleiders, projectuitvoerders en de programmacommissie van informatie, en ziet erop toe dat resultaten van het project goed benut worden.

Nature or Nurture? (VIDI)

Een team van de Universiteit Utrecht doet, onder leiding van prof. dr. Tine de Moor, onderzoek naar zaken als huwelijkspatronen, historische ouderenzorg, levensverwachting, et cetera. Daarbij wordt niet zo zeer gekeken naar het individu (wie trouwt met wie, wie wordt hoe oud?), maar wordt geprobeerd om op basis van grote hoeveelheden gegevens bepaalde patronen te ontdekken en te verklaren.

Voor dit onderzoek zijn veel genealogische gegevens nodig. Om het onderzoeksteam hierin te ondersteunen roept Genealogie Online haar gebruikers op om hun GEDCOM bestanden te delen met de wetenschap!

Genealogie voor wetenschap

Onder de titel Genealogie voor wetenschap zijn er door Genealogie Online voorwaarden gesteld waaraan wetenschappelijke organisaties die gebruik willen maken van de genealogische gegeven op Genealogie Online moeten voldoen. Eén van de belangrijkste voorwaarden is dat Genealogie Online het GEDCOM bestand van een stamboomonderzoeker alleen ter beschikking stelt als de stamboomonderzoeker hier uitdrukkelijk toestemming voor heeft gegeven.

Universiteit Utrecht is de eerste wetenschappelijke organisatie waar Genealogie Online een overeenkomst mee heeft gesloten.

Alhoewel wetenschappelijk onderzoek vaak niet “consument-klare” producten oplevert specifiek voor genealogen, denk ik wel dat deze onderzoeken de genealogie ten goede komen. Zowel in de verkregen inzichten in historische demografie, kwaliteitstoetsing en methodieken die stamboomprogramma’s kunnen adopteren.

Mag uw GEDCOM bestand gebruikt worden voor genealogisch onderzoek?

14 maart 2014

Familie in Beeld

Sinds 14 maart ligt de nieuwste uitgave van Familie in Beeld, een tijdschrift over familiegeschiedenis en stamboomonderzoek, in de winkel. Het is alweer de 4e uitgave van hoofdredacteur en uitgever Wim Kros.
image
Uw stamboom uitzoeken, dàt is één. Maar er is iets moois van te maken, dat is twee… en daar gaat het bij ‘Familie in Beeld’ om.

Naast uiteenlopende informatie over het stamboomonderzoek zelf laat het blad een nieuwe manier zien om uw familiegeschiedenis vast te leggen. Er staan veel ideeën, tips, technieken en werkbeschrijvingen in om al uw stamboomgegevens in combinatie met (oude) familiefoto’s, documenten, knipsels en teksten te verwerken tot een rijk gedocumenteerd kwartierstaat-album. Waardevol voor u zelf, maar zeker ook voor uw nageslacht!

Bij het maken van zo’n kwartierstaat-album wordt uitgegaan van het royale A3-formaat, waarop prachtige lay-outs gemaakt kunnen worden. In elke uitgave van ‘Familie in Beeld’ zitten zogenaamde knipvellen, waarmee u uw eigen album lay-outs kunt illustreren, en een uitneembare A3-poster om zelf in te vullen, met daarop bijvoorbeeld een gezinsblad, sierkwartierstaat in de vorm van een stamboom, een kwartierstaatschema, enzovoort.

Het tijdschrift verschijnt 4 keer per jaar, kost € 5,95 en is te koop (of te bestellen als het uitverkocht is) bij de goed gesorteerde tijdschriftenwinkel.

Warm aanbevolen.

image

07 maart 2014

De spelregels bij cultureel ondernemerschap

Vanaf 1 mei biedt het innovatieve Archief Eemland de website Het bewaren waard, waarmee het een economische activiteit ontplooit. Alhoewel de overheid cultureel ondernemerschap stimuleert,  heb ik - als ondernemer - een dubbel gevoel bij het Amersfoortse initiatief.

Waar is de vernieuwing?

De website Het bewaren waard biedt Amers-foorters de mogelijkheid om hun verzameling (historische) foto's en andere waardevolle documenten uit de ‘schoenendoos’ online te delen met andere Amersfoorters.

Dit concept is niet echt ‘verrassend digitaal’ te noemen. Het online plaatsen van je foto’s kan bijvoorbeeld via de website Flickr, inclusief reageer functionaliteit.

Familie ArchivarisEen website die meer gericht is op familie- geschiedenis is Familie Archivaris. Ook hier kun je foto’s/scans en verhalen kwijt in een (besloten) digitaal archief. De ‘familie archivaris’ kan familieleden uit nodigen om te participeren in het familiearchief: zij kunnen het familiearchief inzien, vullen met materiaal, verhalen schrijven bij materiaal en commentaar toevoegen!

Het door Archief Eemland gehanteerde beeld van de schoenendoos toont grote gelijkenis met het product Shoebox van Ancestry.com. Shoebox is een app voor de smartphone om het materiaal uit de ‘schoenendoos’ in de stamboom te krijgen.

Core business van het archief

Een unique selling point waar Archief Eemland mee schermt is dat het materiaal gelijk veilig bewaard wordt voor de toekomst. En dan worden niet alleen de digitale representaties bedoeld.

Tijdens het congres van de Koninklijke Vereniging van Archivarissen in Nederland (KVAN) in 2012 werd het project al gepresenteerd, toen nog onder de werktitel Publieksarchieven.nl. Wat mij van deze presentatie is bijgebleven, is vooral het aspect van het fysiek opslaan van de archieven van particulieren.

Bij de presentatie van Het Bewaren Waard komt dit aspect er nog wat bekaaid af. Pas na uitleg over het digitaal krijgen van het materiaal  en het delen van het materiaal, wordt er kort melding gemaakt dat er een fysieke schoenendoos aange-vraagd kan worden voor opslag in het nieuwe depot van Archief Eemland.

Voorwaarde voor de fysieke opslag van familie-archieven (dat op zich ook al op meerdere plekken mogelijk is, een goede bron hiervoor is http://www.familiearchieven.nl/) is dat het materiaal eerst is ge-upload, beschreven en openbaar moet zijn gemaakt. Deze voorwaarden maakt het opnemen van het materiaal in de collectie van Archief Eemland een stuk gemakkelijker. Hier zit het stukje vernieuwing in.

Financiering van het project

Archief Eemland probeert met deze nieuwe dienst meer historisch Amersfoorts materiaal te acquireren. Hun taak - beheren en vindbaar maken van archieven en collecties - vatten ze met Het bewaren waard ruim op.

Alhoewel het concept dus niet heel vernieuwend is heeft Archief Eemland toch vele fondsen kunnen overtuigen om een financiële bijdrage te doen in de ontwikkeling van de nieuwe dienst: Mondriaan Fonds, VSBfonds, Prins Bernard Cultuurfonds, AmersfoortBreed, BNG Cultuurfonds en kfHein Fonds.

Archief Eemland gaat commercieel

De aanleiding voor deze blog-posting was het nieuwsbericht dat Het Bewaren Waard het freemium model gaat hanteren. Het freemium model is een populair bedrijfmodel, Genealogie Online en het Stamboom Forum hanteren ook dit model.

Het woord freemium is een combinatie de 2 woorden: free (=gratis) en premium (=hoogwaardig). Bij dit model bied je een deel van de dienst/product gratis aan en moeten gebruikers voor extra’s betalen. Het opslaan van foto’s en video’s is bij Het bewaren waard gratis tot 1 GB, daarboven zal er een abonnement genomen moeten worden.

Deze vorm van cultureel ondernemen door een publieke instelling doet bij mij vraagtekens rijzen.

Ondernemers, die in de meeste gevallen geen beroep kunnen doen op financiële bijdragen van fondsen of subsidies en dus zelf moeten investeren (en risico nemen), zien nu een overheidsorganisatie als concurrent op het toneel verschijnen.

Let wel, concurrentie is op zich goed! Het houdt partijen scherp, ze moeten een goed product tegen een goede prijs leveren om klant te krijgen en te behouden.

Een culturele instelling als het Archief Eemland kan echter risicoloos (op basis van eigen inbreng, dus publiek geld, en fondsen) een product maken en biedt de basis dan ook nog eens gratis aan. Waar een ondernemer voor bepaalde onder-steuning iemand moet inhuren maakt Archief Eemland een medewerker vrij (dus publiek geld!) om te ondersteunen bij het scannen en uploaden.

Wet Markt en Overheid geeft gedragregels

Sinds 1 juli 2012 is de Wet Markt en Overheid van kracht. Het doel van deze wet is om oneerlijke
concurrentie door overheidsorganisaties met marktpartijen te voorkomen en om zo een gelijkwaardig speelveld te creëren.

Het in concurrentie treden met marktpartijen wordt in deze wet als economische activiteit geduid. Als sprake is van economische activi- teiten, dan moeten de integrale kosten van deze producten en diensten worden doorberekend aan de afnemers van deze producten en diensten.

Hoe past het freemium model van Het bewaren waard op de Wet Markt en Overheid?

De kosten voor de opslagruimte (waar Archief Eemland gewoon een factuur van Picturae voor krijgt) en ontwikkeling, beheer en onderhoud van de dienst (waar Archief Eemland gewoon facturen van Picturae en Zicht Online voor ontvangt) worden niet doorberekend aan de klanten.

Vanuit de publieke taak kan een archief een deel van de diensten gratis aanbieden, aan andere diensten hangt een prijskaartje. Maar met Het bewaren waard en de keuze voor freemium wordt er een markt betreden, waar voor een overheids-organisatie gedragsregels gelden.

03 februari 2014

De links die je vanuit akten kunt leggen

imageWanneer er op een archiefwebsite gegevens van een akte worden getoond dan zijn de namen binnen deze akte veelal links (web koppelingen), zodat er eenvoudig en snel naar die betreffende naam gezocht kan worden. Open Archieven laat zien dat akten aan veel diverse informatiebronnen gekoppeld kunnen worden en daarmee dus verrijkt kunnen worden.

Links naar zoekacties

Ook op Open Archieven worden de namen van de personen tot ‘zoekactie link’ gemaakt. Maar krachtiger zijn de ‘zoekactie links’ die bij de koppels worden getoond. Zoeken op twee personen is een veel gebruikte en gevraagde functie die je ook direct vanuit de akte kan aanbieden, daar worden immers bij diverse type akten relaties tussen personen getoond.

Hieronder een voorbeeld van een huwelijksakte, waar je met één klik op een ‘relatie harkje’ de ouders van bruidegom of bruid kunt zoeken (om zo de broers en zussen van bruid of bruidegom te vinden) of het bruidspaar kunt zoeken (om hun kinderen te vinden).

imageKlik op de afbeelding om de akte op Open Archieven te bekijken.

Veelal zijn de persoonsnamen in akten goed te identificeren omdat deze in een apart veld staan. Soms staan er ook namen in het opmerkingen veld. Zo kan er bijvoorbeeld melding gemaakt worden van een tweeling zus/broer. Open Archieven herkent de vermelding van tweelingen waardoor ook de naam in het opmerkingen veld tot een zoekactie gemaakt kan worden.

imageKlik op de afbeelding om de akte op Open Archieven te bekijken.

De zoekactie naar de tweeling zus/broer is echter niet puur een zoekactie op naam. De zoekactie kan slimmer gemaakt worden door informatie te gebruiken die in de akte voorhanden is, bijvoorbeeld het jaartal en de achternaam van de moeder. Een dergelijke slimme zoekactie levert in de meeste gevallen direct de gezochte tweeling zus/broer.

Links naar andere akten

De informatie over de ouders in de akten kan ook gebruikt worden ook meer informatie over de betreffende persoon te vinden. Wanneer bijvoorbeeld bij een overlijdensakte de ouders genoemd staan kan hiermee vaak ook de geboorte- en huwelijksakte gevonden worden. Open Archieven voert deze zoekactie on-the-fly uit en toont de resultaten als links naar de andere akten.

imageKlik op de afbeelding om de akte op Open Archieven te bekijken.

Dit principe van zoeken naar gerelateerde akten en dus personen kun je ook meerdere keren herhalen. Dit is was de ‘Links Explorer’ op Open Archieven doet. Na het klikken op het ‘Links Explorer’ icoontje (hier rechts afgebeeld) dan opent er een scherm en worden, vanuit de akte waar je bent, andere akten gezocht om op deze wijze een relatienetwerk van personen te tonen. Dit schema toont ouder-kind relaties met een (bloed)rode lijn en huwelijken met een oranje lijn.

imageKlik op de afbeelding om de akte op Open Archieven te bekijken, klik daarna op het Links Explorer icoontje.


De informatie die in akten wordt getoond kun je ook slim gebruiken om zoekacties in andere informatiebronnen uit te voeren.

Links naar biografieën

Met een naam en een geboortedatum/plaats of overlijdensdatum/plaats kun je via het Biografisch Portaal van Nederland opzoeken of er van een persoon een biografie bekend is. Open Archieven voert deze zoekactie automatisch uit zodat er onder de akte links naar biografieën getoond kunnen worden. Het voorbeeld hieronder is te zien onder de doopakte van Hendrik Constatijn Cras op Open Archieven.

imageKlik op de afbeelding om de akte op Open Archieven te bekijken.

Links naar grafzerken

Er zijn diverse websites die informatie bieden over grafzerken, zoals Graftombe.nl en Online-Begraafplaatsen.nl. Bij geboorte- en overlijdensakten doorzoekt Open Archieven deze bronnen. Wanneer er een link is te maken is wordt deze op de bekende wijze:

imageKlik op de afbeelding om de akte op Open Archieven te bekijken.

Links naar online stambomen

Bovenstaand voorbeeld laat ook zien dat Open Archieven de (hoofd)persoon van de akte opzoekt in online stambomen, specifiek Genealogie Online. Andersom geeft Genealogie Online hints omtrent scans van genealogische gebeurtenissen bij archieven via de Scans zoeken service.

Link naar het weer

Met de combinatie datum en plaatsnaam kan er in de Historische weerreeksen van het KNMI worden opgezocht of er metingen zijn. Als deze er zijn kan het weer op en rond de betreffende datum in grafiekvorm worden weergegeven.

imageKlik op de afbeelding om de akte op Open Archieven te bekijken, klik daarna op de datum 13 september 1746.

Link naar een kaart

Met name bevolkingsregisters bevatten ook straatnamen die interessant zijn. Een onderzoeker wil graag willen weten waar de betreffende straat lag. Open Archieven kent nu van Leiden en Rijnsburg een groot deel van de (historische) straatnemen en heeft van deze twee steden ook oude kaarten. Met deze informatie kan dan de betreffende straat (met een dikke oranje lijn) op de historische kaart weergegeven worden.

imageKlik op de afbeelding om de akte op Open Archieven te bekijken, klik daarna op de straatnaam Hogewoerd.

Link naar scan

Als een archief van bepaalde akten geen scan heeft betekent dit niet dat er geen scans zijn (zie ook Weet waar er online scans worden aangeboden!). Wanneer Open Archieven nieuwe open data opneemt van archiefinstellingen of particulieren (zie ook Open Archieven is op zoek naar uw bronbewerkingen en indexen) dan wordt er ook gekeken waar er scans beschikbaar zijn en of deze te koppelen zijn.

Zo worden er op Open Archieven scans van FamilySearch getoond bij akten van Regionaal Historisch Centrum Vecht en Venen, scans van GaHetNa bij akten van Groene Hart Archieven en scans van Van Papier Naar Digitaal bij akten van Regionaal Archief Alkmaar!

Verrijkte informatie tonen

Zoals in dit artikel is aangetoond hoeft een akte niet ‘kaal’ getoond. Veel aktes kunnen verrijkt worden met (links naar) een of meerdere informatiebronnen. Met deze verrijking wordt Open Archieven een nog fijner onderzoekshulpmiddel.

image


Over Open Archieven

Open Archieven is een initiatief van Bob Coret die de innoverende kracht van open data en services toont. De genealogische zoekmachine is beschikbaar in het Nederlands, Engels, Duits en Frans. Volg Open Archieven op Google+ of Twitter.

09 januari 2014

Van scan naar rijk informatie object

imageVeel archiefinstellingen bieden via hun website scans aan van akten. Aan de aflevering van deze gratis of betaalde scans wordt helaas geen aandacht besteed. Terwijl dit zo eenvoudig is te realiseren en zo waardevol is voor de ontvanger.

Mijn droom

Laat ik u meenemen in mijn droom hoe scans afgeleverd zouden kunnen worden.

De downloadlink op de archiefwebsite levert mij een gecomprimeerd (ZIP) bestand op. Als ik dubbelklik op dit bestand om de inhoud te bekijken wordt ik blij verrast.

Het ZIP bestand bevat een drietal bestanden, een JPG (de scan), een HTML bestand website en een GEDCOM bestand, allen met dezelfde naam. Spannend!

image

De scan

De naam van de bestanden is niet zo belangrijk, want in één oogopslag zie ik de document eigenschappen van de scan (ook wel meta-data genoemd, oftewel informatie over het bestand).

Ik zie gelijk dat het de scan betreft van de huwelijksakte van Joannes Coret en Adriana Catharina de Hoogh, afkomstig van het Regionaal Archief Tilburg. Deze informatie zit in de scan (het JPG bestand) verwerkt. Als ik het bestand dus deel met iemand anders, of zelf later het bestand wil terugzoeken, dan is de informatie nog steeds beschikbaar.

Het HTML bestand

Als ik op het 2e bestand klik, het HTML bestand, dan wordt mijn browser geopend en zie ik alle informatie van de akte, zoals dat ook op de website van het Regionaal Archief Tilburg stond bij deze akte.

De meeste onderzoekers zullen de informatie verwerken in het stamboomprogramma of publicatie in tekstverwerker. Het HTML bestand bevat ook een bronvermelding van de akte die zo gebruikt kan worden en een link naar archiefwebsite.

Het GEDCOM bestand

Het derde bestand bevat alle informatie die ook is te lezen in het HTML bestand, maar dan in het GEDCOM formaat dat door mijn stamboom- programma wordt begrepen. In één keer heb ik de informatie uit de akte in mijn stamboom-programma, inclusief nette bronvermelding!

Scan

Wat een mooi cadeau!

We zijn de gegaan van een ‘kale’ scan (die je moet inzien om te kijken wat het ook al weer was, en dan maar hopen dat je je aantekeningen hiervan nog kunt vinden of de originele website, en die je later nooit goed kunt terug vinden), naar een rijk informatie object.

Doordat de meta-data in de scan is verwerkt kan ik heel makkelijk de scan identificeren en zoeken. Ik hoef bestanden niet meer te hernoemen of te rubriceren in mapjes. Wil ik bijvoorbeeld de BS Huwelijksakten vinden dan kan ik deze via de Windows Verkenner met de zoekopdracht “labels:BSH” eenvoudig terugvinden.

Alle informatie staat in het HTML bestand, die heb ik dus ook later nog (zonder dat ik weer naar de archiefwebsite hoef te gaan) ter beschikking. Het verwerken van (een deel) van de informatie in mijn stamboomprogramma is door het valide GEDCOM bestand een fluitje van een cent.

Een technische uitdaging?

Techniek staat bovenstaande droom niet in de weg. Documenteigenschappen zijn een standaard functie van Windows. Niet alle bestanden kunnen extra informatie in zich bergen, maar bestanden als JPG (in EXIF formaat) en PDF bijvoorbeeld wel. De zoekfunctie van Windows kijkt ook in de documenteigenschappen.

Qua documenteigenschappen van scans stel ik het volgende voor:

  • Titel: type akte, datum en plaatsnaam
  • Onderwerp: hoofdpersonen in akte
  • Auteurs: naam van de archiefinstelling
  • Opmerkingen: (p)url van de akte
  • Labels: afkorting type akte, plaatsnaam

image

Alle informatie die wordt geboden is beschikbaar in het archiefsysteem (want wordt op de website getoond). De ‘download scan’ functie hoeft alleen maar de extra informatie in het JPG bestand erbij te zetten, de akte informatie in een HTML bestand te plaatsen, de akte informatie te vertalen naar GEDCOM en deze drie bestanden te comprimeren tot één ZIP bestand dat ‘met een strik’ afgeleverd kan worden.

Als ik dan om één ding mag vragen…

Bovenstaande droom hoeft niet gelijk volgende week volledig gerealiseerd te worden door de (leveranciers van de) archiefinstellingen. Maar ik hoop dat de archiefinstellingen de waarde van meta-data inzien en de meta-data in JPG (en PDF) bestanden gaan verwerken!