15 augustus 2010

Scans zoeken service in cijfers

Wat begon als een experiment met FamilySearch zoals beschreven in Zoek de scans bij mijn genealogische gegevens! is in de afgelopen weken gegroeid tot een omvangrijke service die ik via Genealogie Online kan bieden: Scans zoeken.

Om een indruk te geven van de omvang hierbij wat cijfers!

De 3.425 (van de 3.624) stambomen, parentelen en kwartierstaten die in GEDCOM zijn aangeleverd aan Genealogie Online geven informatie over in totaal 11.144.962 personen. De gegevens van deze personen (over gebeurtenissen als geboorte, huwelijk, overlijden/begrafenis) worden gehouden tegen het inventaris van 20 bronnen die digitale scans bieden. Dit gebeurt als iemand nieuwe gegevens toevoegt of zijn/haar gegevens bijwerkt.

De onderstaande tabel toont het aantal scans – over alle publicaties op Genealogie Online - dat is gevonden per bron/provincie. Klik op de kolomkoppen om te sorteren op de betreffende kolom.

BronProvincie

Scans

FamilySearch Gelderland 800298
FamilySearch Limburg 40734
FamilySearch Noord-Brabant 2553
FamilySearch Noord-Holland 329238
FamilySearch Overijssel 169692
FamilySearch Utrecht 330597
FamilySearch Zeeland 188651
FamilySearch Zuid-Holland 1280299
Gemeente Zederik Zuid-Holland 21354
Regionaal Archief West-Brabant Noord-Brabant 89178
Regionaal Archief Tilburg Noord-Brabant 252101
Alle Friezen Friesland 148357
Alle Groningers Groningen 296088
Historisch Centrum het Markiezenhof Noord-Brabant 36993
Streekarchief Bommelerwaard Gelderland 55569
Gemeentearchief Roosendaal Noord-Brabant 9599
Streekarchivariaat De Liemers en Doesburg Gelderland 527
Brabants Historisch Informatie Centrum Noord-Brabant 55664
Archief Almelo Overijssel 7700
Stadsarchief 's-Hertogenbosch Noord-Brabant 28096
Gemeentearchief Delft Zuid-Holland 31886
Gemeentearchief Schouwen-Duivenland (*1) Zeeland 5455
Gemeentearchief Hengelo (*1) Overijssel 6884
Drents Archief (*1) Drenthe 7596
Regionaal Historisch Centrum Eindhoven (*2) Noord-Brabant 70577
Archief Eemland (*2) Utrecht 49487
Gemeentearchief Rotterdam (*2) Zuid-Holland 9640
Totaal   4324813

*1 Vanaf komende week krijgen gebruikers van de Scans zoeken service ook suggesties voor scans bij Gemeentearchief Schouwen-Duivenland, Gemeentearchief Hengeloe en het Drents Archief (Drenlias). De analyse heeft reeds plaatsgevonden!

*2 Ik hoop binnenkort ook de Digitale Stamboom websites van Regionaal Historisch Centrum Eindhoven, Archief Eemland en Gemeentearchief Rotterdam toe te voegen aan de lijst van bronnen van de Scans zoeken service. De analyse heeft reeds plaatsgevonden, echter deze archieven moeten aan hun website een bestand toevoegen, zoals ook Digitale Stamboom Delft reeds heeft gedaan. Rotterdam heeft reeds aangegeven hiervoor opdracht te geven aan bouwer MindBus.

In onderstaande interactieve kaart wordt het aantal scans dat is gevonden per provincie weergegeven.



20 juli 2010

WieWasWie: WieDoetMee?

wiewaswie Op dit moment wordt er druk gewerkt door projectbureau STAP en haar toeleveranciers aan WieWasWie, de opvolger van Genlias en de Digitale Stamboom. We moeten nog even geduld hebben, de eerste versie zal pas “in de eerste helft van 2011” beschikbaar komen.

WatKunJeErMee?

Het werk zit ‘m enerzijds in het bouwen van de website zelf, de functionaliteiten. Zo moeten gebruikers op WieWasWie onder andere eenvoudig en uitgebreid kunnen zoeken, ze moeten reacties kunnen geven en die moeten worden verwerkt. Ook zal het mogelijk worden om een stamboom of persoonsdossier te maken, op te slaan en met anderen te delen.

WatZitErIn?

Het werk zit ‘m anderzijds in het vullen van de database “onder” WieWasWie. In ieder geval zal de data die nu beschikbaar is in Genlias en de Digitale Stamboom beschikbaar komen, deze zal dus moeten “verhuizen”. Voor stamboomonderzoekers zal ook van belang zijn welke data er nog meer bijkomt. Kortom, welke archieven gaan meedoen met WieWasWie (en wie blijft het eigen losse wiel uitvinden/gebruiken of blijft zelfs inactief op Internet)?

WieDoetMee?

Er lopen nog gesprekken met diverse archieven. Ook zijn er gesprekken met diverse musea om ook de biografische informatie van niet papieren collecties (foto's, merklapjes) beschikbaar te krijgen via WieWasWie.

Een blik op de huidige Deelnemerspagina van WieWasWie leert dat de volgende archieven nu meedoen:

  • Archief Delft
  • Archief Eemland
  • Brabants Historisch Informatie Centrum
  • Drents Archief
  • Gelders Archief
  • Gemeentearchief Rotterdam
  • Groninger Archieven
  • Het Utrechts Archief
  • Historisch Centrum Overijssel
  • Historisch Centrum Het Markiezenhof
  • IISG
  • Nationaal Archief
  • Nieuwland Erfgoed
  • Noord-Hollands Archief
  • Regionaal Archief Leiden
  • Regionaal Historisch Centrum Eindhoven
  • Regionaal Historisch Centrum Limburg
  • Stadsarchief Breda
  • Tresoar
  • Westfries Archief
  • Zeeuws Archief

WatMissenWe?

Alhoewel al een aardige lijst, mis ik wel enkele archieven:

Mist u nog bepaalde archieven? Laat het weten op dit weblog of dat van WieWasWie! Of vraag bij het betreffende missende archief of zij voornemens zijn om te participeren…

Kijken of we die “schapen” ook over de dam krijgen!

474677102_9a689a54ba(via Flickr Creative Commons, door Hans S)

04 juli 2010

Zoek de scans bij mijn genealogische gegevens!

FamilySearch Er komen meer en meer scans van Burgerlijke Stand (BS) en Doop, Trouw en Begraaf registers (DTB) online beschikbaar. Gescand door archieven of gefotografeerd door vrijwilligers. Een andere speler die veel materiaal beschikbaar stelt zijn de Mormonen. Via hun website FamilySearch zijn onder andere heel veel scans van BS en DTB in te zien van diverse gemeenten in diverse Nederlandse provincies, waaronder:
  • Zeeland, Zuid-Holland, Utrecht, Overijssel en Noord-Holland (BS 1792-1952)
  • Gelderland en Noord-Brabant (BS 1811-1950)
  • Zuid-Holland (BS 1811-1942)
  • Limburg (DTB 1600-1822)
Deze scans worden ter beschikking via de website search.labs.familysearch.org. De Nederlandse scans zijn nog niet geïndexeerd/getranscribeerd, dus je moet wel op basis van datum/plaats van de gebeurtenis de juiste collectie vinden en dan soms heel wat pagina's doorbladeren om de akte te vinden. Maar dan heb je wel gelijk een digitale akte die je kunt downloaden en koppelen aan je stamboom!

Ik ben lui dus ik automatiseer…

Ik wilde eigenlijk een lijst van alle personen uit mijn stamboom waarvan er een scan op FamilySearch beschikbaar zou kunnen zijn, een lijst met links. Wat ik wil was de inhoud van mijn genealogische data houden tegen de inventaris van scans op FamilySearch. Alsof je tegen je computer roept: Zoek de scans bij mijn genealogische gegevens!

inventaris_publicatie_suggesties

Voorbeeld

Mijn overgrootvader Bernardus Nicolaas Brizee is geboren in 1859 te Leiden. Uit het inventaris van FamilySearch blijkt dat zij de BS gegevens van de Zuid-Holland > Leiden > Geboorten no. 1-1026 1859 hebben. Even bladeren in de 527 pagina’s (!) en je vind de geboorteakte:
bs_geboorten_1959_bn_brizee_1859_familysearch

Automatiseren en delen

De methodiek om de gegevens uit een genealogische publicatie (GEDCOM) te houden tegen een inventaris van digitale scans bij FamilySearch was vrij snel gerealiseerd, mede doordat de inventaris gegevens via XML opvraagbaar zijn. Over het resultaat: ik ben nog wel even bezig met het downloaden van alle akten…
Ik heb deze “scan-zoek” service nu ook beschikbaar gemaakt voor auteurs op Genealogie Online. Hierdoor blijft het niet bij alleen roepen dat bron(vermelding)en belangrijk zijn, de zoektocht wordt ook nog eens gefaciliteerd! Een voorbeeld van een resultaatpagina van de “scan-zoek” service kunt u hier bekijken: http://www.genealogieonline.nl/stamboom-boissevain/familysearch.php

Dat wil ik ook!


Heeft u al een publicatie op Genealogie Online dan hoeft u alleen maar een nieuwe GEDCOM aan te bieden via mijn.genealogieonline.nl zodat uw publicatie wordt bijgewerkt. Heeft u nog geen publicatie bij Genealogie Online, maak er dan één aan door via www.genealogieonline.nl/nieuwe_publicatie/ uw GEDCOM aan te bieden.
Om de resultaat pagina te zien moet u achter het Internet adres van uw publicatie “familysearch.php” toevoegen, bijvoorbeeld http://www.genealogieonline.nl/stamboom-boissevain/familysearch.php (omdat deze pagina meer voor de auteur is dan voor de gemiddelde bezoeker is er geen directe link vanuit de publicatie).

Alleen FamilySearch?

Wat een dag geleden als een proof-of-concept begon smaakt naar meer. Zoals in de intro aangegeven, zijn er op veel meer plekken scans van akten beschikbaar. Ik denk dan bijvoorbeeld aan de Digitale Stamboom en Genlias (binnenkort WieWasWie) maar ook Van Papier Naar Digitaal, veelal is de kwaliteit van scans beter dan bij FamilySearch. Als er van dergelijke collecties een digitaal inventaris is, idealiter in XML (open data!), en er naar collecties of zoekfunctie ge-deeplinkt kan worden, dan kan de “scan-zoek” service worden uitgebreid!

Ik sta open voor suggesties.


[Update 22 juli 2010] Zie ook Scans zoeken bij AlleFriezen bij uw genealogische gegevens

14 mei 2010

Maak back-ups van uw (genealogische) bestanden!

367661095_56350a941c_m Onlangs kreeg ik weer eens een vraag van een gebruiker of ik toevallig nog een GEDCOM bestand had van zijn publicatie op Genealogie Online omdat z’n harddisk was gecrasht en hij al zijn digitale genealogische gegevens verloren was… slik.

Deze Genealogie Online gebruiker kon gelukkig eenvoudig via mijn.coret.org (of mijn.genealogieonline.nl) zijn eigen aangeleverde GEDCOM weer downloaden en had weer wat gegevens (zie video). Maar hoe zat het met allerlei Word documenten, foto’s en scans? In dit artikel loop ik langs de mogelijkheden die er zijn om offline en online back-ups te maken van bestanden.

Offline back-up

Opslag capaciteit is tegenwoordig erg goedkoop. Er zijn meerdere “offline” (dus niet via Internet) methoden om uw gegevens redundant op te slaan:

  • Heeft u in uw thuisnetwerk meerdere computers? Dan kunt u bestanden “repliceren” van de ene computer naar de andere computer, en omgekeerd. Wanneer één van de computer problemen krijgt zijn de gegevens ook op de andere computer aanwezig.
  • Een externe harddisk van 1,5 TB (dat is dus ruim 1500 GB) is erg goed betaalbaar. Dit kleine kastje verbindt u met de computer via een USB kabel en u heeft er in eens heeft veel extra ruimte bij voor het back-uppen! Een USB stick van enkele GB’s kan natuurlijk ook al (beperkt) uitkomst bieden.
  • Tenslotte is het ook aan te raden om zo nu en dan gegevens op een DVD te branden (er gaat zo’n 4 GB op een schrijf). Het voordeel hiervan is dat u deze DVD’s ook elders kunt bewaren, bij familie (ouders/kinderen) of vrienden. In het geval van een brand bij u thuis zijn de elders bewaarde DVD’s gespaard!

Voor het maken van back-up's zijn er diverse (gratis) programma’s beschikbaar. Maar veelal kunt u ook al uit de voeten met de door Microsoft bij Windows geleverde back-up software.

Online back-up (of “off-site storage”)

Het voordeel van de “online” back-up methoden (dus via Internet) is dat de bestanden niet thuis opgeslagen worden en dat deze ook nog eens vanaf elke locatie via Internet beschikbaar zijn. Nadeel is dat het back-uppen en terughalen bij grote hoeveelheden data wel enige tijd kan duren.

Er zijn vele online back-up diensten, zowel gratis als betaald. Zo biedt Microsoft met het product SkyDrive gratis 25 GB opslag! Bij Mozy krijgt u gratis 2 GB aan opslag en kunt u het back-uppen automatiseren. Maar ook een dienst als Google Docs is een handige opslag (van 1 GB) voor documenten en sinds kort allerlei documenten. Bij veel van deze diensten kunt u extra opslagruimte kopen. Bij een service als Elephant Drive heeft u voor zo’n $99,95 per jaar zelf ongelimiteerde opslag!

Zijn genoemde services puur voor bestanden, noemenswaardig zijn ook diensten die zich vooral op afbeeldingen richten. We hebben namelijk door de digitale camera steeds meer foto’s digitaal en als genealogen hebben we ook heel wat scans van akten. Ook deze kunt u eenvoudig online “stallen”. En dan niet alleen voor het back-uppen maar ook voor het delen van de afbeeldingen: openbaar dus voor iedereen of alleen voor genodigden (voor de vakantiekiekjes). Twee diensten waar u zeker eens moet kijken zijn het Nederlandse Mijn Album en het Amerikaanse Flickr (waar al ruim 4 miljard afbeeldingen staan!!!).

Onder andere mijn uitingen via Twitter berichten, blog berichten, Google Documenten, Google e-mail berichten, Google Calender en Facebook (welke dus alle alleen online staan en niet op mijn laptop) worden weer (automatisch en gratis) geback-upped met de online service Backupify. Want ook dit soort services kunnen ineens ophouden te bestaan, problemen krijgen of u eruit gooien…

Tenslotte

  • Wees niet te selectief bij het back-uppen. Dus niet alleen het GEDCOM bestand back-uppen, ook de bronbestanden van Aldfaer, GensdataPro, … En ook de foto’s en scans. En ook de Word documenten met verhalen. En ook …
  • Een back-up is pas een goede back-up als u deze succesvol heeft teruggezet (“ge-restored”). Test dus altijd of u de geback-upte bestanden ook weer van de DVD kunt halen (bedenk dat DVD’s niet het eeuwige leven hebben!) of van de online faciliteit kunt downloaden.
  • Het gaat niet alleen om de hulpmiddelen (die hierboven genoemd staan) maar vooral om discipline. Het kan helpen als u de back-up kunt automatiseren, dus dat er automatisch elke week op de achtergrond een back-up wordt gemaakt. Maar deze dient u nog steeds te controleren.

Zo, nu aan de slag met back-uppen zodat u waardevolle (genealogische) bestanden niet verloren gaan!

23 april 2010

Meertalig maken met vrijwilligers

multilingual Een wens die al langer leefde bij mij en publicerende stamboomonderzoekers op Genealogie Online was om de website in meerdere talen beschikbaar te krijgen. Internet is internationaal, dus er komen ook veel niet-Nederlandstaligen af op de ruim 3000 genealogische publicaties.

Genealogie Online had tot enige tijd geleden de menu optie om de website in het Engels te lezen. Deze functie maakte gebruik van de gratis Google Translate service waarmee je een tekst of webpagina mee kan vertalen. Dit is een nuttige site die u nog steeds kunt gebruiken om tekst en webpagina's in een andere taal beschikbaar te krijgen. Echter, deze vertaaldienst van Google is niet perfect. Zo wordt alle tekst vertaald wat niet altijd de bedoeling is. Bijvoorbeeld: "Ben de Boer, geboren in Houten" moet niet vertaald worden in "Are the farmer, born in Wooden". Om deze reden heb ik de menu optie verwijderd.

Omdat mijn tijd beperkt is en ik ook geen polyglot ben heb ik de vertaling van de tekstdelen in het Engels, Duits, Frans, Spaans en Italiaans “uitbesteed” aan vrijwilligers. Deze werkwijze word crowdsourcing genoemd, websites als Twitter, Facebook en Drupal zijn op deze wijze vertaald.

Het vertalen van alle tekstdelen van Genealogie Online wordt ondersteund door een maatwerk applicatie. Op eenvoudige wijze worden de te vertalen tekstdelen gepresenteerd. Elke vertaling wordt door twee andere vrijwilligers gecontroleerd om de kwaliteit van de vertalingen te borgen. Een lijstje met de meest actieve vertalers mag natuurlijk niet ontbreken, het geeft erkenning wat voor velen een stimulans is.

Het inzetten van vrijwilligers is in de genealogie geen noviteit, zie ook het artikel Vrijwillige digitalisering van genealogische bronnen motiveren en ondersteunen. Archieven maken veel gebruik van vrijwilligers om bijvoorbeeld gegevens te transcriberen, denk maar eens aan Genlias. Toch, de kracht van crowdsourcing is me met deze vertaal actie pas echt duidelijk geworden.

De vertaling in Engels en Duits zijn in een kleine 3 weken voltooid! Genealogie Online is nu dus ook in het Engels en Duits beschikbaar! Vertaling in het Frans, Italiaans en Spaans staan op het moment van schrijven op resp. 90% , 67% en 31% (helpt u mee?).

Ik ben de vrijwilligers die meegeholpen hebben met het vertalen (en controleren) zeer dankbaar. Het resultaat is boven mijn verwachting!

05 maart 2010

Is het een kwartierreeks?

De Amerikaanse televisieserie Faces of America (die online is te bekijken, een aanrader) toont in het verhaal diverse malen een reeks van voorouders van de gasten (waaronder Meryl Streep en Koningin Noor). Het is een illustratieve genealogische weergave van voorouders, maar hoe heet deze?

Kwartierstaat

In de genealogie zijn er diverse weergaven om voorouders in beeld te brengen. De meest bekende is de kwartierstaat. Een kwartierstaat is een genealogische weergave van alle directe voorouders van een individu (ook wel probandus genoemd). In een kwartierstaat worden de rechtstreekse voorouders, zowel in mannelijke en vrouwelijke lijn, vermeld.

Wikipedia geeft de volgende weergave van een kwartierstaat:

Kwartierstaat

Stamreeks

Een stamreeks is een genealogisch overzicht waarbij langs de lijn van de vader (patrilineaire stamreeks), moeder (matrilineaire stamreeks) of naamdrager (naamstamreeks) alle rechtstreekse voorouders van een probandus in kaart worden gebracht.

Wikipedia geeft de volgende weergave van een patrilineaire stamreeks:

Stamreeks

Kwartierreeks?

De overzichten die in Faces of America toont zijn een variatie op de stamreeks, het toont één bepaalde lijn voorouders. Waar de stamreeks dit of via mannelijke lijn doet, of via de vrouwelijke lijn, of via de lijn van de geslachtsnaam, is dat bij deze overzichten niet het geval. De geslachtsnaam is niet leidend in de lijn “naar boven”, er wordt soms de vader en soms de moeder gevolgd. In dezelfde stijl als de Wikipedia afbeeldingen ziet dit er bijvoorbeeld als volgt uit:

Kwartierreeks

Is er voor deze weergave een officiële naam? Is het een voorouderreeks of is dat een synoniem voor stamreeks? Anders maar een Wikipedia pagina aanmaken voor de kwartierreeks?