08 maart 2013

A2A open: goed nieuws voor archiefinstellingen!

Gisteren is de standaard voor het ontsluiten van historische persoonsgegevens openbaar gemaakt. Deze standaard, die al in 2011 is ontwikkeld binnen het WieWasWie project, zorgt er voor dat archiefinstellingen hun gegevens op een eenduidige wijze kunnen aanbieden aan alle partijen die deze willen presenteren of willen gebruiken voor toepassingen. De drempel voor archiefinstellingen om hun data als open data beschikbaar te stellen is hiermee weer een stuk lager geworden!

Archive 2 All (A2A) model

Het ontwerp van WieWasWie is er op gebaseerd dat de historische persoonsgegevens die de archiefinstellingen beheren naar één centraal punt worden ‘gekopieerd’ en daar doorzoekbaar is. Omdat archiefinstellingen hun data in verschillende systemen bewaren moesten er afspraken worden gemaakt over hoe deze data op een eenduidige wijze uit de archiefsystemen kon worden verkregen en gecommuniceerd naar andere systemen. Het resultaat hiervan (dat in wezen los staat van WieWasWie) is het door Mindbus ontwikkelde A2A model.

image

Eigenlijk staat A2A voor Archive 2 Archive, wat natuurlijk een verkeerde naam is. Het model is bedoeld om historische persoonsinformatie die archiefinstellingen beheren te ontsluiten. Maar het ene archief gaat toch niet de data van een ander archief binnenhalen? Vandaar dat ik het model hernoem tot Archive 2 All model.

De leveranciers van archiefsystemen zoals Picturae en DE REE archiefsystemen hebben hun systemen aangepast zodat de gegevens er volgens het Archive 2 All model (en OAI-PMH) zijn uit te halen. Dit wordt nu toegepast bij WieWasWie, maar waarom stoppen bij WieWasWie? Waarom geef je als archiefinstelling niet meer partijen toegang tot de historische persoonsgegevens. Een goed moment voor archiefinstellingen om hier over na de denken!

Data op basis van het Archive 2 All verwerken

In maart 2012 schreef ik het artikel Wat zou jij doen met de genealogische data van een heel archief? Wat het artikel niet vermeldde was dat deze data van het Brabants Historisch Informatie Centrum op basis het Archive 2 All model was beschreven (en ‘geharvest’ via OAI-PMH). Ik had de beschrijving van het Archive 2 All model toen al in handen, maar anderen nog niet, wat natuurlijk voor de archiefinstellingen en uiteindelijk (stamboom)onderzoekers jammer was omdat gebruik en doorontwikkeling van het model werd belemmerd.

In oktober 2012 stelde het Regionaal Archief Leiden haar genealogische gegevens beschikbaar als open data. Een ieder kan dus alle genealogische data, onder een vrije CC0 licentie, downloaden (of beter ‘harvesten’) en er mooie, creatieve, innovatieve dingen mee doen. Een voorwaarde voor open data is echter dat deze ook goed is beschreven, het liefst op basis van een (open) standaard. Met het openbaren van het Archive 2 All model (op basis waarvan ook de genoemde dataset is beschreven) mag het Regionaal Archief Leiden hun dataset vanaf nu dus met recht open data noemen!

Doorontwikkeling van een open standaard

Het Archive 2 All model (versie 1.7) beschrijft aktes uit bevolkingsregisters, DTB-registers, notariële archieven, VOC, Memories van successie en de Burgerlijke stand. In de toekomst kunnen hier bijvoorbeeld kadaster en militieregisters aan worden toegevoegd.

Het Centraal Bureau voor Genealogie, exploitant van WieWasWie, voert het beheer over het Archive 2 All model. Nu het model openbaar is en wordt aangemeld bij de kennisbank van Digitaal Erfgoed Nederland kunnen ook anderen feedback geven op de beschrijving van het Archive 2 All model en de technische documentatie. Professionals èn particulieren kunnen bijdragen aan de doorontwikkeling. De openheid van het model komt de kwaliteit en de adoptie van het model alleen maar ten goede!

Welke archiefinstelling volgt met open stellen van historische persoonsgegevens?

Alle archiefinstellingen die deelnemen aan WieWasWie en archiefinstellingen die gebruik maken van software van Picturae of DE REE (archieven.nl) kunnen nu dus heel eenvoudig hun genealogische gegevens beschikbaar stellen als open data. Ik bepleit dit al langer, onder andere tijden de KVAN dagen met de presentatie Geef mij uw data – alstublieft.

Andere partijen kunnen met de data van de archiefinstellingen (op basis van het Archive 2 All model) nieuwe toepassingen maken, analyses maken om nieuwe inzichten te krijgen en/of samenvoegen met andere datasets. Mooi voor de archiefinstellingen! Mooi voor de (stamboom)onderzoekers!