vrijdag 29 augustus 2014

Genealogische database als Open Data

Vanaf vandaag stelt Regionaal Archief Tilburg de genealogische data zoals die in de database zit beschikbaar als Open Data.

Het gebruik van overheidsdata in digitale vorm staat volop in de belangstelling. De Nederlandse overheid streeft ernaar om zoveel mogelijk van de digitale informatie gratis en zo open mogelijk ter beschikking te stellen. Daar hebben ze een speciale website voor opengezet; data.overheid.nl. Daarop kun je als overheidsorganisatie kenbaar maken welke databestanden je als open data ter beschikking stelt.

Hoe krijg je open data?
Gegevens in een database zijn niet zomaar open. De data zit verstopt in een database met veldstructuren, verborgen velden en informatie en een zoekscherm waarin wij bepalen wat de zoekvraag kan zijn. In principe beperken we daarmee zoekmogelijkheden en bieden we aan de onderzoeker die verder wil kijken niet de mogelijkheid om volledig gebruik te maken van onze digitale data.

Om de gegevens in een database als open data beschikbaar te stellen is een technische aanpassing nodig. Het is belangrijk dat de database of dataset gebruik maakt van open standaarden. Een open standaard is een norm (of standaard) die publiek beschikbaar is. Het gebruik van open standaarden vergroot de uitwisselbaarheid van gegevens en verminderd de afhankelijkheid van gesloten standaarden waarvoor een licentie nodig is. Een bekend voorbeeld van een open standaard is het World Wide Web.

Wat kun je met Open Data doen?
Door open data beschikbaar te stellen kunnen andere partijen, commercieel en niet-commercieel, nieuwe toepassingen bedenken. Het zo breed mogelijk beschikbaar stellen van de informatie die het archief beheerd is een belangrijke voorwaarde om maatschappelijk relevant te zijn. Archiefinformatie heeft te maken met identiteit en recht.
Door het aanbieden van datasets als open data krijgen andere partijen de gelegenheid om met die data nieuwe services te ontwikkelen die mogelijk een nieuwe doelgroep aanspreekt of een bestaande doelgroep beter bedient (bv. openarch.nl). Het archief blijft dan in de rol die hen het beste past, nl die van dataprovider. Wij zijn als archiefdienst verantwoordelijk voor zo nauwkeurig mogelijke datasets waar andere partijen vanuit hun kennis en expertise gebruikers optimaal mee kunnen bedienen.

De Open datasets die we beschikbaar stellen kunnen deel uit gaan maken van grote nationale en internationale portals als Openbeelden.nl (foto’s), Openarch.nl (genealogische gegevens), www.europeana.eu">Europeana en Apex (Archives Portal Europe). Het foto- en kaartmateriaal wordt interessant voor grote websites als Wikipedia. Meedoen in die portals vraagt op deze manier geen extra investering.

Toepassingen als Tilburg op de Kaart maken gebruik van dergelijke directe koppelingen naar onze fotodatabase en de TilburgWiki, maar ook naar de rijksmonumentendatabase van de Rijksdienst voor Cultureel Erfgoed die hun database open heeft gezet. Recent is de heritagebrowser die de Bibliotheek Midden-Brabant heeft geplaatst gevuld met de foto’s uit de fotodatabase van Regionaal Archief Tilburg via een open data protocol.

Open Data bij Regionaal Archief Tilburg
Stamboomonderzoek of genealogie is een onderzoeksgebied waar veel mensen in Nederland, maar zeker ook daarbuiten, actief in zijn. Het beschikbaar stellen van een substantiƫle set genealogische data biedt kenners en amateurs de gelegenheid om op een heel andere wijze met deze data aan de slag te gaan. Dat kan zich vertalen in grafieken over aantallen geboorten e.d. maar evengoed in frequentie van geboorten in een regio of wat er verder maar aan vragen te stellen is aan deze dataset.

De dataset bevat alle gegevens zoals die ook via de website van het archief te doorzoeken zijn. Een overzicht van wat er beschikbaar is staat op de website: http://www.regionaalarchieftilburg.nl/zoeken-in-databases/genealogie/welke-bronnen-zijn-al-beschikbaar.

Een voorbeeld van wat er mogelijk is kun je zien op de website www.openarch.nl. Deze website, een initiatief van Bob Coret, gebruikt meerdere open datasets om genealogische informatie in een keer te doorzoeken.

De genealogische dataset staat ook in de etalage op de website www.opencultuurdata.nl.

Regionaal Archief Tilburg streeft er naar het komende jaar meer van hun informatie als open data beschikbaar te stellen. Volg dit weblog om daarover op de hoogte te blijven.

4 opmerkingen:

Walther Hasselo zei

Mooi dat jullie het voorbeeld van Erfgoed Leiden en Omstreken volgen! Ik hoop dat er nu snel meer instellingen dit gaan doen!

Luud de Brouwer zei

@Walther
We blijven hopen... ;)

Bernadine Ypma zei

Beste Luud,

wat een goede ontwikkeling. Het RHC Vecht en Venen maakt zich op om de komende jaren te werken aan een bredere en betere toegankelijkheid van de archieven o.a. via open data. Wij moeten nog een aantal stappen maken voordat we zover zijn. Het is inspirerend om de ontwikkelingen bij Leiden en Tilburg te volgen. Wellicht dat jullie samen een artikel voor het archievenblad kunnen schrijven?

Luud de Brouwer zei

@Bernardine
Als je advies wilt of een keer erover praten dan weet je ons te vinden :) Ik zal Walther eens polsen voor een artikel.