Gegevensbeschrijvingen/Handreiking

Uit NORA Online
< Semantiek
Naar navigatie springen Naar zoeken springenHet Afgeleide Principe 17 schrijft voor: De aan de dienst gerelateerde informatieobjecten zijn, uniek geïdentificeerd, in een informatiemodel beschreven.

Doel van deze handreiking[bewerken]

Deze handreiking heeft tot doel om beheerders van (catalogi van) informatieobjecten op weg te helpen bij het maken van een beschrijving daarvan, die voldoet aan de relevante standaarden en geschikt is voor zowel intern gebruik als voor interoperabiliteit met andere organisaties. Dat laatste doel wordt bereikt door meer standaardisatie in de metagegevens waarmee de informatieobjecten worden beschreven. Daartoe wordt de weg gewezen naar de relevante standaarden en is een aanvullende lijst metagegevens met een gegevensmodel opgesteld, voor het geval er geen model voor het eigen domein beschikbaar is of als dat te beperkt is. De beschrijving dient daarnaast te voldoen aan de kwaliteitseisen die zijn genoemd in het afgeleide principe AP17: 'Beschrijving informatieobjecten'.

Beschrijvingen van informatieobjecten bestaan voor uitlopende doelen en in velerlei vormen. Afhankelijk van de aard en het doel van de beschrijving zijn bepaalde metagegevens meer of minder relevant. In de meest uitgebreide vorm beschrijft deze handreiking zowel de semantiek, als de syntax en de registratiegegevens.

Reikwijdte van het begrip informatieobject en de relevante standaarden[bewerken]

Het begrip informatieobject in AP17 is enerzijds ontleend aan de standaarden voor ongestructureerde gegevens als NEN-ISO 23081 (metagegevens voor archiefbescheiden), Richtlijn metagegevens Overheid (RMO) en Overheids Web Metadata Standaard (OWMS). Deze laatste standaard definieert een informatieobject als “Een identificeerbaar, mogelijk samengesteld geheel van gegevens.”

In AP17 worden onder het begrip informatieobject echter ook de afzonderlijke gestructureerde gegevens verstaan. Voor beide soorten informatieobjecten bestaan reeds specifieke standaarden. Aangezien gegevenscatalogi, thesauri, taxonomieën of conceptuele modellen zowel documenten als beschrijvingen van gestructureerde gegevens zijn, is er sprake van een zekere mate van overlap van standaarden.

Voor het onderdeel ongestructureerde informatie zijn reeds handreikingen beschikbaar, inclusief de daarbij te gebruiken metagegevens en hun gegevensstructuur. Daarom wordt hier kortheidshalve verwezen naar de desbetreffende standaarden voor ongestructureerde informatie.

Standaarden voor gestructureerde gegevens (gegevensbeschrijvingen) verschillen sterk per domein. Het Metamodel voor Informatiemodellering (MIM) biedt standaard metadata-elementen voor het beschrijven van informatiemodellen. Het wordt breed gebruikt door allerlei overheidsorganisaties .

Er is eerder een handreiking voor deze categorie opgesteld met een aanbevolen lijst met referentienamen en -definities (PDF, 63 kB) met gegevensstructuur, beschreven in een metagegevensmodel. De lijst vormt echter zelf geen standaard en vervangt de bestaande standaarden ook niet. De lijst dient als checklist voor mogelijke aanvullingen op de te kiezen standaard om tot een meer uniforme beschrijving te komen over meerdere domeinen heen. Omdat namen en definities in de domeinspecifieke standaarden onderling verschillen, zijn ze aangeduid met referentienamen en -definities, die bij een keuze voor een specifieke standaard daardoor vervangen dienen te worden.

Verantwoording handreiking gegevensbeschrijving[bewerken]

De handreiking is opgesteld door experts die hier veel ervaring mee hebben opgedaan bij verschillende (overheids)organisaties en is gericht op een praktische toepassing voor diverse situaties. De handreiking heeft evenwel niet de pretentie voor iedere situatie de relevante metagegevens te kunnen voorschrijven.

Uitgangspunt vormde een inventarisatie van gebruikelijke metagegevens in catalogi van Nederlandse registraties en de publicatie 'Catalogus Authentieke Registratie' van het programma Stroomlijning basisgegevens. Deze publicatie lag ook ten grondslag aan de Stelselcatalogus 1.0 in 2009. Sindsdien is de beschrijving in diverse werkgroepen met de basisregistraties doorontwikkeld. Deze lijst vormt een vocabulaire voor de beschrijving van veelgebruikte metagegevens en dient zowel als checklist voor mogelijk relevante metagegevens als ter uniformering daarvan over verschillende standaarden heen.

Hiermee wordt de in de praktijk opgedane ervaring beschikbaar gesteld voor hergebruik en doorontwikkeling. Dit proces is nog in volle gang. Het is een eerste inventarisatie van veelvoorkomende metagegevens, zonder pretentie van volledigheid: “Work in progress”. Uit de zo ontstane longlist is een set belangrijkste metagegevens geselecteerd op basis van de mate van voorkomen bij Nederlandse registraties en inschatting van het belang. Deze zijn vetgedrukt weergegeven in de lijst met referentienamen en -definities (PDF, 63 kB).

Vervolgens zijn de metagegevens gestructureerd in Metagegevensmodel.

Status[bewerken]

De handreiking is niet bindend, maar melding van de reden van eventuele afwijking wordt ten zeerste gewaardeerd ter verdere verbetering en toelichting. In die zin is het 'pas toe of leg uit' principe hier wel van toepassing.

Stappen bij het maken van een gegevensbeschrijving[bewerken]

 1. Kies een standaard, die het meeste aansluit bij de sector waarin de organisatie actief is. Ga daarvoor te rade bij andere organisaties in de sector en raadpleeg het overzicht met standaarden.
 2. Schets een eerste lijst metagegevens op basis van de eigen behoefte van de organisatie, de afnemers en de gekozen standaard.
 3. Neem de naamgeving en definities van de standaard over, voor zover mogelijk en wenselijk in de sector. [1]
 4. Vul de lijst aan met de relevant geachte metagegevens uit de lijst met referentienamen en -definities (PDF, 63 kB).
 5. Bepaal de wenselijke vorm van de catalogus gelet op het gebruiksdoel: als tekstdocument, digitaal raadpleegbare catalogus of wiki. Let hierbij zowel op de behoefte in de ontwikkelfase van toepassingen (domeinmodellen, functionele ontwerpen, berichtdefinities) als tijdens de gebruiksfase, zowel binnen de sector als voor hergebruik van gegevens in andere sectoren en catalogi (zoals de Stelselcatalogus) en andere RDF-toepassingen.
 6. Bepaal de metagegevensstructuur. Sluit zo mogelijk aan op het metagegevensmodel.
 7. Realiseer de gegevensbeschrijving in een adequate tool en voer de metagegevens in. Neem ook relevante begrippen uit wetten op en modelleer zo nodig overeenkomsten en verschillen zoals beschreven in het metagegevensmodel
 8. Publiceer de gegevensbeschrijving in de gekozen vorm. Zie verder onder Publicatie.

Impact[bewerken]

De impact van deze handreiking op de bestaande beschrijvingen van informatieobjecten kan alleen per geval worden vastgesteld. Als in een sector reeds aan een geschikte standaard wordt voldaan, kan de impact beperkt blijven. In geval van vele verschillende en afwijkende beschrijvingen per deeldomein kan een volledig nieuwe beschrijving voor de sector benodigd zijn.

Publicatie[bewerken]

Twee implicaties van het afgeleide principe 17: “Systematische beschrijving informatieobjecten” hebben betrekking op de publicatie:

 1. De beschrijving is op internet gepubliceerd en voor mensen leesbaar (toegankelijk)
 2. De beschrijving is bij voorkeur ook machinaal lees- en interpreteerbaar (toegankelijk)

In het Metagegevensmodel zijn de metagegevens opgenomen die hierbij van belang zijn in de objecttypen: Registratiecatalogustype, Distributietype, Betrokkenetype en Contactgegevenstype. Voor een raadpleger is het belangrijk dat metagegevens als beschrijving van de inhoud van de catalogus, geografische dekking, laatste wijziging, vindplaatsen, contactgegevens en dergelijke actueel en volledig zijn om te kunnen bepalen of de inhoud voor hem of haar relevant is.

De vindbaarheid kan verder vergroot worden door de gegevensbeschrijving aan te melden voor opname in de NORA-inventarisatie van gegevenswoordenboeken in de publieke sector. Daarnaast draagt opname van de gegevenselementen in de Stelselcatalogus bij aan de vind- en vergelijkbaarheid.

Voor de machinale lees- en interpreteerbaarheid zijn eveneens metadata opgenomen bij Distributietype. In de Bijlage Waardelijsten is onder andere een lijst opgenomen voor het aanbevolen distributieformaat. Voor toepassing in Linked Open Data is distributie van de afzonderlijke gegevensbeschrijvingen van belang. RDF is hier het gebruikelijke formaat.


Referenties[bewerken]

 1. Zie voor een 1:1 koppeling met standaarden: werkbestand referentie metagegevens.ods (ODF-spreadsheet, 45 kB)
Volgende pagina: Metagegevensmodel⇢