Handreiking DCAT-AP-NL
Algemeen
Beheerder: Geonovum
Status bij Forum Standaardisatie: geen, de standaard zit in het proces om op de “pas toe, leg uit” lijst te komen
Waarde van de standaard
DCAT-AP-NL is een standaard voor het beschrijven van datasets en de bijbehorende gegevensdiensten (dataservices) beschreven kunnen worden, zodat deze beschrijvingen (metagegevens) gepubliceerd kunnen worden in een datacatalogus.
Belangrijke voordelen van de DCAT-AP-NL standaard zijn:
- Ondersteunen van de publicatie van datasets en gegevensdiensten in datacatalogi, zodat ze vindbaar zijn en afnemers kunnen bepalen of en hoe deze hergebruikt kunnen worden in hun eigen context.
- Standaardiseren van de inhoud en structuur van beschrijvingen van datasets en gegevensdiensten, zodat afnemers en systemen deze eenvoudiger en met minder fouten kunnen begrijpen en verwerken.
- Ondersteunen van federatief zoeken van datasets en gegevensdiensten in meerdere datacatalogi met standaard zoekmechanismen, zodat zij breder vindbaar zijn.
- Voldoen aan de Europese eisen voor Open data en High-Value Datasets, zodat compliance met Europese wet- en regelgeving is geborgd.
De DCAT-AP-NL standaard en het daarvan afgeleide profiel biedt waarde aan de volgende specifieke doelgroepen:
| Doelgroep | Waarde |
|---|---|
| Managers |
|
| Analisten en ontwikkelaars |
|
Werking van de standaard
DCAT-AP-NL is een profiel op de Europese DCAT-AP standaard. Behalve de algemene DCAT-AP en DCAT-AP-NL standaarden zijn er sectorspecifieke standaarden zoals mobilityDCAT-AP in het mobiliteitsdomein en HealthDCAT-AP in het gezondheidsdomein. DCAT-AP en DCAT-AP-NL gelden als de gemeenschappelijke standaarden om over domeinen heen metadata uit te kunnen wisselen.
Binnen specifieke domeinen kunnen standaarden als mobilityDCAT-AP, HealthDCAT-AP of het Nederlands metadata profiel op ISO 19115 voor geografie preferent zijn. Er zijn mappings om deze domein specifieke standaarden om te zetten naar DCAT-AP-NL zodat sector overstijgende uitwisseling van metadata via DCAT-AP-NL kan verlopen.
Omdat DCAT-AP-NL een profiel is op DCAT-AP voldoet metadata die voldoet aan DCAT-AP-NL ook aan DCAT-AP. Er zijn zowel aanvullende eigenschappen als strengere verplichtingen opgenomen in DCAT-AP-NL ten opzichte van DCAT-AP. DCAT-AP is een profiel op de W3C standaard DCAT. DCAT beschrijft alleen een aantal mogelijke eigenschappen die je kunt vastleggen bij datasets, distributies en dataservices (gegevensdiensten). Een applicatieprofiel (zoals DCAT-AP en DCAT-AP-NL) beschrijft verplicht in te vullen waarden of verplicht te gebruiken waardenlijsten. Een applicatieprofiel kan daarmee ook gebruikt worden om te toetsen of een aantal minimale eigenschappen zijn ingevuld.
Een dataset is in DCAT een verzameling van samenhangende gegevens, die beheerd of gepubliceerd wordt door één organisatie, en in één of meer formaten beschikbaar of downloadbaar is. Een gegevensdienst is een geautomatiseerde dienst waarmee gegevens opgevraagd kunnen worden. Naast datasets en gegevensdiensten is het in DCAT ook mogelijk om een beschrijving te maken van de catalogus zelf als dataset alsook van distributies van gegevens. Een distributie beschrijft hoe (een deel van) een dataset te verkrijgen is en levert rechtstreeks een dataset in een specifiek formaat op.
De standaard beschrijft veel algemene metagegevens van datasets en gegevensdiensten zoals de identificatie titel, beschrijving, wijzigingsdatum, taal en verantwoordelijke partijen die zijn gebaseerd op de Dublin Core standaard. Het bevat ook de mogelijkheid om meer geavanceerde eigenschappen te beschrijven zoals licenties, rechten, plichten, beperkingen en datalineage (provenance).
Relatie met GDI domeinarchitectuur gegevensuitwisseling
De DCAT standaard geeft een invulling aan de volgende principes in de domeinarchitectuur.
| Principe | Invulling |
|---|---|
| Gegevens die kunnen worden gedeeld zijn vindbaar, toegankelijk, interoperabel en herbruikbaar | De standaard verhoogt de vindbaarheid en herbruikbaarheid van gegevens doordat datasets en gegevensdienst op gestandaardiseerde wijze in datacatalogi gepubliceerd zijn. |
| Metagegevens zijn begrijpelijk voor mensen | De standaard biedt de mogelijkheid om datasets en gegevensdiensten op uitgebreide wijze te documenteren, zodat mensen goed kunnen begrijpen wat ze zijn en of ze voor hen bruikbaar zijn. |
| Metagegevens zijn aan elkaar verbonden | De standaard maakt het mogelijk om relaties te leggen met andere datasets (die bron zijn) en andere vormen van metagegevens, zoals metagegevens over gegevenskwaliteit en datalineage. |
| Metagegevens zijn beschikbaar als Linked Data | De standaard is gebaseerd op Linked Data standaarden. |
| Gegevens worden geleverd vanuit herbruikbare gegevensdiensten | De standaard ondersteunt de publicatie van herbruikbare gegevensdiensten in datacatalogi. |
| Informatieproducten zijn herleidbaar naar de onderliggende gegevens en regels | De standaard maakt het mogelijk om informatieproducten als datasets te beschrijven, inclusief informatie over hun datalineage |
De standaard is ondersteunend aan de volgende functies in het functiemodel van de domeinarchitectuur:
- Beheren metagegevens over datasets
- Beheren metagegevens over gegevensdiensten
- Beschikbaar stellen metagegevens
Positionering van de standaard
Relatie met andere metagegevens
Er kan in DCAT-AP-NL (en/of in de onderliggende DCAT standaard) worden verwezen naar meer uitgebreide beschrijvingen van bepaalde soorten metagegevens volgens andere standaarden. Dat geldt bijvoorbeeld voor rechten, plichten, beperkingen, datalineage, gegevenskwaliteit, gegevensmodellen en begrippen. Meer informatie hierover is opgenomen bij de paragraaf over de relatie met andere standaarden.
Impact van de standaard
De processen voor het creëren en publiceren van metagegevens over datasets en gegevensdiensten moeten worden ingericht. Dit vraagt het definiëren van rollen, taken en verantwoordelijkheden en het inrichten van systemen. Er zal een tool of systeem moeten worden ingericht om de metagegevens in te definiëren en te beheren. Voor een beperkt aantal datasets kan hiervoor een spreadsheet worden gebruikt. Voor een meer professionele ondersteuning van het beheer van dit soort metagegevens is een uitgebreider systeem gewenst. Een dergelijk systeem moet ook faciliteren dat mensen deze metagegevens kunnen beheren en dat ook ondersteuning biedt bij het invoeren van metagegevens conform de standaard. Merk op dat dit soort processen en systemen in bepaalde organisaties en/of domeinen reeds aanwezig zijn.
Daarnaast is het belangrijk om de metagegevens te publiceren. Omdat de DCAT standaard gebaseerd is op Linked Data standaarden is er al een mapping op de RDF standaard. Een machineleesbare versie van de metagegevens kan vervolgens in allerlei catalogi worden gepubliceerd, zoals data.overheid.nl. In het Federatief Datastelsel is het uitgangspunt dat aanbieders van datasets zelf verantwoordelijk zijn voor het beschikbaar stellen van deze metagegevens op een eigen weblocatie, die door catalogi kan worden geharvest. Aandachtspunten
Granulariteit van datasets
Een veelvoorkomende vraag rondom de publicatie van datasets is hoe groot of klein deze zou moeten worden gezien. In algemene zin is het belangrijk om te kijken vanuit inhoudelijke samenhang: vormen de gegevens samen één logisch geheel voor afnemers? Daarbij is van invloed of de gegevens over hetzelfde onderwerp gaan, op dezelfde manier worden geproduceerd, gezamenlijk worden gebruikt en gemeenschappelijke metagegevens hebben. De voorgaande vraag heeft ook een relatie met de vraag in hoeverre datasets door individuele bronhouders zouden moeten worden beschreven, of alleen als geheel door de aanbieder van de landelijke voorziening die het samengestelde geheel ontsluit. Het is duidelijk dat de landelijke voorziening in ieder geval als dataset moet zijn gepubliceerd. Publicatie door individuele bronhouders is alleen waardevol als dat een duidelijke meerwaarde heeft ten opzichte van de landelijke voorziening. Heeft de bronhouder bijvoorbeeld meer actuele of een rijkere versie van de gegevens.
Het is mogelijk om met de “is part of” relatie een hiërarchie aan te brengen in datasets die wezenlijk andere kenmerken hebben. Verder is het concept datasetserie toegevoegd. Een datasetseries is een verzameling van datasets die bepaalde kenmerken delen waardoor ze gegroepeerd zijn.
Een gegevensdienst zou in potentie ook gegevens uit meerdere datasets kunnen ontsluiten. Dat brengt zowel flexibiliteit met zich mee, maar kan ook tot verwarring leiden.
Relatie met andere standaarden
Relatie met Dublin Core
Dublin Core is een algemene standaard voor metagegevens, die initieel voor webcontent is ontworpen. Het doel ervan was vooral om content op het web goed te kunnen vinden. Webcontent zou zichzelf moeten kunnen beschrijven. De standaard beschrijft veelvoorkomende algemene metagegevens voor allerlei vormen van digitale objecten. DCAT maakt uitgebreid gebruik van metagegevens uit Dublin Core. Denk aan algemene metagegevens zoals de identificatie titel, beschrijving, wijzigingsdatum, taal en verantwoordelijke partijen, maar ook aan zaken zoals licenties, rechten en beperkingen.
Relatie met OpenAPI specification
De OpenAPI specification maakt het mogelijk om API’s op een standaard manier te documenteren, inclusief hun operaties, foutcodes en datamodel. De gegevensdiensten die worden beschreven met de DCAT standaard zijn vaak ook API’s. De soorten metagegevens die DCAT vastlegt zijn echter anders dan de metagegevens die conform de OpenAPI specification worden vastgelegd. Zo is het in DCAT niet mogelijk om de operaties, foutcodes en datamodel te beschrijven. Anderzijds biedt DCAT andere beschrijvende metagegevens waarmee meer context kan worden gegeven aan API’s zoals de rechten, plichten en beperkingen die van toepassing zijn. De doelgroep van beide standaarden zijn ook anders. De OpenAPI specification is primair gericht op ontwikkelaars, terwijl de DCAT standaard een veel bredere doelgroep kent. Het is vooral gericht op afnemers van gegevens die primair willen begrijpen welke gegevens worden aangeboden. Het is mogelijk om met de eigenschap “endpoint description” vanuit een dataset te verwijzen naar een OpenAPI specification.
Relatie met NL-SBB
NL-SBB is de standaard voor het beschrijven van begrippen. Een begrip is een eenheid van denken - idee, betekenis of categorisering. De standaard geeft aan hoe begrippen in een begrippenlijst, taxonomie of thesaurus eenduidig worden beschreven. Het is mogelijk om in datasets die zijn beschreven te verwijzen naar begrippen door gebruik te maken van de “theme” eigenschap. Er zou minimaal verwezen moeten worden naar een begrip in de formele Dataset Theme Vocabulary, maar het is aanbevolen om ook te verwijzen naar domeinspecifieke begrippenkaders.
Je zou een begrippenkader ook kunnen zien als een standaard waar je middels een “conforms to” eigenschap van een dataset naar kunt verwijzen. Daarmee geef je dan aan dat de gegevens in de dataset conformeren aan het begrippenkader.
Een begrippenkader kun je ook zien als een dataset en dus als DCAT dataset kunnen typeren. Daarmee druk je uit dat de het begrippenkader als geheel een eenheid van beheer is. In de NL-SBB standaard is beschreven dat deze typering ook op het niveau van individuele begrippen of delen van begripsbeschrijvingen kunnen worden belegd. De keuze voor het niveau van typering heeft vooral te maken met hoe met versiebeheer van begrippen en begrippenkaders wordt omgegaan.
Relatie met MIM
Het Metamodel Informatie Modellering (MIM) beschrijft een generieke structuur voor het vastleggen van informatie- en gegevensmodellen. Voor een dataset kan een bepaald gegevensmodel van toepassing zijn. Er kan gebruik worden gemaakt van de “conforms to” eigenschap om een dataset te laten verwijzen naar het gegevensmodel dat van toepassing is op de dataset.
Relatie met DQV
Data Quality Vocabulary (DQV) is een standaard van het World Wide Web Consortium waarmee gegevens over gegevenskwaliteit op een gestructureerde manier kunnen worden vastgelegd. Het kan gebruikt worden om de kwaliteit van de gegevens in een dataset mee te beschrijven. Dat is geen normatief onderdeel van de DCAT 3.0 standaard en ook geen onderdeel van het Nederlands profiel. Er is in het niet-normatieve deel van de DCAT 3.0 standaard wel beschreven hoe kwaliteitsinformatie gekoppeld kan worden aan een dataset. Ook in de DQV standaard is hierover meer informatie beschikbaar. Vanuit een dataset kan met de DQV “has quality measurement” verwezen naar een meetresultaat die is beschreven in DQV. Andersom kan de DQV “computed on” eigenschap worden gebruikt bij meetresultaten worden aangegeven op welke dataset deze betrekking heeft.
Relatie met PROV
PROV is een open standaard van het W3C voor het beschrijven van dataprovenance, wat je grotendeels kunt beschouwen als synoniem voor datalineage. Datalineage is de beschrijving van databewegingen en -transformaties op verschillende abstractieniveaus langs datatrajecten. Het wordt steeds belangrijker om bij gegevens ook informatie te leveren over datalineage zodat duidelijk is hoe de gegevens tot stand zijn gekomen. In de handreiking datalineage is beschreven op welke wijze dat zou kunnen en hoe de DCAT en PROV standaarden daarbij gebruikt kunnen worden. Met de eigenschap “was generated by” kan verwezen worden naar een activiteit die is beschreven conform de PROV standaard. Bij de activiteit is dan vervolgens beschreven wat de precieze invoer- en uitvoergegevens waren.
Relatie met ODRL
Open Digital Rights Language (ODRL) is een standaard voor het beschrijven van rechten, plichten en beperkingen die van toepassing zijn op een dataset. Het kan bijvoorbeeld worden gebruikt om te bepalen of een afnemer gebruik mag maken van de dataset. Dat kan ook als een geautomatiseerde autorisatiecontrole worden geïmplementeerd. In het Dataspace Protocol wordt de standaard ook op deze wijze gepositioneerd. Los van die specifieke context is het mogelijk om bij een dataset in DCAT te verwijzen naar een ODRL specificatie met de “has policy” eigenschap.
Relatie met MDTO
MDTO (Metagegevens voor duurzaam toegankelijke overheidsinformatie) is een norm van het Nationaal Archief voor het vastleggen en uitwisselen van eenduidige metagegevens om de duurzame toegankelijkheid van overheidsinformatie mogelijk te maken. Het is primair een instrument voor overheidsorganisaties om de verplichtingen uit de Archiefwet en de Wet open overheid te kunnen nakomen. Gegevens die worden overgebracht naar een archiefinstelling en zijn voorzien van MDTO-gebaseerde metagegevens zou je ook als een dataset kunnen beschouwen en met DCAT kunnen beschrijven. Een dataset zit in DCAT echter meestal wel op een meer abstract niveau, dan een concrete verzameling van informatieobjecten.
Links
11 mei 2026 05:20:44
11 maart 2026 06:32:39
11 mei 2026 05:20:44
6
Informatief