Handreiking DQV
Algemeen
Beheerder: W3C
Status bij Forum Standaardisatie: geen
Waarde van de standaard
Data Quality Vocabulary (DQV) is een open standaard van het W3C voor het beschrijven van de kwaliteit van gegevens.
Belangrijke voordelen van de DQV standaard zijn:
- Bieden van inzicht in de kwaliteit van gegevens, zodat er meer inzicht ontstaat in de mate van bruikbaarheid voor specifieke doeleinden.
- Het in machineleesbare vorm kunnen beschrijven van informatie over de kwaliteit van gegevens, zodat deze geautomatiseerde wijze kunnen worden verwerkt in tools en systemen.
- Standaardiseren van de structuur waarin de kwaliteit van gegevens wordt uitgedrukt, zodat deze informatie op meer gestandaardiseerde wijze kan worden gecommuniceerd.
- Eenvoudig kunnen configureren van specifieke kwaliteitsraamwerken, zodat het op maat kan worden gemaakt voor meer specifieke afspraken en standaarden.
De DQV standaard biedt waarde aan de volgende specifieke doelgroepen:
| Doelgroep | Waarde |
|---|---|
| Gebruikers |
|
| Managers |
|
| Managers |
|
| Datastewards |
|
| Ontwikkelaars |
|
Werking van de standaard
DQV is een open standaard van het W3C voor het beschrijven van de kwaliteit van gegevens. De kern van de bestaat uit het kunnen beschrijven van de aspecten van kwaliteit die moeten worden gemeten, in combinatie met informatie over de resultaten van kwaliteitsmetingen. De basis hiervoor wordt gelegd door het definiëren van kwaliteitsdimensies. Dat zijn aspecten van kwaliteit waaraan gebruikers van gegevens waarde hechten. Denk bijvoorbeeld aan juistheid, compleetheid of actualiteit. Deze kunnen in categorieën worden geclusterd en verdiept tot kwaliteitsmetrieken. Dat is het meetbare niveau waaraan meetresultaten worden gekoppeld. Er is ook een relatie te leggen naar kwaliteitseisen die in de ORDL standaard uitgedrukt kunnen worden.
De kracht van DQV ligt vooral in het beschrijven van de resultaten van kwaliteitsmetingen. Deze metingen zijn gekoppeld aan een kwaliteitsdimensie en een metriek die beschrijft wat er gemeten is. Ze hebben vooral een waarde, typisch het percentage van de gegevens dat aan een bepaalde metriek voldoet. De waarde kan echter ook anders van aard zijn, zoals een ja/nee waarde die aangeeft of aan een bepaalde conditie wordt voldaan. Kwaliteitsmetingen worden gebundeld in speciale datasets met meetresultaten. Het is ook mogelijk meer algemene annotaties met betrekking tot kwaliteit te relateren aan datasets. Denk aan aspecten van kwaliteit die niet geformaliseerd zijn in kwaliteitsmetrieken, zoals feedback van gebruikers. Daarnaast kunnen datasets gerelateerd worden aan certificaten die een formele uitdrukking zijn van het resultaat van een kwaliteitsbeoordeling.
Relatie met GDI domeinarchitectuur gegevensuitwisseling
De DQV standaard geeft een invulling aan de volgende principes in de domeinarchitectuur.
| Principe | Invulling |
|---|---|
| Gegevens die kunnen worden gedeeld zijn vindbaar, toegankelijk, interoperabel en herbruikbaar | De standaard maakt het mogelijk om metagegevens vast te leggen en beschikbaar te stellen over de kwaliteit van gegevens. |
| De kwaliteit van gegevens is afgestemd op het gebruik | De standaard maakt het mogelijk om metagegevens vast te leggen en beschikbaar te stellen over de kwaliteit van gegevens en daarmee inzicht te geven in de geschiktheid voor het (beoogde) gebruik. |
| Metagegevens zijn aan elkaar verbonden | De standaard maakt het mogelijk om relaties te leggen naar andere metagegevens zoals naar datasets en policies. |
| Metagegevens zijn beschikbaar als Linked Data | De standaard is gebaseerd Linked Data standaarden en integreert daardoor goed met andere Linked Data standaarden. |
| Gemeenschappelijke begripsvorming is het startpunt | De standaard maakt het mogelijk om de taal waarmee over gegevenskwaliteit te communiceren te standaardiseren. |
| Metagegevens zijn begrijpelijk voor mensen | De standaard kan goed worden gecombineerd met andere Linked Data vocabulaires om voor mensen begrijpelijke beschrijvingen te bieden van de kwaliteit van gegevens. |
De standaard is ondersteunend aan de volgende functies in het functiemodel van de domeinarchitectuur:
- Beheren metagegevens over datasets
- Beschikbaar stellen metagegevens
Positionering van de standaard
NORA raamwerk gegevenskwaliteit
Het NORA raamwerk gegevenskwaliteit biedt een standaard set aan kwaliteitsdimensies, kwaliteitsattributen en kwaliteitsmetrieken. Het levert daarmee een standaard taal voor het communiceren over kwaliteit van gegevens. Het is gepositioneerd als overheidsbrede standaard, en is een voorgenomen standaard in het Federatief Datastelsel. De DQV standaard biedt een standaard structuur en formaat waarin het raamwerk gegevenskwaliteit en meetresultaten conform dat raamwerk kunnen worden beschreven. Een mapping op de DQV standaard is dan ook onderdeel van het NORA raamwerk gegevenskwaliteit.
Een verdere operationalisering van het gebruik van de DQV standaard is ontwikkeld in de context van de jaarlijkse kwaliteitsmonitoring van datasets in het Federatief Datastelsel. Er is daarbij een kwaliteitregistratietool ontwikkeld die gebruik maakt van het NORA raamwerk gegevenskwaliteit en deze in DQV formaat exporteert ten behoeve van landelijke rapportage. Ten behoeve van dat tool zijn meer specifieke keuzes gemaakt voor het beschrijven van resultaten van kwaliteitsmetingen. Deze zijn beschreven in het gegevensmodel dat hoort bij het tool. Overigens kan het tool ook los van het Federatief Datastelsel gebruikt worden om resultaten van kwaliteitsmetingen op gestructureerde wijze vast te leggen.
Andere vormen van kwaliteit
De standaard zelf is heel generiek gedefinieerd, zodat het ook gebruikt kan worden om andere vormen van kwaliteit uit te drukken. Denk bijvoorbeeld aan kwaliteit van software of serviceniveas.
Impact van de standaard
De DQV standaard is een hele generiek standaard, die op allerlei manieren kan worden gebruikt. Binnen de overheid is het streven om gebruik te maken van het NORA raamwerk gegevenskwaliteit die een specifieke configuratie van de DQV standaard voorstelt. Daarnaast is het advies om ook gebruik te maken van de uitbreiding die is ontwikkeld voor het kwaliteitsmonitoringtool voor het Federatief Datastelsel. Daarmee hebben organisaties een standaard vocabulaire dat ze direct kunnen gebruiken, in ieder geval voor het uitdrukken van gegevens over kwaliteitsmetingen. Ze zouden ook gebruik kunnen maken van het standaard tool dat is ontwikkeld in de context van het Federatief Datastelsel. Dat is wel vooral bedoeld om meer geaggregeerde rapportages te faciliteren.
Het is vervolgens aan organisaties zelf om te bepalen op welke manier en op welke plaatsen ze de DQV standaard willen toepassen. Er zijn nauwelijks standaard tools beschikbaar ter ondersteuning van de standaard, waardoor het wel aan organisaties zelf is om de standaard te implementeren. Het meest logische inzetgebied van de standaard is het ontsluiten van gegevens over meetresultaten uit (decentrale) systemen en registraties richting een centraal gegevenskwaliteitsysteem. Dat centrale systeem kan dan organisatiebrede rapportages en dashboards beschikbaar stellen. Het biedt dan vooral een gestandaardiseerde uitwisseling.
Aandachtspunten
Beperkte toolondersteuning
Er zijn nauwelijks standaard tools beschikbaar ter ondersteuning van de DQV standaard. Hierdoor zijn organisaties gedwongen de standaard zelf in systemen te implementeren. Er kan wel gebruik worden gemaakt van het registratietool dat is ontwikkeld voor het Federatief Datastelsel.
Tegelijkertijd heeft de standaard als voordeel dat het gebaseerd is op Linked Data standaarden. Hiervoor kunnen generieke tools voor het opslaan en ontsluiten van Linked Data worden gebruikt, zoals triplestores. Het zou verder vooral als uitwisselformaat moeten worden gezien. Gegevens over resultaten van kwaliteitsmetingen kunnen worden geconverteerd naar de DQV standaard en daarmee op uniforme wijze worden ontsloten.
Relatie met andere standaarden
Relatie met DCAT-AP-NL
Data Catalog Vocabulary (DCAT) is een metadatastandaard en is ontworpen om interoperabiliteit tussen gegevenscatalogi, gepubliceerd op het internet, te vergemakkelijken. DCAT-AP-NL is het Nederlands profiel op DCAT. DCAT maakt decentrale publicaties en ontsluiting van catalogi mogelijk. Het is mogelijk om datasets te beschrijven conform de DCAT standaard. Het is mogelijk om een verzameling van resultaten van kwaliteitsmetingen te bundelen in een speciale dataset. Hiervoor is in de DQV standaard de klasse QualityMeasurementDataset gedefinieerd, als subklasse van de DCAT klasse DataSet. Het DCAT record van de originele dataset kan aan deze speciale dataset worden verbonden met de eigenschap “dqv:hasQualityMeasurement”.
Relatie met SKOS
De Simple Knowledge Organization System (SKOS) standaard is gericht op het beschrijven van gecontroleerde vocabulaires, zoals begrippenkaders. De NL-SBB standaard voor het beschrijven van begrippen bevat dan ook een mapping op de SKOS standaard. De DQV standaard maakt gebruik van de SKOS standaard voor het definiëren van kwaliteitsdimensies. Een kwaliteitsdimensie is dan ook een begrip in SKOS (SKOS:Concept). Dat bevestigt dat een kwaliteitsraamwerk zoals bijvoorbeeld het NORA raamwerk gegevenskwaliteit vooral een gemeenschappelijk begrippenkader is.
Relatie met ODRL
De Open Digital Rights Language (ODRL) is gericht op het beschrijven van beleidsregels. Het gaat om rechten, plichten en beperkingen die van toepassing zijn op bepaalde digitale objecten. Het is mogelijk om met DQV een verbinding te leggen met uitspraken in ODRL. Daarmee is het mogelijk om kwaliteitsbeleid, kwaliteitseisen en kwaliteitsregels te definiëren en te koppelen aan een dataset. Dat is dan in potentie dezelfde dataset waaraan ook de resultaten van kwaliteitsmetingen zijn gekoppeld die zijn beschreven conform de DQV standaard. Hiervoor is in de DQV een placeholder klasse QualityPolicy gedefinieerd, die met de eigenschap “odrl:target” gekoppeld kan worden aan een DCAT dataset. Het is ook mogelijk om kwaliteitsmetrieken te operationaliseren in ODRL policies. In ODRL kun je dan uitdrukken hoe de metriek gemeten wordt.
Links
30 april 2026 06:50:16
9 april 2026 13:02:37
30 april 2026 06:50:16
4
Informatief