Raamwerk gegevenskwaliteit

Uit NORA Online
(Doorverwezen vanaf Raamwerk gegevenskwaliteit)
Naar navigatie springen Naar zoeken springen


Onderdeel van
Thema's
Contact
Wim Stolk
Wim.Stolk@minbzk.nl
Status
Actueel
Auteurs

Danny Greefhorst (ArchiXL), Kasper Kisjes (Rijkswaterstaat), Jaap van den Berg en Gerald Groot Roessink (DUO) en Wim Stolk (Min BZK) met hulp van Rien Schep (Berenschot)

Doel & uitgangspunten raamwerk gegevenskwaliteit[bewerken]

Het doel van het raamwerk gegevenskwaliteit is om een gemeenschappelijke taal te bieden voor het beschrijven van de kwaliteit van gegevens. Een dergelijke gestandaardiseerde taal maakt het eenvoudiger om te begrijpen wat er met specifieke kwaliteitseigenschappen wordt bedoeld en maakt het ook eenvoudiger om deze te vergelijken tussen verschillende registraties. Het kan gebruikt worden bij het bepalen van kwaliteitseisen, maar ook voor het eenduidig beschrijven van het resultaat van kwaliteitsmetingen. In meer algemene zin is het vooral een taal en checklist om na te denken over de kwaliteit van gegevens.

Uitgangspunt bij het ontwikkelen van het raamwerk was om gebruik te maken van (inter)nationale onafhankelijke standaarden. Er is met name gebruik gemaakt van ISO/IEC 25024, NEN-ISO 19157 en ISO 5725. Tegelijkertijd was de intentie om een raamwerk te ontwikkelen dat maximaal aansluit en bruikbaar is voor Nederlandse overheidsorganisaties. Alhoewel het primair gericht is op overheidsorganisaties, is het ook breder toepasbaar. Het raamwerk gegevenskwaliteit focust nu op de kwaliteit van de gegevens zelf en dus niet op bijvoorbeeld de kwaliteit van het proces, de systemen, de governance of de gegevensmodellen.

Het raamwerk bevat een breed toepasbare set van kwaliteitsdimensies en onderliggende kwaliteitsattributen en biedt daarmee een gemeenschappelijke referentiekader. De kwaliteitsattributen zijn toepasbaar op verschillende niveau's. Ze zijn gerelateerd aan andere standaarden, zodat zichtbaar hoe ze zich daartoe verhouden. Ze zijn ook voorzien van een zinsjabloon, die een standaard structuur biedt om de huidige of gewenste kwaliteit te beschrijven.

Voorbeelden en begrippenlijst[bewerken]

Er zijn voorbeelden beschreven, gebaseerd op een aantal landelijke basisregistraties. Ze zijn expliciet afgestemd met verantwoordelijken voor deze basisregistraties. Deze voorbeelden laten ook zien hoe de recent toegevoegde zinsjablonen gebruikt kunnen worden.

Er is ook een begrippenlijst gedefinieerd met daarin begrippen die specifiek zijn voor kwaliteit.

Voorgeschiedenis[bewerken]

Het raamwerk gegevenskwaliteit kent een uitgebreide geschiedenis. Het is een doorontwikkeling van het raamwerk zoals dat is ontwikkeld in de context van de Omgevingswet in 2018. Dat raamwerk was vooral gebaseerd op een aantal ISO standaarden (met name ISO/IEC 25012/25024 en NEN/ISO 19157), de facto standaarden zoals de Data Management Body of Knowledge, onderzoek en raamwerken en ervaringen bij verschillende overheidsorganisaties.

In 2021 is het raamwerk doorontwikkeld tot het NORA raamwerk. Daarbij is de inhoud opnieuw door een aantal overheidsorganisaties (met name DUO en Rijkswaterstaat) besproken en heeft een openbare consultatie plaatsgevonden. In deze openbare consultatie hebben tientallen professionals van binnen en buiten de overheid gereageerd op het raamwerk gegevenskwaliteit. Reacties kwamen binnen vanuit gemeenten, ministeries, DAMA NL, het stelsel van Basisregistraties en bijvoorbeeld een juridisch adviesbureau. De consultatie volgde op de eerste versie van het raamwerk en heeft ook geleid tot enkele bijstellingen, aanscherpingen en aanvullingen op definitie en omschrijving.

In 2024 is het raamwerk geadopteerd door het programma Federatief Data Stelsel. In een werkgroep gegevenskwaliteit is het toegepast op een aantal basisregistraties (HR, BRP en BAG), goed bruikbaar bevonden en gepositioneerd voor bredere inzet binnen de Nederlandse overheid. Een aantal toelichtingen zijn aangescherpt en er zijn standaard zinsjablonen toegevoegd waarmee op een standaard, gestructureerde manier uitdrukking kan worden gegeven aan de (huidige of gewenste) kwaliteit van gegevens. Deze zinsjablonen zijn inmiddels beschikbaar op deze website. De zinsjablonen moeten niet als verplicht worden beschouwd (wel als sterk aanbevolen). Suggesties voor aanvullende zinsjablonen zijn welkom. Naast de zin die ontstaat door het toepassen van de zinsjabloon is het ook aan te bevelen om een aanvullende toelichting op te nemen waarin relevante context en nuances kunnen worden beschreven.

Kwaliteitsdimensies[bewerken]

KwaliteitsdimensieDefinitie
JuistheidDe mate waarin gegevens de echte waarde goed weergeven.
CompleetheidDe mate waarin gegevens aanwezig zijn.
ValiditeitDe mate waarin gegevens voldoen aan de verwachte structuur en opslagvorm.
ConsistentieDe mate waarin gegevens vrij van tegenspraak zijn en samenhang vertonen met andere gegevens.
ActualiteitDe mate waarin gegevens recent genoeg zijn.
PrecisieDe mate waarin gegevens exact of onderscheidend genoeg zijn.
PlausibiliteitDe mate waarin gegevens worden beschouwd als waar en geloofwaardig door gebruikers.
TraceerbaarheidDe mate waarin de totstandkoming en het gebruik van gegevens zijn vastgelegd.
BegrijpelijkheidDe mate waarin gegevens eenvoudig gelezen en geïnterpreteerd kunnen worden door gebruikers.

Kwaliteitsattributen[bewerken]

Basisraamwerk[bewerken]

Juistheid
De mate waarin gegevens de echte waarde goed weergeven.
Classificatie juistheid
De mate waarin gegevensobjecten zijn geïdentificeerd als het juiste objecttype.
Thematische juistheid
De mate waarin kwalitatief beschrijvende gegevens overeenkomen met de werkelijkheid
Compleetheid
De mate waarin gegevens aanwezig zijn.
Attribuut compleetheid
De mate waarin bij gegevensobjecten waarden aanwezig zijn voor een attribuut.
Dataset compleetheid
De mate waarin objecten waarvan het bestaan bekend is aanwezig zijn.
Historie compleetheid
De mate waarin historische gegevens aanwezig en temporeel dekkend zijn.
Identificeerbaarheid
De mate waarin gegevens zijn voorzien van een unieke en stabiele identificatie die ook buiten de directe gebruikscontext betekenis heeft.
Overcompleetheid
De mate waarin gegevensobjecten niet onterecht aanwezig zijn.
Validiteit
De mate waarin gegevens voldoen aan de verwachte structuur en opslagvorm.
Domeinvaliditeit
De mate waarin de inhoud van waarden consistent zijn met hun domein.
Formaatvaliditeit
De mate waarin gegevens syntactisch correct zijn.
Consistentie
De mate waarin gegevens vrij van tegenspraak zijn en samenhang vertonen met andere gegevens.
Homogeniteit
De mate waarin de gegevens in een dataset gelijksoortig zijn.
Logische consistentie
De mate waarin de combinaties van waarden logisch samenhangend zijn.
Referentiële integriteit
De mate waarin verwijzingen in gegevens verwijzen naar bestaande gegevens.
Actualiteit
De mate waarin gegevens recent genoeg zijn.
Updatefrequentie
De snelheid waarmee gegevens worden vernieuwd.
Versheid
De mate waarin gegevens tijdig overeenkomen met de werkelijkheid.
Precisie
De mate waarin gegevens exact of onderscheidend genoeg zijn.
Opslagprecisie
De mate van detail waarmee gegevens zijn geregistreerd.
Plausibiliteit
De mate waarin gegevens worden beschouwd als waar en geloofwaardig door gebruikers.
Authenticiteit
De mate waarin de identiteit van de bron van de gegevens aantoonbaar is.
Bewijsbaarheid
De mate waarin de juistheid van een gegeven kan worden aangetoond
Reputatie
De mate waarin de gegevens worden vertrouwd vanwege de bron.
Waarschijnlijkheid
De mate waarin gegevens waarschijnlijk zijn voor de situatie.
Traceerbaarheid
De mate waarin de totstandkoming en het gebruik van gegevens zijn vastgelegd.
Gebruiksinzicht
De mate waarin er inzicht is in de gebruikers en hun gebruik.
Herleidbaarheid
De mate waarin is vastgelegd wie of wat het gegeven waar, wanneer en op welke manier heeft ingewonnen of bewerkt.
Reproduceerbaarheid
De mate waarin de transformatieregels die zijn gebruikt om tot de gegevens te komen bekend zijn.
Begrijpelijkheid
De mate waarin gegevens eenvoudig gelezen en geïnterpreteerd kunnen worden door gebruikers.
Duidelijkheid
De mate waarin teksten voor de doelgroep begrijpelijk zijn geformuleerd.

Extensies: Geografie en Statistiek[bewerken]

GeografieStatistiek
Juistheid
De mate waarin gegevens de echte waarde goed weergeven.
Positionele juistheid
De mate waarin locatiegegevens overeenkomen met de werkelijkheid.
Kwantitatieve juistheid
De mate waarin kwantitatieve gegevens overeenkomen met de werkelijkheid.
Compleetheid
De mate waarin gegevens aanwezig zijn.
Ruimtelijke dekking
De mate waarin de gegevens ruimtelijk dekkend zijn.
Validiteit
De mate waarin gegevens voldoen aan de verwachte structuur en opslagvorm.
Geometrische validiteit
De mate waarin iedere geometrie voldoet aan geometrische regels.
Consistentie
De mate waarin gegevens vrij van tegenspraak zijn en samenhang vertonen met andere gegevens.
Topologische consistentie
De mate waarin ruimtelijke gegevens zich op de juiste wijze tot elkaar verhouden.
Actualiteit
De mate waarin gegevens recent genoeg zijn.
Precisie
De mate waarin gegevens exact of onderscheidend genoeg zijn.
Geometrische precisie
De mate van detail waarmee ruimtelijke gegevens worden ingewonnen.
Statistische precisie
De mate waarin metingen of berekeningen bij herhaling dezelfde waarde opleveren.
Plausibiliteit
De mate waarin gegevens worden beschouwd als waar en geloofwaardig door gebruikers.
Representativiteit
De mate waarin een dataset een goede weergave geeft van het geheel.
Traceerbaarheid
De mate waarin de totstandkoming en het gebruik van gegevens zijn vastgelegd.
Begrijpelijkheid
De mate waarin gegevens eenvoudig gelezen en geïnterpreteerd kunnen worden door gebruikers.

Tabel met alle attributen[bewerken]

KwaliteitsattribuutDimensieDefinitieToelichtingZinsjabloon
Attribuut compleetheidCompleetheidDe mate waarin bij gegevensobjecten waarden aanwezig zijn voor een attribuut.Dit gaat over of er waarden zijn geregistreerd voor een specifiek attribuut. In een informatiemodel is bij attributen typisch aangegeven in hoeverre ze verplicht zijn. Dit kwaliteitsattribuut gaat dus met name over die attributen.voor ATTRIBUUT: PERCENTAGE van de gegevens in de registratie hebben een waarde
AuthenticiteitPlausibiliteitDe mate waarin de identiteit van de bron van de gegevens aantoonbaar is.Dit gaat erover of gegevens echt afkomstig zijn van de bron die je verwacht. Authenticiteit kan bijvoorbeeld worden aangetoond door de bewerker of verzender een digitale handtekening toe te laten voegen aan een gegeven. Niet te verwarren met authenticiteit in de betekenis dat ze een wettelijk verplicht gebruik kennen.voor OBJECTTYPE: PERCENTAGE van de gegevensobjecten is aantoonbaar afkomstig van de aanleverende partij
BewijsbaarheidPlausibiliteitDe mate waarin de juistheid van een gegeven kan worden aangetoondDit gaat over de objectiviteit van een waarde; zijn er bewijzen aanwezig die onderbouwen dat deze waarde echt klopt? De kans is anders groot dat de waarde vooral gebaseerd is op wat één persoon denkt.voor OBJECTTYPE: PERCENTAGE van de gegevensobjecten is voorzien van BEWIJS
Classificatie juistheidJuistheidDe mate waarin gegevensobjecten zijn geïdentificeerd als het juiste objecttype.Dit gaat over of gegevens wel of niet vallen onder de definitie van het objecttype. Als dat niet het geval is dan zou het kunnen beteken dat de definitie niet duidelijk genoeg is en dus aangescherpt moet worden.voor OBJECTTYPE: PERCENTAGE van de gegevensobjecten in de registratie zijn hebben het juiste objecttype
Dataset compleetheidCompleetheidDe mate waarin objecten waarvan het bestaan bekend is aanwezig zijn.Dit gaat over of voor alle objecten in de werkelijkheid die in scope zijn van de dataset ook als gegevensobject aanwezig zijn in de dataset. Om dit te kunnen bepalen moet ook duidelijk zijn wat het geheel is. Het is daarom belangrijk om ook de populatie van de dataset expliciet te maken. Daarnaast kunnen er altijd bepaalde objecten in de werkelijkheid zijn die we nog niet kennen en die we dus ook niet beschouwen als onderdeel van het geheel.voor OBJECTTYPE: PERCENTAGE van de objecten zoals bekend in BRONNEN zijn opgenomen in de registratie
DomeinvaliditeitValiditeitDe mate waarin de inhoud van waarden consistent zijn met hun domein.Dit gaat over de mate waarin een waarde een geldige waarde is. Een domein is een type (zoals getal of tekst of opsomming) en kan ook een lijst van toegestane waarden beschrijven (waardelijst).voor ATTRIBUUT: PERCENTAGE van de gegevens hebben een toegestane waarde
DuidelijkheidBegrijpelijkheidDe mate waarin teksten voor de doelgroep begrijpelijk zijn geformuleerd.Dit gaat er vooral over dat teksten kunnen worden begrepen door de lezer. Het is dan met name relevant om de gebruikte woorden te beperken tot een subset waarvan ondersteld mag worden dat de doelgroep deze begrijpt. In die context wordt ook wel gesproken over een B1 taalniveau, wat een niveau is wat het merendeel van de bevolking begrijpt. Duidelijke metadata maken data begrijpelijk. Daarom kunnen binnen dit kwaliteitsattribuut ook eisen worden gesteld aan de metadata.voor ATTRIBUUT: is geschreven op taalniveau TAALNIVEAU
FormaatvaliditeitValiditeitDe mate waarin gegevens syntactisch correct zijn.Dit gaat over of de gegevens voldoen aan het afgesproken formaat; of ze syntactisch correct zijn. Zijn alle symbolen overeenkomstig het verwachte formaat?PERCENTAGE van de gegevensobjecten in de registratie voldoet aan de formaateisen
GebruiksinzichtTraceerbaarheidDe mate waarin er inzicht is in de gebruikers en hun gebruik.Dit gaat zowel over de groepen die de gegevens gebruiken als over hun precieze gebruik (de doelen waarvoor de gegevens worden gebruikt). De laatste vraagt het loggen van het gebruik en het inzichtelijk maken van deze logging in de vorm van statistieken.PERCENTAGE van de attributen in de registratie zijn nadrukkelijk zijn expliciet gerelateerd aan een gebruiksdoel
Geometrische precisiePrecisieDe mate van detail waarmee ruimtelijke gegevens worden ingewonnen.Dit gaat over onder meer de gridgrootte en aantal decimalen van coördinaten. Er wordt in de context van rasterdata ook wel gesproken over resolutie; het scheidend vermogen van een optisch apparaat.voor ATTRIBUUT: is ingewonnen met een resolutie van AANTAL EENHEID
Geometrische validiteitValiditeitDe mate waarin iedere geometrie voldoet aan geometrische regels.Dit gaat over attributen die een geometrie bevatten. De verzameling punten die onderdeel uitmaken van deze geometrie moeten aan specifieke voorwaarden voldoen. Zo mogen zij bijvoorbeeld niet in een incorrecte ringvolgorde zitten, geen dubbele punten bevatten, het juiste aantal punten bevatten en geen onnodig korte lijnen.voor OBJECTTYPE: PERCENTAGE van de gegevensobjecten in de registratie hebben een valide geometrie
HerleidbaarheidTraceerbaarheidDe mate waarin is vastgelegd wie of wat het gegeven waar, wanneer en op welke manier heeft ingewonnen of bewerkt.Dit gaat vooral over het beschikbaar zijn van informatie over de herkomst van gegevens en het pad dat zij hebben gevolgd. Dit is onderdeel van 'data lineage'. Het vraagt een audit trail waarin dergelijke gegevens beschikbaar zijn. In tegenstelling tot een meer algemene audit trail is deze onderdeel van de gegevens zelf. Het detailniveau van de audit trail is op het niveau van handelingen van subjecten.voor OBJECTTYPE: PERCENTAGE van de gegevensobjecten dat herleid kan worden tot BRON
Historie compleetheidCompleetheidDe mate waarin historische gegevens aanwezig en temporeel dekkend zijn.Dit heeft betrekking op dat gegevens op elk moment waarover een dataset uitspraken doet een geldige waarde moeten hebben. Er mogen als het ware geen gaten in de tijd ontstaan. Elke relevante toestandsverandering van een object zou zijn weerslag moeten vinden in de registratie.voor OBJECTTYPE: PERCENTAGE van de gegevensobjecten in de registratie bevat gegevens over de volledige materiële historie van het object in de werkelijkheid
HomogeniteitConsistentieDe mate waarin de gegevens in een dataset gelijksoortig zijn.Dit gaat over specifieke attributen in een dataset en de mate waarin deze op een soortgelijk detailniveau zijn gevuld voor de gehele dataset. Er wordt bij homogeniteit ook wel gesproken over de mate van variatie van kwaliteit. Het meest sprekend is als je denkt over een geografische dataset, waarbij voor bepaalde gebieden in de dataset veel meer detail in het kaartbeeld aanwezig is dan voor andere gebieden.voor ATTRIBUUT: PERCENTAGE van de gegevens in de registratie is beschreven met DETAILNIVEAU
IdentificeerbaarheidCompleetheidDe mate waarin gegevens zijn voorzien van een unieke en stabiele identificatie die ook buiten de directe gebruikscontext betekenis heeft.Dit gaat over identifiers die relevant zijn om naar te verwijzen vanuit andere datasets. Dergelijke identifiers zijn de basis om datasets op een betrouwbare manier aan elkaar te kunnen koppelen.voor OBJECTTYPE: PERCENTAGE van de gegevensobjecten in de registratie is voorzien van een unieke identificatie
Kwantitatieve juistheidJuistheidDe mate waarin kwantitatieve gegevens overeenkomen met de werkelijkheid.Dit gaat specifiek in op attributen die uitgedrukt worden in een getal. Deze moeten zoveel mogelijk overeenkomen met het juiste getal. Als hier statistisch naar wordt gekeken dan wordt ook wel gesproken over systematische afwijking.voor ATTRIBUUT: PERCENTAGE van de gegevens waarvan de waarde maximaal AFWIJKING afwijkt van de juiste waarde
Logische consistentieConsistentieDe mate waarin de combinaties van waarden logisch samenhangend zijn.Dit gaat over de relatie tussen verschillende attributen; dat een waarde voor een specifiek attribuut invloed heeft op de toegestane waarde voor een ander attribuut. Dergelijke relaties worden vastgelegd in kwaliteitsregels. In de context van het controleren hiervan wordt ook wel gesproken over verbandscontroles. Hiervoor wordt ook wel de term integriteit gebruikt.voor OBJECTTYPE: PERCENTAGE van de gegevensobjecten in de registratie voldoen aan de gedefinieerde beperkingsregels
Metadata compleetheidCompleetheidDe mate waarin metadata aanwezig zijn.Dit gaat over de mate waarin beschrijvende gegevens aanwezig zijn over een dataset, gegevensobject of waarde. Dit gaat alleen over eigenschappen die direct gerelateerd zijn aan de gegevens zelf, zoals de definitie, het datatype, het formaat, toegekende klassen (in meest generieke zin), trefwoorden, kardinaliteit en verantwoordelijken.PERCENTAGE van de modelelementen in het gegevensmodel zijn voorzien van een definitie
OpslagprecisiePrecisieDe mate van detail waarmee gegevens zijn geregistreerd.Dit gaat vooral over het detailniveau van gegevens; het detailniveau van inwinning, het detailniveau door herhaalde metingen en het detailniveau waarmee data worden opgeslagen. Onderdeel van precisie is ondermeer het aantal significante cijfers.voor ATTRIBUUT: is ingewonnen met een precisie van AANTAL EENHEID
OvercompleetheidCompleetheidDe mate waarin gegevensobjecten niet onterecht aanwezig zijn.Dit gaat over gegevens die onderdeel zijn van de dataset, maar daarin eigenlijk niet thuishoren omdat zij niet passen bij de overeengekomen scope van de dataset, zij een duplicaat zijn van een ander informatieobject of onterecht zijn geïdentificeerd als behorend bij een specifiek objecttype (classificatie correctheid). Die laatste is ook een losse indicator. Het attribuut is bewust als een ontkenning geformuleerd zodat minder overcompleetheid tot een hogere score leidt.voor OBJECTTYPE: PERCENTAGE van de gegevensobjecten in de registratie zijn hier niet onterecht in opgenomen
Positionele juistheidJuistheidDe mate waarin locatiegegevens overeenkomen met de werkelijkheid.Dit gaat over attributen die betrekking hebben op een locatie. Deze gegevens moeten zoveel mogelijk overeenkomen met de daadwerkelijke locatie.voor OBJECTTYPE: PERCENTAGE van de gegevensobjecten in de registratie waarvan de geometrie maximaal AFSTAND afwijkt van de vorm en ligging van de objecten in de werkelijkheid
Referentiële integriteitConsistentieDe mate waarin verwijzingen in gegevens verwijzen naar bestaande gegevens.Referentiële integriteit gaat over of verwijzingen tussen gegevens kloppen. Dergelijke verwijzingen zitten in database definities typisch in foreign key constraints. De waarde van een attribuut dat een dergelijke constraint kent moet dan verwijzen naar de primaire sleutel van een ander informatieobject.voor ATTRIBUUT: PERCENTAGE van de gegevens in de registratie die verwijzen naar een bestaand gegevensobject
RepresentativiteitPlausibiliteitDe mate waarin een dataset een goede weergave geeft van het geheel.Dit gaat over de dataset als geheel en hoe deze zich verhoudt tot andere datasets in een groter geheel (doelpopulatie). Een dataset is representatief als de inhoud ervan statistisch gezien lijkt op die van andere datasets in het geheel.de registratie is gebaseerd op een steekproefgrootte van AANTAL EENHEID op een populatie van AANTAL EENHEID
ReproduceerbaarheidTraceerbaarheidDe mate waarin de transformatieregels die zijn gebruikt om tot de gegevens te komen bekend zijn.Dit gaat over regels die gebruikt worden om gegevens om te vormen. Als deze regels gedocumenteerd zijn dan is het mogelijk om een set van uitvoergegevens te reproduceren met deze regels.PERCENTAGE van de afgeleide attributen zijn gerelateerd aan de daarbij gebruikte transformatieregels
ReputatiePlausibiliteitDe mate waarin de gegevens worden vertrouwd vanwege de bron.Dit gaat over de partij die de gegevens heeft aangeleverd. Vertrouwen kan op allerlei manieren worden opgebouwd, met name door eerdere ervaringen met een partij.voor OBJECTTYPE: PERCENTAGE van de gegevensobjecten is aangeleverd door een vertrouwde partij
Ruimtelijke dekkingCompleetheidDe mate waarin de gegevens ruimtelijk dekkend zijn.Dit gaat erover dat voor een bepaald gebied er gegevens aanwezig zijn voor alle deelgebieden en dat er dus geen "gaten" bestaan.voor PERCENTAGE van het geografische gebied zijn gegevens beschikbaar
Statistische precisiePrecisieDe mate waarin metingen of berekeningen bij herhaling dezelfde waarde opleveren.Dit gaat over de reproduceerbaarheid van metingen. Hoe groter de precisie hoe kleiner de toevallige fout. Statistische precisie ook wel uitgedrukt in de standaardafwijking. De standaardafwijking geeft de mate van spreiding van getallen rondom het gemiddelde van deze getallen.voor ATTRIBUUT: is ingewonnen met een precisie van AANTAL EENHEID
Thematische juistheidJuistheidDe mate waarin kwalitatief beschrijvende gegevens overeenkomen met de werkelijkheidDit gaat vooral over of gegevens inhoudelijk kloppen. Idealiter is dat of ze overeenkomen met de werkelijkheid, maar in de praktijk is dat of ze overeenkomen met een registratie die dichter bij de werkelijkheid ligt of meer betrouwbaar is. Het is daarom bij het definiëren van de kwaliteit deze registraties waarmee wordt vergeleken expliciet te benoemen. Daarnaast geldt dat een dergelijke vergelijking niet zinvol is voor een registratie die zelf een juridische werkelijkheid creëert, omdat de registratie die zelf bepaalt. Thematische juistheid kan zowel betrekking hebben op de reële werkelijkheid als de juridische werkelijkheid.voor ATTRIBUUT: PERCENTAGE van de gegevens komt overeen met de gegevens in BRONNEN
Topologische consistentieConsistentieDe mate waarin ruimtelijke gegevens zich op de juiste wijze tot elkaar verhouden.Dit gaat over specifieke attributen in een dataset en de mate waarin deze op een soortgelijk detailniveau zijn gevuld voor de gehele dataset. Er wordt bij homogeniteit ook wel gesproken over de mate van variatie van kwaliteit. Het meest sprekend is als je denkt over een geografische dataset, waarbij voor bepaalde gebieden in de dataset veel meer detail in het kaartbeeld aanwezig is dan voor andere gebieden.voor OBJECTTYPE: PERCENTAGE van de gegevensobjecten in de registratie hebben een topologisch consistente geometrie
UpdatefrequentieActualiteitDe snelheid waarmee gegevens worden vernieuwd.Dit heeft betrekking op hoe vaak gegevens of delen ervan worden bijgewerkt in een registratie. Dat wordt typisch uitgedrukt in termen van periodes zoals dagelijks, wekelijks, maandelijks of jaarlijks.voor OBJECTTYPE: PERCENTAGE van de gegensobjecten in de registratie is geactualiseerd binnen PERIODE
VersheidActualiteitDe mate waarin gegevens tijdig overeenkomen met de werkelijkheid.Dit heeft betrekking op hoe oud gegevens zijn. Gegevens moeten periodiek opnieuw worden gemeten of er moet worden gecontroleerd of ze nog correct zijn. Dat kun je uitdrukken in termen van het verschil tussen het moment waarop een gegeven is ingewonnen en het moment waarop dit gegeven zichtbaar is voor een eindgebruiker.voor OBJECTTYPE: PERCENTAGE van de objecten zijn binnen NORMTIJD opgenomen of gewijzigd in de registratie
WaarschijnlijkheidPlausibiliteitDe mate waarin gegevens waarschijnlijk zijn voor de situatie.Mensen zijn vaak in staat om in één oogopslag te zien als iets ongeloofwaardig is. Door de regels die daar onbewust bij worden gebruikt expliciet te maken kan waarschijnlijkheid ook geautomatiseerd worden bepaald. Deze regels noemen we “signaalregels” of "plausibiliteitsregels". Een onwaarschijnlijk gegeven is een gegeven dat een signaalregel overschrijdt. Het gegeven is daarmee niet automatisch fout. Er is slechts een signaal dat het gegeven mogelijk fout is.voor OBJECTTYPE: PERCENTAGE van de gegevensobjecten in de registratie voldoen aan de gedefinieerde plausibiliteitsregels

Overzicht[bewerken]

Raamwerk gegevenskwaliteit.jpg

Feedback[bewerken]

De NORA expertgroep gegevensmanagement staat altijd open voor feedback op het raamwerk of de toepassing van het raamwerk. Via de gegevens in het colofon (boven rechts) kunt u een bericht achterlaten.