2 Inleiding gegevenskwaliteit
Dit hoofdstuk geeft een algemene inleiding op het onderwerp gegevenskwaliteit. Het geeft aan dat het vooral om continue verbetering vraagt en onderdeel is van gegevensmanagement als groter geheel. Het beschrijft ook de belangrijkste standaarden.
2.1 Gegevenskwaliteit en het belang ervan
Gegevenskwaliteit is de mate waarin gegevens voldoen aan expliciete en impliciete behoeften en verwachtingen. Deze behoeften zijn gebaseerd op het gebruik van de gegevens. Ze worden expliciet gemaakt door ze te beschrijven in de vorm van kwaliteitsregels en kwaliteitseisen. Ze maken concreet in welke mate bijvoorbeeld de juistheid, compleetheid of actualiteit van gegevens van belang is. Kwaliteitseisen zouden gebaseerd moeten zijn op de behoeften die voortvloeien uit het gebruik. Het is belangrijk dat er afstemming is tussen bronhouders en afnemers over de eisen en de daaraan ten grondslag liggende behoeften. Afnemers kennen hun eigen gebruik het best en zijn dan ook het best in staat de eisen vanuit gebruik te definiëren. Maatregelen die worden genomen voor het verbeteren van de kwaliteit dienen in verhouding te staan tot de behoeften. Een te hoge kwaliteit kan net zo onwenselijk zijn als een te lage kwaliteit, omdat dat een inspanning vraagt en daarmee tot kosten leidt die niet in verhouding staan tot wat nodig is voor het gebruik. Inzicht in gegevenskwaliteit is belangrijk zodat gebruikers kunnen inschatten of de kwaliteit voldoende is voor hun gebruik.
De kwaliteit van gegevens vraagt expliciete aandacht van overheidsorganisaties. Foutieve gegevens leiden tot onbetrouwbare informatie, verkeerde beslissingen, inefficiënte en ineffectieve processen en slechte dienstverlening. Uiteindelijk leiden ze tot ontevreden burgers en bedrijven, en imagoschade van de overheid. Wet- en regelgeving stelt ook eisen aan gegevenskwaliteit. Zo staat er bijvoorbeeld in artikel 5, lid 1, onder d van de Algemene verordening gegevensbescherming (AVG) dat persoonsgegevens juist moeten zijn en zo nodig moeten worden geactualiseerd. Daarnaast zijn er kwaliteitseisen benoemd voor allerlei overheidsregistraties waaraan zij moeten voldoen, zoals voor de landelijke basisregistraties. Overheidsorganisaties zouden ook los van deze formele plichten expliciet aandacht moeten besteden aan de kwaliteit van gegevens.
Algemene redenen om aan de slag te gaan met gegevenskwaliteit zijn:
- Betere analyses: meer betrouwbare gegevens leiden tot betere waarheidsvinding en als gevolg daarvan tot betere informatie.
- Betere besluitvorming: het verhogen van de kwaliteit van besluiten, doordat deze op betere gegevens en analyses zijn gebaseerd.
- Betere processen: het verbeteren van de efficiëntie en voorspelbaarheid van processen en de kwaliteit van dienstverlening, door het voorkomen van fouten, rework en herstel.
- Compliance: het voldoen aan wet- en regelgeving die eisen stelt aan de kwaliteit van gegevens en/of het met meer vertrouwen rapporteren dat wordt voldaan aan wet- en regelgeving.
2.2 Gegevenskwaliteit vraagt om continue verbetering
Er kunnen allerlei maatregelen nodig zijn om de kwaliteit van de gegevens te verhogen. Gegevens ontstaan bij hun inwinning en daar zou in eerste instantie al aandacht voor kwaliteit moeten zijn. Dat betekent dat de inwinningprocessen en gebruikte meetinstrumenten expliciete aandacht vragen. Voor gegevens die administratief worden ingewonnen betekent het vooral aandacht voor het correct invoeren van de gegevens. Dat vraagt goede instructies voor gebruikers, maar ook (geautomatiseerde) controles die ervoor zorgen dat foutieve gegevens niet worden geaccepteerd. De kwaliteit van bestaande gegevens kan worden verbeterd door ze te vergelijken, in lijn te brengen en/of te verrijken met andere bronnen van gegevens. Daarnaast kunnen gegevens soms ook op basis van (geautomatiseerde) regels worden gestandaardiseerd of gecorrigeerd. Een belangrijke bron voor verbetering van gegevens zijn eindgebruikers. Zij kunnen mogelijke twijfel over de juistheid van gegevens melden aan de verantwoordelijke partij of persoon. Voor de basisregistraties is dat zelfs een formele plicht.
Het verbeteren van gegevenskwaliteit is geen project, maar iets dat continu aandacht vraagt. De basis voor gegevenskwaliteit is een kwaliteitscyclus. Het is een cyclus van plannen, uitvoeren, evalueren en bijstellen (ook wel: Plan, Do, Check, Act - PDCA). De cyclus start met het opstellen van een plan voor het oplossen van problemen met gegevenskwaliteit. De problemen met gegevenskwaliteit worden vervolgens opgelost, er wordt geëvalueerd of de oplossingen werken en tenslotte worden de oplossingen bijgesteld en breed geïmplementeerd.

Figuur 1: Kwaliteitscyclus
2.3 Een breder perspectief op gegevens
Gegevenskwaliteit is één van de aspecten van gegevensmanagement (ook wel: data management) in algemene zin. Andere aspecten van gegevensmanagement zijn bijvoorbeeld data governance, metagegevensbeheer en gegevensmodellering. Het werken aan gegevenskwaliteit heeft een nauwe relatie met deze andere aspecten. Data governance gaat over het maken van afspraken over rollen, taken, bevoegdheden, verantwoordelijkheden, processen, overleg- en beslisstructuren. Met name de eindverantwoordelijkheid en uitvoerende verantwoordelijkheid voor specifieke gegevens zijn cruciaal om gegevenskwaliteit goed te laten werken. Metagegevens en gegevensmodellen hebben ook een directe relatie met gegevenskwaliteit. Als deze niet aanwezig zijn of kwalitatief onvoldoende zijn, dan leidt dat ook tot een lagere kwaliteit van de gegevens in algemene zin. Zo kun je bijvoorbeeld heel weinig met gegevens waarvan hun betekenis niet goed is gedefinieerd.
Een specifiek aandachtspunt is het hergebruiken van gegevens voor andere gebruiksdoelen. Gegevens zijn vaak ingewonnen voor een specifiek gebruiksdoel en het gebruik in andere contexten stelt andere (kwaliteits)eisen aan de gegevens. Er is expliciete afstemming met de bronhouder nodig als dit soort afwijkende eisen bestaan. Afnemers en bronhouders (of hun aanbieders) dienen dan in onderling te bepalen wat er mogelijk is. Onderlinge afspraken daarover worden in een gegevensleveringsovereenkomst vastgelegd. Overigens is ook altijd een expliciete toets door de afnemer belangrijk om te bepalen of de betreffende gegevens wel aansluiten bij het doel en de grondslag voor verwerking.
2.4 Standaarden voor gegevenskwaliteit
Er zijn allerlei standaarden die betrekking hebben op gegevenskwaliteit. Alleen al in de context van ISO zijn er meerdere standaarden, die vanuit verschillende achtergronden zijn opgesteld en dus ook niet direct vergelijkbaar of combineerbaar zijn. Zo zijn de ISO/IEC 25012 en 25024 standaarden ontstaan vanuit het domein van software-ontwikkeling. Ze beschrijven standaard dimensies en attributen voor het uitdrukken van gegevenskwaliteit. De NEN-ISO 19517 standaard komt vanuit het domein van geografische gegevens en beschrijft aspecten van gegevenskwaliteit die vooral gaan over geografische aspecten, zoals geometrie en topologie. De ISO 5725 standaard komt vanuit het domein van metingen en gaat met name in op de juistheid en precisie van meetgegevens. De NEN-ISO 8000 standaard (ISO, 2022) komt vanuit het domein van data management en is veel breder dan de voorgenoemde standaarden. Het gaat bijvoorbeeld ook in op de processen en de data governance. Het beschrijft ook een procesmodel (gebaseerd op de kwaliteitscyclus) en een volwassenheidsmodel.
Los van deze standaarden is ook het werk van de Data Management Association (DAMA) belangrijk. De Data Management Body of Knowledge (DAMA International, 2017) biedt een overzicht van data management in algemene zin, maar gaat ook in op gegevenskwaliteit. De Nederlandse vertegenwoordiging van DAMA (DAMA NL) heeft ook een aantal relevante stukken geproduceerd, zoals een research paper over datakwaliteitsdimensies (DAMA NL, 2020) en managementsysteem voor gegevenskwaliteit (DAMA NL, 2024). Met name de laatste is erg relevant voor dit stappenplan, omdat het beschrijft wat er allemaal nodig is om gegevenskwaliteit organisatorisch te borgen. Het beoogt een managementsysteem te bieden voor gegevenskwaliteit, gebaseerd op de ISO 9001 standaard voor proceskwaliteit. Genoemde producten van DAMA NL zijn in gestructureerde vorm beschikbaar in de data management wiki van DAMA NL.
Naast genoemde standaarden is er ook een grote diversiteit aan onderzoek en praktijk op het gebied van gegevenskwaliteit. Een aantal individuele overheidsorganisaties heeft zelf methoden en raamwerken voor gegevenskwaliteit ontwikkeld, zoals bijvoorbeeld Rijkswaterstaat. In de context van de Omgevingswet was er ook behoefte aan een visie en raamwerk op het gebied van gegevenskwaliteit (Greefhorst, 2018). Daarbij is ook expliciet gekeken naar bestaande standaarden en ervaringen. Het resultaat daarvan is doorontwikkeld en verder afgestemd en verrijkt en vastgelegd in het NORA raamwerk gegevenskwaliteit (zie Figuur 2). Het raamwerk bestaat uit 9 kwaliteitsdimensies en daaronder een aantal kwaliteitsattributen, die deels specifiek zijn voor geografische of statistische gegevens. Het raamwerk is inmiddels ook omarmd door het federatief datastelsel en vormt een belangrijk Nederlands referentiekader voor het beschrijven van gegevenskwaliteit. Het beoogt een praktisch handvat te bieden voor overheidsorganisaties. De NORA expertgroep gegevensmanagement, die tevens de opdrachtgever is voor dit stappenplan, is ook eigenaar van het raamwerk gegevenskwaliteit.

Figuur 2: NORA raamwerk gegevenskwaliteit
Volgende hoofdstuk: Hoofdstuk 3 - Aanvliegroutes en algemene inrichting
19 mei 2025 15:24:20
14 mei 2025 07:26:43
19 mei 2025 15:24:20
16
Informatief
20 mei 2025