4 Stappenplan gegevenskwaliteit
Dit hoofdstuk beschrijft een algemeen stappenplan voor het verbeteren van de kwaliteit van een specifieke set van gegevens. Het biedt nadrukkelijk een ander perspectief dan de kwaliteitscyclus zoals beschreven in hoofdstuk 2. Een aantal onderwerpen wordt wel benoemd, maar niet uitgebreid beschreven in dit hoofdstuk. Ze zijn uitgebreider beschreven in het volgende hoofdstuk. Na een korte inleiding worden de individuele stappen beschreven. Het hoofdstuk eindigt met een overzicht van taken en verantwoordelijkheden per stap in het stappenplan.
4.1 Inleiding
Het stappenplan is gericht op het verbeteren van de kwaliteit van een specifieke set van gegevens. Voor alle stappen en taken geldt dat het afhankelijk is van de context en de volwassenheid in hoeverre ze nodig zijn. Figuur 4 geeft een overzicht van de stappen en hun samenhang. Merk op dat alhoewel het stappenplan een lineair proces lijkt, het in de praktijk een cyclisch proces is. Naast dat het proces per dataset loopt, kan het ook over datasets heen lopen. In cycli wordt continu gewerkt aan verbetering van het meetinstrumentarium, regels en eisen, kwaliteitsproblemen en maatregelen.

Figuur 4: Stappenplan met resultaten per stap
Het stappenplan staat nadrukkelijk los van de kwaliteitscyclus zoals beschreven in hoofdstuk 2. Het stappenplan legt de nadruk op de inhoudelijke stappen, terwijl de kwaliteitscyclus meer gaat over fasering van verbetering. Een aantal stappen komen ook in meerdere fases van de kwaliteitscyclus terug. De focus van het stappenplan ligt op de fase van plannen (plan) en deels op uitvoeren (do). De uitvoering zelf bestaat naast het implementeren van maatregelen vooral uit de dagelijkse verwerking van gegevens. Het meten van gegevenskwaliteit en het afhandelen van signalen is zowel relevant voor het plannen (plan) als voor het evalueren (check). Het implementeren van maatregelen kun je ook zien als onderdeel van het bijstellen (act).
4.2 Beschrijving van stappen
4.2.1 Bepalen context
In deze stap wordt de organisatorische context van de specifieke gegevens expliciet gemaakt, op basis waarvan kan worden bepaald waar de aandacht op gericht kan worden.
Identificeer de aanleiding en de drijfveren voor verandering rondom de gegevens en de rol die gegevenskwaliteit daarin kan spelen. Er zijn allerlei aanleidingen die ook andere activiteiten en producten vragen. Voorbeelden van aanleidingen zijn:
- Een algemeen signaal dat de kwaliteit van specifieke gegevens onvoldoende is.
- Een concreet probleem m.b.t. specifieke gegevens.
- Het opzetten van een nieuwe gegevensverzameling.
- De behoefte aan een nieuw informatieproduct.
- Het implementeren van een nieuw informatiesysteem en het migreren van de bijbehorende gegevens.
Identificeer welke processen de gegevens creëren en gebruiken en waar deze processen zich bevinden in de keten. Identificeer de betrokkenen, zodat met hen over de benodigde kwaliteit van de gegevens kan worden afgestemd. Wie is bijvoorbeeld betrokken bij de inwinning, het beheren, het aanbieden of het afnemen van de gegevens? Wie zijn de gebruikers en wie is de eindverantwoordelijke en de uitvoerend verantwoordelijke voor de gegevens?
Bepaal in hoeverre er draagvlak is voor de gewenste verandering bij de betrokkenen. Creëer waar nodig bewustzijn en draagvlak. Besteed expliciete aandacht aan het duidelijk maken welke rol een betere gegevenskwaliteit kan spelen bij het bereiken van de gewenste verandering.
Bepaal de volwassenheid van de organisatie (team) rondom de specifieke gegevens op het gebied van gegevenskwaliteit. Deze wordt voor een deel bepaald door de volwassenheid van de organisatie als geheel. Identificeer op basis daarvan welke stappen, activiteiten en producten het meest waardevol zijn.
Bepaal of alle noodzakelijke competenties beschikbaar zijn voor de gewenste verandering. Zorg er anders voor dat andere medewerkers worden geworven of anderzijds beschikbaar kunnen worden gesteld.
Zie hoofdstuk 6 voor meer informatie over volwassenheid.
4.2.2 Beschrijven gegevens
In deze stap worden beschrijvingen verzameld en/of opgesteld van de set van gegevens waarvan de kwaliteit moet worden verbeterd.
Baken af welke gegevens onderdeel zijn van de verbetering en wat hun eigenschappen zijn. Leg de beschrijving van de gegevens vast in de vorm van metagegevens. Maak gebruik van een metagegevens repository om de datasets en gegevenselementen te documenteren.
Breng de herkomst van de gegevens in kaart (datalineage), om meer inzicht te krijgen in de keten van creatie tot gebruik. Als deze herkomst niet expliciet is vastgelegd, dan kan deze op hoog niveau handmatig in kaart worden gebracht.
Overweeg om met terugwerkende kracht de begrippen, het informatiemodel en/of het gegevensmodel behorende bij de gegevens op te stellen. Dit is vooral relevant als bredere communicatie en/of doorontwikkeling van de betekenis of gegevensstructuur relevant is.
Leg focus op de belangrijkste gegevenselementen, zodat de kwaliteit van gegevens gericht kan worden verbeterd. Deze heten ook wel kritieke gegevenselementen. Er kan ook op een meer geaggregeerd niveau worden bepaald of gegevens kritiek zijn, zoals op het niveau van gegevensgroepen of datasets.
Zie paragraaf 5.4.6 voor meer informatie over metagegevens repositories, paragraaf 5.4.3 voor meer informatie over datalineage, paragraaf 5.2.3 voor meer informatie over kritieke gegevenselementen en paragraaf 5.4 voor meer informatie over metagegevens, begrippen, informatie- en gegevensmodellen.
4.2.3 Beschrijven regels en eisen
In deze stap worden voor een specifieke set van gegevens regels gemaakt die beschrijven wanneer gegevens valide zijn en worden er eisen gesteld aan de gegevens.
Beschrijf de kwaliteitsregels en leg deze gestructureerd vast. Kwaliteitsregels zijn regels die bepalen waar gegevens aan moeten voldoen. Bij het ontwerpen van een systeem zou een gegevensmodel moeten zijn opgesteld, inclusief bijbehorende beperkingsregels (constraints), die als uitgangspunt kunnen worden genomen. Focus op de kritieke gegevenselementen.
Beschrijf de kwaliteitseisen en leg deze gestructureerd vast. Kwaliteitseisen zijn te zien als doelen die bereikt moeten worden. Het is belangrijk dat zij goed aangeven wat belangrijk is en dat het realiseren van deze eisen reëel is. Bepaal ze bij voorkeur op basis van de business impact van potentiële problemen en de kosten om deze op te lossen. Op het moment dat er nog geen ervaringscijfers zijn, is het vaak lastig om tot goede eisen te komen. Het kan dan een bewuste keus zijn om in eerste instantie zonder eisen of met meer globale eisen te werken.
Kwaliteitsregels en kwaliteitseisen kunnen uit allerlei bronnen komen, zoals behoeften van gebruikers, wet- en regelgeving, standaarden en technische randvoorwaarden. Kwaliteitsraamwerken kunnen gebruikt worden om relevante categorieën van eisen in een specifieke context te bepalen. Ze zijn te zien als een soort checklist.
Gebruik data profiling als een eerste actie om inzicht te krijgen in de kwaliteit van gegevens, en daarmee op relevante kwaliteitsregels en kwaliteitseisen. Er ontstaat daarmee een beeld of de gegevens logisch, compleet en consistent zijn. Er kunnen ook andere rapportages worden gemaakt om snel een dieper beeld te creëren van de huidige kwaliteit.
Hanteer een risico-gebaseerde benadering om zicht te krijgen op de belangrijkste kwaliteitsregels en kwaliteitseisen. Dat betekent dat wordt nagedacht over welke soorten fouten er kunnen optreden en wat hun kans en impact is.
Baseer eisen op het gebruik van de gegevens en ga in gesprek met afnemers om potentiële eisen te identificeren. Als de trigger voor het starten van het stappenplan een specifieke informatiebehoefte van een afnemer is, bepaal dan de eisen specifiek voor die behoefte. Het vraagt een goed gesprek om te komen tot eisen die enerzijds aansluiten bij wat gebruikers willen en anderzijds ook tegen acceptabele kosten kunnen worden gerealiseerd.
Laat de kwaliteitsregels en kwaliteitseisen formeel goedkeuren, leg ze vast als metagegevens en in gegevensleveringsovereenkomsten (of bijbehorende specificaties).
Zie paragraaf 5.2.1 voor meer informatie over kwaliteitseisen, paragraaf 5.2.2 voor meer informatie over kwaliteitsregels, paragraaf 5.3.4 voor meer informatie over data profiling, en paragraaf 5.2.4 voor meer informatie over gegevensleveringsovereenkomsten.
4.2.4 Meten gegevenskwaliteit
In deze stap worden metingen uitgevoerd van de kwaliteit van de gegevens, om daarmee een beeld te krijgen van de impact van de genomen maatregelen.
Richt voor het meten van gegevenskwaliteit relevante processen en systemen in. Besteed daarbij expliciete aandacht aan rollen en bevoegdheden. Bepaal of er nieuwe systemen nodig zijn om de regels en eisen te controleren. Ondersteun gebruikers bij het inrichten en gebruiken van dit soort systemen.
Voer metingen van gegevenskwaliteit periodiek uit en gebruik ze om problemen met gegevenskwaliteit te identificeren. Dit kan ook als er nog geen specifieke kwaliteitseisen zijn.
Controleer kwaliteitseisen zoveel mogelijk geautomatiseerd, door zoekvragen te stellen aan databases waarin de gegevens zich bevinden. Er zijn ook kwaliteitseisen die niet geautomatiseerd te controleren zijn. Dat zijn vooral eisen die betrekking hebben op juistheid. Deze kunnen alleen worden gecontroleerd door de gegevens te vergelijken met de werkelijkheid. Zo kun je alleen controleren of een huis ergens staat, door te kijken of dat huis er ook echt staat. Deels kan hiervoor gebruik worden gemaakt van bijvoorbeeld fotomateriaal, maar het kan ook nodig zijn om fysiek de werkelijkheid in te gaan om de controle uit te voeren. Het is duidelijk dat dit zoveel inspanning kost, dat het eigenlijk alleen mogelijk is om steekproeven uit te voeren. Daarbij kunnen wel statistische technieken worden gebruikt om kwaliteitsindicaties over de dataset als geheel te geven.
Geef meetresultaten weer in rapportages of dashboards en communiceer deze ook breed in de organisatie. Dat zorgt voor transparantie. Communiceer ook in meer algemene zin over de inzichten die hieruit voortvloeien, zowel positieve als negatieve zaken. Maak de meetresultaten ook inzichtelijk in de metagegevens van datasets.
Zie paragraaf 5.3.6 voor meer informatie over kwaliteitsrapportages en -dashboards en paragraaf 5.4.4 voor meer informatie over het creëren van inzicht in gegevenskwaliteit met metagegevens.
4.2.5 Afhandelen signalen
In deze stap worden signalen over mogelijke problemen met de kwaliteit van gegevens geïdentificeerd, onderzocht en vertaald naar maatregelen (oplossingen).
Identificeer de afwijkingen tussen de kwaliteitseisen en de huidige kwaliteit zoals geconstateerd bij het meten. Een andere bron van signalen over mogelijke problemen in de kwaliteit van gegevens zijn terugmeldingen. Bij het afhandelen van terugmeldingen is onderzoek nodig om te bepalen of de twijfel aan de kwaliteit van de gegevens terecht is. De melders worden ook geïnformeerd over de status en afhandeling van de terugmelding.
Voer onderzoek uit om oorzaken voor kwaliteitsproblemen te vinden. Achterhaal zonodig informatie over de huidige inrichting van processen, gegevens en systemen. Uiteindelijk gaat het vooral om de kernoorzaken (root causes) en is het dus belangrijk om de oorzaken achter de problemen te vinden en daarmee te voorkomen dat symptomen worden bestreden.
Corrigeer fouten in gegevens waar mogelijk in de bron en documenteer de gemaakte keuzes. Er kan een veelheid of complexiteit aan maatregelen nodig zijn, die vragen om het opstellen van een verbeterplan. Creëer inzicht in kosten en baten en aanvullende criteria zoals onzekerheid, beschikbare kennis en capaciteit, urgentie en bijdrage aan de strategie. Zet op basis van de prioritering de maatregelen uit in tijd, rekening houdend met hun afhankelijkheden. Stem het verbeterplan af met de afnemers. Het zou ook kunnen dat bepaalde problemen gewoonweg niet opgelost kunnen worden. Het inzichtelijk maken daarvan heeft echter ook waarde.
Zie paragraaf 5.3.8 voor meer informatie over terugmeldingen.
4.2.6 Implementeren maatregelen
In deze stap worden de maatregelen geïmplementeerd om de kwaliteitsproblemen op te lossen.
Deze maatregelen zijn typisch gericht op het voorkomen van toekomstige problemen. Denk bijvoorbeeld aan invoercontroles, controles in ETL-processen of extra controles in processen.
Het is afhankelijk van de situatie of een pilot noodzakelijk is of dat de maatregel gelijk breed kan worden uitgerold. Een pilot is te zien als een test, waarbij gecontroleerd wordt of de aangepaste processen of systemen gegevens van de juiste kwaliteit afleveren. De bevindingen en het besluit n.a.v. de pilot worden gestructureerd gedocumenteerd. De bevindingen uit de pilot moeten worden verwerkt en de aangepaste maatregel moet breed worden geïmplementeerd als de pilot daartoe aanleiding geeft.
4.3 Overzicht van taken per stap
Tabel 3 geeft een overzicht van de taken per stap en is te zien als een samenvatting van het stappenplan. Het laat tevens zien welke taken primair door de uitvoerend verantwoordelijke voor specifieke gegevens worden uitgevoerd en welke taken typisch bij andere rollen liggen. Net zoals geldt voor het stappenplan, geldt dat ook deze tabel betrekking heeft op de taken die worden uitgevoerd voor één specifieke gegevensverzameling.
De (uitvoerende) verantwoordelijkheid voor gegevens ligt typisch bij iemand die de rol data steward heeft, maar kan bij andere (of een verzameling van) functies of rollen worden belegd. De eindverantwoordelijke voor gegevens zoals bedoeld in de tabel is iemand die ook budgetverantwoordelijk is. In sommige organisaties is er een splitsing tussen de budgetverantwoordelijke en de inhoudsverantwoordelijke. De tabel is nadrukkelijk geen volledige RACI (Responsible, Accountable, Consulted, Informed) tabel. Het benoemt alleen de uitvoerende taken (responsible) en de taken van een eindverantwoordelijke (accountable) gerelateerd aan gegevenskwaliteit. De rollen die worden geconsulteerd (consulted) of geïnformeerd (informed) zijn bewust niet opgenomen om de tabel overzichtelijk te houden. Zo is bijvoorbeeld de rol inhoudsdeskundige (subject matter expert) niet expliciet gemaakt, omdat deze in elke stap belangrijke input levert (geconsulteerd wordt). Daarnaast kunnen er bijvoorbeeld centrale staffunctionarissen of afdelingen zijn die geconsulteerd moeten worden. Verder betekent de uitvoerende taak niet per definitie dat deze ook volledig door de uitvoerend verantwoordelijke moet worden uitgevoerd. Bij veel taken zal het nodig zijn om allerlei andere mensen te betrekken en is er dus vooral coördinatie nodig van de uitvoerend verantwoordelijke. Organisaties kunnen zelf op basis van de tabel bepalen wat voor hen een logische vertaling naar rollen is.
| Taken uitvoerend verantwoordelijke | Taken andere rollen | |
|---|---|---|
| 1. Bepalen context |
| Eindverantwoordelijke voor gegevens:
|
| 2. Beschrijven gegevens |
|
Data-architect:
Analist:
Modelleur:
Technisch specialist:
|
| 3. Beschrijven regels en eisen |
Analist:
Eindverantwoordelijke voor gegevens:
| |
| 4. Meten gegevenskwaliteit |
|
Technisch specialist:
|
| 5. Afhandelen signalen |
|
Eindverantwoordelijke voor gegevens:
Technisch specialist:
|
| 6. Implementeren maatregelen |
|
Projectleider:
Technisch specialist:
|
Tabel 3: Taken en verantwoordelijkheden per stap in het stappenplan
Volgende hoofdstuk: Hoofdstuk 5 - Bouwstenenen voor gegevenskwaliteit
23 december 2025 14:38:36
14 mei 2025 08:43:35
23 december 2025 14:38:36
31
Informatief
20 mei 2025