Raamwerk gegevenskwaliteit

Uit NORA Online
Versie door M.M.Vos (overleg | bijdragen) op 24 jun 2021 om 12:01 (links, consistent {{pijl}} ipv bulletpoints)
(wijz) ← Oudere versie | Huidige versie (wijz) | Nieuwere versie → (wijz)
Ga naar: navigatie, zoeken
Logo van het subthema gegevensmanagement,de tekst Gegevensmanagement met een serie nulletjes en eentjes die op verschillende manieren zijn gegroepeerd en gearceerd. Plus in de onderhoek het logo van Data op het web, een spinneweb met nulletjes en eentjes er in en de tekst Data op het web.

Onderdeel van Gegevensmanagement.
Status: 1.0 - eerste publieke versie
Auteurs: Danny Greefhorst (ArchiXL), Kasper Kisjes (Rijkswaterstaat), Jaap van den Berg en Gerald Groot Roessink (DUO) en Wim Stolk (Voorzitter Expertgroep Gegevensmanagement/Berenschot) met hulp van Rien Schep (Berenschot)

Feedback pagina: w.stolk@berenschot.nl

Beste lezer,

Voorgeschiedenis[bewerken]

Voor je ligt het resultaat van de openbare consultatie van het eerste kwartaal 2021 voor het raamwerk gegevenskwaliteit. In deze openbare consultatie hebben tientallen professionals van binnen en buiten de overheid gereageerd op het raamwerk gegevenskwaliteit. Reacties kwamen binnen vanuit gemeenten, ministeries, DAMA NL, het stelsel van Basisregistraties en bijvoorbeeld een juridisch adviesbureau.

De consultatie volgde op de eerste versie van het raamwerk en heeft ook geleid tot enkele bijstellingen, aanscherpingen en aanvullingen op definitie en omschrijving. Deze reviews waren positief van aard en veel reacties dat er nu een basis ligt om een eenduidige interpretatie van het begrip gegevenskwaliteit en de daaronder liggende dimensies en attributen te onderkennen.

 * Deze opzet is opgesteld en bijgewerkt na de review door Danny Greefhorst (ArchiXL), Kasper Kisjes (Rijkswaterstaat) Jaap van den Berg (DUO) en Gerald Groot Roessink (DUO) en Wim Stolk (Voorzitter Expertgroep Gegevensmanagement/Berenschot) met hulp van Tim Vrieling (Berenschot).


Vervolgtraject, planning[bewerken]

Met deze eerste versie zijn we nog niet klaar met de omschrijving en uitwerking van gegevenskwaliteit. In 2021 staat nog een verdere detaillering van het raamwerk gepland en om het draagvlak verder te verbreden. • Vervolgtraject o Ambitie / planning o Mogelijkheden om mee te doen o Oproep (wat hebben jullie nog nodig? Bijvoorbeeld feedback sturen als je in de praktijk raamwerk gebruikt wat er goed ging en wat niet)

Doel & uitgangspunten raamwerk gegevenskwaliteit[bewerken]

Het doel van het raamwerk gegevenskwaliteit was om te komen tot een gemeenschappelijke definitie en inzicht in hoe gegevenskwaliteit moet worden omschreven en gewaardeerd. Als de gegevenskwaliteit voor de Nederlandse overheid niet eenduidig is gedefinieerd dan wordt het lastig om gegevens met elkaar te vergelijken, toe te passen of eisen te stellen aan een verbeterde gegevenskwaliteit.

Stel je nu eens voor dat er sprake is van één omschrijving van gegevenskwaliteit en een breed toepasbare set van dimensies en onderliggende attributen, dan is het minimaal mogelijk om een gemeenschappelijke referentiekader te formuleren waarlangs elk gegeven kan worden gelegd. Dan is het niet eens nodig om nu direct elk gegevensset om te gooien volgens nieuwe gegevenskwaliteitsdefinities, maar kunnen we wél direct aan de slag met een gemeenschappelijke referentiekader.

Overigens ligt hierbij de focus op praktische toepasbaarheid en daarmee op meetbaarheid van de kwaliteitsattributen. Daarmee benoemen we dus vooral de praktisch meest waardevolle dingen en streven we geen volledigheid na vanuit theoretisch perspectief.

Scope[bewerken]

Uitgangspunt bij het vaststellen van het raamwerk was om gebruik te maken van (inter)nationale onafhankelijke standaarden. We wilden dus niet het wiel opnieuw uitvinden maar standaarden die aansluiten bij gebruik voor de Nederlandse overheid selecteren en waar nodig vertalen van het Engels naar Nederlands.

Het raamwerk gegevenskwaliteit focust nu op de inherente gegevenskwaliteit. Inherente datakwaliteit verwijst naar de mate waarin kwaliteitskenmerken van gegevens het intrinsieke potentieel hebben om aan de gestelde en impliciete behoeften te voldoen wanneer gegevens onder gespecificeerde omstandigheden worden gebruikt. Dus er wordt niet gesproken over systeem-afhankelijk- of proces- afhankelijke gegevenskwaliteit.

Deze systeem-afhankelijke of proces gegevenskwaliteit kunnen we in latere versies nog onderzoeken.

Voor wie is het raamwerk bedoeld?[bewerken]

Het raamwerk gegevenskwaliteit is bedoeld voor iedereen die met overheidsgegevens werkt. Dat is bijvoorbeeld van toepassing op basisregistraties of de SUWI-keten of gemeentelijke gegevens in het sociale domein. Het gaat zowel van applicatiebeheerders tot aan afdelingsmanagers en informatiearchitecten of datascientisten. Ook kan een CIO of CDO dit raamwerk toepassen in het vaststellen van het gewenste gegevenskwaliteitsproces of interpretatie van attributen.

Toepassen van het raamwerk[bewerken]

Het raamwerk is op diverse manieren inzetbaar:

  • Referentie naar onderdelen van gegevenskwaliteit, dimensies of attributen
  • Bij het opzetten van een nieuwe registratie het kunnen inzetten van eenduidige gegevenskwaliteitseisen
  • Bij het vergelijken van gegevenssets een hanteerbare lijst van gegevenskwaliteitseisen die ontdaan zijn proces-gerelateerde eisen
  • Bij een gegevenskwaliteitsproject om de gegevenskwaliteit te verbeteren met eenduidige door NORA opgestelde gegevenskwaliteitseisen

Definities gegevens & kwaliteit van gegevens[bewerken]

Als we spreken over de kwaliteit van gegevens , dan spreken we over "De mate waarin een geheel van eigenschappen en kenmerken van één of meer gegevens voldoet aan eisen". NB we hebben bij deze omschrijving gebruik gemaakt van de definitie uit [NEN-ISO 9000. En daarnaast maken we gebruik van de definitie gegevens zoals deze in de NORA in gebruik is: Een formeel vastgelegd feit, begrip of aanwijzing.

Onderdelen van het raamwerk[bewerken]

Het raamwerk bestaat uit vier onderdelen: een begrippenlijst, de 9 kwaliteitsdimensies, de 32 kwaliteitsattributen en voorbeelden van de attributen.

Begrippenlijst[bewerken]

In de begrippenlijst is een overzicht te vinden van veelgebruikte begrippen binnen het raamwerk gegevenskwaliteit. Gegevenskwaliteit is een thema met veel begrippen en een eigen context, daarmee is een begrippenlijst wel nodig.

Dimensies en attributen[bewerken]

Het raamwerk gegevenskwaliteit is vervolgens verdeeld in 9 dimensies en beschrijft de betekenis van deze dimensies en hoe of wanneer, waarom of voor wie deze relevant is. Dimensies zijn onderverdelingen van gegevenskwaliteit in niet overlappende categorieën. Attributen zijn kenmerken of eigenschappen van de eerder genoemde dimensies.

Per dimensie geeft het raamwerk de belangrijkste attributen die van belang zijn. Dat zijn over het algemeen geen nieuwe notaties of ideeën, maar een herschikking van bestaande kennis in één logisch raamwerk.

(in raamwerk en tabel)

Mapping attributen[bewerken]

Zoals al eerder gesteld hebben we veel hergebruikt van bestaande raamwerken. Voor wie al werkte met bestaande gegevensraamwerken geven we daarom ook een verwijzing/mapping per attribuut. Bronnen zijn: de ISO/IEC 25024, de NEN-ISO 19157, de ISO 5725, het DAMA-NL raamwerk en het Kwaliteitsraamwerk Omgevingswet.

Voorbeelden[bewerken]

De lijst met voorbeelden is nog niet compleet, deze worden in 2021 verder aangevuld en uitgewerkt. De huidige set voorbeelden beschrijven de dimensies, bijbehorende attributen en voorbeelden zoals deze binnen Rijkswaterstaat, het Digitaal Stelsel Omgevingswet en DUO zijn toegepast. Nogmaals: deze voorbeelden zijn nog niet compleet en zullen komend jaar verder ontwikkelen.

Bronnen[bewerken]

  • ISO-standaarden 25010 en 25012
  • DAMA / Dataquality
  • Gegevenskwaliteit in de omgevingswet
  • Dataquality framework Rijkswaterstaat
  • DUO Gegevenskwaliteit

Feedback[bewerken]

De NORA expertgroep gegevensmanagement staat altijd open voor feedback op het raamwerk of de toepassing van het raamwerk. Via de gegevens in het colofon (boven rechts) kunt u een bericht achterlaten.