1 Inleiding

1.1 Aanleiding

Er worden steeds meer gegevens verwerkt door organisaties. Overheidsorganisaties delen hun gegevens toenemend met burgers, bedrijven en andere overheden. Het is belangrijk voor het vertrouwen van burgers en bedrijven dat deze gegevens betrouwbaar zijn. Dit vraagt vooral om het creëren van inzicht in de kwaliteit en herkomst van gegevens. Het is daarbij relevant om voor alle stappen die de gegevens hebben doorlopen te weten wie er op welk moment welke bewerking heeft uitgevoerd. Dit wordt ook wel “datalineage” genoemd.

Datalineage ondersteunt overheidsorganisaties om zichzelf te verantwoorden, bijvoorbeeld om in de context van de AVG burgers inzage te kunnen geven in waar hun gegevens worden verwerkt. Het zorgt daarmee voor transparantie en controleerbaarheid van de overheid. Tegelijkertijd helpt het organisaties zelf om hun gegevenshuishouding beter op orde te hebben. Door beter inzicht te hebben in de totstandkoming van gegevens kan ook de impact van wijzigingen beter worden ingeschat. Ook de FAIR principes, die breed worden omarmd als basis voor het delen van gegevens, vragen expliciet om het vastleggen van datalineage zodat gegevens beter herbruikbaar zijn.

Er is nog relatief weinig ervaring bij overheidsorganisaties met datalineage. De aanleiding voor het schrijven van deze handreiking is het belang ervan bij gegevensuitwisseling tussen organisaties. Zo wordt het onderwerp nadrukkelijk genoemd in de context van dataspaces. Een dataspace is een virtuele omgeving waarbinnen gegevens worden uitgewisseld. De ontwikkeling van dataspaces wordt gestimuleerd vanuit de Europese Commissie heeft om gegevensuitwisseling binnen Europa eenvoudiger te maken en daarmee één interne (economische) markt mogelijk te maken. Referentie-architecturen voor dataspaces zoals die van de International Dataspaces Association (IDSA, 2022) en het Dataspaces Support Center (DSSC, 2025) geven aan dat datalineage belangrijk is. Ze geven echter geen handreiking om hier invulling aan te geven.

1.2 Dit document

Dit document beschrijft algemene informatie over het onderwerp datalineage, geeft aan welke keuzes organisaties moeten maken bij het inrichten ervan en doet daarvoor praktische handreikingen. Het document belicht datalineage in algemene zin, maar is specifiek gericht op datalineage bij gegevensuitwisseling tussen overheidsorganisaties. Om die reden is er specifieke aandacht voor standaarden en wordt er een uitwerking gegeven op basis van de PROV standaard. Dit is een belangrijke wereldwijde standaard op het gebied van datalineage en provenance. De toegevoegde waarde van deze praktische handreiking ten opzichte van andere bronnen is dat het informatie vooral op een begrijpelijke manier en in samenhang aanbiedt. Het is nadrukkelijk geen gebruiksaanwijzing; het moet worden vertaald naar de specifieke organisatiecontext.

Dit document is tot stand gekomen in afstemming met vertegenwoordigers van overheidsorganisaties. De ondersteuning van het proces en redactie van het document is verzorgd vanuit Bureau architectuur van het ministerie van Binnenlandse Zaken en Koninkrijksrelaties. De doelgroep van dit document zijn medewerkers van overheidsorganisaties die een rol hebben in de inrichting van datamanagement in organisaties. Dat zijn bijvoorbeeld mensen zoals data architecten, dataengineers, datastewards en medewerkers van een CDO-office.

1.3 Documentstructuur

De structuur van dit document is als volgt:

  • Hoofdstuk 2 geeft een algemene inleiding op het onderwerp datalineage.
  • Hoofdstuk 3 beschrijft een aantal belangrijke standaarden voor datalineage.
  • Hoofdstuk 4 beschrijft patronen voor typische inrichtingen van datalineage.
  • Hoofdstuk 5 beschrijft een mogelijke uitwerking van datalineage op basis van linkeddata.
  • Hoofdstuk 6 beschrijft een standaard profiel voor datalineage.
  • Hoofdstuk 7 geeft een aantal adviezen om praktisch aan de slag te gaan met datalineage.
  • Bijlage A beschrijft de gebruikte bronnen.
  • Bijlage B beschrijft de gehanteerde begrippen.
  • Bijlage C beschrijft de betrokkenen.

Hoofdstukken 5 en 6 zijn meer technisch van aard en bedoeld voor meer technische lezers. Ze vragen voorkennis op het gebied van linkeddata en bijbehorende standaarden.