Handreiking Logboek Dataverwerkingen

Algemeen

Beheerder: Logius

Status bij Forum Standaardisatie: geen (consultatie loopt)

Waarde van de standaard

Logboek Dataverwerkingen beschrijft hoe overheden gegevens kunnen vastleggen over hun verwerkingen om daarmee verantwoording te kunnen afleggen.

Belangrijke voordelen van de Logboek Dataverwerkingen standaard zijn:

  • Bieden van transparantie naar burgers, bedrijven en andere partijen, zodat deze meer vertrouwen krijgen in de overheid.
  • Invulling geven aan verantwoordingseisen die worden gesteld vanuit wet- en regelgeving, zodat aan die wet- en regelgeving kan worden voldaan.
  • Mogelijk maken van auditing, toezicht en kwaliteitsverbetering van de informatiehuishouding, doordat verwerkingen worden vastgelegd.
  • Sneller kunnen herstellen van fouten en onregelmatigheden in verwerkingen, doordat deze verwerkingen inzichtelijk kunnen worden gemaakt.
  • Ondersteunen van integratie van logging over de grenzen van systemen en organisaties, zodat de gehele keten van verwerkingen inzichtelijk kan worden gemaakt.

De Logboek Dataverwerkingen standaard biedt waarde aan de volgende specifieke doelgroepen:

DoelgroepWaarde
Burgers en organisaties
Managers
  • Voldoen aan wet- en regelgeving, doordat eisen aan verantwoording worden gefaciliteerd.<
  • Verlagen van de afhankelijkheid van leveranciers en hun oplossingen voor logging, doordat deze eenvoudiger kunnen vervangen door andere oplossingen die de standaard ondersteunen.
Ontwikkelaars
  • Duidelijkheid over welke gegevens moeten worden gelogd over verwerkingen, doordat deze logging is gestandaardiseerd.
Technisch beheerders
  • Verlagen beheerlast door het op gestandaardiseerde wijze kunnen vastleggen en verwerken van logs van dataverwerkingen.

Werking van de standaard

De Logboek Dataverwerkingen standaard beschrijft vooral welke gegevens zouden moeten worden vastgelegd in een log. Dataverwerkingen binnen dezelfde context (bijvoorbeeld een organisatie of een verantwoordelijkheid binnen een organisatie) worden gegroepeerd. Wanneer een dataverwerking een andere dataverwerking tot gevolg heeft worden de logregels van beide dataverwerkingen aan elkaar gerelateerd. Statische informatie over dataverwerkingen kan worden opgezocht in registers op basis van een verwijzing die in elke logregel wordt opgenomen. Denk bijvoorbeeld aan een register van verwerkingsactiviteiten of het Algoritmeregister.

De standaard Logboek Dataverwerkingen specificeert de basis voor het loggen en aan elkaar relateren van dataverwerkingen. Aanvullende functionaliteit wordt gestandaardiseerd in extensies.

De volgende gegevens zijn verplicht om op te nemen in een logregel:

  • trace_id: een unieke identificatie van de overkoepelende trace;
  • span_id: een unieke identificatie van de actie binnen de dataverwerking;
  • status: een indicatie of de dataverwerking succesvol is uitgevoerd;
  • name: naam van de actie binnen de dataverwerking;
  • start_time: tijdstip waarop de actie is gestart;
  • end_time: tijdstip waarop de actie is beëindigd;
  • parent_span_id: een unieke identificatie van de aanroepende actie binnen de huidige applicatie;
  • resource: een systeem, applicatie of component dat de verwerking ondersteunt;
  • attributes: verwijzingen naar registers, subjecten en externe applicaties.

De standaard is niet gericht op logging van toegang, beveiligingsincidenten of de technische werking van applicaties of infrastructuur. Het is ook niet bedoeld als auditlog.

Relatie met GDI domeinarchitectuur gegevensuitwisseling

De Logboek Dataverwerkingen standaard geeft een invulling aan de volgende principes in de domeinarchitectuur.

PrincipeInvulling
Burgers en organisaties hebben regie over hun eigen gegevensDe standaard zorgt ervoor dat burgers en organisaties inzicht kunnen krijgen in de verwerkingen van hun gegevens.
Uitwisseling van gegevens wordt gelogd als deze later aantoonbaar moet zijnDe standaard biedt mechanismes voor logging van verwerkingen, inclusief de uitwisseling van gegevens en het correleren op basis van unieke identificaties.

De standaard is ondersteunend aan de volgende volgende functies in het functiemodel van de domeinarchitectuur:

  • Loggen verzending
  • Loggen ontvangst

Positionering van de standaard

Relatie met audit logging

Het loggen van dataverwerkingen is gericht op het inzichtelijk maken van verwerkingen naar externe belanghebbenden. Dat is iets anders dan een auditlog dat vooral gericht is op informatiebeveiliging en het inzichtelijk maken van gevoelige handelingen ten behoeve van auditing en fraudebestrijding. Een belangrijk verschil is verder dat in een auditlog ook een identificatie van de gebruiker is opgenomen, omdat handelingen traceerbaar moeten zijn naar gebruikers. Een logboek van dataverwerkingen bevat juist geen identificatie van een gebruiker, maar kan wel een identificatie bevatten van het subject waarop de verwerking betrekking heeft. Het loggen van inhoudelijke gegevens is typisch geen onderdeel van een auditlog.

Impact van de standaard

De protocollen die worden gebruikt tussen applicatie en logboek en voor het uitvoeren van transacties tussen applicaties worden niet voorgeschreven in de standaard. Er wordt wel aanbevolen om gebruik te maken van het OpenTelemetry Protocol.

Applicaties kunnen logs direct conform deze standaard vastleggen, maar het is ook mogelijk dat applicatie-specifieke logs worden getransformeerd naar logs die voldoen aan de standaard. Dit is met name relevant omdat er initieel weinig applicaties zullen zijn die de standaard ondersteunen en een deel van de applicaties de standaard mogelijk nooit zullen ondersteunen. Denk bijvoorbeeld aan standaardapplicaties, die ook niet specifiek zijn gericht op de Nederlandse markt.

Er zal een prioritering moeten worden aangebracht bij het implementeren van de standaard in het applicatielandschap van overheidsorganisaties. Factoren die daarbij een rol spelen zijn:

  • De mate waarin persoonsgegevens worden verwerkt;
  • Het belang van de processen die worden ondersteund;
  • De mate waarin applicaties aan te passen zijn aan de standaard.

Er kan in logregels worden verwezen naar registers, zoals een register van verwerkingsactiviteiten. Het is ook mogelijk om te verwijzen naar bronnen die zijn gebruikt voor de verwerking. Er zijn verschillende niveaus van verwijzingen mogelijk vanuit een logregel. Zo kan bijvoorbeeld alleen naar de bron zelf worden verwezen, kan verwezen worden naar de gebruikte kolommen of kunnen de concrete gegevens die zijn gebruikt worden opgenomen. Een hoger detailniveau van logging verhoogt de bruikbaarheid van de logs.

Er wordt gewerkt aan een extensie waarin een inzage API wordt gedefinieerd, die organisaties ook zelf zouden kunnen inzetten.

Aandachtspunten

Grondslag voor logging

Er is allerlei wet- en regelgeving die om verantwoording van verwerkingen vraagt. De initiële aanleiding voor het Logboek Dataverwerkingen waren de informatieverplichtingen die voortvloeien uit de AVG. De AVG geeft aan betrokkenen – degenen over wie de persoonsdata gaan - verschillende rechten in het kader van inzage en correctie. Het is belangrijk om op te merken dat het recht op inzage geen zelfstandige of voldoende grondslag is voor een logboek van dataverwerkingen. Er zal voor een juridische grondslag daarom naar een combinatie van verplichtingen moeten worden gekeken. De standaard is daarom ook bewust in bredere zin gericht op het leggen van verantwoording over verwerkingen. Zo zijn er bijvoorbeeld ook beginselen in de Algemene wet bestuursrecht die een belangrijke basis vormen.

Relatie met andere standaarden

Relatie met FSC

De standaarden FSC en Logboek Dataverwerkingen zijn beide bedoeld voor het loggen van uitwisselingen van gegevens. In de FSC standaard is logging een extensie. Logging middels deze extensie is gericht op het loggen van de technische aspecten van de gegevensuitwisseling ten behoeve van technisch beheer. Het kan ook gebruikt worden om achteraf aan te tonen dat de gegevensuitwisseling heeft plaatsgevonden. Het Logboek Dataverwerkingen is gericht op het functioneel inzicht geven in verwerkingen van gegevens ten behoeve van verantwoording, bijvoorbeeld richting de burger. Een uitwisseling van gegevens is een specifiek voorbeeld van een verwerking van gegevens.

Relatie met PROV

PROV is een open standaard van het W3C voor het beschrijven van dataprovenance, wat je grotendeels kunt beschouwen als synoniem voor datalineage. Datalineage is de beschrijving van databewegingen en -transformaties op verschillende abstractieniveaus langs datatrajecten. Datalineage is een breed gebied, waarbinnen allerlei patronen bestaan, zoals beschreven in de handreiking datalineage. Het logboek dataverwerkingen ondersteunt een vorm van datalineage die de nadruk legt op de keten van verwerkingen en de gegevens die in deze verwerkingen gebruikt zijn. Onderzoek van Geonovum heeft laten zien dat daarbij ook de PROV standaard zou kunnen worden gebruikt. De nadruk in datalineage ligt echter meestal op de gegevens zelf, waarbij je vanuit een gegeven dat is ontstaan kunt zien welke andere gegevens daarvoor zijn gebruikt en welke transformaties daarbij zijn gehanteerd. Dat is het primaire toepassingsgebied van de PROV standaard. In genoemde handreiking voor datalineage is hiervoor een voorbeeld uitgewerkt en een standaard profiel beschreven.

Links