Anatomie van Anonimiseren en Pseudonimiseren bij de Bron

Synopsis van de presentatie Anatomie van Anonimiseren en Pseudonimiseren bij de Bron, zoals gegeven door Erik Hoekstra van de gemeente Haarlem bij de bijeenkomst van de expertgroep Gegevensmanagement op 23 april 2026.


Binnen de transitie naar Common Ground ontwikkelen Gemeente Haarlem en Gemeente Zandvoort i.h.k.v. het Programma Open Overheid / XENA, een open source oplossing voor het anonimiseren en pseudonimiseren van persoonsgegevens direct in de bronsystemen — in plaats van achteraf bij publicatie.

De presentatie gaat dieper in op de architectuur en het ontwerp van deze oplossing.
De kern is een meerlaagse PII-detectie volgens het "Swiss Cheese"-model: drie onafhankelijke detectielagen (regelgebaseerd via Microsoft Presidio, patroonherkenning via Anonypy, en contextuele analyse via AI/LLM) compenseren elkaars blinde vlekken. Een Rule Engine verwerkt gebruikersfeedback op false positives en false negatives en verbetert zo de detectiekwaliteit over tijd.
Voor anonimisering (Woo) wordt encryptie toegepast in plaats van traditioneel lakken: versleutelde PII-waarden worden ingebed via RDFa-format met per-document unieke sleutels.
Voor pseudonimisering (onderzoek, monitoring, ketenpartners) genereert een HMAC-SHA256-engine deterministische, consistente pseudoniemen met domain separation. Een Privacy Permission Level (PPL) systeem met vier niveaus, gekoppeld aan ABAC-autorisatie en een sleutelhiërarchie met HSM-opslag, waarborgt dat gebruikers alleen die persoonsgegevens zien waartoe zij geautoriseerd zijn.
De architectuur volgt het Common Ground 5-lagenmodel en is gevalideerd tegen zeven concrete use cases van zes afdelingen — van batch ETL-verwerking voor het datawarehouse (1,5 miljoen mutaties/uur) tot een Externe Upload Portal voor buurtteams en een TTP-model voor onafhankelijk sleutelbeheer. De oplossing voldoet aan EDPB Guidelines 01/2025, AVG, NEN 7524:2019 en BIO.

De presentatie behandelt de technische anatomie, de use-case validatie, de EDPB-compliance en de lessen uit het ontwikkeltraject. Relevant voor gemeenten die worstelen met anonimisering voor Woo-publicaties én pseudonimisering voor datagedreven werken.