Nationaal Semantisch Vlak

Uit NORA Online
Naar navigatie springen Naar zoeken springen


Aanleiding[bewerken]

In een rechtstaat verdient de overheid vertrouwen van burgers en bedrijven. Dit geldt ook in het digitale tijdperk, waarin vrijwel alle besluiten worden genomen op basis van steeds meer gegevens. Daartoe is een integrale visie nodig voor zicht op de samenhang, grondslag, betekenis en duurzaamheid van deze gegevens en hoe en in welke context ze zijn verzameld. Het Nationaal Semantisch Vlak is bedoeld als basis voor een overheid (of zelfs de maatschappij) die transparant, verantwoord en op de juiste manier met gegevens omgaat. Het Nationaal Semantisch Vlak verbindt alle aspecten van gegevens en is daarmee het fundament voor een samenhangend gegevensmanagement.

Het Nationaal Semantisch Vlak biedt een visie op gegevensmanagement die bruikbaar is voor beleidsmakers (als houvast voor toepasbaar en uitvoerbaar beleid) en voor mensen die dit beleid vorm moeten geven met werkbare oplossingen. In de NORA wordt het Nationaal Semantisch Vlak uitgewerkt in de Informatielaag.

  • Gebruikers. Zij die baat hebben bij een deel van het ingevulde stelsel, omdat zij er in hun werk rechtstreeks baat bij kunnen hebben. In de eerste fase zal dat beperkt zijn tot enkele ketens of domeinen, omdat nog niet voldoende is ingevuld om iedere veranderaar, ontwerper van een dienst, beleidsjurist et cetera al ten dienste te zijn. Waar het wel is ingevuld kunnen deze groepen de meest vocale supporters van het stelsel worden, doordat ze het verschil met de situatie er voor kennen.
  • Uitvoerenden. Mensen die daadwerkelijk iets moeten doen om dit stelsel te bouwen, te vullen en door te ontwikkelen. Het gaat hier om de specialisten op de gebieden van onder andere uitvoerbare wetgeving, semantiek, begrippen, gegevenswoordenboeken, informatiemodellering, datamodellen en, datauitwisseling. Een kern van deze doelgroep is al actief betrokken bij de NORA. Voor succes moet die groep breder getrokken worden zodat alle betrokkenen het gevoel krijgen dat het ‘hun’ stelsel wordt waarin hun eigen stukje van de puzzel de waardering krijgt die het volgens hen verdient.
  • Ambassadeurs. Mensen die het belang van het stelsel als geheel inzien: enterprise architecten en breed denkende dienstverleningsarchitecten, strategisch beleidsmedewerkers, bestuurders die gecommitteerd zijn aan de één-overheid-gedachte, bestuurders die denken vanuit de transparantie van de overheidsdienstverlening voor de burger, NGO’s, volksvertegenwoordigers en anderen die de overheid ter verantwoording willen kunnen roepen. Deze groepen vormen de aanjagers van het stelsel, die draagvlak en budget kunnen zoeken om het breder uit te rollen. Ze moeten aangehaakt worden bij de gedachte en vervolgens gevoed worden met de voortgang van de concretisering zodat ze er genoeg vertrouwen in opbouwen om er ook echt hun gewicht achter te zetten.
  • Managers. Zij die geld vrij moeten maken voor het invullen van hun onderdeel van het stelsel. Hier zal actief communicatie nodig zijn, zeker waar de baat niet op dezelfde plek ligt als de kosten en inspanning.
  • Bestuurders. Zij die moeten besluiten over (onderdelen van) het afsprakenstelsel. Denk aan OBDO, Forum Standaardisatie et cetera. Het doel van communicatie zou hier vooral moeten zijn om deze groep te laten overlappen met de tweede groep, door het belang van het stelsel inzichtelijk te maken met concrete voorbeelden uit de praktijk.

Nationaal Semantisch Vlak[bewerken]

Gegevens en hun onderliggende begrippen moeten goed beschreven en gemakkelijk te begrijpen zijn. Hierdoor kunnen zowel ambtenaren als burgers en bedrijven gegevens en begrippen consistent (her)gebruiken. Begrippen gaan direct of indirect over de ‘echte’ wereld, de fysieke werkelijkheid, de maar hebben altijd een grondslag in de juridische werkelijkheid, namellijk in wet- en regelgeving, beleid, richtlijnen, (nationale) programma’s of bestuursopdrachten. Begrippen beschrijven ook de betekenis van de administratieve werkelijkheid van datasets, gegevensbeschrijvingen en informatiemodellen. Meetbare en/of toetsbare begrippen verhogen de uitvoerbaarheid, de vergelijkbaarheid en optelbaarheid. Daardoor vormen begrippen een belangrijke verbindende schakel in het Nationaal Semantisch Vlak.

Het Nationaal Semantisch Vlak beschrijft de samenhang van de onderdelen van gegevensmanagement en de semantische standaarden. De onderdelen voor deze visie op gegevensmanagement zijn al beschikbaar, net zoals de semantische standaarden voor deze onderdelen. Daarmee vormt het National Semantisch Vlak de basis voor de verbinding van afzonderlijke oplossingen van specialisten uit verschillende vakgebieden. Het verbindt de oplossingen inhoudelijk aan elkaar en het is de basis van het ontwerp van een afsprakenstelsel waarin doorontwikkeling in samenhang mogelijk wordt. Hierdoor beschrijft het ook het inhoudelijke werkveld van de Chief Data Officer. Het Nationaal Semantisch Vlak verbindt bovenal onderwerpen die tot voor kort nog als losse thema’s werden behandeld, zoals begrippen, gegevenswoordenboeken, AI & algoritmes, API's, data op het web, duurzame toegankelijkheid, geo, toegang, stelsel van basisregistraties en (internationale) standaarden.

Door het verbinden van al deze onderwerpen wordt dubbel werk voorkomen en krijgen gegevens meerwaarde, c.q. kunnen gegevens op waarde worden geschat. In de uitvoering hoeven geen extra kosten te worden gemaakt, het werk gebeurt immers al, alleen in geïsoleerde processen. Dit vraagt een andere, gegevensgerichte samenwerking in plaats van de huidige op loshangende deelprocessen ingerichte organisaties. Het resultaat bestaat uit gegevens met sociale waarde, geschikt voor consistent (her)gebruik.


width


Fysieke werkelijkheid
Gegevens gaan altijd over de echte wereld. Dat is de wereld waarin wij (samen)leven, de fysieke werkelijkheid zoals wij die waarnemen, de leefomgeving. Hierin bevinden zich allerlei objecten (dingen, mensen). Hier wordt geboren, gestorven, gebouwd, et cetera, ofwel hierin vinden allerlei (levens)gebeurtenissen plaats. Zodra je deze werkelijkheid gaat beschrijven is het niet meer de werkelijkheid zelf, maar een beschrijving ervan.

Juridische werkelijkheid

Een in een rechtstaat relevante beschrijving is die van de juridische werkelijkheid. In de juridische of institutionele werkelijkheid worden regels voor de samenleving vastgelegd. Naast regels gaat het om beleid, richtlijnen, (nationale) programma’s en bestuursopdrachten. Deze vormen de grondslag voor de gegevens die een overheid over objecten en gebeurtenissen mag vastleggen en hoe en door wie deze data mogen worden gebruikt voor bijvoorbeeld besluiten of toepassing van AI. Ook worden formele beschrijvingen van toestanden van objecten en gebeurtenissen vastgelegd.

Administratieve werkelijkheid
In de administratieve werkelijkheid, c.q. de wereld van de gegevens worden dit informatieobjecten die worden beschreven met data en metadata. Dit is de kern van het Nationaal Semantisch Vlak. De standaarden voor de beschrijving van deze semantiek staan, nu nog als losse standaarden, op de pas-toe-leg-uit lijst van het Forum Standaardisatie. In Europees verband zijn de semantische standaarden in Joinup beschreven in vocabulaires.
De administratieve werkelijkheid wordt in de regel bijgehouden op basis van documenten uit de juridisch/institutionele werkelijkheid. Dit zijn vaak aktes, zoals geboorteaktes, oprichtingsaktes (van organisaties) of leveringsaktes (van onroerende zaken). Cyclorama’s en luchtfoto’s die worden gebruikt voor de inwinning van data voor kaarten zijn niet echt juridisch of institutioneel, maar zijn wel een abstractie van, of (letterlijk) een view op de fysieke werkelijkheid. Soms ontstaat een juridische werkelijkheid uit gegevens, bijvoorbeeld de belastingverplichting in het werk- en inkomensdomein.

Standaarden en vocabulaires
Voor alle onderdelen bestaan standaarden. Dit zijn direct toepasbare open standaarden, waarvoor een Nederlandse community bestaat zoals de Nederlandse Standaard voor het Beschrijven van Begrippen (NL-SBB) voor begrippen, het Metamodel voor Informatie Modellering (MIM) voor modelelementen , het Nederlands Applicatie Profiel voor Data catalogi (Dcat-AP-NL) en de Metagegevens voor duurzaam toegankelijke overheidsinformatie (MDTO). Maar ook NEN en ISO standaarden zijn een bron van good practices. Daarnaast zijn voor al deze standaarden W3C vocabulaires beschikbaar. Gebruik van deze standaarden leidt tot semantische interoperabiliteit. Het Nationaal Semantisch Vlak verbindt de beschrijvingen van de verschillende onderdelen.

Use cases[bewerken]


Use cases voor een Nationaal Semantisch Vlak zijn:

  • Als burger of bedrijf wil ik kunnen inzien welke gegevens de overheid over mij geregistreerd heeft, met welke doel en wat die gegevens betekenen (bijvoorbeeld wat is ‘inkomen’ in dit geval?), zodat ik begrijp waarom en in welke context een bepaalde beslissing wordt genomen.
  • Als dataspecialist, data steward et cetera wil ik de eigen begrippen en gegevens van een organisatie met zorg beschrijven en ontsluiten, zodat anderen kunnen voortbouwen op mijn werk.
  • Als ontwerper van een dienst die gegevens nodig heeft wil ik kunnen vinden of deze bestaan, of ze inderdaad bruikbaar zijn voor mijn doel en of/hoe dit gebruik is toegestaan, zodat ik deze dienst efficiënt en rechtmatig kan ontwerpen.
  • Als beleidsjurist bij wetsvoorbereiding wil ik kunnen putten uit bestaande begrippen en hun definities, zodat ik al bij de eerste ontwerpversie kan checken of de wet gebruik kan maken van bestaande datasets, of nieuwe gegevens verzameld moeten worden, met andere woorden wat de implicaties zijn voor de uitvoerbaarheid.
  • Als veranderaar wil ik informatie uit andere organisaties kunnen vertalen naar mijn eigen context, zodat ik kan controleren welke betekenis begrippen in die context hebben en welke synoniemen ik zelf gebruikt, zodat ik maximaal gebruik kan maken van alle gegevens, informatie en kennis die in de publieke sector beschikbaar is en ik het innovatief vermogen van de overheid als geheel wordt vergroot.


Uitwerking van het Nationaal Semantisch Vlak[bewerken]


width
Definities Onderstaande definities zijn voorlopig. Vanuit de expertgroep NORA begrippenkader wordt gewerkt aan een begrippenkader conform de Nederlandse Standaard voor het Beschrijven van Begrippen. Zodra dit ver genoeg is zullen de definities uit dit begrippenkader worden overgenomen.

  • Een informatieobject is een op zichzelf staand geheel van gegevens met een eigen identiteit. Dit kan van alles zijn, een document, een geluidsopname, een set samenhangende gegevens in een database (NORA). De Data Governance Act en Data Act spreken over: ‘Elke digitale weergave van handelingen, feiten of informatie en elke compilatie van dergelijke handelingen, feiten of informatie, ook in de vorm van geluidsopnames of visuele of audiovisuele opnames.’
  • Een objectregistratie is de beschrijving van een versie van een informatieobject op enig moment in de tijd (NEN3610, todo NORA).
  • Een modelelement is een bouwsteen of metaklasse van een metamodel voor informatiemodellen (MIM).
  • Een begrip is een eenheid van denken - idee, betekenis of categorisering (NL-SBB).
  • De grondslag is de wet- en regelgeving die de betekenis van een begrip definieert (todo NORA).
  • Een informatiemodel is een gestructureerde beschrijving van de structuur, semantiek en de eigenschappen van informatie over dingen in de werkelijkheid. (NORA).
  • Een begrippenkader is een verzameling van begrippen die in een bepaalde context relevant zijn (NL-SBB).
  • Een datacatalogus is een samengestelde verzameling metadata over informatiebronnen (Dcat).
  • Een dataset is een zinvolle verzameling van samenhangende gegevens, die beheerd of gepubliceerd wordt door één organisatie, en in één of meer formaten beschikbaar of downloadbaar is. (Dcat).
  • Een dataservice (gegevensdienst) is een service een computer service waar gegevens opgevraagd worden aan de hand van specificaties in een aanvraag. De gegevens die voldoen aan de meegegeven specificatie worden als antwoord teruggestuurd. (Dcat).
  • Een thema is een thema uit de Thema-indeling voor Officiële Publicaties (TOOI).

Een stelsel is Een systeem waarbinnen organisaties via afspraken, standaarden en/of voorzieningen samenwerken om bepaalde functionaliteit te realiseren. (NORA)

  • De gegevenskwaliteit is de mate waarin een geheel van eigenschappen en kenmerken van één of meer gegevens voldoet aan eisen (todo NORA).
  • De geldigheidsperiode is de periode waarin een objectregistratie juridisch geldig is (NEN3610).
  • De registratieperiode is de periode waarin een objectregistratie beschikbaar is via een registratie (NEN3610).
  • De locatie is de geografische positie en de vorm (geometrie), of een kenmerk waarvan elders de vorm en de positie bekend is (NORA).
  • Duurzame toegankelijkheid is de toegankelijkheid gedurende de vastgestelde bewaartermijn conform aan de DUTO-kenmerken: vindbaar, beschikbaar, leesbaar, interpreteerbaar, betrouwbaar en toekomstbestendig, voor iedereen die daar recht op heeft en voor zo lang als noodzakelijk (todo NORA).
  • Toegang betreft alle uitwisselingen om “burger en bedrijf” uniek te identificeren en authentiseren ten behoeve van autorisatie. Tevens kan de bevoegdheid tot het digitaal handelen namens een persoon worden vastgesteld. (NORA).


Toelichting
Een informatieobject krijgt in de digitale wereld een formele eigen identiteit zoals een burgerservicenummer, perceelnummer of documentidentificatie. De gegevens over een object (bijvoorbeeld iemands haarkleur) kunnen wijzigen in de tijd. Gegevens over een object worden daarom altijd vastgelegd in een objectregistratie, een beschrijving van (een versie van) een object op een bepaald moment.

Relevante data over informatieobjecten kunnen worden gerepresenteerd als modelelementen als onderdeel van een informatiemodel. Modelelementen relateren concrete gegevens in een objectregistratie aan andere soorten gegevens en hebben kenmerken als ‘authentiek gegeven’. Modelelementen krijgen betekenis via overeenkomstige begrippen als onderdeel van een begrippenkader, die op hun beurt hun betekenis ontlenen aan de grondslag op basis van wet- en regelgeving.

Begrippenkaders en Informatiemodellen zijn direct verbonden met datasets op basis waarvan dataservices worden geleverd. De thema’s die aan een dataset zijn gekoppeld bieden een extra ingang om over een bepaald onderwerp data te vinden. Deze thema-indeling voor Officiële Publicaties is bedoeld als evenwichtige thematische indeling van alle officiële publicaties door centrale en decentrale overheidsorganen. Nog meer context ontstaat door datasets in samenhang te beschrijven in catalogi als bouwsteen van een digitaal stelsel zoals het stelsel van basisregistraties, het digitaal stelsel voor de Omgevingswet (DSO) of het Afsprakenstelsel voor Zorgeloos Vastgoed.


Implicaties[bewerken]

Belangrijke bouwstenen in het Nationaal Semantisch Vlak zijn:

  • beschrijvingen van metadata van datasets en bijbehorende dataservices (Dcat-AP-NL)
  • begrippenkaders met begrippen, inclusief verwijzingen naar hun (juridische) grondslag (NL-SBB)
  • informatiemodellen met modelelementen (MIM)
  • digitale duurzaamheids aspecten (MDTO)

Begrippenkaders hebben een centrale rol in het Nationaal Semantisch Vlak. Begrippenkaders zijn al op veel plaatsen beschikbaar als begrippenlijst, gegevenswoordenboek, taxonomie of thesaurus. De uitdaging is om deze eenduidig te ontsluiten. Nu zijn ze vaak in diverse interne tools opgenomen of alleen via Excel, Word of PDF gepubliceerd. Met de nieuwe NLL-SBB standaard worden deze begrippenkaders eenduidig ontsloten. NORA verwijst al naar meer dan 25 Gegevenswoordenboeken. Begrippenkaders met hun status (conform NL-SBB, geplande conformiteit NL-SBB) kunnen worden aangemeld via nora@ictu.nl. Zodra we een contactpersoon hebben met wie we de tekst kunnen afstemmen wordt het begrippenkadertoegevoegd.

Op termijn moet het Nationaal Semantisch Vlak snel en overzichtelijk antwoorden bieden op concrete vragen uit de praktijk. Antwoorden die op dit moment slechts met veel graafwerk, volharding en tijd beschikbaar komen. Bijvoorbeeld:

  • Begrip X dat ik wil gebruiken in mijn project, bestaat dat al?
  • In welke Wet- en Regelgeving is het begrip gedefinieerd?
  • Staat het al in een gegevenswoordenboek binnen dit of een ander domein?
  • Werkt er al een informatiesysteem met het begrip?
  • Wat betekent het daar dan?
  • Wat zijn de overeenkomsten en verschillen in definitie en gebruik in de verschillende contexten?
  • Wat is de authentieke bron voor dit begrip?

Uiteindelijk doel is dat het Nationaal Semantisch Vlak een overzicht geeft van alle begrippen die overheidsdata in Nederland beschrijven. We roepen overheidsorganisaties op om hun gegevenswoordenboeken en informatiemodellen te publiceren. Voor afstemming op het hoogste niveua kan worden begonnen met het Bedrijfs Object Model (BOM). Zie ook het artikel Hoeders van thesauri, verenigt u.