Nationaal Semantisch Vlak

Uit NORA Online
Naar navigatie springen Naar zoeken springen
Afbeelding van het Nationaal Sematisch Vlak als een onderdeel van de Informatielaag in het Vijflaagsmodel van NORA: vijf paralellogrammen boven elkaar, van boven naar beneden Groen, Paars, Blauw, Oranje en Grijs, waarbij het blauwe vlak is uitvergroot. Vanuit de blauwe Informatielaag loopt een pijl naar de groene laag (Grondslaglaag, W&R, AMVB, Beleid etc.) met als tekst Definities in Wet- en Regelgeving. Een tweede pijl leidt naar de paarse laag (Organisatorische laag, domeinen, organisaties, processen), met als tekst Processen en informatiemodellen. Een derde pijl gaat naar de oranje laag (Applicatielaag, bouwstenen, registers) met als tekst Gegevens in registraties. De grijze Netwerklaag is vooralsnog niet verbonden. Het Nationaal Sematisch Vlak zelf is weergegeven als een netwerk van GWB's (gegevenswoordenboeken), verbonden met een Stelselcatalogus.GrondslagenlaagOrganisatorische laagNationaal Semantisch VlakApplicatielaagNetwerklaag
Semantisch Vlak als onderdeel van het Vijflaagsmodel

Het Nationaal Semantisch Vlak zien we als een verzameling van alle begrippen die voor de Nederlandse dienstverlening en informatiehuishouding van de overheid relevant zijn, met hun definitie, relaties en de context waarin ze gebruikt worden. De definitie is een omschrijving van de inhoud van het begrip, waarbij ook is aangegeven in welke wetgeving het begrip is gedefinieerd. De relaties zijn de verbanden tussen twee of meer begrippen, bijvoorbeeld omdat je het ene begrip niet kunt beschrijven zonder het andere begrip te gebruiken. De context geeft aan waar de begrippen gebruikt worden, dus in welke gegevenswoordenboeken ze voorkomen, in welke processen of informatiemodellen ze gebruikt worden en in welke systemen ze worden vastgelegd.

Het Nationaal Semantisch Vlak is de verzamelterm voor al deze gecombineerde informatie. Het hoeft dus niet één allesomvattend systeem of gegevenswoordenboek te zijn. Het kan een samenhangend stelsel van systemen en indexen e.d. zijn, dat zich gedraagt als één geheel en dat zo inzicht geeft in de relevante begrippen, relaties en context.

Behoefte aan Nationaal Semantisch Vlak[bewerken]

De behoefte aan inzicht in gegevens en registraties neemt toe naarmate we meer gaan werken met apps en API’s om de dienstverlening van de overheid vorm te geven. Momenteel (anno 2020) hebben we slechts beperkt zicht op die gegevens en registraties. We denken nu aan: 13 Basisregistraties, ca. 149 Sectorregistraties en wellicht 10.000’en specifieke registraties bij overheidsorganisaties.
De AVG schrijft data-minimalisatie voor, waardoor minder gegevens moeten worden uitgewisseld en geregistreerd. Registraties zullen daardoor op termijn minder gegevens gaan omvatten, maar altijd tenminste 1 authentiek gegeven bevatten, waarmee toegevoegde waarde wordt geleverd. Zicht op welk authentiek gegeven in welke registratie (authentieke bron) is opgenomen, is daardoor van primair belang voor architecten en ontwikkelaars.

Met dat voor ogen, gaan we verbeteringen doorvoeren op basis van het FAIR principe: Findable, Accessible, Interoperable, Reusable (zie https://www.dtls.nl/fair-data/fair-data).
De toegankelijkheid en het her-gebruik van de feitelijke gegevens (dus niet de meta-gegevens) wordt met name bepaald door W&R en door de beheerder van de betreffende registratie. Daar zullen we vanuit de NORA geen directe rol in nemen.

Op termijn moet het Nationaal Semantisch Vlak snel en overzichtelijk antwoorden bieden op concrete vragen uit de praktijk. Antwoorden die op dit moment slechts met veel graafwerk, volharding en tijd beschikbaar komen. Bijvoorbeeld:

  • Begrip X dat ik wil gebruiken in mijn project, bestaat dat al?
    • Is begrip X gedefinieerd in Wet&Regelgeving?
    • Staat het al in een gegevenswoordenboek binnen dit of een ander domein?
    • Werkt er al een systeem met het begrip?
  • Wat betekent het daar dan?
  • Wat zijn de overeenkomsten en verschillen in definitie en gebruik in de verschillende contexten?

Om de antwoorden op dit soort vragen beschikbaar te krijgen is nog wat werk te verzetten. We beschrijven de belangrijkste acties onder de kop Route naar het Semantisch Vlak.

Plaatsing binnen Vijflaagsmodel[bewerken]

Laag 3: Informatielaag uit het Vijflaagsmodel dat de NORA aan het ontwikkelen is heeft als beschrijving:


Een belangrijke basis voor samenwerking, is het delen van taal en begrippen (woorden), zodat we elkaar kunnen begrijpen en voor het uitwisselen en (her)gebruiken van elkanders informatie. Er is (nog) geen uitputtend overzicht beschikbaar van de informatie en gegevens die voor de informatiehuishouding van de overheid relevant zijn. Doorgaans wordt voor elk systeem, organisatie of domein, een afzonderlijk gegevenswoordenboek en/of gegevensmodel gehanteerd.

Het Nationaal Semantisch Vlak is het overzicht dat in deze beschrijving gezocht wordt. Het heeft echter ook relaties met de andere lagen.

Laag 1: Grondslagenlaag bevat de wet- en regelgeving waarin de definities van veel begrippen zijn vastgelegd.

Laag 2: Organisatorische laag biedt de context van processen, diensten, domeinen en organisaties waarbinnen de begrippen worden toegepast.

In Laag 4: Applicatielaag worden de begrippen daadwerkelijk gebruikt: hier worden de gegevens geregistreerd in systemen, uitgewisseld en hergebruikt.

Laag 5: Netwerklaag maakt tenslotte de uitwisseling en verbinding via Linked Data fysiek mogelijk.

Een prominente plaats binnen het Nationaal Semantisch Vlak is weggelegd voor De Stelsel Catalogus (verbonden aan de Basisregistraties) en de tientallen Gegevenswoordenboeken (verbonden aan domeinen en sectorale registraties). De uitdaging is om deze eenduidig te ontsluiten, nu zijn ze vaak in diverse interne tools opgenomen of alleen via Excel, Word of PDF gepubliceerd. Met de nieuwe internet-technologie Linked Open Data (wikipedia), is dat relatief eenvoudig mogelijk geworden.

Grote winst is te behalen door deze semantische laag reeds beschikbaar te hebben wanneer via projecten wijzigingen worden doorgevoerd in de duizenden registraties van de overheid, de gegevensuitwisselingen daartussen en de gegevensverstrekkingen daaruit.

Route naar het Nationaal Semantisch Vlak[bewerken]

Bestaande gegevenswoordenboeken in kaart brengen[bewerken]

Het doel is een uitputtende verwijzingslijst te maken van alle gegevenswoordenboeken die gebruikt worden in de diverse domeinen en ketens. NORA verwijst al naar meer dan 25 Gegevenswoordenboeken.

Meer gegevenswoordenboeken kunnen worden aangemeld via nora@ictu.nl. Zodra we een contactpersoon hebben met wie we de tekst kunnen afstemmen wordt het gegevenswoordenboek toegevoegd.

Begrippen ontsluiten en linken[bewerken]

Elk begrip (gegeven) in een woordenboek willen we het liefst ontsluiten via Linked Data, waarbij voor de definitie bij voorkeur wordt gelinkt met de relevante Wet- en Regelgeving. Beheerders van Gegevenswoordenboeken die het voornemen hebben dat te gaan doen, wordt verzocht contact op te nemen met beheerders die daar al ervaring mee hebben. Zie verderop hieronder de lijst met Semantische Intermediairs en de lijst met bestaande initiatieven en hulpbronnen op het gebied van Linked Data.

Er zijn al enkele vindplaatsen met machine leesbare gegevensbeschrijvingen:

  1. BegrippenXL dat een zoekfunctie heeft voor gegevens in diverse reeds beschikbare thesauri en informatiemodellen die via LD c.q. SKOS zijn ontsloten;
  2. Stelselcatalogus met een zoekfunctie binnen de gegevens van de Basisregistraties;
  3. NL thesauri;
  4. EU thesauri;


In het wiki-netwerk van de NORA Familie wordt de dynamiek van het overzetten van de meta-data van bestaande databases vanuit huidige Gegevenswoordenboeken naar LD c.q. SKOS ondersteund door de tooling van ArchiXL en kan dus eenvoudig in een wiki als de NORA of bij BegrippenXL worden opgenomen. Ook is een gebruiksvriendelijke interface beschikbaar voor handmatige invoer. Het NSV staat voor een eco-systeem waar alles in kan zitten: de Stelsel Catalogus, het wiki-netwerk, zelfstandige ontsluitingen (zoals de BAG) of gefaciliteerde ontsluitingen (als een organisatie niet zelf de middelen heeft voor zo’n ontsluiting, dan kan dat via BegrippenXL of via de SC). Als we dus alle opties combineren zijn we het meest flexibel en voegen we Nationaal gezien de meeste waarde toe voor de gegevensbeschrijvingen. Laten we daarom gezamenlijk de Stelsel Catalogus beter gaan verbinden met het wiki-netwerk en onderliggende registraties.

We roepen organisaties op om informatiemodellen te publiceren ! Te beginnen met het Bedrijfs Object Model (BOM), voor afstemming op het hoogste niveau.
Zie ook het artikel Hoeders van thesauri, verenigt u.

NB. Voor het beschrijven en modelleren van gegevens zijn al afspraken beschikbaar, gebaseerd op MIM: NORA AP17 - Informatie-objecten_systematisch_beschreven, met aanvullend (met meer uitleg) bij het thema Gegevensmanagement Modellering van gegevens.

Bestaande registraties in kaart brengen[bewerken]

In de NORA vind je de Basisregistratie en Sectorregistraties voor zover bekend. Er is ook een overzicht van datasets die in het kader van Open Data beschikbaar worden gesteld op data.overheid.nl.

Gegevens in registraties linken met andere data (Data Dictionary)[bewerken]

Elk gegeven in elke registratie willen we het liefst met Linked Data linken aan de begrippen in de gegevenswoordenboeken. We verzoeken beheerders die daarmee willen beginnen om contact op te nemen met beheerders die daar al ervaring mee hebben, hieronder te vinden in de tabel met Semantische Intermediairs.
NB. Waar mogelijk wil je ook andere links leggen:

  • links met het proces waarin het gegeven wordt verzameld
  • links met alle processen waarin het gegeven wordt gebruikt.

Pragmatische set met meta-data voor de gegevens bepalen[bewerken]

Het gaat tijd kosten om te komen tot een gedragen set van meta-data. Tot die tijd kunnen we uitgaan van:

  • naam
  • definitie
  • grondslag voor die definitie
  • verzameld via proces (indicatie van de eigenaar)
  • gebruikt door proces(sen)
  • geregistreerd in registratie(s)

Hierbij kan ook metadata-dataset op data.overheid.nl een nuttige aanzet vormen.

Modelleringswijze voor gegevens bepalen[bewerken]

Modellering kan gebaseerd zijn op de bestaande afspraken in de NORA.

Afspraken integreren en borgen[bewerken]

De afspraken die nieuw gemaakt worden moeten geborgd, zodat ze ook worden geïmplementeerd en nageleefd. Hiervoor is het belangrijk om de relatie met reeds bestaande afspraken in het vizier te houden, er bij aan te sluiten en te zorgen dat ze elkaar versterken en niet tegenspreken. NORA Informatie-objecten systematisch beschreven bevat voorbeelden van standaarden hiervoor: Informatiemodellen systematisch beschreven.

Bovenliggende (sector-)modellen modelleren[bewerken]

Dergelijke modellering moet ook de relaties met de Basisregistraties bevatten. Via de Basisregistraties kunnen we dan ook de relaties met de Europese 'Core assets' ((Person, Business, Location, Service etc.) modelleren [1]

Semantische intermediairs[bewerken]

Semantische Intermediairs hebben ervaring met het ontsluiten van gegevens via Linked Data en willen die ervaring inzetten om anderen te helpen.

Er zijn binnen diverse Domeinen reeds semantische intermediairs actief:

 DomeinBeschrijvingContactpersoonContactgegevens
BelastingdienstDomein BelastingenHeeft een eerste registratie, de BRI, via Linked Data ontsloten en werkt Linked Data voor datamining.Wouter Bronsgeestwl.bronsgeest@belastingdienst.nl
Gemeente AmsterdamDomein GeneriekHeeft een Stelselpedia opgezet om alle begrippen voor de gegevens van hun informatiehuishouding te ontsluiten voor hergebruik.Stelseladviseurs gemeente AmsterdamStelselpedia@amsterdam.nl
JustidDomein Immigratie integratie en inburgering
Domein Openbare orde en veiligheid
Domein Rechtspraak
Beheert enkele gegevens- en berichtenboeken van de Vreemdelingenketen, Strafrechtketen en het Centraal Documenten Depot (CDD) en zoekt naar mogelijkheden om die beter te kunnen ontsluiten, zoals via Linked Data.Pim Keizerp.keizer@justid.nl
KadasterDomein GeneriekHeeft de BAG via Linked Data ontsloten en gaat voort met de andere GEO-registraties (BRO, BRT, BGT).Arjen Santemaarjen.santema@kadaster.nl
KennisnetDomein Onderwijs en wetenschapHeeft bij het onderwijsdomein een netwerk van betrokkenen opgebouwd om de eerste afspraken over semantiek te gaan delen, Kennisnet werkt daartoe samen met o.a. DUO.Henk Nijstad
Walter Grabner (KOI)
Marcia van Oploo (OBK)
h.nijstad@kennisnet.nl

w.grabner@kennisnet.nl m.vanoploo@kennisnet.nl

info@edustandaard.nl
LogiusDomein GeneriekEen Stelselcatalogus voor de begrippen van de 13 Basisregistraties. De gegevens zijn met Linked Data ontsloten, maar vanuit een kopie van het informatiemodel, dus niet rechtstreeks vanuit elk van de Basisregistraties.Kristian Mulkristian.mul@logius.nl
Ministerie van Infrastructuur en Milieu (IenM)Domein Bouwen wonen en leefomgevingVoor het Omgevingsloket in de Laan van de Leefomgeving wordt een zogenaamde “ Laan Catalogus” gebruikt voor het delen van begrippen en gegevens.Ben Zwartveldben.zwartveld@ilent.nl
Nationaal ArchiefDomein GeneriekIn het platform NDE / werkgroep architectuur is de wens geuit om ordenende kaders te scheppen voor de vorming van de verschillende gegevensbestanden voor archivering en erfgoed, opdat er geen wildgroei ontstaat.
Platform Linked Data Nederland (PLDN)Domein GeneriekPlatform Linked Data Nederland is een netwerk waar experts en belangstellenden kennis delen over linked data. Iedereen die meer wil weten over linked data, kan hier terecht. In het netwerk zitten mensen werkzaam in het bedrijfsleven, de overheid en kennisinstellingen. Er zijn nauwe banden met de wetenschap (met name het Netwerk Instituut van de Vrije Universiteit), en ook Europees is het platform goed verankerd met o.a. links naar W3C en OGC. Ook kan het platform gebruik maken van een experimenteeromgeving in het Big Data Value Center in Almere. Op deze server staan diverse databases en zogenaamde triple-stores, die voor iedereen beschikbaar zijn.Pieter van Everdingeninfo@pldn.nl
VNG RealisatieDomein Overheid bestuur en koninkrijkVia GEMMA is VNG Realisatie betrokken bij het beschikbaar stellen van verschillende modellen via Linked Open Data. Het Informatiemodel Zaaktypen staat online als Linked Open Data (ImZTC), en is downloadbaar in RDF-formaat. Het Referentiemodel Stelsel van Gemeentelijke Basisgegevens (RSGB) en het Referentiemodel Gemeentelijke Basisgegevens Zaken (RGBZ) volgen binnenkort.Ellen Debatsellen.debats@vng.nl

bestaande initiatieven en hulpbronnen op het gebied van LinkedData[bewerken]

data.overheid.nl geeft een beschrijving van datasets, niet alleen van de begrippen in de sets maar ook van de set als geheel. ‘Linked Data: Evolving the Web into a Global Data Space’, linkeddatabook.com Het Linked Data Cookbook van het W3C, is ook erg bruikbaar. Daarin worden 7 stappen beschreven voor het komen tot linked data. De eerste is ‘model the data.’

  1. Zie hiervoor de EIRA.