Beschrijving en samenhang van (metadata)standaarden Handreiking Metagegevens

Kaders zoals RMO (Richtlijn Metadata Overheidsinformatie) en INSPIRE RMO bevat een kader voor het gebruik van metadata die essentieel zijn voor een goede, betrouwbare informatiehuishouding binnen de overheid. De reikwijdte is nadrukkelijk overheidsbreed voor het informatie- en archiefdomein. De kaders die de Richtlijn biedt zijn van toepassing op alle informatie die door de overheid wordt gecreëerd of ontvangen. De Richtlijn beschrijft op logisch niveau een metadataschema voor alle systemen waarin of waarmee overheidsinformatie wordt verwerkt. Dat metadataschema schrijft voor welke metadata minimaal vastgelegd zouden moeten worden. De NEN-ISO 23081 norm gaat specifiek over metadata voor informatie- en archiefbeheer. Deze Richtlijn is een kader voor de toepassing van deze norm binnen de Nederlandse overheid

Sinds 15 mei 2007 is de Europese kaderrichtlijn INSPIRE van kracht. De invoering van INSPIRE is met een implementatiewet sinds 2009 in de Nederlandse INSPIRE-wet verankerd. In een notendop verplicht de wet Europese lidstaten om geo-informatie (datasets) over 34 thema's te voorzien van metadata en de datasets ‘as is’ en Europees geharmoniseerd beschikbaar te stellen via netwerkdiensten (zoek-, view- en downloaddiensten). Dit alles volgens leveringsvoorwaarden die het gebruik niet onnodig belemmeren. De Europese kaderrichtlijn INSPIRE is in detail uitgewerkt in invoeringsregels, en voorzien van technische richtlijnen. Deze invoeringsregels en technische richtlijnen hebben geleid tot Europese profielen voor geo-standaarden. Deze profielen zijn waar mogelijk ook verwerkt in Nederlandse profielen voor metadata, diverse dataspecificaties (informatiemodellen) en bijbehorende netwerkdiensten (API’s).

Internationale standaarden zoals DCAT, Dublin Core, SKOS, NEN-ISO 23081, ISO 19115 en ISO 19119bewerken

Data Catalog Vocabulary (DCAT) is een metadatastandaard van W3C voor het uitwisselen van metadata tussen verschillende datacatalogi. DCAT maakt decentrale publicaties en ontsluiting van catalogi mogelijk (federated search van datasets over meerdere catalogi). Door datasets en dataservices (API´s) te beschrijven volgens DCAT, oftewel met metadata, zijn datasets overzichtelijker te presenteren en is er gerichter te zoeken naar datasets. Door de beschrijving volgens DCAT zijn datasets toegankelijker en wordt het - afhankelijk van de gebruiksrestricties - tot open data gemaakt. DCAT wordt gebruikt in CKAN (Open source software voor datacatalogi) dat in veel dataportalen wordt gebruikt, zoals data.overheid.nl. DCAT is op RDF gebaseerd. Voor Europese portalen is het “DCAT Application Profile for Data Portals in Europe" (DCAT-AP) opgesteld. DCAT-AP heeft een extensie GeoDCAT-AP voor het beschrijven van datasets, dataset-series en services. Deze extensie is eveneens afgestemd op INSPIRE.

SKOS (Simple Knowledge Organization System) is nadrukkelijk bedoelt voor het publiceren van begrippen op het web. Deze standaard richt zich op het beschrijven van begrippen ongeacht of deze op het web worden gepubliceerd. Door deze standaard te volgen kunnen begrippen foutloos conform SKOS op het web gepubliceerd worden. NL-SBB is een Nederlandse uitwerking van SKOS, zie hieronder. NEN-ISO 23081 is een internationale standaard voor het informatie en archiefdomein en onder andere uitgewerkt in de RMO en MDTO. ISO 19115 en ISO 19119 zijn internationale GEO standaarden die uitgewerkt zijn in een NL profiel.

Nationale inhoudelijke standaarden/kennismodellen/kaders zoals MDTO, TOOI, MIM, NEN 3610, DCAT-AP-NL, NL profielen op ISO 19115 en 19119bewerken

MDTO bestaat in de kern uit een metadataschema en een koppelvlak voor het uitwisselen van metadata. Het is geen informatiemodel zoals bedoeld in MIM (MDTO gebruikt de term metagegevensschema in plaats van de term informatiemodel).

Binnen de overheidsbrede discussies die op dit moment worden gevoerd over een stelsel van metadatastandaarden, een federatief datastelsel en de introductie van de FAIR-principes, hebben MDTO en TOOI beide een eigen positie. NA en KOOP nemen in die discussies deel en zullen samen zorgen dat de onderlinge relatie tussen MDTO en TOOI – en die met andere standaarden – nadere aandacht, toelichting en uitwerking krijgen. Dit betreft onder meer, maar niet limitatief:

  1. Toelichting op het gebruik binnen MDTO – en/of het bredere stelsel van metadatastandaarden – van waardelijsten die beheerd (of ontwikkeld) worden binnen TOOI;
  2. Het naar Linked Data omzetten van bestaande MDTO-waardenlijsten;
  3. Toelichting op enkele definitieverschillen tussen TOOI en MDTO, onder meer m.b.t. 'informatieobject';
  4. Toelichting op de relatie met DCAT. Dit geldt zowel voor TOOI als MDTO.

Het Metamodel Informatie Modellering (MIM) biedt een standaardtaal, structuur en set aan metadata voor informatie- en logische gegevensmodellen. Hierdoor zijn ze meer gestandaardiseerd en kunnen ze eenvoudiger worden begrepen en uitgewisseld. Het beschrijft de metaklassen, metastructuur en metadata die de grondslag vormen voor een informatiemodel. Doel van MIM is het standaardiseren van de methode van informatiemodelleren. Hierdoor wordt afstemming tussen informatiemodellen, vergelijkbaarheid in publicatie en gebruik van gemeenschappelijke tooling mogelijk. Conformiteit aan MIM faciliteert het ontstaan van een overheidsbreed stelsel van vergelijkbare en samenhangende informatiemodellen. Het MIM-metamodel is conceptueel beschreven en uitgewerkt voor toepassing in UML en in Linked Data. Het beschrijft hoe ze in UML, XML en als Linked Data gerepresenteerd kunnen worden. Het is ook mogelijk om informatie- en logische gegevensmodellen direct conform Linked Data standaarden zoals RDFS, OWL en SHACL vast te leggen.

NEN 3610 is het basismodel voor geo-informatiemodellen en is afgestemd op en gerelateerd aan internationale standaarden. De structuur en opbouw van NEN 3610 conformeert aan de ISO 19100-serie. Aan deze ISO-standaard moet geo-informatie voldoen in het kader van Europese regels (INSPIRE). Door de internationale afstemming is de structuur en opbouw van de Nederlandse informatiemodellen conform NEN 3610 vergelijkbaar met die van Europese standaarden. De Europese INSPIRE-standaarden zijn geïmplementeerd aan de hand van 34 inhoudelijke thema’s, waarvoor 'dataspecificaties' zijn opgesteld. Nederlandse datasets die onder INSPIRE vallen, worden conform deze Europese dataspecificaties aan de Europese geo-informatie infrastructuur beschikbaar gesteld. Om NEN 3610 informatiemodellen interoperabel te maken in de context van de digitale overheid gebruikt NEN 3610 als metamodel de Nederlandse standaard voor meta-informatiemodellering. NEN 3610 conformeert aan MIM.

Beschrijvende standaarden voor begrippen zoals NL-SBBbewerken

NL-SBB is de standaard voor het beschrijven van begrippen en geeft aan hoe begrippen in een begrippenlijst, taxonomie of thesaurus eenduidig worden beschreven. Er is aandacht voor uitleg in begrijpelijke taal (B1-niveau) en de verwijzing naar de (juridische) grondslag van een begrip in een geschreven bron of een bron op het internet (zoals wetten.nl [link]). De standaard kent een taalbinding waarmee een begrippenkader als Linked data kan worden gepubliceerd. Daarbij wordt gebruik gemaakt van met name SKOS, maar de standaard kan ook worden gebruikt zonder gebruik te maken van Linked data. Daarmee kunnen organisaties los van de door hen gebruikte technologie de standaard toepassen als stap op weg naar semantische interoperabiliteit. Deze standaard is geen geheel nieuwe standaard, maar een combinatie van bestaande industriestandaarden en een verdere invulling hiervan. Deze vormen de Nederlandse standaard voor het beschrijven van begrippen.

In het Nationaal Semantisch Vlak (NSV) wordt onder andere de samenhang tussen semantische standaarden uitgewerkt. DCAT-AP-NL is voor het beschrijven van datasets en dataservices (API´s), MIM voor het beschrijven van conceptuele en logische informatiemodellen en NL-SBB voor het beschrijven van begrippen. Er zit een zekere overlap tussen het MDTO enerzijds en DCAT, MIM en NL-SBB anderzijds. Dat komt boven als je MDTO gaat projecteren op bestaande semantische standaarden (W3C of EU-vocabularies zoals Dublin Core, Prov, PAV en Dcat/ADMS). Dat is nog niet (goed) gedaan. De meeste semantische standaarden in het NSV staan op de 'Pas toe of leg uit'-lijst of zijn onderweg daarnaartoe. Standaarden zoals NL-SBB, MIM, DCAT-AP-NL beschrijven hoe je begrippenkaders, informatiemodellen en datasets beschrijft. TOOI vult deze standaarden en MDTO aan met onder andere het beschrijven van waardelijsten. TOOI gaat over het begrippenkader en conceptueel model informatiemodel voor overheidsorganisaties. TOOI beschrijft ook concrete ontologieën, bijvoorbeeld van organisaties. TOOI is een voorbeeld van een conceptueel informatiemodel op MIM beschouwingsniveau 2. In Linked data-termen is een MIM2-model een ontologie. Voor dit soort ontologieën is het MIM bedoeld. Uitdrukken in MIM bevordert de semantische interoperabiliteit van dit soort modellen. Er is nog doorontwikkeling van MIM nodig. Die is gepland voor MIM 2.0. Dan wordt duidelijker hoe je de ontologie van overheidsorganisaties in MIM kunt uitdrukken (dus geen onderdeel van MIM, maar toepassen van MIM). De STOP-standaard biedt een model voor de opbouw van officiële publicaties die wordt toegepast in Omgevingsdocumenten. Het geeft een opbouw in hoofdstukken, artikelen, leden, et cetera voor publicaties en een informatiemodel voor organisaties. Voor de contentstructuur van andere publicaties is er geen publieke standaard. Dit is met name van belang om bij het ontwerp van een overheidsdienst te kunnen kiezen uit bestaande standaarden die voldoen aan de gewenste doelen en waarden en daarnaast het beste passen binnen de relevante ICT-infrastructuur. Onderstaand een voorbeeld van RWS over welke doelen en waarden worden ondersteund door verschillende metadatastandaarden. Dit voorbeeld laat zien hoe vanuit verschillende invalshoeken naar metadata gekeken kan worden.

Vervolgacties:

  1. Om meer grip te krijgen op de harmonisatie van de generieke/gemeenschappelijke metadata, is het verstandig om een overzicht te onderhouden van de metadata (attributen) waarover gezamenlijke afspraken zijn gemaakt qua beschrijving en toepassing. Dat kunnen bijvoorbeeld de metadata zijn die worden onderkend bij de 5 entiteiten van de NEN-ISO 23081, of metadata voor informatiemodellen. Voor elk van deze attributen kan het Informatie-object worden aangegeven waartoe het behoort, zoals: document, zaak of uitkering, de eventuele onderlinge samenhang met andere attributen en de eventuele waardenlijst of het formaat (zodat daar meer eenduidigheid bij ontstaat en meer hergebruik kan plaatsvinden).
  2. De beheerders en intermediairs van bestaande standaarden en enkele experts zouden deze samenhang kunnen uitwerken. Bijvoorbeeld te beginnen bij de meest gebruikte of meest relevante metadatastandaarden en gebruiksfuncties. Denk aan de RMO, MDTO en TOOI en aanvullend ook de GEO-standaarden.
  3. Uitwerken van een stappenplan; hoe kies ik de juiste standaarden en hoe zorg ik voor een geïntegreerde implementatie? Zie ook hoofdstuk 9: Implementatie aanbevelingen Handreiking Metagegevens.

Volgende pagina, hoofdstuk 5: Informatie- en archiefdomein Handreiking Metagegevens