Handreiking MIM
Algemeen
Beheerder: Geonovum
Status bij Forum Standaardisatie: aanbevolen
Waarde van de standaard
Het Metamodel Informatie Modellering (MIM) beschrijft een generieke structuur voor het vastleggen van informatie- en gegevensmodellen.
Belangrijke voordelen van de MIM standaard zijn:
- Expliciet maken van de betekenis en structuur van gegevens, zodat deze eenduidig begrepen, uitgewisseld en geautomatiseerd verwerkt kunnen worden.
- Verhogen van de uniformiteit van de beschrijving van informatie- en gegevensmodellen, zodat deze eenvoudiger kunnen worden gemaakt en begrepen kunnen worden.
- Standaardiseren van de metagegevens van informatie- en gegevensmodellen, zodat hun kwaliteit wordt verhoogd.
- Bieden van een modelleertaalonafhankelijk metamodel en uitwisselformaat, zodat informatie- en gegevensmodellen eenvoudiger kunnen worden uitgewisseld tussen organisaties.
De MIM standaard biedt waarde aan de volgende specifieke doelgroepen:
| Doelgroep | Waarde |
|---|---|
| Managers |
|
| Informatie- en gegevensmodelleurs |
|
| Analisten en ontwikkelaars |
|
Werking van de standaard
De MIM standaard biedt een standaard metamodel voor informatie- en gegevensmodellen. Onderdeel daarvan zijn een verzameling metaklassen, inclusief bijbehorende metagegevens. De belangrijkste metaklassen uit de standaard zijn objecttype en attribuutsoort, die respectievelijk bedoeld zijn om de dingen en hun eigenschappen te beschrijven. De formele definitie van deze metaklassen is:
- Objecttype: De typering van een groep objecten die binnen een domein relevant zijn en als gelijksoortig worden beschouwd.
- Attribuutsoort: De typering van gelijksoortige gegevens die voor een objecttype van toepassing is.
Los van deze metaklassen zijn er ook metaklassen om zaken zoals relaties, groeperingen van gegevens, datatypes en waardelijsten te beschrijven. Verder zijn er allerlei gestandaardiseerde metagegevens om zaken zoals de naam, de formele definitie en een toelichting van deze metaklassen te beschrijven.
Het metamodel is vertaald naar UML en Linked Data standaarden, zodat informatie- en gegevensmodellen met deze modelleertalen conform de standaard kunnen worden beschreven.
Relatie met GDI domeinarchitectuur gegevensuitwisseling
De MIM standaard geeft een invulling aan de volgende principes in de domeinarchitectuur.
| Principe | Invulling |
|---|---|
| Gegevens die kunnen worden gedeeld zijn vindbaar, toegankelijk, interoperabel en herbruikbaar | De standaard verhoogt de interoperabiliteit en herbruikbaarheid van gegevens doordat betere informatie- en gegevensmodellen worden opgesteld, die ook eenvoudiger kunnen worden begrepen. |
| Metagegevens zijn begrijpelijk voor mensen | De standaard zorgt ervoor dat gegevens en de informatie- en gegevensmodellen die ze beschrijven eenvoudiger kunnen worden begrepen. |
| Metagegevens zijn aan elkaar verbonden | De standaard maakt het mogelijk om relaties te leggen tussen informatie- en gegevensmodellen, alsook naar begrippenkaders. |
| Metagegevens zijn beschikbaar als Linked Data | De standaard biedt een mapping op Linked Data standaarden, waardoor informatie- en gegevensmodellen ook als Linked Data beschikbaar kunnen worden gesteld. |
| Gegevens worden zo vroeg mogelijk gevalideerd | De standaard ondersteunt validatie van gegevens doordat constraints die ten grondslag liggen aan validatieregels in informatie- en gegevensmodellen kunnen worden beschreven. |
De standaard is ondersteunend aan de volgende functies in het functiemodel van de domeinarchitectuur:
- Beheren informatie- en gegevensmodellen
- Beschikbaar stellen metagegevens
Positionering van de standaard
Relatie met begrippen
Informatie- en gegevensmodellen gebruiken begrippen, die los van de MIM standaard moeten worden beschreven. Ze bevinden zich dus op een ander niveau dan deze informatie- en gegevensmodellen. Begrippen bestaan op het niveau van taal; ze beschrijven woorden (termen) en hun definitie. Informatiemodellen formaliseren deze taal zodat met voldoende exactheid informatie over de werkelijkheid kan worden vastgelegd. De objecttypes in informatiemodellen en hun definitie kunnen overeenkomen met die van begrippen, of daarvan zijn afgeleid. Gegevensmodellen beschrijven de structuur en datatypes van de gegevens die nodig zijn om de informatie te representeren. Ze zijn nodig voor geautomatiseerde verwerking en uitwisseling van gegevens.
Relatie met andere modelleertalen
De huidige versie van de standaard biedt geen ondersteuning voor andere modelleertalen dan UML en de Linked Data standaarden. De nieuwe versie van de standaard (2.0) zal wel meer talen ondersteunen, zoals Entity Relationship modellering, Fact Based Modeling, ArchiMate en OntoUML. Vooruitlopend daarop is het wel mogelijk om zelf een mapping te maken van dit soort modelleertalen op de standaard. Voor standaard modelleerconstructies is een dergelijke mapping ook niet ingewikkeld. Zolang deze echter niet is gestandaardiseerd, zullen organisaties daar wel eigen keuzes bij maken.
Relatie met andere metagegevens
Informatie- en gegevensmodellen kunnen worden gezien als een vorm van metagegevens. Het zijn metagegevens die gegevens definiëren. Er is een grote diversiteit aan soorten metagegevens. De Data Management Body of Knowledge hanteert een driedeling in soorten metagegevens: business metagegevens, technische metagegevens en operationele metagegevens. Informatie- en gegevensmodellen zijn vooral business metagegevens; ze zijn gericht op het creëren van begrip bij mensen over de betekenis van gegevens. Een deel van de metagegevens in dit soort modellen kun je ook beschouwen als basis voor technische metagegevens, zoals de gebruikte datatypes. Operationele metagegevens zijn gegevens die ontstaan bij de verwerking van gegevens, zoals auditlogs of metagegevens over de totstandkoming van gegevens (ook wel: horizontale data lineage). Deze kunnen niet met de standaard worden beschreven.
Informatie- en gegevensmodellen zijn bedoeld om metagegevens vast te leggen over gegevens die nog niet bestaan. Het is ook mogelijk om metagegevens vast te leggen over gegevens die al wel bestaan. Denk daarbij met name aan fysieke datamodellen en schema’s van gegevens die in databases aanwezig zijn. Dit soort metagegevens kunnen middels reverse engineering technieken uit databases worden onttrokken en vastgelegd in repositories van metagegevens. Het is mogelijk om de metagegevens in deze repositories weer te relateren aan bovenliggende informatie- en/of gegevensmodellen. Hierdoor kan meer betekenis worden gegeven aan bestaande gegevens.
Soorten informatie- en gegevensmodellen
De standaard doet geen uitspraken over de soorten informatie- en gegevensmodellen die worden gemaakt. Deze kunnen verschillende doeleinden ondersteunen, zoals de ontwikkeling van applicaties, de ontwikkeling van informatieproducten of de uitwisseling van gegevens. De aanleiding en de belangrijkste toepassing ligt bij het modelleren van gegevens die worden uitgewisseld door (overheids)organisaties. Tegelijkertijd zou de standaard ook gebruikt kunnen worden voor bijvoorbeeld gegevensmodellen die de basis zijn voor programmacode, databaseschema’s of een datawarehouse. Het is aan organisaties zelf om te bepalen of ze vinden of de standaard hiervoor voldoende meerwaarde biedt.
Impact van de standaard
De MIM standaard biedt ondersteuning voor het representeren van informatie- en gegevensmodellen in UML en conform Linked Data standaarden. Als gekozen wordt voor UML dan kunnen UML klassediagrammen gebruikt worden voor het tekenen van de modellen. Er is ook een toolbox (plug-in) voor het UML modelleertool Sparx Enterprise Architect beschikbaar om het tekenen van deze modellen te vereenvoudigen. Als gebruik wordt gemaakt van een ander UML modelleertool dan zal een eigen mapping op dat tool moeten worden opgesteld. De metaklassen zijn gerepresenteerd als UML stereotypes, dus zouden in elk UML modelleertool moeten kunnen worden beschreven. Voor de metagegevens van de metaklassen geldt dat het modelleertool ruimte moet bieden om zelfgedefinieerde eigenschappen toe te voegen. Dat wordt door niet alle UML modelleertools ondersteund. Als dat wel wordt ondersteund, dat wordt er liefst een MIM-specifieke configuratie van dat modelleertool gemaakt om de metaklassen en bijbehorende metagegevens op een eenvoudige wijze te beschrijven.
Voor de Linked Data representatie is er een aparte vocabulaire die gebruikt kan worden in RDF. Deze vormt tevens een één-op-één serialisatie van informatie- en gegevensmodellen naar RDF, die bijvoorbeeld gebruikt kan worden voor de uitwisseling van deze modellen. Er is een gestandaardiseerde mapping van het MIM Linked Data vocabulaire naar OWL, RDFS en SHACL beschikbaar om modellen om te zetten naar een specifieke Linked Data ontologie.
Er is ook een standaard serialisatie naar XML beschikbaar, waardoor informatie- en gegevensmodellen ook op gestandaardiseerde manier in machineleesbare vorm kunnen worden uitgewisseld. De genoemde serialisaties maken het mogelijk om gestandaardiseerde tools te bieden voor het creëren, vertalen en publiceren van de modellen.
Informatie- en gegevensmodellen zullen uiteindelijk ook moeten worden vertaald naar fysieke datamodellen en schema’s. Er bestaan tools die deze vertaling geautomatiseerd kunnen uitvoeren, zoals bijvoorbeeld het eerdergenoemde modelleertool Sparx Enterprise Architect.
Het is belangrijk om informatie- en gegevensmodellen ook te publiceren, zodat afnemers en andere gebruikers ze kunnen raadplegen. Er bestaan allerlei tools en voorzieningen die publicatie ondersteunen. Zo wordt vaak gebruik gemaakt van ReSpec als standaard tool. Dit is een tool van het W3C, die deze gebruikt voor het publiceren van standaarden. Voor overheidsbrede informatie- en gegevensmodellen is de stelselcatalogus beschikbaar als landelijk portaal. De modellen zijn liefst ook in machineleesbare vorm beschikbaar, zodat ze door anderen in tools kunnen worden ingelezen en gebruikt. Hiervoor kan gebruik worden gemaakt van de Linked Data of XML serialisatie.
Aandachtspunten
Datalineage
Waar de huidige versie van de standaard nog niets over zegt is op welke wijze wordt omgegaan met verticale data lineage tussen informatie-, gegevens- en datamodellen. Het is wel mogelijk om een relatie te leggen van modelelementen naar de begrippen die aan deze modelelementen ten grondslag liggen. Los daarvan is het gewenst om bij een logisch gegevensmodel een relatie te leggen naar de modelelementen in het conceptuele informatiemodel dat eraan ten grondslag ligt. Soortgelijk is het gewenst om de relatie te leggen van een fysiek datamodel naar het logische gegevensmodel. In UML wordt hiervoor typisch de “trace” relatie gebruikt. Er bestaan tools die een kopie kunnen maken van een informatiemodel als start voor een gegevensmodel, waarbij automatisch trace relaties tussen de modelelementen worden gelegd.
De standaard zegt niets over hoe met horizontale datalineage wordt omgegaan. Dat is ook logisch omdat horizontale datalineage betrekking heeft op hoe gegevens stromen door ketens van systemen, processen en organisaties. Er is wel een handreiking opgesteld door de NORA expertgroep gegevensmanagement die hiervoor een voorbeelduitwerking en een standaard profiel biedt. Daarbij wordt gebruik gemaakt van de PROV standaard en de Linked Data representatie van MIM. Het laat zien hoe individuele gegevenselementen in een gegevensuitwisseling kunnen worden verbonden aan modelelementen in informatie- en gegevensmodellen.
Informatie- en gegevensmodellen en hun onderlinge relatie
De standaard doet geen uitspraak over of het nodig is om een conceptueel informatiemodel los van een logisch gegevensmodel op te stellen. Er zijn verschillende argumenten waarom dat waardevol is. Zo beschrijft een informatiemodel eigenlijk andere dingen dan een gegevensmodel. Een informatiemodel beschrijft de dingen die bestaan in de werkelijkheid teneinde deze werkelijkheid beter te begrijpen. Een gegevensmodel beschrijft de structuur van de gegevens beschrijft ten behoeve van geautomatiseerde verwerking. Als deze twee perspectieven niet van elkaar worden onderscheiden dan zijn de argumenten om modelelementen te benoemen en te structureren niet goed duidelijk. Aan de andere kant kost het opstellen, onderhouden en relateren van een separaat informatiemodel wel extra inspanning. Daarnaast lijken informatie- en gegevensmodellen vaak erg op elkaar waardoor het onderscheid ook kunstmatig kan aanvoelen.
Relatie met andere standaarden
Relatie met NL-SBB en SKOS
Zoals hiervoor beschreven is, is het mogelijk om modelelementen in informatie- en gegevensmodellen te relateren aan begrippen. Hiervoor is het standaard metagegeven “begrip” beschikbaar voor alle modelelementen. Deze kan de vorm aannemen van een term of een URI (verwijzing). Het begrip zelf kan conform de NL-SBB standaard zijn beschreven en/of conform de SKOS standaard zijn gepubliceerd. Dat maakt voor de MIM standaard niet uit en kun je ook niet zien aan de term of URI die verwijst naar het begrip. Als gekozen wordt voor de Linked Data representatie van MIM dan sluit dat wel goed aan op NL-SBB en SKOS, omdat deze ook zijn gebaseerd op Linked Data standaarden. Het is dan eenvoudiger om te navigeren van informatie- of gegevensmodellen naar begrippen.
Relatie met OpenAPI specification
De OpenAPI specification is gericht op het beschrijven van de operaties en gegevens die worden geboden via API’s. Voor het beschrijven van de gegevens wordt daarbij gebruik gemaakt van de JSON-schema standaard. Die standaard kun je zien als een manier om een fysiek datamodel te beschrijven van gegevens. De gegevens worden daarbij typisch maar niet noodzakelijkerwijs zelf in JSON gerepresenteerd. Een JSON schema kun je zien als een doorvertaling van een gegevensmodel, dat je conform de MIM standaard kunt beschrijven. De MIM standaard biedt geen mechanismen om de relatie tussen deze modellen te beschrijven (zie ook paragraaf over datalineage). Hetzelfde geldt voor de OpenAPI specification. Organisaties kunnen hiervoor wel eigen conventies beschrijven.
Relatie met DCAT
Data Catalog Vocabulary (DCAT) is een metadatastandaard en is ontworpen om interoperabiliteit tussen gegevenscatalogi, gepubliceerd op het internet, te vergemakkelijken. DCAT-AP-NL is het Nederlandse profiel op DCAT. DCAT maakt decentrale publicaties en ontsluiting van catalogi mogelijk. Het is mogelijk om datasets te beschrijven conform de DCAT standaard. Het is mogelijk in de beschrijving van een dataset te verwijzen naar naar standaarden zoals het gegevensmodel dat van toepassing is op de dataset. Hiervoor kan gebruik worden gemaakt van de “conforms to” eigenschap in DCAT.
Links
11 mei 2026 05:23:02
10 maart 2026 16:53:03
11 mei 2026 05:23:02
5
Informatief