Gegevensbeschrijvingen/Handreiking: verschil tussen versies

Uit NORA Online
< Semantiek
Naar navigatie springen Naar zoeken springen
Geen bewerkingssamenvatting
(navigatiemenu toegevoegd)
 
(55 tussenliggende versies door 4 gebruikers niet weergegeven)
Regel 1: Regel 1:
{{concept|}}
{{Semantiek
==Doel van deze handreiking==
|Contactpersoon= Eric Brouwer
Het NORA Afgeleide Principe [[Informatie-objecten_systematisch_beschreven_(concept)|AP17]] stelt: “De aan de dienst gerelateerde informatieobjecten zijn systematisch beschreven en op passende wijze gemodelleerd.” Het is afgeleid van de basisprincipes [[vindbaar]], [[toegankelijk]], [[standaard (Basisprincipe)|standaard]] en [[transparant]]. Om te komen tot een uniforme invulling van het Afgeleide Principe biedt deze handreiking een vocabulaire in de vorm van een overzicht van veelgebruikte metagegevens en relevante standaarden.
|e-Mailadres= eric.brouwer@ictu.nl
}}


Beschrijvingen van informatieobjecten bestaan voor uiteenlopende doelen en in velerlei vormen. Afhankelijk van de aard en het doel van de beschrijving zijn bepaalde metagegevens meer of minder relevant. Deze aanbeveling heeft daarom niet de pretentie voor ieder voorkomend geval de juiste metagegevens te kunnen voorschrijven. De publicatie van deze handreiking heeft evenwel mede tot doel om de in de praktijk opgedane ervaringen met de toepassing ervan te bundelen ter verdere verbetering. In die zin is het 'pas toe of leg uit'-principe hier wel van toepassing, ook al zal de uitleg in veel gevallen luiden: 'Voor dit doel niet relevant'. De metagegevens zijn daarom gegroepeerd in aandachtsgebieden die al dan niet relevant kunnen zijn in een specifieke situatie. Vaker gebruikte metagegevens zijn vet afgedrukt.
__NOTOC__


==Status==
Het [[Informatie-objecten systematisch beschreven (concept)|Afgeleide Principe 17]] schrijft voor: ''{{#show: Informatie-objecten systematisch beschreven (concept)| ?Stelling }}''
Deze handreiking heeft als status: “Work in progress”. Het is een eerste inventarisatie van veelvoorkomende metagegevens in grotere gegevensregistraties in Nederland, zonder pretentie van volledigheid. Deze handreiking is niet bindend, maar melding van de reden van afwijking wordt ten zeerste gewaardeerd ter verdere verbetering en toelichting.


Omdat metagegevens onder verschillende benamingen en met verschillende definities voorkomen zijn ze aangeduid met referentienamen en -definities, indien het naar de geest om een overeenkomstig metagegeven handelt. Bij de metagegevens zijn verwijzingen opgenomen naar mogelijk van toepassing zijnde standaarden. Aanbevolen wordt om aan te sluiten bij de voor het beoogde doel meest relevante standaard(en).
== Doel van deze handreiking ==
Deze handreiking heeft tot doel om beheerders van (catalogi van) informatieobjecten op weg te helpen bij het maken van een beschrijving daarvan, die voldoet aan de relevante standaarden en geschikt is voor zowel intern gebruik als voor interoperabiliteit met andere organisaties. Dat laatste doel wordt bereikt door meer standaardisatie in de metagegevens waarmee de informatieobjecten worden beschreven. Daartoe wordt de weg gewezen naar de relevante standaarden en is een aanvullende lijst metagegevens met een gegevensmodel opgesteld, voor het geval er geen model voor het eigen domein beschikbaar is of als dat te beperkt is. De beschrijving dient daarnaast te voldoen aan de kwaliteitseisen die zijn genoemd in het afgeleide principe AP17: 'Beschrijving informatieobjecten'.


==Reikwijdte van het begrip informatieobject en de relevante standaarden==
Beschrijvingen van informatieobjecten bestaan voor uitlopende doelen en in velerlei vormen. Afhankelijk van de aard en het doel van de beschrijving zijn bepaalde metagegevens meer of minder relevant. In de meest uitgebreide vorm beschrijft deze handreiking zowel de semantiek, als de syntax en de registratiegegevens.  
Het begrip informatieobject is ontleend aan de standaarden voor ongestructureerde gegevens als NEN-ISO 23081 (metagegevens voor archiefbescheiden), Richtlijn metagegevens Overheid (RMO) en Overheids Web Metadata Standaard (OWMS). Deze laatste standaard definieert een informatieobject als “Een identificeerbaar, mogelijk samengesteld geheel van gegevens.


In AP17 worden onder het begrip informatieobject ook alle gestructureerde gegevens en hun beschrijvingen verstaan. De daarvoor bestaande specifieke standaarden zijn vermeld in de tabel. Aangezien gegevenscatalogi, thesauri, taxonomieën of conceptuele modellen (Semantic Assets in termen van ADNS) ook documenten zijn is er sprake van een zekere mate van overlap van standaarden. Hieronder wordt het toepassingsgebied van de relevante standaarden kort samengevat aan de hand van de in Nederland geldende toepassingsrichtlijnen, voor zover die bestaan.
== Reikwijdte van het begrip informatieobject en de relevante standaarden ==
Het begrip informatieobject in AP17 is enerzijds ontleend aan de standaarden voor '''ongestructureerde''' gegevens als NEN-ISO 23081 (metagegevens voor archiefbescheiden), Richtlijn metagegevens Overheid (RMO) en Overheids Web Metadata Standaard (OWMS). Deze laatste standaard definieert een informatieobject als “Een identificeerbaar, mogelijk samengesteld geheel van gegevens.


===Overheid Web Metadata Standaard/Dublin Core===
In AP17 worden onder het begrip informatieobject echter ook de afzonderlijke '''gestructureerde''' gegevens verstaan. Voor beide soorten informatieobjecten bestaan reeds [[Gegevensbeschrijvingen/Standaarden voor gegevensbeschrijvingen|specifieke standaarden]]. Aangezien gegevenscatalogi, thesauri, taxonomieën of conceptuele modellen zowel documenten als beschrijvingen van gestructureerde gegevens zijn, is er sprake van een zekere mate van overlap van standaarden.
De [[OWMS (Overheid.nl Web Metadata Standaard)]] is een semantische definitie van de metadata-eigenschappen waarmee ongestructureerde informatie van de Nederlandse overheid op een gestructureerde manier beschreven kan worden. Het betreft informatie van organen van een rechtspersoon, die ingesteld zijn volgens het publiekrecht, dan wel een ander persoon of college met enig openbaar gezag bekleed.


Het domein van de OWMS-eigenschappen (DCAM: domain) is 'informatieobject', ontsloten via internet. Dit is een beperking ten opzichte van het domein van de overgenomen [[Dublin_Core_metadata_element_set|Dublin Core]] properties: 'resource'. Het betreft bijvoorbeeld een overheidspublicatie, webpagina of een databank, dus geen metagegevens voor de beschrijving van gestructureerde informatie in de vorm van gegevens. In deze handreiking heeft OWMS vooral betrekking op het registratiecatalogustype.
Voor het onderdeel ongestructureerde informatie zijn reeds handreikingen beschikbaar, inclusief de daarbij te gebruiken metagegevens en hun gegevensstructuur. Daarom wordt hier kortheidshalve verwezen naar de desbetreffende [[Gegevensbeschrijvingen/Standaarden voor gegevensbeschrijvingen#standaarden voor ongestructureerde informatie|standaarden voor ongestructureerde informatie]].


===Richtlijn Metagegevens Overheidsinformatie/NEN-ISO 23081===
[[Gegevensbeschrijvingen/Standaarden voor gegevensbeschrijvingen#standaarden voor gestructureerde gegevens|Standaarden voor gestructureerde gegevens]] (gegevensbeschrijvingen) verschillen sterk per domein. Het [https://www.geonovum.nl/geo-standaarden/metamodel-informatiemodellering-mim Metamodel voor Informatiemodellering (MIM)] biedt standaard metadata-elementen voor het beschrijven van informatiemodellen. Het wordt breed gebruikt door allerlei overheidsorganisaties .
Artikel 19 van de Archiefregeling (2009) schrijft voor dat zorgdragers<ref name="ftn1">Degene die bij of krachtens de wet belast is met de zorg voor de archiefbescheiden (Archiefwet 1995) </ref> een metagegevensschema opstellen aan de hand van [[NEN-ISO 23081]]. De [[Richtlijn Metagegevens Overheidsinformatie]] (RMO) is opgesteld voor gebruik binnen de Nederlandse overheid en maakt deel uit van NORA. De RMO geldt voor informatieobjecten die bij de uitvoering van overheidstaken worden gebruikt en gemaakt: documenten, databases, afbeeldingen, mp3-bestanden, websites, GIS, CAD-tekeningen en beperkt zich dus niet tot webpublicaties zoals OWMS. Wel is het toepassingsgebied beperkt tot archiefbescheiden.


De RMO beschrijft welke entiteiten kunnen worden onderscheiden (Record<ref name="ftn2">Een record wordt, in aansluiting op de Archiefwet 1995, NEN 2082 en de Baseline Informatiehuishouding Rijksoverheid, gedefinieerd als “Informatieobject, ongeacht zijn vorm, met de bijbehorende metagegevens ontvangen of opgemaakt door een natuurlijke en/of rechtspersoon bij de uitvoering van taken en bewaard om te voldoen aan wettelijke en/of administratieve en/of maatschappelijke behoeften”.</ref>, Actor, (Bedrijfs-) Activiteit, Mandaat en Relatie) en hun metagegevens en is daarmee evenals OWMS niet bedoeld voor de beschrijving van gestructureerde gegevens. De RMO wordt niet rechtstreeks toegepast, maar dient een nadere vertaling te krijgen in een Toepassingsprofiel. Voor het Rijk is het Toepassingsprofiel Metagegevens Rijksoverheid ontwikkeld en vastgesteld. Hiermee wordt tevens voldaan aan de Baseline Informatiehuishouding Rijksoverheid.
Er is eerder een handreiking voor deze categorie opgesteld met een aanbevolen {{bestand met info|Referentienamen_definities_en_standaarden.pdf|lijst met referentienamen en -definities}} met gegevensstructuur, beschreven in een [[Gegevensbeschrijvingen/Metagegevensmodel|metagegevensmodel]]. De lijst vormt echter zelf geen standaard en vervangt de bestaande standaarden ook niet. De lijst dient als checklist voor mogelijke aanvullingen op de te kiezen standaard om tot een meer uniforme beschrijving te komen over meerdere domeinen heen. Omdat namen en definities in de domeinspecifieke standaarden onderling verschillen, zijn ze aangeduid met referentienamen en -definities, die bij een keuze voor een specifieke standaard daardoor vervangen dienen te worden.


===ADMS en DCAT===
== Verantwoording handreiking gegevensbeschrijving ==
Het Asset Descripion Metadata Schema (EU en W3C), ofwel [[ADMS_(Asset_Description_Metadata_Schema)|ADMS]], is een toepassingsprofiel van [[DCAT_(Data_Catalog_Vocabulary)|DCAT]], dat gebruikt kan worden om ''semantic assets'' (grofweg: informatieobjecten in een catalogus of register) te beschrijven in de vorm van in hoge mate herbruikbare metadata (bv. xml-schema’s, generieke datamodellen) en referentiedata (bv. code lists, taxonomies, dictionaries, vocabularies) voor eGovernment systeemontwikkeling. Er zijn geen metadata voor het beschrijven van afzonderlijke gestructureerde gegevens. ADMS focust op de informatieobjecten in die afzonderlijke catalogi. DCAT focust meer op het vinden van catalogi.
De handreiking is opgesteld door experts die hier veel ervaring mee hebben opgedaan bij verschillende (overheids)organisaties en is gericht op een praktische toepassing voor diverse situaties. De handreiking heeft evenwel niet de pretentie voor iedere situatie de relevante metagegevens te kunnen voorschrijven.  


===Geo standaarden ISO 19103, 19109, 19110 en 19115===
Uitgangspunt vormde een inventarisatie van gebruikelijke metagegevens in catalogi van Nederlandse registraties en de publicatie 'Catalogus Authentieke Registratie' van het programma Stroomlijning basisgegevens. Deze publicatie lag ook ten grondslag aan de Stelselcatalogus 1.0 in 2009. Sindsdien is de beschrijving in diverse werkgroepen met de basisregistraties doorontwikkeld. Deze lijst vormt een vocabulaire voor de beschrijving van veelgebruikte metagegevens en dient zowel als checklist voor mogelijk relevante metagegevens als ter uniformering daarvan over verschillende standaarden heen.  
'''[[ISO/TS_19103|ISO 19103]] (Geographic Information – Conceptual schema language)''' biedt een formele conceptuele taal voor het eenduidig beschrijven van uitwisseling van geo-informatie en interoperabele services. De standaard identificeert in UML in combinatie met OCL object-klassen (features), attributen, basis datatypen, associaties, operaties, stereotypen, constraints en documentatie.


'''[[ISO 19109]]: Geographic information - Rules for application schema.''' Het metamodel definieert de regels voor het opstellen en documenteren van applicatieschema’s inclusief de principes voor het definiëren van objecttypen. De formele beschrijving bevat de inhoud en structuur van gegevens die in een of meerdere toepassingen worden gebruikt om daaruit eenduidig informatie te kunnen halen. Het Algemene ObjecttypeModel (General Feature Model) beschrijft aan de hand van modelelementen (klassen, attributen, associaties, specialisaties e.d.) die een applicatieschema kan hebben de regels voor hun eigenschappen, gedrag en naamgeving. De modelelementen worden beschreven in metaklassen (metaclass). Zo heeft de metaklasse Objecttype (optioneel of verplicht) een naam, een definitie, abstractJaNee, een overervingsrelatie, associaties, constraints. De scope van de standaard omvat o.a.:
Hiermee wordt de in de praktijk opgedane ervaring beschikbaar gesteld voor hergebruik en doorontwikkeling. Dit proces is nog in volle gang. Het is een eerste inventarisatie van veelvoorkomende metagegevens, zonder pretentie van volledigheid: “Work in progress”. Uit de zo ontstane longlist is een set belangrijkste metagegevens geselecteerd op basis van de mate van voorkomen bij Nederlandse registraties en inschatting van het belang. Deze zijn vetgedrukt weergegeven in de {{bestand met info|Referentienamen_definities_en_standaarden.pdf|lijst met referentienamen en -definities}}.
* conceptueel modelleren van objecttypen en hun eigenschappen binnen een toepassingsdomein;
* gebruik van UML voor het maken van applicatieschema’s
* vertaling van concepten in het conceptuele model naar datatypen in een applicatieschema.


'''ISO 19110: Geographic information — Methodology for feature cataloguing.''' Methodologie voor het opstellen van een objectcatalogus. Die definieert de objecttypen, hun attributen en associaties voor de omzetting van data naar bruikbare informatie. De standaard bevat een normatieve layout voor een objectcatalogus waarin de beschrijvende eigenschappen per informatie-element op het niveau van ´type´ worden gedefinieerd.
Vervolgens zijn de metagegevens gestructureerd in [[Gegevensbeschrijvingen/Metagegevensmodel|Metagegevensmodel]].


'''[[ISO 19115]]: Geographic information — Metadata.''' Definieert het schema voor het beschrijven van geografische informatie en (netwerk) services. Het bevat informatie over het identificeren, de geografische extent, de kwaliteit, het ruimtelijke en temporele schema, geografisch referentiestelsel en de verspreiding van geografische data. De metadata zijn toepasbaar op datasets, dataset-series, en individuele geografische objecten en eigenschappen daarvan (attributen, relaties e.d.). Hoewel bedoeld voor digitale data kan het ook toegepast worden op niet digitale geografische data en niet geografische data.
== Status ==
De handreiking is niet bindend, maar melding van de reden van eventuele afwijking wordt ten zeerste gewaardeerd ter verdere verbetering en toelichting. In die zin is het 'pas toe of leg uit' principe hier wel van toepassing.


===Core Components Technical Specification===
== Stappen bij het maken van een gegevensbeschrijving ==
[[CCTS_(Core_Component_Technical_Specification)]] (CCTS, 2001 Verenigde Naties) definieert een metamodel en regels voor het beschrijven van structuur en inhoud van conceptuele en logische gegevens- en uitwisselingsmodellen in UML, gestructureerde informatie dus. Core Components zijn gegevenstypen als objecttypen (Aggregate Core Component) attribuuttypen (Basic Core Component) en relatietypen (Association Core Component). CCTS verwijst naar [[ISO/IEC 11179]] (2003), maar is een zelfstandige standaard.
# Kies een standaard, die het meeste aansluit bij de sector waarin de organisatie actief is. Ga daarvoor te rade bij andere organisaties in de sector en raadpleeg [[Gegevensbeschrijvingen/Standaarden voor gegevensbeschrijvingen|het overzicht met standaarden]].
# Schets een eerste lijst metagegevens op basis van de eigen behoefte van de organisatie, de afnemers en de gekozen standaard.
# Neem de naamgeving en definities van de standaard over, voor zover mogelijk en wenselijk in de sector. <ref>Zie voor een 1:1 koppeling met standaarden: {{bestand met info|werkbestand referentie metagegevens.ods}}</ref>
# Vul de lijst aan met de relevant geachte metagegevens uit de {{bestand met info|Referentienamen definities en standaarden.pdf|lijst met referentienamen en -definities}}.
# Bepaal de wenselijke vorm van de catalogus gelet op het gebruiksdoel: als tekstdocument, digitaal raadpleegbare catalogus of wiki. Let hierbij zowel op de behoefte in de ontwikkelfase van toepassingen (domeinmodellen, functionele ontwerpen, berichtdefinities) als tijdens de gebruiksfase, zowel binnen de sector als voor hergebruik van gegevens in andere sectoren en catalogi (zoals de [http://www.stelselcatalogus.nl Stelselcatalogus]) en andere RDF-toepassingen.
# Bepaal de metagegevensstructuur. Sluit zo mogelijk aan op [[Gegevensbeschrijvingen/Metagegevensmodel|het metagegevensmodel]].
# Realiseer de gegevensbeschrijving in een adequate tool en voer de metagegevens in. Neem ook relevante begrippen uit wetten op en modelleer zo nodig overeenkomsten en verschillen zoals beschreven in het [[Gegevensbeschrijvingen/Metagegevensmodel|metagegevensmodel]]
# Publiceer de gegevensbeschrijving in de gekozen vorm. Zie verder onder [[Gegevensbeschrijvingen/Handreiking#Publicatie|Publicatie]].


==Verantwoording opname metagegevens gestructureerde informatie==
== Impact ==
Uitgangspunt voor de aanbeveling vormde een inventarisatie van gebruikelijke metagegevens in catalogi van Nederlandse registraties. Hieruit kwam een grote diversiteit naar voren, zowel van soorten catalogi, als van gebruikte metagegevens voor de beschrijving daarvan. De publicatie 'Catalogus Authentieke Registratie' in 2002 door het programma Stroomlijning basisgegevens is door sommige basisregistraties gevolgd, waarmee een beperkte mate van standaardisatie was ontstaan. Deze publicatie lag ook ten grondslag aan de Stelselcatalogus 1.0 in 2009. Sindsdien is de beschrijving met metagegevens in diverse werkgroepen met de basisregistraties verder ontwikkeld. De resultaten daarvan zijn gebruikt bij het opstellen van de lijst metagegevens voor AP17.  
De impact van deze handreiking op de bestaande beschrijvingen van informatieobjecten kan alleen per geval worden vastgesteld. Als in een sector reeds aan een geschikte standaard wordt voldaan, kan de impact beperkt blijven. In geval van vele verschillende en afwijkende beschrijvingen per deeldomein kan een volledig nieuwe beschrijving voor de sector benodigd zijn.


Voor de modellering is aangesloten bij het 'Whitepaper metamodel'<ref name="ftn3">Whitepaper metamodel 2013-01-14, A. Loeffen, R. Onink, A. Droogh, </ref> van de werkgroep 'Best Practices' voor zover daarover ruime overeenstemming bestaat. Daaraan is op verzoek van betrokken organisaties een modellering van de wijzigingen van gegevens toegevoegd op basis van het 'Whitepaper Gebeurtenissen'<ref name="ftn4">Whitepaper Gebeurtenissen V1.0 final, Rob Onink , 27-05-2013</ref> van R. Onink ea. Deze modellering is beperkt gehouden tot het gegevensdeel om overlap met procesmodellen en zaaktypecatalogi te beperken.
==Publicatie==
Twee implicaties van het afgeleide principe 17: “Systematische beschrijving informatieobjecten” hebben betrekking op de publicatie:
#De beschrijving is op internet gepubliceerd en voor mensen leesbaar (toegankelijk)
#De beschrijving is bij voorkeur ook machinaal lees- en interpreteerbaar (toegankelijk)


In het [[Gegevensbeschrijvingen/Metagegevensmodel|Metagegevensmodel]] zijn de metagegevens opgenomen die hierbij van belang zijn in de objecttypen: Registratiecatalogustype, Distributietype, Betrokkenetype en Contactgegevenstype. Voor een raadpleger is het belangrijk dat metagegevens als beschrijving van de inhoud van de catalogus, geografische dekking, laatste wijziging, vindplaatsen, contactgegevens en dergelijke actueel en volledig zijn om te kunnen bepalen of de inhoud voor hem of haar relevant is.


Uit de zo ontstane longlist is een set belangrijkste metagegevens geselecteerd op basis van de mate van voorkomen bij Nederlandse registraties en inschatting van het belang. Deze zijn vetgedrukt weergegeven in de bijlage Referentienamen, definities en standaarden.ods.
De vindbaarheid kan verder vergroot worden door de gegevensbeschrijving aan te melden voor opname in de NORA-inventarisatie van [[gegevenswoordenboeken]] in de publieke sector. Daarnaast draagt opname van de gegevenselementen in de [http://www.stelselcatalogus.nl Stelselcatalogus] bij aan de vind- en vergelijkbaarheid.


==Toelichting op het model en de metagegevens==
Voor de machinale lees- en interpreteerbaarheid zijn eveneens metadata opgenomen bij Distributietype. In de Bijlage Waardelijsten is onder andere een lijst opgenomen voor het aanbevolen [[Gegevensbeschrijvingen/Metagegevensmodel#Formaat (Distribution)|distributieformaat]]. Voor toepassing in Linked Open Data is distributie van de afzonderlijke gegevensbeschrijvingen van belang. RDF is hier het gebruikelijke formaat.
De basis van het model wordt gevormd door de gebruikelijke elementen in een gegevencatalogus: objecttype, relatietype en attribuuttype. In de VN-standaard CCTS worden deze met 'Core Components' aangeduid. In navolging van het Relationeel Model zijn relaties (associaties) als attribuuttypen gemodelleerd (foreign keys)<ref name="ftn5">Over de modellering van relaties volgens het UML klassenmodel bestaat geen consensus binnen de kring van basisregistraties</ref>. Om meervoudige voorkomens van gelijknamige metagegevens bij deze typen te voorkomen zijn deze genormaliseerd naar de supertypen 'Gegevenstype', 'Concept' en 'Term'. Het supertype 'Gegevenstype' betreft de metagegevens over de registratie van object-, gegevensgroep-, attribuut-, en gebeurtenistypen.


Het supertype 'Concept' betreft de semantiek van deze gegevens en domeinwaarden. Door dit supertype apart op te nemen is de mogelijkheid geboden om ook concepten op te nemen waarvan geen instanties worden geregistreerd. Dit opent de mogelijkheid van semantische modellering van overeenkomsten en verschillen van concepten, door middel van gebruikelijke relaties als specialisatie van, onderdeel van, instantie van en relatie (associatie). Hier zijn ook een definitie, toelichting en een link naar de regelgeving ondergebracht. Voor de aanduiding van een concept is een aparte 'Term' opgenomen, hetgeen de mogelijkheid geeft om naast de catalogusterm ook synoniemen op te nemen. Homoniemen dienen te worden voorkomen door toevoeging van een onderscheidend achtervoegsel in de term, dat het bedoelde concept kenmerkt.
{{referenties}}
 
{{HoofdstukVoet|Volgende=Volgende pagina: [[Gegevensbeschrijvingen/Metagegevensmodel|Metagegevensmodel⇢]]}}
Vervolgens is 'Gebeurtenis' toegevoegd en via 'Mutatie' gekoppeld aan 'Gegevenstype'. De koppeling kan betrekking hebben op een object, gegevensgroep of (relatie)attribuut. Gebeurtenis is zelf een subtype van concept, met alle attributen en relaties van dien. De verschillende betrokkenen bij een gebeurtenis zijn via een n:m-relatie 'Rol' gemodelleerd conform het zakenmodel van gemeenten. Tenslotte zijn 'Distributie' en 'Registratie' toegevoegd conform ADMS.
[[Categorie:semantiek]]
 
==Referentiemodel structuur metagegevens==
[[Image:Referentiemodel_catalogus_AP17.svg|thumb|Referentie metamodel gegevenscatalogus]]
 
==Bijlage waardelijsten==
===Conditietype===
* preconditie
* postconditie
* invariant
 
===Datatype===
* tekst (string)
* Id
* URI
* booleaans getal (boolean)
* duur (duration)
* datum (date)
* datum_tijd (dateTime)
* jaar (gYear)
* jaar_maand (gYearMonth)
* geheel getal (integer)
* natuurlijk getal (nonNegativeInteger)
* reëel getal (decimal)
* reëel getal (float)
* reëel getal (double)
* punt (GM_Point)
* lijn (GM_Curve)
* vlak (GM_Surface)
* multivlak (GM_Multisurface)
* volume (GM_Solid)
* getal hexadecimaal (hexBinary)
* getal 64 binair (base64Binary)
* keuze (choice)
* samengesteld (union)
 
===Datatype (samengesteld)===
* <nowiki>(tekst|ID|URI) (<lengte>|<minimale lengte>..<maximale lengte) <codering>? <beperking>? <taal>?</nowiki>
* <nowiki>getal <lengte>.<decimalen>? <eenheid>?</nowiki>
* <nowiki>(hex|binair 64) (<lengte>|<minimale lengte>..<maximale lengte) <eenheid>?</nowiki>
* (datum|datumTijd|jaar|jaarMaand|duur|float|double|punt|lijn|vlak|multivlak|volume)
* booleaans getal
* <nowiki>lijst (list) (<lengte>|<minimale lengte>..<maximale lengte) <formaat></nowiki>
* <nowiki>samengesteld (union) <datatype> …</nowiki>
* <nowiki>keuze (choice) <datatype> …</nowiki>
 
===Formaat (Distribution)===
* RDF/XML
* XSD
* HTML
* PDF
* ZIP
 
===Lengte===
* <nowiki>(<lengte>|<minimale lengte>..<maximale lengte)</nowiki>
* <nowiki><lengte>.<decimalen>?</nowiki>
 
*<nowiki>Minimum: (<minInclusiv>waarde|<minExclusiv>waarde)</nowiki>
 
*<nowiki>Maximum: (<maxInclusiv>waarde|<maxExclusiv>waarde)</nowiki>
 
===Licentietype===
* openbaar: zonder restricties
* openbaar: met restricties
* autorisatie: doelbinding wettelijk
* autorisatie: doelbinding autorisatiebesluit of certificaat
 
===Mutatietype===
* opvoeren
* wijzigen
* beëindigen
 
===Rol===
* actor
* agent
* bronhouder
* registratiehouder
* overige (Zie zaaktype)
----
<references/>
[[Categorie:Instrumenten]]

Huidige versie van 1 feb 2023 om 16:24



Het Afgeleide Principe 17 schrijft voor: De aan de dienst gerelateerde informatieobjecten zijn, uniek geïdentificeerd, in een informatiemodel beschreven.

Doel van deze handreiking[bewerken]

Deze handreiking heeft tot doel om beheerders van (catalogi van) informatieobjecten op weg te helpen bij het maken van een beschrijving daarvan, die voldoet aan de relevante standaarden en geschikt is voor zowel intern gebruik als voor interoperabiliteit met andere organisaties. Dat laatste doel wordt bereikt door meer standaardisatie in de metagegevens waarmee de informatieobjecten worden beschreven. Daartoe wordt de weg gewezen naar de relevante standaarden en is een aanvullende lijst metagegevens met een gegevensmodel opgesteld, voor het geval er geen model voor het eigen domein beschikbaar is of als dat te beperkt is. De beschrijving dient daarnaast te voldoen aan de kwaliteitseisen die zijn genoemd in het afgeleide principe AP17: 'Beschrijving informatieobjecten'.

Beschrijvingen van informatieobjecten bestaan voor uitlopende doelen en in velerlei vormen. Afhankelijk van de aard en het doel van de beschrijving zijn bepaalde metagegevens meer of minder relevant. In de meest uitgebreide vorm beschrijft deze handreiking zowel de semantiek, als de syntax en de registratiegegevens.

Reikwijdte van het begrip informatieobject en de relevante standaarden[bewerken]

Het begrip informatieobject in AP17 is enerzijds ontleend aan de standaarden voor ongestructureerde gegevens als NEN-ISO 23081 (metagegevens voor archiefbescheiden), Richtlijn metagegevens Overheid (RMO) en Overheids Web Metadata Standaard (OWMS). Deze laatste standaard definieert een informatieobject als “Een identificeerbaar, mogelijk samengesteld geheel van gegevens.”

In AP17 worden onder het begrip informatieobject echter ook de afzonderlijke gestructureerde gegevens verstaan. Voor beide soorten informatieobjecten bestaan reeds specifieke standaarden. Aangezien gegevenscatalogi, thesauri, taxonomieën of conceptuele modellen zowel documenten als beschrijvingen van gestructureerde gegevens zijn, is er sprake van een zekere mate van overlap van standaarden.

Voor het onderdeel ongestructureerde informatie zijn reeds handreikingen beschikbaar, inclusief de daarbij te gebruiken metagegevens en hun gegevensstructuur. Daarom wordt hier kortheidshalve verwezen naar de desbetreffende standaarden voor ongestructureerde informatie.

Standaarden voor gestructureerde gegevens (gegevensbeschrijvingen) verschillen sterk per domein. Het Metamodel voor Informatiemodellering (MIM) biedt standaard metadata-elementen voor het beschrijven van informatiemodellen. Het wordt breed gebruikt door allerlei overheidsorganisaties .

Er is eerder een handreiking voor deze categorie opgesteld met een aanbevolen lijst met referentienamen en -definities (PDF, 63 kB) met gegevensstructuur, beschreven in een metagegevensmodel. De lijst vormt echter zelf geen standaard en vervangt de bestaande standaarden ook niet. De lijst dient als checklist voor mogelijke aanvullingen op de te kiezen standaard om tot een meer uniforme beschrijving te komen over meerdere domeinen heen. Omdat namen en definities in de domeinspecifieke standaarden onderling verschillen, zijn ze aangeduid met referentienamen en -definities, die bij een keuze voor een specifieke standaard daardoor vervangen dienen te worden.

Verantwoording handreiking gegevensbeschrijving[bewerken]

De handreiking is opgesteld door experts die hier veel ervaring mee hebben opgedaan bij verschillende (overheids)organisaties en is gericht op een praktische toepassing voor diverse situaties. De handreiking heeft evenwel niet de pretentie voor iedere situatie de relevante metagegevens te kunnen voorschrijven.

Uitgangspunt vormde een inventarisatie van gebruikelijke metagegevens in catalogi van Nederlandse registraties en de publicatie 'Catalogus Authentieke Registratie' van het programma Stroomlijning basisgegevens. Deze publicatie lag ook ten grondslag aan de Stelselcatalogus 1.0 in 2009. Sindsdien is de beschrijving in diverse werkgroepen met de basisregistraties doorontwikkeld. Deze lijst vormt een vocabulaire voor de beschrijving van veelgebruikte metagegevens en dient zowel als checklist voor mogelijk relevante metagegevens als ter uniformering daarvan over verschillende standaarden heen.

Hiermee wordt de in de praktijk opgedane ervaring beschikbaar gesteld voor hergebruik en doorontwikkeling. Dit proces is nog in volle gang. Het is een eerste inventarisatie van veelvoorkomende metagegevens, zonder pretentie van volledigheid: “Work in progress”. Uit de zo ontstane longlist is een set belangrijkste metagegevens geselecteerd op basis van de mate van voorkomen bij Nederlandse registraties en inschatting van het belang. Deze zijn vetgedrukt weergegeven in de lijst met referentienamen en -definities (PDF, 63 kB).

Vervolgens zijn de metagegevens gestructureerd in Metagegevensmodel.

Status[bewerken]

De handreiking is niet bindend, maar melding van de reden van eventuele afwijking wordt ten zeerste gewaardeerd ter verdere verbetering en toelichting. In die zin is het 'pas toe of leg uit' principe hier wel van toepassing.

Stappen bij het maken van een gegevensbeschrijving[bewerken]

  1. Kies een standaard, die het meeste aansluit bij de sector waarin de organisatie actief is. Ga daarvoor te rade bij andere organisaties in de sector en raadpleeg het overzicht met standaarden.
  2. Schets een eerste lijst metagegevens op basis van de eigen behoefte van de organisatie, de afnemers en de gekozen standaard.
  3. Neem de naamgeving en definities van de standaard over, voor zover mogelijk en wenselijk in de sector. [1]
  4. Vul de lijst aan met de relevant geachte metagegevens uit de lijst met referentienamen en -definities (PDF, 63 kB).
  5. Bepaal de wenselijke vorm van de catalogus gelet op het gebruiksdoel: als tekstdocument, digitaal raadpleegbare catalogus of wiki. Let hierbij zowel op de behoefte in de ontwikkelfase van toepassingen (domeinmodellen, functionele ontwerpen, berichtdefinities) als tijdens de gebruiksfase, zowel binnen de sector als voor hergebruik van gegevens in andere sectoren en catalogi (zoals de Stelselcatalogus) en andere RDF-toepassingen.
  6. Bepaal de metagegevensstructuur. Sluit zo mogelijk aan op het metagegevensmodel.
  7. Realiseer de gegevensbeschrijving in een adequate tool en voer de metagegevens in. Neem ook relevante begrippen uit wetten op en modelleer zo nodig overeenkomsten en verschillen zoals beschreven in het metagegevensmodel
  8. Publiceer de gegevensbeschrijving in de gekozen vorm. Zie verder onder Publicatie.

Impact[bewerken]

De impact van deze handreiking op de bestaande beschrijvingen van informatieobjecten kan alleen per geval worden vastgesteld. Als in een sector reeds aan een geschikte standaard wordt voldaan, kan de impact beperkt blijven. In geval van vele verschillende en afwijkende beschrijvingen per deeldomein kan een volledig nieuwe beschrijving voor de sector benodigd zijn.

Publicatie[bewerken]

Twee implicaties van het afgeleide principe 17: “Systematische beschrijving informatieobjecten” hebben betrekking op de publicatie:

  1. De beschrijving is op internet gepubliceerd en voor mensen leesbaar (toegankelijk)
  2. De beschrijving is bij voorkeur ook machinaal lees- en interpreteerbaar (toegankelijk)

In het Metagegevensmodel zijn de metagegevens opgenomen die hierbij van belang zijn in de objecttypen: Registratiecatalogustype, Distributietype, Betrokkenetype en Contactgegevenstype. Voor een raadpleger is het belangrijk dat metagegevens als beschrijving van de inhoud van de catalogus, geografische dekking, laatste wijziging, vindplaatsen, contactgegevens en dergelijke actueel en volledig zijn om te kunnen bepalen of de inhoud voor hem of haar relevant is.

De vindbaarheid kan verder vergroot worden door de gegevensbeschrijving aan te melden voor opname in de NORA-inventarisatie van gegevenswoordenboeken in de publieke sector. Daarnaast draagt opname van de gegevenselementen in de Stelselcatalogus bij aan de vind- en vergelijkbaarheid.

Voor de machinale lees- en interpreteerbaarheid zijn eveneens metadata opgenomen bij Distributietype. In de Bijlage Waardelijsten is onder andere een lijst opgenomen voor het aanbevolen distributieformaat. Voor toepassing in Linked Open Data is distributie van de afzonderlijke gegevensbeschrijvingen van belang. RDF is hier het gebruikelijke formaat.


Referenties[bewerken]

  1. Zie voor een 1:1 koppeling met standaarden: werkbestand referentie metagegevens.ods (ODF-spreadsheet, 45 kB)
Volgende pagina: Metagegevensmodel⇢