Gegevensbeschrijvingen/Handreiking: verschil tussen versies

Uit NORA Online
< Semantiek
Naar navigatie springen Naar zoeken springen
Geen bewerkingssamenvatting
Geen bewerkingssamenvatting
Regel 1: Regel 1:
{{concept|}}
{{concept|}}
==Doel van deze handreiking==
Beschrijvingen van informatieobjecten bestaan voor uitlopende doelen en in velerlei vormen. Afhankelijk van de aard en het doel van de beschrijving zijn bepaalde metagegevens meer of minder relevant. De metagegevens zijn daarom gegroepeerd in aandachtsgebieden die al dan niet relevant kunnen zijn in een specifieke situatie. Vaker gebruikte metagegevens zijn vet afgedrukt.
Het NORA Afgeleide Principe [[Informatie-objecten_systematisch_beschreven_(concept)|AP17]] stelt: “De aan de dienst gerelateerde informatieobjecten zijn systematisch beschreven en op passende wijze gemodelleerd.” Het is afgeleid van de basisprincipes [[vindbaar]], [[toegankelijk]], [[standaard (Basisprincipe)|standaard]] en [[transparant]]. Om te komen tot een uniforme invulling van het Afgeleide Principe biedt deze handreiking een vocabulaire in de vorm van een overzicht van veelgebruikte metagegevens en relevante standaarden.
In verschillende standaarden worden vergelijkbare metagegevenstypen aangeduid met voor de standaard specifieke benamingen en definities. In deze handreiking zijn vergelijkbare metagegevenstypen daarom aangeduid met referentienamen en -definities.  
 
Beschrijvingen van informatieobjecten bestaan voor uiteenlopende doelen en in velerlei vormen. Afhankelijk van de aard en het doel van de beschrijving zijn bepaalde metagegevens meer of minder relevant. Deze aanbeveling heeft daarom niet de pretentie voor ieder voorkomend geval de juiste metagegevens te kunnen voorschrijven. De publicatie van deze handreiking heeft evenwel mede tot doel om de in de praktijk opgedane ervaringen met de toepassing ervan te bundelen ter verdere verbetering. In die zin is het 'pas toe of leg uit'-principe hier wel van toepassing, ook al zal de uitleg in veel gevallen luiden: 'Voor dit doel niet relevant'. De metagegevens zijn daarom gegroepeerd in aandachtsgebieden die al dan niet relevant kunnen zijn in een specifieke situatie. Vaker gebruikte metagegevens zijn vet afgedrukt.
 
==Status==
Deze handreiking heeft als status: “Work in progress”. Het is een eerste inventarisatie van veelvoorkomende metagegevens in grotere gegevensregistraties in Nederland, zonder pretentie van volledigheid. Deze handreiking is niet bindend, maar melding van de reden van afwijking wordt ten zeerste gewaardeerd ter verdere verbetering en toelichting.
 
Omdat metagegevens onder verschillende benamingen en met verschillende definities voorkomen zijn ze aangeduid met referentienamen en -definities, indien het naar de geest om een overeenkomstig metagegeven handelt. Bij de metagegevens zijn verwijzingen opgenomen naar mogelijk van toepassing zijnde standaarden. Aanbevolen wordt om aan te sluiten bij de voor het beoogde doel meest relevante standaard(en).
 
==Reikwijdte van het begrip informatieobject en de relevante standaarden==
Het begrip informatieobject is ontleend aan de standaarden voor ongestructureerde gegevens als NEN-ISO 23081 (metagegevens voor archiefbescheiden), Richtlijn metagegevens Overheid (RMO) en Overheids Web Metadata Standaard (OWMS). Deze laatste standaard definieert een informatieobject als “Een identificeerbaar, mogelijk samengesteld geheel van gegevens.”
 
In AP17 worden onder het begrip informatieobject ook alle gestructureerde gegevens en hun beschrijvingen verstaan. De daarvoor bestaande specifieke standaarden zijn vermeld in de tabel. Aangezien gegevenscatalogi, thesauri, taxonomieën of conceptuele modellen (Semantic Assets in termen van ADNS) ook documenten zijn is er sprake van een zekere mate van overlap van standaarden. Hieronder wordt het toepassingsgebied van de relevante standaarden kort samengevat aan de hand van de in Nederland geldende toepassingsrichtlijnen, voor zover die bestaan.
 
===Overheid Web Metadata Standaard/Dublin Core===
De [[OWMS (Overheid.nl Web Metadata Standaard)]] is een semantische definitie van de metadata-eigenschappen waarmee ongestructureerde informatie van de Nederlandse overheid op een gestructureerde manier beschreven kan worden. Het betreft informatie van organen van een rechtspersoon, die ingesteld zijn volgens het publiekrecht, dan wel een ander persoon of college met enig openbaar gezag bekleed.
 
Het domein van de OWMS-eigenschappen (DCAM: domain) is 'informatieobject', ontsloten via internet. Dit is een beperking ten opzichte van het domein van de overgenomen [[Dublin_Core_metadata_element_set|Dublin Core]] properties: 'resource'. Het betreft bijvoorbeeld een overheidspublicatie, webpagina of een databank, dus geen metagegevens voor de beschrijving van gestructureerde informatie in de vorm van gegevens. In deze handreiking heeft OWMS vooral betrekking op het registratiecatalogustype.
 
===Richtlijn Metagegevens Overheidsinformatie/NEN-ISO 23081===
Artikel 19 van de Archiefregeling (2009) schrijft voor dat zorgdragers<ref name="ftn1">Degene die bij of krachtens de wet belast is met de zorg voor de archiefbescheiden (Archiefwet 1995) </ref> een metagegevensschema opstellen aan de hand van [[NEN-ISO 23081]]. De [[Richtlijn Metagegevens Overheidsinformatie]] (RMO) is opgesteld voor gebruik binnen de Nederlandse overheid en maakt deel uit van NORA. De RMO geldt voor informatieobjecten die bij de uitvoering van overheidstaken worden gebruikt en gemaakt: documenten, databases, afbeeldingen, mp3-bestanden, websites, GIS, CAD-tekeningen en beperkt zich dus niet tot webpublicaties zoals OWMS. Wel is het toepassingsgebied beperkt tot archiefbescheiden.
 
De RMO beschrijft welke entiteiten kunnen worden onderscheiden (Record<ref name="ftn2">Een record wordt, in aansluiting op de Archiefwet 1995, NEN 2082 en de Baseline Informatiehuishouding Rijksoverheid, gedefinieerd als “Informatieobject, ongeacht zijn vorm, met de bijbehorende metagegevens ontvangen of opgemaakt door een natuurlijke en/of rechtspersoon bij de uitvoering van taken en bewaard om te voldoen aan wettelijke en/of administratieve en/of maatschappelijke behoeften”.</ref>, Actor, (Bedrijfs-) Activiteit, Mandaat en Relatie) en hun metagegevens en is daarmee evenals OWMS niet bedoeld voor de beschrijving van gestructureerde gegevens. De RMO wordt niet rechtstreeks toegepast, maar dient een nadere vertaling te krijgen in een Toepassingsprofiel. Voor het Rijk is het Toepassingsprofiel Metagegevens Rijksoverheid ontwikkeld en vastgesteld. Hiermee wordt tevens voldaan aan de Baseline Informatiehuishouding Rijksoverheid.
 
===ADMS en DCAT===
Het Asset Descripion Metadata Schema (EU en W3C), ofwel [[ADMS_(Asset_Description_Metadata_Schema)|ADMS]], is een toepassingsprofiel van [[DCAT_(Data_Catalog_Vocabulary)|DCAT]], dat gebruikt kan worden om ''semantic assets'' (grofweg: informatieobjecten in een catalogus of register) te beschrijven in de vorm van in hoge mate herbruikbare metadata (bv. xml-schema’s, generieke datamodellen) en referentiedata (bv. code lists, taxonomies, dictionaries, vocabularies) voor eGovernment systeemontwikkeling. Er zijn geen metadata voor het beschrijven van afzonderlijke gestructureerde gegevens. ADMS focust op de informatieobjecten in die afzonderlijke catalogi. DCAT focust meer op het vinden van catalogi.
 
===Geo standaarden ISO 19103, 19109, 19110 en 19115===
'''[[ISO/TS_19103|ISO 19103]] (Geographic Information – Conceptual schema language)''' biedt een formele conceptuele taal voor het eenduidig beschrijven van uitwisseling van geo-informatie en interoperabele services. De standaard identificeert in UML in combinatie met OCL object-klassen (features), attributen, basis datatypen, associaties, operaties, stereotypen, constraints en documentatie.
 
'''[[ISO 19109]]: Geographic information - Rules for application schema.''' Het metamodel definieert de regels voor het opstellen en documenteren van applicatieschema’s inclusief de principes voor het definiëren van objecttypen. De formele beschrijving bevat de inhoud en structuur van gegevens die in een of meerdere toepassingen worden gebruikt om daaruit eenduidig informatie te kunnen halen. Het Algemene ObjecttypeModel (General Feature Model) beschrijft aan de hand van modelelementen (klassen, attributen, associaties, specialisaties e.d.) die een applicatieschema kan hebben de regels voor hun eigenschappen, gedrag en naamgeving. De modelelementen worden beschreven in metaklassen (metaclass). Zo heeft de metaklasse Objecttype (optioneel of verplicht) een naam, een definitie, abstractJaNee, een overervingsrelatie, associaties, constraints. De scope van de standaard omvat o.a.:
* conceptueel modelleren van objecttypen en hun eigenschappen binnen een toepassingsdomein;
* gebruik van UML voor het maken van applicatieschema’s
* vertaling van concepten in het conceptuele model naar datatypen in een applicatieschema.
 
'''ISO 19110: Geographic information — Methodology for feature cataloguing.''' Methodologie voor het opstellen van een objectcatalogus. Die definieert de objecttypen, hun attributen en associaties voor de omzetting van data naar bruikbare informatie. De standaard bevat een normatieve layout voor een objectcatalogus waarin de beschrijvende eigenschappen per informatie-element op het niveau van ´type´ worden gedefinieerd.
 
'''[[ISO 19115]]: Geographic information — Metadata.''' Definieert het schema voor het beschrijven van geografische informatie en (netwerk) services. Het bevat informatie over het identificeren, de geografische extent, de kwaliteit, het ruimtelijke en temporele schema, geografisch referentiestelsel en de verspreiding van geografische data. De metadata zijn toepasbaar op datasets, dataset-series, en individuele geografische objecten en eigenschappen daarvan (attributen, relaties e.d.). Hoewel bedoeld voor digitale data kan het ook toegepast worden op niet digitale geografische data en niet geografische data.
 
===Core Components Technical Specification===
[[CCTS_(Core_Component_Technical_Specification)]] (CCTS, 2001 Verenigde Naties) definieert een metamodel en regels voor het beschrijven van structuur en inhoud van conceptuele en logische gegevens- en uitwisselingsmodellen in UML, gestructureerde informatie dus. Core Components zijn gegevenstypen als objecttypen (Aggregate Core Component) attribuuttypen (Basic Core Component) en relatietypen (Association Core Component). CCTS verwijst naar [[ISO/IEC 11179]] (2003), maar is een zelfstandige standaard.
 
==Verantwoording opname metagegevens gestructureerde informatie==
Uitgangspunt voor de aanbeveling vormde een inventarisatie van gebruikelijke metagegevens in catalogi van Nederlandse registraties. Hieruit kwam een grote diversiteit naar voren, zowel van soorten catalogi, als van gebruikte metagegevens voor de beschrijving daarvan. De publicatie 'Catalogus Authentieke Registratie' in 2002 door het programma Stroomlijning basisgegevens is door sommige basisregistraties gevolgd, waarmee een beperkte mate van standaardisatie was ontstaan. Deze publicatie lag ook ten grondslag aan de Stelselcatalogus 1.0 in 2009. Sindsdien is de beschrijving met metagegevens in diverse werkgroepen met de basisregistraties verder ontwikkeld. De resultaten daarvan zijn gebruikt bij het opstellen van de lijst metagegevens voor AP17.
 
Voor de modellering is aangesloten bij het 'Whitepaper metamodel'<ref name="ftn3">Whitepaper metamodel 2013-01-14, A. Loeffen, R. Onink, A. Droogh, </ref> van de werkgroep 'Best Practices' voor zover daarover ruime overeenstemming bestaat. Daaraan is op verzoek van betrokken organisaties een modellering van de wijzigingen van gegevens toegevoegd op basis van het 'Whitepaper Gebeurtenissen'<ref name="ftn4">Whitepaper Gebeurtenissen V1.0 final, Rob Onink , 27-05-2013</ref> van R. Onink ea. Deze modellering is beperkt gehouden tot het gegevensdeel om overlap met procesmodellen en zaaktypecatalogi te beperken.
 
 
Uit de zo ontstane longlist is een set belangrijkste metagegevens geselecteerd op basis van de mate van voorkomen bij Nederlandse registraties en inschatting van het belang. Deze zijn vetgedrukt weergegeven in de bijlage Referentienamen, definities en standaarden.ods.
 
==Toelichting op het model en de metagegevens==
De basis van het model wordt gevormd door de gebruikelijke elementen in een gegevencatalogus: objecttype, relatietype en attribuuttype. In de VN-standaard CCTS worden deze met 'Core Components' aangeduid. In navolging van het Relationeel Model zijn relaties (associaties) als attribuuttypen gemodelleerd (foreign keys)<ref name="ftn5">Over de modellering van relaties volgens het UML klassenmodel bestaat geen consensus binnen de kring van basisregistraties</ref>. Om meervoudige voorkomens van gelijknamige metagegevens bij deze typen te voorkomen zijn deze genormaliseerd naar de supertypen 'Gegevenstype', 'Concept' en 'Term'. Het supertype 'Gegevenstype' betreft de metagegevens over de registratie van object-, gegevensgroep-, attribuut-, en gebeurtenistypen.
 
Het supertype 'Concept' betreft de semantiek van deze gegevens en domeinwaarden. Door dit supertype apart op te nemen is de mogelijkheid geboden om ook concepten op te nemen waarvan geen instanties worden geregistreerd. Dit opent de mogelijkheid van semantische modellering van overeenkomsten en verschillen van concepten, door middel van gebruikelijke relaties als specialisatie van, onderdeel van, instantie van en relatie (associatie). Hier zijn ook een definitie, toelichting en een link naar de regelgeving ondergebracht. Voor de aanduiding van een concept is een aparte 'Term' opgenomen, hetgeen de mogelijkheid geeft om naast de catalogusterm ook synoniemen op te nemen. Homoniemen dienen te worden voorkomen door toevoeging van een onderscheidend achtervoegsel in de term, dat het bedoelde concept kenmerkt.
 
Vervolgens is 'Gebeurtenis' toegevoegd en via 'Mutatie' gekoppeld aan 'Gegevenstype'. De koppeling kan betrekking hebben op een object, gegevensgroep of (relatie)attribuut. Gebeurtenis is zelf een subtype van concept, met alle attributen en relaties van dien. De verschillende betrokkenen bij een gebeurtenis zijn via een n:m-relatie 'Rol' gemodelleerd conform het zakenmodel van gemeenten. Tenslotte zijn 'Distributie' en 'Registratie' toegevoegd conform ADMS.
 
==Referentiemodel structuur metagegevens==
==Referentiemodel structuur metagegevens==
[[Image:Referentiemodel_catalogus_AP17.svg|thumb|Referentie metamodel gegevenscatalogus]]
[[Image:Referentiemodel_catalogus_AP17.svg|thumb|700px|none|Referentie metamodel gegevenscatalogus]]<br clear = all>
Zie ook de {{bestand met info|Referentienamen_definities_en_standaarden.ods|referentielijst bij het metamodel}}, met definities van metagegevenstypen en verwijzingen naar relevante standaarden. Aanbevolen wordt om aan te sluiten bij de voor het beoogde doel meest relevante standaard(en).


==Bijlage waardelijsten==
==Bijlage waardelijsten==
Regel 134: Regel 79:
* registratiehouder
* registratiehouder
* overige (Zie zaaktype)
* overige (Zie zaaktype)
----
<references/>
[[Categorie:Instrumenten]]

Versie van 3 mrt 2014 18:23

Deze pagina is een concept. Reacties via nora@ictu.nl of tekstvoorstellen in de wiki zijn welkom.

Beschrijvingen van informatieobjecten bestaan voor uitlopende doelen en in velerlei vormen. Afhankelijk van de aard en het doel van de beschrijving zijn bepaalde metagegevens meer of minder relevant. De metagegevens zijn daarom gegroepeerd in aandachtsgebieden die al dan niet relevant kunnen zijn in een specifieke situatie. Vaker gebruikte metagegevens zijn vet afgedrukt. In verschillende standaarden worden vergelijkbare metagegevenstypen aangeduid met voor de standaard specifieke benamingen en definities. In deze handreiking zijn vergelijkbare metagegevenstypen daarom aangeduid met referentienamen en -definities.

Referentiemodel structuur metagegevens[bewerken]

Referentie metamodel gegevenscatalogus


Zie ook de referentielijst bij het metamodel (ODF-spreadsheet, 25 kB), met definities van metagegevenstypen en verwijzingen naar relevante standaarden. Aanbevolen wordt om aan te sluiten bij de voor het beoogde doel meest relevante standaard(en).

Bijlage waardelijsten[bewerken]

Conditietype[bewerken]

  • preconditie
  • postconditie
  • invariant

Datatype[bewerken]

  • tekst (string)
  • Id
  • URI
  • booleaans getal (boolean)
  • duur (duration)
  • datum (date)
  • datum_tijd (dateTime)
  • jaar (gYear)
  • jaar_maand (gYearMonth)
  • geheel getal (integer)
  • natuurlijk getal (nonNegativeInteger)
  • reëel getal (decimal)
  • reëel getal (float)
  • reëel getal (double)
  • punt (GM_Point)
  • lijn (GM_Curve)
  • vlak (GM_Surface)
  • multivlak (GM_Multisurface)
  • volume (GM_Solid)
  • getal hexadecimaal (hexBinary)
  • getal 64 binair (base64Binary)
  • keuze (choice)
  • samengesteld (union)

Datatype (samengesteld)[bewerken]

  • (tekst|ID|URI) (<lengte>|<minimale lengte>..<maximale lengte) <codering>? <beperking>? <taal>?
  • getal <lengte>.<decimalen>? <eenheid>?
  • (hex|binair 64) (<lengte>|<minimale lengte>..<maximale lengte) <eenheid>?
  • (datum|datumTijd|jaar|jaarMaand|duur|float|double|punt|lijn|vlak|multivlak|volume)
  • booleaans getal
  • lijst (list) (<lengte>|<minimale lengte>..<maximale lengte) <formaat>
  • samengesteld (union) <datatype> …
  • keuze (choice) <datatype> …

Formaat (Distribution)[bewerken]

  • RDF/XML
  • XSD
  • HTML
  • PDF
  • ZIP

Lengte[bewerken]

  • (<lengte>|<minimale lengte>..<maximale lengte)
  • <lengte>.<decimalen>?
  • Minimum: (<minInclusiv>waarde|<minExclusiv>waarde)
  • Maximum: (<maxInclusiv>waarde|<maxExclusiv>waarde)

Licentietype[bewerken]

  • openbaar: zonder restricties
  • openbaar: met restricties
  • autorisatie: doelbinding wettelijk
  • autorisatie: doelbinding autorisatiebesluit of certificaat

Mutatietype[bewerken]

  • opvoeren
  • wijzigen
  • beëindigen

Rol[bewerken]

  • actor
  • agent
  • bronhouder
  • registratiehouder
  • overige (Zie zaaktype)