Gegevensbeschrijvingen/Handreiking: verschil tussen versies

Uit NORA Online
< Semantiek
Naar navigatie springen Naar zoeken springen
Geen bewerkingssamenvatting
Geen bewerkingssamenvatting
Regel 329: Regel 329:
==Referenties==
==Referenties==
<references/>
<references/>
* [[:Media:Handreiking metagegevens en structuur gegevenscatalogi en conceptuele modellen.pdf|Handreiking metagegevens en structuur gegevenscatalogi en conceptuele modellen als pdf (393 kB)]]
<ol start="4">
<li>[[:Media:Handreiking metagegevens en structuur gegevenscatalogi en conceptuele modellen.pdf|Handreiking metagegevens en structuur gegevenscatalogi en conceptuele modellen als pdf (393 kB)]]
</ol>

Versie van 11 feb 2014 16:03

Handreiking metagegevens en structuur gegevenscatalogi en conceptuele modellen[bewerken]

Aanbevolen wordt de onderstaande set belangrijkste metagegevens op te nemen in gegevenswoorden-boeken en conceptuele modellen. Zie voor de volledige lijst metagegevens het metamodel.


Naam Alternatieve namen Standaarden
Begrip (Concept + term) Core Component; concept CCTS; ISO 11179
Id. Unique Identifier; Identificatiekenmerk; ID; URI; identifier CCTS; RMO; ADMS; ISO19103; ISO 11179
Naam Object Class term; Naam; name; specialisation; designation CCTS; RMO; ADMS; ISO19109; ISO 11179
Specialisatie van Relatie; relationship RMO; ISO 11179
Gerelateerd aan (associatie) ASCC; Relatie; association; relationship CCTS; RMO; ISO19103/109; ISO 11179
Definitie Definition; description; definition CCTS; ADMS; ISO 11179
Regelgeving (verwijzing naar) (~Origin of definition); Relatie (extern) CCTS; RMO
Autoriteit Actor RMO
Gegevenstype Core Component, data element concept CCTS; ISO 11179
Naam registratie Name repository ADMS
Registratiehouder Actor; publisher; ADMS
Bronhouder registration authority ISO 11179
Indicatie authentiek
Aanduiding in onderzoek
Brondoc.-/zaak-/Gebeurtenistype
Aanduiding datumTijd begin geldig
Aanduiding datumTijd eind geldig
Gegevensregel Usage Rule; constraint CCTS; ISO19109
Versieaanduiding Version Id.; version CCTS; ADMS
Versiedatum date of last modification ADMS
Objecttype Aggregate Core Component; class CCTS; ISO 11179
Aanduiding Id object Unique Identifier, Idenitificatiekenmerk CCTS; RMO
Populatie population CCTS
Kwaliteit objecttype Quality; Integriteit CCTS; RMO
(Relatie-)Attribuuttype Association/Basic Core Component; property CCTS; ISO 11179
Onderdeel van Id. Aggregate Core Component CCTS
Kardinaliteit Min_ en max_cardinality; multiplicity; cardinality CCTS; ISO19103; ISO19109
Id. Waardenlijst of objecttype Id. Codelist CCTS
Enumeratie Id. Codelist; enumeration CCTS; ISO 19109
Formaat+lengte(.dec)|(min..max) datatype ISO19103
Kwaliteit attribuuttype quality CCTS
Norm/Standaard (+ versie) NORA AP17
Waardenlijst Codelist CCTS; ISO 19103
Id.: URI Unique Identifier , Identificatiekenmerk; ID CCTS; RMO; ADMS
Code code CCTS
Waarde literal_term CCTS
Begin geldig start_date CCTS
Eind geldig end_date CCTS
Distributie Distribution ADMS
Id.: URI Id.: URI; Access URL ADMS
Beschrijving Description; description ADMS
Formaat Format ADMS
Id. Concept Id. Asset ADMS


Toelichting[bewerken]

Reikwijdte van het begrip informatieobject en de relevante standaarden[bewerken]

Het begrip informatieobject is ontleend aan de standaarden voor ongestructureerde gegevens als NEN-ISO 23081 (metagegevens voor archiefbescheiden), Richtlijn metagegevens Overheid (RMO) en Overheids Web Metadata Standaard (OWMS). Deze laatste standaard definieert een informatieobject als “Een identificeerbaar, mogelijk samengesteld geheel van gegevens.“ Als voorbeelden worden genoemd: “Documenten, webpagina's, datasets.” De RMO noemt als toepassingsgebied: “... alle informatie die, in welke vorm dan ook, bij de uitvoering van overheidstaken wordt gebruikt en gemaakt: documenten, databases, afbeeldingen, mp3-bestanden, websites, GIS, CAD-tekeningen en informatie in elk denkbaar systeem waarmee informatie wordt ontvangen, uitgewisseld, bewerkt of beheerd”. De entiteiten in deze Richtlijn beperken zich evenwel tot “Record, Actor, (Bedrijfs-)Activiteit, Mandaat en Relatie. […] Een record wordt, in aansluiting op de Archiefwet 1995, NEN 2082 en de Baseline Informatiehuishouding Rijksoverheid, gedefinieerd als “Informatieobject, ongeacht zijn vorm, met de bijbehorende metagegevens ontvangen of opgemaakt door een natuurlijke en/of rechtspersoon bij de uitvoering van taken en bewaard om te voldoen aan wettelijke en/of administratieve en/of maatschappelijke behoeften”

In AP17 worden onder het begrip informatieobject ook alle gestructureerde gegevens en hun beschrijvingen verstaan. De daarvoor bestaande specifieke standaarden zijn vermeld in de tabel. De beschrijving daarvan valt binnen het begrip 'Semantic Asset', zoals dat wordt gehanteerd in ADMS. Aangezien gegevenscatalogi, thesauri, taxonomieën of conceptuele modellen ook documenten zijn is er sprake van een zekere mate van overlap van standaarden.

Naleving van standaarden voor geografische en ongestructureerde informatie[bewerken]

De standaarden voor ongestructureerde gegevens (NEN-ISO 23081-1, Richtlijn Metagegevens Overheids-informatie (RMO), Dublin Core en OWMS) zijn in de Nederlandse overheid breed geaccepteerd. In toenemende mate worden door overheden toepassingsprofielen opgesteld. Ook geografische standaarden ISO 19115, Inspire en NEN_3610 worden breed geaccepteerd en toegepast, dankzij de inspanningen van Geonovum. Hier wordt volstaan met de aanbeveling deze standaarden te blijven volgen.

Verantwoording aanbeveling gestructureerde gegevens[bewerken]

Uitgangspunt voor de aanbeveling vormde een inventarisatie van gebruikelijke metagegevens in catalogi van Nederlandse registraties. Hieruit kwam een grote diversiteit naar voren, zowel van soorten catalogi, als van gebruikte metagegevens voor de beschrijving daarvan. De publicatie 'Catalogus Authentieke Registratie' in 2002 door het programma Stroomlijning basisgegevens, is door sommige basisregistraties gevolgd, waarmee een beperkte mate van standaardisatie was ontstaan. Deze publicatie lag ook ten grondslag aan de Stelselcatalogus 1.0 in 2009. Sindsdien is de beschrijving met metagegevens in diverse werkgroepen met de basisregistraties verder door ontwikkeld. De resultaten daarvan zijn gebruikt bij het opstellen van de aanbeveling voor AP17.

Voor de modellering is aangesloten bij het 'Whitepaper metamodel'[1] van de werkgroep 'Best Practices' voorzover daarover ruime overeenstemming bestaat. Daaraan is op verzoek van betrokken organisaties een modellering van de wijzigingen van gegevens toegevoegd op basis van het 'Whitepaper Gebeurtenissen'[2] van R. Onink ea. Deze modellering is beperkt gehouden tot het gegevensdeel om overlap met procesmodellen en zaaktypecatalogi te beperken.

Vervolgens is aansluiting gezocht bij bestaande standaarden voor gestructureerde gegevens: Core Components Technical Specification (CCTS, 2001) van de Verenigde Naties, ISO-IEC 11179 (2003), Data Catalog Vocabulary (DCAT, W3C, 2012) en Asset Description Metadata Schema (ADMS, EU en W3C, 2012). Naast de Nederlandse benamingen zijn de benamingen daaruit toegevoegd indien het naar de geest een overeenkomstig metagegeven betrof.

Uit de zo ontstane longlist is een set belangrijkste metagegevens geselecteerd op basis van de mate van voorkomen bij Nederlandse registraties en inschatting van het belang. Zie voor de volledige lijst het referentiemodel metagegevens.

Toelichting op het model en de metagegevens[bewerken]

De basis van het model wordt gevormd door de gebruikelijke elementen in een gegevencatalogus: objecttype, relatietype en attribuuttype. In de VN-standaard CCTS worden deze met 'Core Components' aangeduid. In navolging van het Relationeel Model zijn relaties (associaties) als attribuuttypen gemodelleerd (foreign keys)[3]. Om meervoudige voorkomens van gelijknamige metagegevens bij deze typen te voorkomen zijn deze genormaliseerd naar de supertypen 'Gegevenstype' en 'Begrip' (Concept + term). Het supertype 'Gegevenstype' betreft de metagegevens over de registratie van object-, gegevensgroep-, attribuut- en gebeurtenistypen.

Het supertype 'Begrip' (Concept + term) betreft de semantiek van deze gegevens. Door dit supertype apart op te nemen is de mogelijkheid geboden om ook begrippen op te nemen waarvan geen instanties worden geregistreerd. Dit opent de mogelijkheid van semantische modellering van overeenkomsten en verschillen tussen de begrippen, door middel van gebruikelijke relaties als specialisatie van, onderdeel van, instantie van en relatie (associatie). Hier zijn ook een definitie, toelichting en een link naar de regelgeving ondergebracht. 'Begrip' is feitelijk onderverdeeld in 'Concept' en 'Term' hetgeen de mogelijkheid geeft om naast de voorkeursterm ook synoniemen op te nemen. Homoniemen dienen te worden voorkomen door toevoeging van een onderscheidend achtervoegsel dat het concept kenmerkt.

Vervolgens is 'Gebeurtenis' toegevoegd en via 'Administratieve handeling' gekoppeld aan 'Gegevenstype'. De koppeling kan betrekking hebben op een object, gegevensgroep of (relatie)attribuut. Gebeurtenis is zelf een subtype van begrip, met alle attributen en relaties van dien. De verschillende betrokkenen bij een gebeurtenis zijn via een n:m-relatie 'Rol' gemodelleerd conform het zakenmodel van gemeenten. Tenslotte zijn 'Distributie' en 'Registratie' toegevoegd conform ADMS.

Referentiemodel structuur metagegevens[bewerken]
Afbeelding 1: Referentie metamodel gegevenscatalogus



Bijlagen[bewerken]

Bijlage definities[bewerken]

Bijlage definities.png

Bijlage waardelijsten[bewerken]

Conditietype[bewerken]
  • preconditie
  • postconditie
  • invariant
Datatype[bewerken]
  • tekst (string)
  • Id
  • URI
  • booleaans getal (boolean)
  • duur (duration)
  • datum (date)
  • datum_tijd (dateTime)
  • jaar (gYear)
  • jaar_maand (gYearMonth)
  • geheel getal (integer)
  • natuurlijk getal (nonNegativeInteger)
  • reëel getal (decimal)
  • reëel getal (float)
  • reëel getal (double)
  • punt (GM_Point)
  • lijn (GM_Curve)
  • vlak (GM_Surface)
  • multivlak (GM_Multisurface)
  • volume (GM_Solid)
  • getal hexadecimaal (hexBinary)
  • getal 64 binair (base64Binary)
  • keuze (choice)
  • samengesteld (union)
Datatype (samengesteld)[bewerken]
  • (tekst|ID|URI) (<lengte>|<minimale lengte>..<maximale lengte) <codering>? <beperking>? <taal>?
  • getal <lengte>.<decimalen>? <eenheid>?
  • (hex|binair 64) (<lengte>|<minimale lengte>..<maximale lengte) <eenheid>?
  • (datum|datumTijd|jaar|jaarMaand|duur|float|double|punt|lijn|vlak|multivlak|volume)
  • booleaans getal
  • lijst (list) (<lengte>|<minimale lengte>..<maximale lengte) <formaat>
  • samengesteld (union) <datatype> …
  • keuze (choice) <datatype> …
Formaat (Distribution)[bewerken]
  • RDF/XML
  • XSD
  • HTML
  • PDF
  • ZIP
Lengte[bewerken]
  • (<lengte>|<minimale lengte>..<maximale lengte)
  • <lengte>.<decimalen>?

Minimum: (<minInclusiv>waarde|<minExclusiv>waarde)

Maximum: (<maxInclusiv>waarde|<maxExclusiv>waarde)

Licentietype[bewerken]
  • openbaar: zonder restricties
  • openbaar: met restricties
  • autorisatie: doelbinding wettelijk
  • autorisatie: doelbinding autorisatiebesluit of certificaat
Mutatietype[bewerken]
  • opvoeren
  • wijzigen
  • beëindigen
Rol[bewerken]
  • actor
  • agent
  • bronhouder
  • registratiehouder
  • overige (Zie zaaktype)

Referenties[bewerken]

  1. Whitepaper metamodel 2013-01-14, A. Loeffen, R. Onink, A. Droogh,
  2. Whitepaper Gebeurtenissen V1.0 final, Rob Onink , 27-05-2013
  3. Over de modellering van relaties volgens het UML klassenmodel bestaat geen consensus binnen de kring van basisregistraties
  1. Handreiking metagegevens en structuur gegevenscatalogi en conceptuele modellen als pdf (393 kB)