Gegevensbeschrijvingen/Handreiking: verschil tussen versies
Geen bewerkingssamenvatting |
Geen bewerkingssamenvatting |
||
Regel 329: | Regel 329: | ||
==Referenties== | ==Referenties== | ||
<references/> | <references/> | ||
<ol start="4"> | |||
<li>[[:Media:Handreiking metagegevens en structuur gegevenscatalogi en conceptuele modellen.pdf|Handreiking metagegevens en structuur gegevenscatalogi en conceptuele modellen als pdf (393 kB)]] | |||
</ol> |
Versie van 11 feb 2014 16:03
Handreiking metagegevens en structuur gegevenscatalogi en conceptuele modellen[bewerken]
Aanbevolen wordt de onderstaande set belangrijkste metagegevens op te nemen in gegevenswoorden-boeken en conceptuele modellen. Zie voor de volledige lijst metagegevens het metamodel.
Naam | Alternatieve namen | Standaarden |
---|---|---|
Begrip (Concept + term) | Core Component; concept | CCTS; ISO 11179 |
Id. | Unique Identifier; Identificatiekenmerk; ID; URI; identifier | CCTS; RMO; ADMS; ISO19103; ISO 11179 |
Naam | Object Class term; Naam; name; specialisation; designation | CCTS; RMO; ADMS; ISO19109; ISO 11179 |
Specialisatie van | Relatie; relationship | RMO; ISO 11179 |
Gerelateerd aan (associatie) | ASCC; Relatie; association; relationship | CCTS; RMO; ISO19103/109; ISO 11179 |
Definitie | Definition; description; definition | CCTS; ADMS; ISO 11179 |
Regelgeving (verwijzing naar) | (~Origin of definition); Relatie (extern) | CCTS; RMO |
Autoriteit | Actor | RMO |
Gegevenstype | Core Component, data element concept | CCTS; ISO 11179 |
Naam registratie | Name repository | ADMS |
Registratiehouder | Actor; publisher; | ADMS |
Bronhouder | registration authority | ISO 11179 |
Indicatie authentiek | ||
Aanduiding in onderzoek | ||
Brondoc.-/zaak-/Gebeurtenistype | ||
Aanduiding datumTijd begin geldig | ||
Aanduiding datumTijd eind geldig | ||
Gegevensregel | Usage Rule; constraint | CCTS; ISO19109 |
Versieaanduiding | Version Id.; version | CCTS; ADMS |
Versiedatum | date of last modification | ADMS |
Objecttype | Aggregate Core Component; class | CCTS; ISO 11179 |
Aanduiding Id object | Unique Identifier, Idenitificatiekenmerk | CCTS; RMO |
Populatie | population | CCTS |
Kwaliteit objecttype | Quality; Integriteit | CCTS; RMO |
(Relatie-)Attribuuttype | Association/Basic Core Component; property | CCTS; ISO 11179 |
Onderdeel van | Id. Aggregate Core Component | CCTS |
Kardinaliteit | Min_ en max_cardinality; multiplicity; cardinality | CCTS; ISO19103; ISO19109 |
Id. Waardenlijst of objecttype | Id. Codelist | CCTS |
Enumeratie | Id. Codelist; enumeration | CCTS; ISO 19109 |
Formaat+lengte(.dec)|(min..max) | datatype | ISO19103 |
Kwaliteit attribuuttype | quality | CCTS |
Norm/Standaard (+ versie) | NORA AP17 | |
Waardenlijst | Codelist | CCTS; ISO 19103 |
Id.: URI | Unique Identifier , Identificatiekenmerk; ID | CCTS; RMO; ADMS |
Code | code | CCTS |
Waarde | literal_term | CCTS |
Begin geldig | start_date | CCTS |
Eind geldig | end_date | CCTS |
Distributie | Distribution | ADMS |
Id.: URI | Id.: URI; Access URL | ADMS |
Beschrijving | Description; description | ADMS |
Formaat | Format | ADMS |
Id. Concept | Id. Asset | ADMS |
Toelichting[bewerken]
Reikwijdte van het begrip informatieobject en de relevante standaarden[bewerken]
Het begrip informatieobject is ontleend aan de standaarden voor ongestructureerde gegevens als NEN-ISO 23081 (metagegevens voor archiefbescheiden), Richtlijn metagegevens Overheid (RMO) en Overheids Web Metadata Standaard (OWMS). Deze laatste standaard definieert een informatieobject als “Een identificeerbaar, mogelijk samengesteld geheel van gegevens.“ Als voorbeelden worden genoemd: “Documenten, webpagina's, datasets.” De RMO noemt als toepassingsgebied: “... alle informatie die, in welke vorm dan ook, bij de uitvoering van overheidstaken wordt gebruikt en gemaakt: documenten, databases, afbeeldingen, mp3-bestanden, websites, GIS, CAD-tekeningen en informatie in elk denkbaar systeem waarmee informatie wordt ontvangen, uitgewisseld, bewerkt of beheerd”. De entiteiten in deze Richtlijn beperken zich evenwel tot “Record, Actor, (Bedrijfs-)Activiteit, Mandaat en Relatie. […] Een record wordt, in aansluiting op de Archiefwet 1995, NEN 2082 en de Baseline Informatiehuishouding Rijksoverheid, gedefinieerd als “Informatieobject, ongeacht zijn vorm, met de bijbehorende metagegevens ontvangen of opgemaakt door een natuurlijke en/of rechtspersoon bij de uitvoering van taken en bewaard om te voldoen aan wettelijke en/of administratieve en/of maatschappelijke behoeften”
In AP17 worden onder het begrip informatieobject ook alle gestructureerde gegevens en hun beschrijvingen verstaan. De daarvoor bestaande specifieke standaarden zijn vermeld in de tabel. De beschrijving daarvan valt binnen het begrip 'Semantic Asset', zoals dat wordt gehanteerd in ADMS. Aangezien gegevenscatalogi, thesauri, taxonomieën of conceptuele modellen ook documenten zijn is er sprake van een zekere mate van overlap van standaarden.
Naleving van standaarden voor geografische en ongestructureerde informatie[bewerken]
De standaarden voor ongestructureerde gegevens (NEN-ISO 23081-1, Richtlijn Metagegevens Overheids-informatie (RMO), Dublin Core en OWMS) zijn in de Nederlandse overheid breed geaccepteerd. In toenemende mate worden door overheden toepassingsprofielen opgesteld. Ook geografische standaarden ISO 19115, Inspire en NEN_3610 worden breed geaccepteerd en toegepast, dankzij de inspanningen van Geonovum. Hier wordt volstaan met de aanbeveling deze standaarden te blijven volgen.
Verantwoording aanbeveling gestructureerde gegevens[bewerken]
Uitgangspunt voor de aanbeveling vormde een inventarisatie van gebruikelijke metagegevens in catalogi van Nederlandse registraties. Hieruit kwam een grote diversiteit naar voren, zowel van soorten catalogi, als van gebruikte metagegevens voor de beschrijving daarvan. De publicatie 'Catalogus Authentieke Registratie' in 2002 door het programma Stroomlijning basisgegevens, is door sommige basisregistraties gevolgd, waarmee een beperkte mate van standaardisatie was ontstaan. Deze publicatie lag ook ten grondslag aan de Stelselcatalogus 1.0 in 2009. Sindsdien is de beschrijving met metagegevens in diverse werkgroepen met de basisregistraties verder door ontwikkeld. De resultaten daarvan zijn gebruikt bij het opstellen van de aanbeveling voor AP17.
Voor de modellering is aangesloten bij het 'Whitepaper metamodel'[1] van de werkgroep 'Best Practices' voorzover daarover ruime overeenstemming bestaat. Daaraan is op verzoek van betrokken organisaties een modellering van de wijzigingen van gegevens toegevoegd op basis van het 'Whitepaper Gebeurtenissen'[2] van R. Onink ea. Deze modellering is beperkt gehouden tot het gegevensdeel om overlap met procesmodellen en zaaktypecatalogi te beperken.
Vervolgens is aansluiting gezocht bij bestaande standaarden voor gestructureerde gegevens: Core Components Technical Specification (CCTS, 2001) van de Verenigde Naties, ISO-IEC 11179 (2003), Data Catalog Vocabulary (DCAT, W3C, 2012) en Asset Description Metadata Schema (ADMS, EU en W3C, 2012). Naast de Nederlandse benamingen zijn de benamingen daaruit toegevoegd indien het naar de geest een overeenkomstig metagegeven betrof.
Uit de zo ontstane longlist is een set belangrijkste metagegevens geselecteerd op basis van de mate van voorkomen bij Nederlandse registraties en inschatting van het belang. Zie voor de volledige lijst het referentiemodel metagegevens.
Toelichting op het model en de metagegevens[bewerken]
De basis van het model wordt gevormd door de gebruikelijke elementen in een gegevencatalogus: objecttype, relatietype en attribuuttype. In de VN-standaard CCTS worden deze met 'Core Components' aangeduid. In navolging van het Relationeel Model zijn relaties (associaties) als attribuuttypen gemodelleerd (foreign keys)[3]. Om meervoudige voorkomens van gelijknamige metagegevens bij deze typen te voorkomen zijn deze genormaliseerd naar de supertypen 'Gegevenstype' en 'Begrip' (Concept + term). Het supertype 'Gegevenstype' betreft de metagegevens over de registratie van object-, gegevensgroep-, attribuut- en gebeurtenistypen.
Het supertype 'Begrip' (Concept + term) betreft de semantiek van deze gegevens. Door dit supertype apart op te nemen is de mogelijkheid geboden om ook begrippen op te nemen waarvan geen instanties worden geregistreerd. Dit opent de mogelijkheid van semantische modellering van overeenkomsten en verschillen tussen de begrippen, door middel van gebruikelijke relaties als specialisatie van, onderdeel van, instantie van en relatie (associatie). Hier zijn ook een definitie, toelichting en een link naar de regelgeving ondergebracht. 'Begrip' is feitelijk onderverdeeld in 'Concept' en 'Term' hetgeen de mogelijkheid geeft om naast de voorkeursterm ook synoniemen op te nemen. Homoniemen dienen te worden voorkomen door toevoeging van een onderscheidend achtervoegsel dat het concept kenmerkt.
Vervolgens is 'Gebeurtenis' toegevoegd en via 'Administratieve handeling' gekoppeld aan 'Gegevenstype'. De koppeling kan betrekking hebben op een object, gegevensgroep of (relatie)attribuut. Gebeurtenis is zelf een subtype van begrip, met alle attributen en relaties van dien. De verschillende betrokkenen bij een gebeurtenis zijn via een n:m-relatie 'Rol' gemodelleerd conform het zakenmodel van gemeenten. Tenslotte zijn 'Distributie' en 'Registratie' toegevoegd conform ADMS.
Referentiemodel structuur metagegevens[bewerken]
Bijlagen[bewerken]
Bijlage definities[bewerken]
Bijlage waardelijsten[bewerken]
Conditietype[bewerken]
- preconditie
- postconditie
- invariant
Datatype[bewerken]
- tekst (string)
- Id
- URI
- booleaans getal (boolean)
- duur (duration)
- datum (date)
- datum_tijd (dateTime)
- jaar (gYear)
- jaar_maand (gYearMonth)
- geheel getal (integer)
- natuurlijk getal (nonNegativeInteger)
- reëel getal (decimal)
- reëel getal (float)
- reëel getal (double)
- punt (GM_Point)
- lijn (GM_Curve)
- vlak (GM_Surface)
- multivlak (GM_Multisurface)
- volume (GM_Solid)
- getal hexadecimaal (hexBinary)
- getal 64 binair (base64Binary)
- keuze (choice)
- samengesteld (union)
Datatype (samengesteld)[bewerken]
- (tekst|ID|URI) (<lengte>|<minimale lengte>..<maximale lengte) <codering>? <beperking>? <taal>?
- getal <lengte>.<decimalen>? <eenheid>?
- (hex|binair 64) (<lengte>|<minimale lengte>..<maximale lengte) <eenheid>?
- (datum|datumTijd|jaar|jaarMaand|duur|float|double|punt|lijn|vlak|multivlak|volume)
- booleaans getal
- lijst (list) (<lengte>|<minimale lengte>..<maximale lengte) <formaat>
- samengesteld (union) <datatype> …
- keuze (choice) <datatype> …
Formaat (Distribution)[bewerken]
- RDF/XML
- XSD
- HTML
- ZIP
Lengte[bewerken]
- (<lengte>|<minimale lengte>..<maximale lengte)
- <lengte>.<decimalen>?
Minimum: (<minInclusiv>waarde|<minExclusiv>waarde)
Maximum: (<maxInclusiv>waarde|<maxExclusiv>waarde)
Licentietype[bewerken]
- openbaar: zonder restricties
- openbaar: met restricties
- autorisatie: doelbinding wettelijk
- autorisatie: doelbinding autorisatiebesluit of certificaat
Mutatietype[bewerken]
- opvoeren
- wijzigen
- beëindigen
Rol[bewerken]
- actor
- agent
- bronhouder
- registratiehouder
- overige (Zie zaaktype)