Publicatie gegevenswoordenboeken
- Onderdeel van
- Thema's
- Contact
- Henk Nijstad
- H.Nijstad@kennisnet.nl
- Status
- Actueel
- Auteurs
Werkgroep gegevenswoordenboeken
Een gegevenswoordenboek is pas bruikbaar als het te vinden is in een formaat dat aansluit bij de gebruikerswensen. Er zijn diverse typen gegevenswoordenboeken, en elk van deze typen kent zijn eigen gebruikers en use cases. Dit stelt andere eisen aan de wijze van publicatie.
Verschillende manieren van publicatie per type gegevenswoordenboek[bewerken]
Voor alle typen gegevenswoordenboeken zijn er verschillende wijzen van publiceren, uitgaande van verschillende doelen:
- Zien: Elementen/begrippen zijn in hun geheel voor mensen te bekijken, wat een compleet overzicht geeft.
- Inzien: Elementen/begrippen zijn apart te bekijken voor mensen, wat een (beperkte) zoekfunctie mogelijk maakt.
- Gebruiken: Elementen/begrippen zijn voor mensen apart te bekijken in toegankelijk formaat, wat gebruik vergemakkelijkt.
- Hergebruiken: Elementen/begrippen zijn op een unieke plek voor mens en machines te raadplegen, wat garandeert dat iedereen naar hetzelfde refereert.
- Verbinden: Elementen/begrippen zijn te raadplegen in verbinding met andere lagen en eventueel andere gegevenswoordenboeken, wat hergebruik in verschillende contexten mogelijk maakt.
<<Gedeeltelijke hiërarchie: zoeken gaat bv beter bij III-V. Maar overzicht bv niet, daar is I-II wellicht beter - tonen op plaatje>>
Deze vijf stappen in publicatie is een vrije vertaling van het 5-sterrenmodel van Tim Berners-Lee:
★ | De gegevens staan online (OL) |
★★ | De gegevens zijn herbruikbaar (RE) |
★★★ | De gegevens zijn beschikbaar in een open formaat (OF) |
★★★★ | De gegevens zijn vindbaar (URI) |
★★★★★ | De gegevens zijn beschikbaar als Linked Data (LD) |
De stappen in het oorspronkelijke, bovenstaande model beschrijven een normatieve opbouw: 5 sterren is beter dan 1 ster. De insteek die we voor de NORA kiezen is meer descriptief; het gekozen formaat is mede afhankelijk van het beoogde doel. De NORA onderscheidt vijf verschillende type modellen, onderstaande tabel geeft voor elk type de verschillende opties weer.
I. Zien | II. Inzien | III. Gebruiken | IV. Hergebruiken | V. Verbinden | |
---|---|---|---|---|---|
Conceptueel informatiemodel | pdf, jpeg | Word, txt | UML | JSON, WikiXL | JSONLD, rdf |
Logisch model | pdf, jpeg | Word | UML | JSON, WikiXL | JSONLD, rdf |
Begrippenmodel | html | JSONLD,rdf | |||
Register | html | xlsx | csv | rdf | |
Technisch model | html | XML | XSD |
Voor conceptuele en logische modellen geldt dat ze snel overzicht kunnen geven van de samenhang tussen begrippen, een plaatje kan hierbij in sommige situaties heel behulpzaam zijn. Voor een begrippenmodel geldt sterker dat de begrippen afzonderlijk te benaderen zijn, daar zijn opties III en IV wenselijker. Een technisch model moet vooral direct toepasbaar kunnen zijn, opties II en III lenen zich hier goed voor.
Uiteraard moet de publicatie in zijn geheel coherent zijn: de keuzes voor elke laag dienen in samenhang te worden gemaakt. Het is niet wenselijk als een gebruiker verschillende formaten moet doorzoeken naar de juiste infomatie.
Tools om gegevenswoordenboeken te publiceren[bewerken]
Er zijn verschillende tools waarmee een gegevenswoordenboek kan worden gepubliceerd. Onderstaande tabel onderscheidt drie varianten:
I. Zien | II. Inzien | III. Gebruiken | IV. Hergebruiken | V. Verbinden | ||
---|---|---|---|---|---|---|
Download | rdf | |||||
Website | html | Resolvable URI’s | ||||
API | html, csv | JSON | xml/rdf, JSONLD |
<<nog toevoegen: toelichting resolvable URI’s>>
Informatie[bewerken]
<<nog uitschrijven>>
- Context
- Toepassing
- Definitie
- Relaties
- Versie
- Status
- Eigenaar