Synthese werksessie metadata op 12 december 2023
Deze synthese is op 12 december 2023 opgesteld door Danny Greefhorst (ArchiXL) en bevat een clustering, samenvatting en redactie van een bijeenkomst op 16 juni 2023 over de probleemdefinitie van metadata voor gegevensuitwisseling. Deze is vooral gebaseerd op de resultaten uit Mentimeter en het gesprek dat erover is gevoerd. Er is voor gekozen om de originele teksten uit de Mentimeter redactioneel te bewerken om ze meer begrijpelijk te maken. De originele Mentimeter resultaten zijn al eerder gedeeld met betrokkenen en zijn op verzoek beschikbaar.
Wat zijn problemen m.b.t. metadata voor gegevensuitwisseling?[bewerken]
Symptomen:
- Doorlooptijden voor het realiseren van gegevensuitwisselingen zijn hoog
- Gebruikers kunnen gegevens niet vinden, begrijpen en/of hergebruiken
- Gegevens zijn niet goed afgestemd op de informatiebehoeften
- Organisaties zijn niet volledig in control over hun gegevens
Problemen:
Metadata is niet vastgelegd of beschikbaar
- Metadata wordt niet systematisch en structureel door organisaties vastgelegd
- Metadata wordt niet altijd juist of volledig ingevoerd
- Metadata is soms wel aanwezig, maar wordt dan gewoonweg niet uitgewisseld
- Er is geen standaard voor de metadata van berichten
- Gegevensmodellen zijn niet gekoppeld aan technische specificaties en uitwisselingen
- Contractuele afspraken zijn grotendeels niet zichtbaar in de beschikbare metadata
- Metadata is niet altijd conform een breed geaccepteerde standaard vastgelegd
De betekenis van de gegevens is niet eenduidig vastgelegd
- De betekenis van gegevens is niet altijd goed gedefinieerd
- Definities zijn niet scherp genoeg en worden verschillend geïnterpreteerd
- De betekenis is afhankelijk van context en niet altijd eenvoudig uitwisselbaar
- Er worden verschillende waardelijsten in verschillende contexten gebruikt, die niet 1-1 aan elkaar te relateren zijn
De eisen die ten grondslag liggen aan gegevensuitwisseling zijn niet expliciet gemaakt
- Er zijn vaak geen verwijzingen opgenomen naar wetgeving
- De verplichtingen of mogelijkheden voor het gebruik van gegevens zijn niet altijd expliciet gemaakt
- De beveiligingseisen aan de gegevensuitwisseling zijn niet te herleiden
- Metadata worden soms misbruikt om de interne processen te laten werken, zoals voor interne routering
De kwaliteit en oorsprong van gegevens zijn niet inzichtelijk
- De kwaliteit van gegevens is veelal niet inzichtelijk in de metadata
- Logging en verwerking zijn niet te herleiden voor de resource owner
- We zien gegevensuitwisseling (te) veel als een oplossing voor een (urgent) probleem, en niet als een risico dat ook gemanaged moet worden (met als resultaat dat we bergen data zonder lineage krijgen)
Er zijn veel standaarden en de standaarden zijn niet consistent
- Er zijn te veel standaarden, onder meer doordat er ook allerlei sectorspecifieke standaarden zijn
- Sectorspecifieke metadata standaarden vragen dat metadata soms in meerdere vormen moeten worden vastgelegd of beschikbaar moet worden gesteld
- Een veld heeft niet in alle metadata standaarden dezelfde betekenis
- Er is veel overlap in standaarden
- De precieze relatie tussen standaarden is onduidelijk
- Er is geen eenduidige typering van soorten gegevensuitwisseling waar we metadata afspraken aan kunnen relateren.
Wat zijn diepere oorzaken voor problemen rondom metadata voor gegevensuitwisseling?[bewerken]
Er is onvoldoende bewustzijn van metadata
- Er is een gebrek aan bewustzijn
- Het belang van metadatering wordt niet goed gezien
- Metadata wordt gezien als een technisch feestje
- Metadata wordt gezien als iets operationeels
- Er is techno optimisme: AI lost het wel op
- Metadata levert vooral risicobeheersing op, functioneel "doet" de gegevensuitwisseling het uiteindelijk best zonder
- Mensen weten niet altijd wat metadata is
- De term metadata is te breed en de onderdelen ervan kennen geen goede naamgeving waardoor discussies moeizaam verlopen
- Er is geen gemeenschappelijke terminologie
Er ontbreken kennis en vaardigheden
- Er is weinig metadata kennis en expertise in organisaties
- Er zijn te weinig competenties voor het goed definiëren van begrippen, informatiemodellen en gegevensmodellen
- Er zijn niet structureel mensen beschikbaar met de juiste kennis
Er zijn geen harde kaders en eisen voor het vastleggen van metadata
- Er is een gebrek aan wetgeving en beleid
- Er wordt niet gestuurd op metadata en er zijn geen middelen beschikbaar
- Er is geen verplichting voor het vastleggen van metadata
- Er is geen bindende afspraak (inclusief handhaving) om de kwaliteit van metadata bij gegevensuitwisseling te toetsen
Het vastleggen van metadata is onvoldoende onderdeel van het primaire proces
- Metadata zou gewoon als data behandeld moeten worden
- Er is te weinig aandacht voor het vastleggen van metadata ‘bij de bron’
- Metadata wordt vaak past gedefinieerd als gegevens uitgewisseld moeten worden
- Systemen zijn er niet altijd op ingericht om metadata goed vast te leggen
- Er ontbreekt ondersteunende software
- De documentatievorm sluit vaak niet aan bij het werkproces
- Metadata moet veel "handmatig" worden ingevuld
- Metadata wordt vaak gezien als ballast
Er is geen expliciete sturing voor hergebruik
- Er is teveel focus op eigen context en gebruik
- Er worden veel bilaterale afspraken gemaakt, waardoor definities onvoldoende herbruikbaar zijn
- Veel begrippen ontstaan in juridische kolommen, die niet op elkaar zijn afgestemd
- Er is te veel focus op korte termijn oplossingen, waardoor metadata geen prioriteit heeft
- Er ontbreekt vaak governance m.b.t. metadata
- Het definiëren van metadata wordt teveel als project gezien en niet organisatorisch geborgd
Er ontbreken goede financiële prikkels
- Er is te weinig incentive voor de metadata-aanbieder
- De financiering is scheef, partijen die metadata moeten opstellen zijn niet de partijen die er van profiteren
- 90% van het budget gaat op aan beheer van de bestaande technologische organisatorische schuld
- Er is weinig directe winst te behalen met metadata
- Kwaliteit kost tijd en geld en krijgt daardoor lage prioriteit
Overig:
- Er blijft (technisch) nog steeds de noodzaak van kopie-maken, waardoor lineage verloren gaat en vele bergen data ontstaan
- Er is geen centrale plaats voor het vinden van begrippen en gegevensmodellen.
Wat zijn oplossingsrichtingen voor de problemen en oorzaken m.b.t. metadata voor gegevensuitwisseling?[bewerken]
Gebruikers bewust maken door belang te benadrukken
- Bepalen welke business /werkelijke vragen of problemen als eerste met metadata kunnen worden geadresseerd
- Aandacht voor semantiek
- Begrippenkader dat omvattend is voor alle doelgroepen
- Nadenken over strategische waarde van toepassen metadata
- Een visie en strategie op gegevensuitwisseling in de toekomst
- Duidelijke en eenduidige communicatie over wat we bedoelen met en rond metadata
Gebruikers beter ondersteunen
- Oplossingen realiseren waardoor gebruikers het nut zien van metadata
- De hoeveelheid metadata beperken (KISS)
- Standaarden niet te veel opleggen om weerstand en onnodige metadata te vermijden
- Aandacht vestigen op kritische metadata
- Metadata zichtbaar integreren in het gehele voortbrengingsproces
- Metadata zoveel mogelijk afleiden uit het proces
- Zo veel mogelijk by design vastleggen van metadata regelen
- Het vastleggen van metadata automatiseren
- Zeker in begin goede begeleiding en tooling om metadata op te stellen voor weinig gebruikte standaarden tot er voldoende massa is om er voordeel mee aan te tonen
Wetgeving, beleid en governance
- Wetgeving
- Formeel beleid voor gegevensuitwisseling, inclusief metadatastandaarden
- Vanuit best-practices toewerken naar standaardisatie
- Eenduidige, normatieve standaarden
- FAIR data principes verplicht stellen (met in ieder geval een Linked Data implementatie)
- Ingerichte governance inclusief handhaving (autoriteit)
- Gegevensdeling inrichten als organisatorische vaardigheid
- Sturen op de kwaliteit van metadata, bijvoorbeeld door deze inzichtelijk te maken
- Geen datasets zonder kwalitatieve metadata
- Governance stelsel van metadatastandaarden inrichten
- Duidelijke metadata afspraken en standaarden voor aanbieders en afnemers.
- Mate van compliancy aan de standaard per organisatieonderdeel inzichtelijk maken (transparant) om zo verandering te sturen
- Eén poort met poortwachter met (geautomatiseerde) checks
- Juist gebruik van data/ informatie onderdeel maken van de handreiking startnota en als verplicht onderdeel van de startnota.
Verbeteren en integreren standaarden
- Samenhang verbeteren, onderlinge relaties tussen standaarden verduidelijken en uitwerken
- MIM 2 API profielen
- Standaard manier hebben om metadata vast te leggen bij API’s.
- Een standaard om semantiek(informatiemodellen en begrippen) aan te sluiten op DCAT c.s.
- Differentiatie naar verschillende vormen van gegevensdeling
- In samenhang bevraagbaar maken van gegevens
Kennis opbouwen en informatie delen
- Inzicht geven in metadatastandaarden en hun toepassing
- Eén centrale plek voor metadata
- Alle(?) begrippen uit wetgeving beschikbaar stellen om mee te verbinden.
- Specialisten opleiden
Gegevensdeling anders organiseren
- Centraliseren (gegevens delen) in plaats van 1 op 1 uitwisselen (gegevens uitwisselen)
- Specialisten inhuren
Wat zijn belangrijke vragen die moeten worden beantwoord?[bewerken]
Gebruik
- Welke vragen leven er daadwerkelijk in het veld die als eerste met metadata opgelost moeten worden?
- Wat zijn de gedragsmatige prikkels die ervoor zorgen dat men metadata wel of niet adopteert als onderdeel van het werkproces?
- Welke metadata zitten gebruikers echt op te wachten?
- Hoe kan de kwaliteit verbeterd worden?
- Hoe precies moet metadata zijn?
Standaarden
- Welke standaarden moeten worden gebruikt, waarvoor en op welke manier?
- Hoe hangen de standaarden met elkaar samen?
- Wat spreken we met elkaar af, hoe we welke standaard gebruiken?
- Welke metadata standaarden zouden er nog op de 'pas toe, leg uit' lijst van Forum Standaardisatie bij moeten komen?
Architectuur
- Kunnen we de FAIR principes "vertalen" naar onze praktijk en als verplicht architectuurkader neerzetten?
- Hoe zou gegevensuitwisseling er in de toekomst idealiter eruit moeten zien?
- Hoe helpt architectuur om tot betere metadata te komen?
- Wat is de bovenliggende business architectuur?
- Welke gegevensuitwisselingen willen we als overheid gaan aanbieden en welke metadata hoort daar dan bij?
- Hoe kan rechtmatigheid worden geborgd?
- Wat zijn de verschillende gevalscategorieën / patronen van gegevensdeling waarvoor uitwisseling van metadata relevant is?
- Hoe automatiseren we het metadata corvee vraagstuk?
Wetgeving en beleid
- Wie stelt kaders?
- Wat zijn de formele kaders (beleid of wetgeving) waarbinnen uitwisseling van metadata ingericht moet worden?
- Welke wettelijke taken zijn afhankelijk van metadata?
- Wat zijn de beleidsvragen?