Metadatamanagement inrichten

Uit NORA Online
Naar navigatie springen Naar zoeken springen


Onderdeel van
Thema's
Contact
Arjen Santema
Arjen.Santema@kadaster.nl
Status
Actueel
Auteurs

Werkgroep Metadatamanagement

4.1 Volwassenheidsmodel

Een praktisch hulpmiddel bij het verder vormgeven van het metadatamanagement in een organisatie is een volwassenheidsmodel. Een goed volwassenheidsmodel helpt bij het bepalen van de huidige positie en bij het identificeren van stappen die nodig zijn om een volgend niveau te bereiken. Dit hoofdstuk start met een volwassenheidsmodel voor metadatamanagement. Vervolgens wordt meer inzicht gegeven in wat er nodig is om invulling te geven aan metadatamanagement.

De tekst en afbeelding zijn overgenomen en vertaald uit het artikel “5 levels of metadata management maturity in a modern enterprise – The Digital Transformation People” van Ruben Sardaryan (zie thedigitaltransformationpeople.com).

Niveau 1 – Onbewust

De organisatie heeft geen idee van het bestaan van metadatamanagement. “We weten niet dat we het niet weten.”

Metadata bevinden zich niet in een centrale repository en zijn meestal volslagen onbekend bij niet-technische gebruikers. Metadata wordt waarschijnlijk “documentatie” genoemd en sporadisch of überhaupt niet georganiseerd. Het onderhoud van metadata is meestal een tijdrovend, handmatig en foutgevoelig proces.

Niveau 2 – Initieel

De organisatie heeft enig besef van metadatamanagement.

Organisaties beginnen in dit stadium te beseffen dat metadatamanagement noodzakelijk is. Ze leren de basisconcepten van metadatamanagement te kennen, en in te zien hoe het hen kan helpen. Maar specifieke systemen of methodologieën om met metadata om te gaan, ontbreken. Zo is er geen centrale repository voor metadata. In plaats daarvan worden generieke tools ingezet die binnen de organisatie gebruikt worden, zoals spreadsheets, documenten, wikipagina’s en databases, om metadata mee te identificeren, verzamelen, ordenen en onderhouden.

Niveau 3 – Gefragmenteerd

De organisatie erkent het belang van metadatamanagement voor het verbeteren van efficiëntie en effectiviteit. Maar organisatieafdelingen richten de metadatamanagement functie in zonder rekening te houden met organisatiebrede behoeften. Het beheer van metadata is hierdoor versnipperd.

Mogelijk gelden binnen de organisatie beperkt richtlijnen voor metadatamanagement, maar het bereik daarvan overstijgt het niveau van afdelingen niet. In veel gevallen worden metadata georganiseerd in eenvoudige mappenstructuren of spreadsheets, maar ontbreekt (verdere) categorisering volgens standaarden die binnen de hele organisatie gehanteerd worden. Bovendien is vaak niet goed duidelijk wie op het gebied van metadatamanagement waarvoor precies verantwoordelijk is.

De organisatie kent waarschijnlijk meerdere te organiseren opslagplaatsen voor metadata - één of meer documentmanagementsystemen, zakelijke woordenlijsten, een interne wiki, codedocumentatie verspreid over git-repository’s, spreadsheets met gegevenswoordenboeken en mapping tabellen.

Doordat gegevensstromen niet stoppen bij afdelings- of organisatiegrenzen, begint de organisatie wel te begrijpen dat metadatamanagement een holistische, gecoördineerde inspanning vereist. Dit kan leiden tot introductie van kwaliteitsstatistieken en oplossingen voor geautomatiseerd verzamelen en beheren van metadata, maar de toepassing daarvan blijft gefragmenteerd en decentraal georganiseerd.

Niveau 4 – Organisatiebreed

Het belang van metadatamanagement wordt tot in de top van de organisatie erkend. Waarschijnlijk is er een Chief Data Officer of een gelijkwaardige rol en een Datamanagementteam op organisatieniveau. Organisaties gebruiken in dit stadium specifiek voor metadatamanagement ontwikkelde tools en procedures die binnen de volledige organisatie worden geïmplementeerd.

Steeds meer mensen binnen de organisatie erkennen het strategische belang van metadata. De organisatie is (daardoor) veel beter in staat een gemeenschappelijke taal te gebruiken. Metadata worden gecentraliseerd beheerd, hoewel op basis van standaardisatie ook decentrale benaderingen mogelijk zijn. Automatisering van metadatamanagement wordt gemeengoed. Metadata worden meestal zonder menselijke tussenkomst ontdekt en uit de bronsystemen gehaald.

Op dit niveau zal waarschijnlijk ook geautomatiseerde of semi- geautomatiseerde metadata verrijking aanwezig zijn. Veel herkomstinformatie wordt geautomatiseerd of handmatig vastgelegd. Organisaties worden merkbaar beter in het begrijpen van hun datastromen en het opsporen van afhankelijkheden. Er wordt voortdurend gewerkt aan het bereiken en behouden van een volledig metadata-overzicht. De kwaliteit van metadata wordt daarnaast systematisch gemeten. Daarover wordt op het hoogste niveau gerapporteerd.

Niveau 5 – Strategisch

Metadata worden gezien als de belangrijkste strategische data in de organisatie en ook als zodanig behandeld. Alle metadata van de organisatie zijn toegankelijk en doorzoekbaar via één gemeenschappelijk toegangspunt. Het publiceren en gebruiken van metadata door alle processen en systemen is verplicht. Om integraties te vereenvoudigen worden universele, gestandaardiseerde metadata formaten gebruikt.

Als data van buiten de organisatie worden ontvangen, worden de metadata ervan in lijn gebracht met interne metagegevensstandaarden. In wezen is de hele organisatie in metadata beschreven. Het is daardoor mogelijk om wijzigingen aan te brengen in bedrijfsprocessen door metadata te wijzigen. De normen voor metadata zijn zeer streng en de kwaliteit wordt nauwgezet beheerd. Het verrijken van metadata is vaak een goed ingeburgerd en geautomatiseerd proces. Algoritmes kennen op dit niveau haast meer interactie met metadata dan met mensen.

4.2 Capabilities voor metadatamanagement

Om stappen te kunnen zetten op het gebied van metadatamanagement zijn diverse capabilities nodig. We geven een aantal voorbeelden:

Metadata model — Een model dat beschrijft welke vormen van metadata door een organisatie worden onderkend en vastgelegd. Een dergelijk metadata model vormt de basis voor metadatamanagement.

Metadata repositories — Hierin worden de metadata beheerd conform het metadata model. Het biedt mogelijkheden om te zoeken, te analyseren en te publiceren. Ook biedt het een goede basis voor onder meer hergebruik van gegevens, ontwerp en ontwikkeling van systemen.

Business glossary of thesaurus — Een set van de begrippen die een organisatie gebruikt, inclusief definities en relaties tussen begrippen. Begrippen zijn zowel een goede manier om data te vinden als om ze beter te begrijpen.

Data lineage — Een vorm van metadata die beschrijft waar data vandaan komen en hoe deze door de processen en systemen stromen. Dit wordt ook wel “horizontale data lineage” genoemd. Een andere vorm van lineage, de verticale, geeft de relatie weer tussen de data en de bijbehorende modellen en definities op verschillende niveaus (conceptueel, logisch, fysiek). Data lineage ondersteunt bij het de analyse hoe informatie tot stand komt en hoe data verwerkt worden. Dit is bijvoorbeeld behulpzaam bij het voldoen aan het door de AVG voorgeschreven verwerkingenregister.

Business Rule management — Het vastleggen van bedrijfsregels die gelden rondom de data. Dit bevordert het gebruik van deze regels bij het gebruik van de data.

4.3 Hoe om te gaan met een volwassenheidsmodel

Organisaties kunnen de neiging hebben om zich het hoogste niveau in het volwassenheidsmodel ten doel te stellen. Dat moet geen automatisme zijn: er ligt ergens een omslagpunt tussen kosten die gemoeid zijn met het verbeteren van metadatamanagement en toegevoegde waarde voor de organisatie.

Een eerste self-assessment (“waar staan we als organisatie met ons metadatamanagement”) is onontbeerlijk. Advies van interne of externe experts (metadata is toch wel een apart domein) over ambitieniveau, te nemen stappen en beoogd eindniveau is sterk aan te raden.

De ervaring leert dat er tussen ambities en daadwerkelijke prioriteit een risicovol spanningsveld bestaat: de operationele zaken krijgen vaak voorrang boven een meer abstract en lange termijndoel als “metadata op orde”. Elke organisatie dient zich hiervan op voorhand bewust te zijn en hiervoor maatregelen te nemen.