Data administratie is onmisbaar voor data management
Datapositie in crisissituaties
Toen Albert Heijn in 2003 begon met de prijzenoorlog was er een acute behoefte om inzicht krijgen in de 1.000 artikelen die waren afgeprijsd (gevalletje: vraag komt binnen en antwoord wordt dezelfde dag verwacht). In no-time hadden we hiertoe de ‘Kiwi-rapportages’ in elkaar gezet (de toenmalig commercieel directeur at naar verluid een kiwi tijdens de directiemeeting waarin het prijzenoffensief werd geïnitieerd). Die snelheid was mogelijk omdat we met het Pallas datawarehouse in de jaren ervoor een betrouwbare en actuele datapositie hadden weten op te bouwen.
Tijdens de financiële crisis van 2007 en 2008 voltrok dit scenario zich op nog veel grotere schaal. Het instorten van de Amerikaanse huizenmarkt bracht een kettingreactie op gang waardoor enorm veel kapitaal verdampte, met name door het gebruik van derivaten. Iedere financiële instelling wilde op dat moment weten wat hun exposure was in dat soort financiële producten: hebben we überhaupt dat soort producten in portefeuille, wie zijn de counterparties, wat is de onderliggende waarde, hoe groot is het risico? Dat soort vragen.
Ook voor de gewone bedrijfsvoering
Wat deze situaties gemeenschappelijk hebben is dat een actuele, betrouwbare en toegankelijke datapositie onontbeerlijk is om dit soort vragen te beantwoorden. Maar niet alleen in crisissituaties. Feitelijk is een effectieve datapositie onontbeerlijk om überhaupt primaire bedrijfsprocessen goed te laten verlopen. Recent hoorde ik het voorbeeld van een groothandel waar door dubbelingen in de artikelregistratie de voorraadpositie in het distributiecentrum veel hoger was dan nodig (met ook nog alle bijkomende fysieke problemen van dien). Een partij als Rijkswaterstaat kan alleen haar primaire taken uitvoeren als de datapositie over de fysieke infrastructuur up-to-date is. Enzovoort…
Datapositie voor data management
Met een data-crisis is die situatie niet anders. Nadat onlangs bekend werd dat er sprake was van een grootschalig datalek bij de GGD (met dank aan de uitstekende onderzoeksjournalistiek van Daniël Verlaan) kwamen direct vergelijkbare vragen naar boven: om welke gegevens gaat het, van hoeveel personen is data gelekt, wat zijn de systemen die deze gegevens beheren? Op dat moment is inzicht in de datapositie zélf vereist. Ook bij andere datamanagement-vraagstukken speelt dezelfde behoefte. De definitie van de garantietermijn wordt aangepast; in welke gegevens wordt deze definitie allemaal toegepast? Een medewerker die gegevenseigenaar was treedt uit dienst; van welke gegevensverzamelingen was hij allemaal eigenaar? We gaan een externe dataset met aanvullende productgegevens gebruiken; in welke systemen worden de basisgegevens van producten vastgelegd en hoe moet deze integratie verlopen?
Wat deze situaties gemeen hebben is dat een datapositie over…. de datapositie vereist is. Kortom, een administratie van alle ‘data assets’ die een organisatie in beheer en gebruik heeft (nota bene: dit staat dus los van de vraag of deze data assets inhoudelijk toereikend zijn om primaire processen te ondersteunen). Dit vraagstuk is een van de grootste vraagstukken binnen data management: organisaties hebben geen systematisch inzicht in welke data ze onder beheer hebben. Stel je voor dat een financiële afdeling haar werk moet doen zonder centrale boekhouding of te maken heeft met een situatie waarin ieder team, afdeling of divisie haar eigen boekhouding bijhoudt. Maar wel wordt geacht organisatiebreed en integraal over de financiële positie te kunnen rapporteren. Onmogelijk. Toch is dit de context waarbinnen veel organisaties opereren op data management-gebied. Versnipperd door de organisatie vinden verbeterinitiatieven plaats, worden data management-processen ingericht of tools geïmplementeerd. Zonder echter een goed beeld te hebben van de data waar het om gaat.
Data administratie als middel
Wat nodig is, is een data administratie: een eenduidig en integraal beeld van de data die een organisatie in beheer en in gebruik heeft. Vergelijkbaar met de financiële administratie voor Finance of de personeelsadministratie voor HR. Hoe anders kan een organisatie gericht haar ‘data assets’ beheren? Die vergelijking met Finance en HR is niet toevallig en zonder reden. De administraties die daarbij horen hebben specifieke kenmerken die ook van toepassing kunnen zijn op een data administratie:
- Er is sprake van een eenduidig metamodel dat ten grondslag ligt aan de administratie. Bij Finance gaat het bijvoorbeeld om kernconcepten als kostenplaats, kostensoort, rekeningstelsel, grootboekrekeningen etc. Wat is het equivalent hiervan voor een data administratie? Hoe definiëren we precies een data asset, dataset, data domein etc.?
- Er zijn regels die bepalen hoe moet worden geadministreerd. Deels nationaal of internationaal bepaald (bijvoorbeeld IFRS) en deels hoe een organisatie zelf wil werken (doorgaans vastgelegd in een accounting manual). Die regels zijn essentieel om te voorkomen dat zomaar wat wordt geadministreerd. Hoe zien die regels eruit voor een data administratie? Wanneer mag c.q. moet een nieuwe dataset worden opgevoerd bijvoorbeeld.
- Er zijn welomschreven processen, rollen & verantwoordelijkheden en een organisatie die zorgt voor de boekhouding: het daadwerkelijk opvoeren en muteren van de administratie conform de boekhoudregels. Binnen Finance is dit bijvoorbeeld vaak centraal georganiseerd in een team of afdeling die de data entry in de boekhouding doet. Hoe organiseren we dit voor de data administratie?
- De administratie wordt ondersteund door hiertoe uitgeruste systemen (e.g. Peoplesoft Financials, Exact, Unit4 etc.)
Wanneer we deze laatste eigenschap vertalen naar onze eigen data management-wereld komen we snel uit bij metadata-management oplossingen. Dit soort oplossingen zijn inderdaad een belangrijke component voor het realiseren van een data administratie. Het geautomatiseerd en slim catalogiseren van fysieke data assets is een belangrijke randvoorwaarde om de data administratie aan te leggen. Maar zoals de vergelijking met Finance hierboven duidelijk heeft gemaakt, begint het dan pas…