De jaarlijkse data administratie-controle
Onlangs viel ik in een gesprek op BNR-radio met de directeur van de Amsterdamse Rekenkamer. “Er zijn 44 afzonderlijke administraties in de Gemeente Amsterdam [..] het is net spaghetti [..] breng eerst de basisadministratie op orde [..] overzicht en inzicht ontbreekt”. Het is dat het duidelijk was dat het over de financiële administratie ging maar het had zomaar een kwalificatie kunnen zijn van de gegevenshuishouding van een willekeurige organisatie.
Iedereen die iets van boekhouden begrijpt, snapt dat met een dergelijke spaghetti gedegen financieel beheer heel erg lastig wordt. Boekhouden gaat terug tot de oudheid en wordt gedaan om overzicht te houden over de financiële positie, inzicht te krijgen in (oorzaken van) winst en verlies en om verantwoording af te leggen. Een goede administratie is een conditio sine qua non voor een normale bedrijfsvoering. Niet zelden gaan bedrijven failliet of komen in ernstige financiële problemen omdat hun boekhouding niet op orde is en niet omdat hun businessmodel niet deugt.
Hoe is het dan met de boekhouding van onze data assets gesteld? Bedroevend, als je het mij vraagt. In een gemiddelde organisatie is dat ongeveer als volgt geregeld. De datamodellen staan in Visio en PowerPoint, de data dictionaries worden in Excel bijgehouden op de G:\-schijf, de externe databronnen die we gebruiken kun je terugvinden op de intranetpagina van IT en als je wil weten welke data ons voorraadsysteem bijhoudt moet je even aan Herman vragen of hij een print maakt van de fysieke database schema’s. Herkenbaar? Ik vrees voor vele bedrijven helaas van wel.
Een tijd geleden adviseerde ik een van onze klanten bij de inkoop van een ERP-softwarepakket te vragen naar onderliggende datamodellen. Het ontluisterende antwoord was dat de leverancier die specificaties niet kon overleggen omdat ze er niet waren… Organisaties hebben de mond vol van data driven werken, hebben hun data als asset bestempeld (Waar dan? Op de balans zie ik niks aan de activa kant staan) en breiden hun organisatiehark uit met Chief Data Officers. Maar van welke data er eigenlijk in een organisatie omgaat, bestaat vaak geen enkel overzicht. Hoe kunnen we data dan in hemelsnaam goed managen? Als we niet weten welke data we hebben en wat de toestand van die data is, hoe kunnen we data dan echt waarde laten genereren? De vraag stellen is hem beantwoorden.
Gedegen datamanagement wordt een noodzaak voor iedere organisatie. Dat betekent dat je moet boekhouden en een administratie moet aanleggen. Over welke data assets beschikken we als organisatie? Wat is de staat van herkomst en gebruik van die data? Waar in de (data) lifecycle bevindt een data asset zich? De noodzaak voor zo’n administratie is evident aanwezig, al zal menig bestuurder of directeur dat nog niet direct zien. Toch is er geen ontkomen aan. Organisaties hebben ondertussen enorme hoeveelheden data tot hun beschikking en stakeholders verwachten dat die professioneel beheerd worden. Maar hoe vaak komt het niet nog voor dat iets simpels als een adreswijziging niet goed verwerkt wordt of dat je klantgegevens dubbel voorkomen. Het is niet meer uit te leggen. Compliance met wet- en regelgeving dwingt organisaties om hun datapositie op orde te hebben. En het uitnutten van data door middel van analytics of data science vereist inzicht in de data waarover een organisatie beschikt.
Hoe dan, om met Arjan Lubach te spreken. Terechte en goede vraag. In ieder geval niet in PowerPoint of Excel, dat mag duidelijk zijn. Als we de vergelijking trekken met Finance dan wordt meteen duidelijk dat er een systematiek nodig is om een dergelijke administratie in te richten, te vullen en te onderhouden. In Finance is dat een rekeningstelsel, grootboek, boekhoudrichtlijnen (GAAP of IFRS bijv.), administrateurs, controleurs etc. Mijn overtuiging is dat een dergelijk stelsel mutadis mutandis ook voor een data administratie vereist is. Een kernvraag is hoe en op welk niveau data assets geadministreerd zouden moeten worden. Hier is een sleutelrol weggelegd voor het logisch datamodel met verbindingen naar andere representatievormen, zowel op een ‘hoger’ conceptueel niveau als een ‘lager’ technisch niveau. Het mag duidelijk zijn dat het ontwerpen van een dergelijke systematiek veel verder gaat dan het aanschaffen van een metadata tool dat even de verschillende repositories uitleest.
Idioot idee of harde noodzaak voor data intensieve organisaties? Ik denk het laatste. Hoe lang zou het duren voordat de jaarlijkse data administratie controle net zo normaal is als de jaarlijkse accountantscontrole van de boekhouding?