Als Datamanagement Specialist aan de slag bij AFM

Bij een organisatie als de Autoriteit Financiële Markten (AFM), die “van de Afdeling Verzekeren & Pensioenen tot aan het Team Digitaal Onderzoek ” datagedreven werkt, is de Datamanagement Specialist cruciaal in een groot aantal rollen. Dat maakt dit een veelzijdige én veeleisende functie. Om een beter inzicht te krijgen in wat een Datamanagement Specialist nu precies doet, spraken we met Robert Breteler, sinds twee jaar werkzaam bij de AFM.

Autoriteit Financiële Markten gebouw entree
Autoriteit Financiële Markten

Tegenwoordig werkt de AFM vrijwel volledig datagedreven, maar dat was niet altijd het geval, zo vertelt Breteler. Oorspronkelijk volgde men puur de ‘expert judgment’ van de toezichthouder, maar het opschalen naar steeds meer toezichthouders in de al maar groeiende, complexere en continu digitaliserende financiële markten is geen levensvatbare strategie. Aan de instellingen waarop de AFM toezicht houdt, worden hoge eisen gesteld op het gebied van verantwoording: iets als een jaarbalans kan pas worden goedgekeurd als er een ononderbroken keten is vastgelegd hoe deze tot stand is gekomen. Daarin is op basis van nauw omschreven regels, bijvoorbeeld een 4-ogen principe, elke stap gedocumenteerd. Voor de AFM als toezichthouder gelden net zulke strenge regels voor de manier waarop datagedreven toezicht wordt gehouden: een beslissing van de autoriteit heeft immers grote gevolgen. Een concreet voorbeeld: voor het op basis van data ‘automatisch’ signaleren van afwijkende transacties op de aandelenmarkt (die een signaal kunnen zijn van marktmisbruik of marktmanipulatie) moeten die regels getoetst worden en betrouwbaar zijn gevonden op basis van vooraf gedefinieerde hypotheses.

De Datamanagement Specialist creëert middels datamanagement processen de randvoorwaarden die ervoor zorgen dat beslissingen zo goed mogelijk door data worden ondersteund. Hij streeft dan ook hoge doelen na: een datamodel dat de werkelijkheid exact beschrijft, een data-architectuur die volledig gestandaardiseerd is, complete controle over de kwaliteit van de data. Hoe ziet dat er in de praktijk uit?

Het begint met definities

De basis voor het toezicht door de AFM is informatie, oftewel data. Die worden doorgaans geleverd door de organisaties waarop toezicht wordt gehouden. Bij ontvangst moeten die data niet alleen qua vorm worden geconverteerd naar een van de twee standaarden (CSV en SQL) die geaccepteerd worden in de architecturen van het Managed Dataplatform van de AFM. Ook moeten die data worden gemodelleerd en gedefinieerd, zodat de data goed aansluit bij het begrippenkader van een toezichthouder.

Modelleren kan je zien als het beantwoorden van de vraag “wat is deze data?” Dat begint met het nauwkeurig omschrijven van elke term in de dataset: elk begrip wordt nauw gedefinieerd. In deze fase, zegt Breteler, “ben ik een taalspecialist, ik hou me bezig met homoniemen en synoniemen.” Alleen op die manier is te garanderen dat altijd duidelijk is wat de data beschrijven. Een ‘beheerder’ kan iets heel anders inhouden bij een verzekeringsmaatschappij, dan bij een beleggingsfonds. Beide varianten (en nog vele andere) krijgen dan ook een eigen term en definitie, zodat ze individueel te onderscheiden zijn. Dat geldt voor alle begrippen in een dataset.

Met het definiëren van begrippen wordt ook de onderlinge relatie tussen die begrippen helder: zo kan een ‘beheerder’ meerdere ‘beleggingsinstellingen’ onder zich hebben. Het einddoel van dit begrippenkader, aldus Breteler, is “dat de werkelijkheid wordt gevat in de data”. Die werkelijkheid kan niet los gezien worden van context: bij de AFM zijn zes verschillende domeinen, die op verschillende typen instellingen toezicht houden. Elk daarvan heeft een eigen begrippenkader met eigen definities. Het datamodel moet voor alles aansluiten bij de respectieve toezichthouder. Een uitdaging is dat een toezichthouder van het ene domein regelmatig informatie nodig heeft uit datasets die via een andere toezichthouder zijn binnengekomen. Een bank heeft immers vaak ook verzekerings- en beleggingsactiviteiten. De Datamanagement Specialist moet hiermee rekening houden bij het definiëren van begrippen en creëren van het datamodel.

Gesproken taal als basis

Het begrippenkader neemt uiteindelijk doorgaans de vorm aan van een database, die volgens de regelen der kunst moet worden opgebouwd. Daarvoor gebruikt Breteler een methodiek die fact based modelling heet; daarmee kan hij een begrippenkader vatten in een conceptueel model; op basis van de logische context waarin de data gebruikt worden, genereert hij een logisch datamodel, dat weer getransformeerd kan worden naar een fysiek datamodel.

Dat klinkt heel abstract, en het vermogen te abstraheren is absoluut een vereiste voor deze taak, maar tegelijkertijd is het interessant om te weten dat de methodiek juist een zeer concrete basis heeft, namelijk in de menselijke, gesproken taal. Een van de tools voor het modelleren van data heet niet voor niets Case Talk, verwijzend de basis in analyse van natuurlijke taal.

Bouwtekeningen maken

Aansluitend op het modelleren is data architectuur een tweede belangrijke verantwoordelijkheid van de Datamanagement Specialist. Data architectuur draait om “het een plaats geven van de data”: van het in ontvangst nemen hiervan (welke formaten, hoe gaan we daarmee om, wat voor eisen worden er gesteld) en het gecentraliseerd beschikbaar maken, tot het omvormen en ontsluiten voor een specifieke toezichthouder. Als data architect maak je daarvoor een tekening voor de inrichting, vergelijkbaar met hoe een architect van huizen een bouwtekening maakt.

Zoals aan het begin aangehaald, is de dataontvangst op het dataplatform van de AFM technisch gestandaardiseerd op twee formaten, CSV en SQL. Alle data die binnenkomen moet daarnaar worden geconverteerd, en die binnenkomende data kunnen vele vormen aannemen, van een API tot een Word-bestand, van een XML-feed tot een database. De Datamanagement Specialist ontwerpt in zijn rol als data-architect de datastandaardisatie om de binnenkomende data op de juiste manier in het dataplatform te zetten; de data engineer creëert de pipeline waar data in allerlei formaten ingaat en er aan de andere kant keurig volgens de ontworpen datastandaard weer uitkomt.

Een heel belangrijk principe van dat platform is dat er geen duplicatie mag optreden: identieke zaken mogen maar één keer worden opgeslagen. Alleen zo is – bijvoorbeeld – een beheerder altijd herkenbaar als beheerder, ook als die wordt aangeduid als ‘administrator’ in de aangeleverde data.

De kwaliteit van de data

Dat brengt ons op het volgende cruciale begrip voor de rol van Datamanagement Specialist: datakwaliteit. Zoals Breteler treffend citeert: “Datakwaliteit gaat enkel en alleen over in control zijn van de kwaliteit van je data.” Met andere woorden, het belangrijkste is dat je precies weet hóe goed de data is. Als een onder toezicht staande instelling een instellingscode aanlevert in een veld waar een productcode moet staan, moet dat worden gesignaleerd en ondervangen. In de regel betekent dit dat de aanleverende partij zijn huiswerk terugkrijgt.

Die grip op de datakwaliteit wordt in hoge mate gewaarborgd door de data-architectuur, die zoals aangehaald onder andere inherent zorgt voor standaardisering van de data. Elk uniek gegeven kan immers maar één keer voorkomen in het dataplatform. Anderzijds zijn gedetailleerde definities nodig van wat de eisen zijn waaraan data moet voldoen bij het beoordelen van aangeleverde informatie.

Daarvoor hanteert de Datamanagement Specialist vier kwaliteitsdimensies: volledigheid (is alle gevraagde data aanwezig?), juistheid (bijvoorbeeld: is een productcode inderdaad een productcode en is het de juiste productcode voor dit product?), tijdigheid (is de data aangeleverd binnen de opgegeven termijn en daarmee nog relevant voor het tijdvak dat deze beschrijft) en integriteit (is de data intern consistent, klopt het aangeleverde met wat al op het dataplatform bekend was).

Communiceren en informeren

De Datamanagement Specialist streeft hoge doelen na: een model dat de werkelijkheid exact beschrijft, een data-architectuur die volledig gestandaardiseerd is, en complete controle over de kwaliteit van de data. Tegelijkertijd is de praktijk natuurlijk gewoon weerbarstig. We haalden al een paar voorbeelden aan, van begrippen die afhankelijk van de context een andere betekenis hebben tot data met allerhande fouten. Veel van dit soort gevallen waarin de werkelijkheid zich weerbarstig toont, kan de Datamanagement Specialist ondervangen met behulp van methoden en technieken, en tooling – maar voor veel andere gevallen is het essentieel om vooral veel te praten, te luisteren en uit te leggen; waarom, hoe en waarmee de data voortbrenging op het dataplatform vorm en inhoud krijgt.

We begonnen dit artikel met de constatering dat de AFM als instituut zoveel mogelijk datagedreven is gaan werken, maar dat gebeurt natuurlijk niet zomaar: hiervoor moet ook iedereen overtuigd zijn van de voordelen van deze aanpak. Dat komt veelal neer op het veranderen van houding en gedrag, waarbij empathisch vermogen essentieel is bij voorlichting en trainingen, zoals de basisopleiding toezicht. “Dat uitleggen doe ik ook graag”, zegt Breteler. “Ik participeer in projecten, trek toezichthouders erbij, breng bij wat modelleren inhoudt.” Meestal gaat dat meteen goed. Als ergens eens iets misgaat, wordt nog duidelijker wat het belang is van de data-architectuur met haar standaardisatie, exacte definities, en datakwaliteit controles. En dan lossen we dat samen op.”

Als Datamanagement Specialist vallen je werkzaamheden dan ook te omschrijven als een rondje langs dezelfde drie stappen: het bedenken van een oplossing (een model, een architectuur, een spelregel, een richtlijn, een procedure, etc.), het zorgen dat deze oplossing binnen de AFM wordt geïmplementeerd, dus uitrol en training, en tot slot de verankering: zorgen dat de oplossing daadwerkelijk wordt gebruikt. Zoals Breteler stelt: “Je kan een mooi dashboard bedenken, maar als dat niet wordt verankerd in het toezicht zelf, zijn we nog steeds niet datagedreven bezig.”

In onderstaande video vertellen Dataspecialisten, onder wie Robert Breteler, over hun werk bij de Autoriteit Financiële Markten.

Copyright © 2020 IDG Communications, Inc.