Aansluitcontrole

Naar overzicht

Als BI Consultant probeer ik samen met mijn collega’s te zorgen voor een goede informatievoorziening voor de business. Dit houdt in dat wij informatie verzamelen uit allerlei verschillende systemen binnen PostNL, denk aan informatie uit HR systemen, uit financiële systemen maar bijvoorbeeld ook uit sorteermachines. Deze informatie slaan we op in een datawarehouse. Een datawarehouse bestaat uit een aantal lagen. Het begint bij de bron, dit is het betreffende systeem waar de originele informatie vandaan komt. Tussen de bron en het datawarehouse bestaat een mechanisme wat de informatie vanuit de bron in het datawarehouse zet. Daarna zijn er verschillende lagen in het datawarehouse om de informatie vanuit de verschillende bronnen te structureren. Je moet je voorstellen dat er heel veel informatie binnenkomt, van heel veel verschillende systemen. In de eerste laag is er dus één grote bak informatie waar nog geen structuur in zit en dus nog geen betekenis aan te ontlenen is. Met behulp van zogeheten transformaties wordt de informatie door de verschillende lagen heen gestructureerd. Dit wordt ook wel het ETL-proces genoemd: Extraction, Transformation en Load.

Om dit proces, en alle technische aspecten die hierbij komen kijken, onder de knie te krijgen is Loek ( een mede MasterClass Professional) en mij gevraagd een generiek model op te zetten dat als het ware ons eigen ETL-proces controleert. Hiermee leren wij hoe dit proces bij PostNL in elkaar zit en betekenen we tegelijkertijd iets voor het team, omdat de controles dan niet meer handmatig gedaan moeten worden. Deze zogeheten aansluitcontrole moet ervoor zorgen dat informatie op de juiste manier in het datawarehouse staat, en dat er geen informatie tussen de verschillende lagen verloren gaat. Wat houdt dit nu precies in? Het idee is dat er naast de originele informatiestroom, een andere informatiestroom komt die controleert of de originele informatie correct door alle lagen van het datawarehouse geleid wordt. Dat wil zeggen, we maken een vergelijking met elke laag in het datawarehouse, vanaf de bron tot aan de bovenste laag, en controleren in elke laag of de informatie nog aansluit met de vorige laag. Hiermee proberen wij ervoor te zorgen een betrouwbare leverancier van informatie te zijn aan de business!

Tot zover een kijkje in een van de projecten die er nu lopen! Nieuwsgierig geworden naar Business Intelligence of de Calco MasterClass? Neem gerust contact met me op voor vragen via LinkedIn of Twitter (Tess_Calco) of solliciteer direct via de site!

Onze opdrachtgevers