Peter _pipelersPeter Pipelers nam als laatstejaarsstudent deel aan de selectie “Dataminer”. Hij slaagde, en werd bij de FOD Financiën in dienst genomen.

Datamining, wat houdt dat eigenlijk in?

Een dataminer gaat in de eerste plaats op zoek naar niet meteen merkbare maar wel aanwezige patronen in grote hoeveelheden data. Zo kunnen we structuren en afwijkingen blootleggen, een profiel opstellen en een voorspellend model bouwen voor toekomstig gebruik.

Datamining technieken zijn nuttig om de interessantste informatie uit een grote hoeveelheid gegevens te selecteren. Ook kunnen ze ondersteuning bieden voor gekende regels en ze verfijnen.

De taak van de dataminer is om deze analyses te interpreteren en te automatiseren. Aangezien een datamining model wordt gekozen door de beschikbare data te trainen, speelt de kwaliteit van de data hier dan ook een enorm belangrijke rol.

Welke studies heb je gevolgd?

Door mijn interesse voor wiskunde koos ik tijdens mijn studies om Informatica te studeren, met als optie numerieke informatica. Een richting waarbij de focus vooral ligt op numerieke algoritmen.

Na mijn studies ging ik aan de slag bij de faculteit bio-ingenieurswetenschappen aan de Universiteit van Gent. Ik werkte er eerst als wetenschappelijk medewerker en vervolgens als assistent. Daar stond ik in voor de practica van enkele vakken in informatica en statistiek. Ik deed er onderzoek naar de ontwikkeling van statistische methoden voor genoomanalyse. Om mijn kennis van statistiek bij te schaven, volgde ik ook een master in “statistical data analysis” aan de Universiteit van Gent.

Hoe ben je in je functie terechtgekomen?

Het werk van een dataminer spreekt mij inhoudelijk enorm aan en daarom wou ik als dataminer aan de slag. Na mij enkele jaren theoretisch verdiept te hebben in de statistiek zag ik de mogelijkheid om mijn kennis om te zetten naar de praktijk. Het gebruik van datamining technieken bij fraudeonderzoek is een recente ontwikkeling en het is een ontwikkeling waar ik zeker achtersta.

De overheid  en dan specifiek de FOD Financiën beschikt over een enorme hoeveelheid aan gegevens waarvan het grootste deel privacygevoelig is. Dat maakt de uitdaging des te groter om aan de hand van geavanceerde tools en technieken patronen te detecteren en profielen op te stellen. Bovendien is datamining een vakgebied dat zichzelf steeds opnieuw uitvindt.

Hoe zie je je toekomst bij de FOD Financiën?

In het kader van de fiscale fraude biedt datamining een beschrijvende en voorspellende meerwaarde. Aangezien fraude zich steeds verder ontwikkelt en steeds inventiever wordt, zal ook datamining steeds uitdagender worden. We hopen steeds meer gegevens te verzamelen om zo de kwaliteit steeds te kunnen verbeteren. Op die manier zullen de voorspellende modellen steeds accurater worden. Vanuit de FOD krijgen we ook de mogelijkheid om extra opleidingen te volgen en worden er extra tools ter beschikking gesteld zodat we ons verder blijven ontwikkelen.