Auteur: Big Data Expo

Het Belang van onzekerheid bij Machine Learning modellen

Algoritmes geven een schijnzekerheid, aangezien we de distributie van onzekerheid bij een uitkomst van een puntschatting niet zien. In deze podcast gaan we in gesprek met Lieke Kools en Richard Bartels van Vantage AI over het belang van onzekerheid in Machine Learning (ML) modellen. We praten over hoe data scientists en eindgebruikers hiermee moeten leren omgaan.

Eerst: even voorstellen

Wie zijn de gasten van deze aflevering? Lieke Kools is werkzaam als data scientist bij Vantage AI. “We bestaan nu net een jaar, en zolang werk ik er ook.” Richard Bartels is eveneens data scientist bij Vantage AI, “Ook sinds een jaar. Ik werk momenteel aan beeldherkenning bij ProRail.” 

Vantage AI is een data science consultant en is het zusje van Big Data Republic. Kools: “Daar zitten de mensen die de projecten trekken. Wij doen meer het uitvoerende werk.” 

Het belang van onzekerheid

Er wordt in ML veel gebruikgemaakt van puntvoorspellingen (voor een goede uitleg over wat hiermee wordt bedoeld, luister je de podcast). Bartels: “ML zoals we het nu kennen is echter nog vrij nieuw, er zitten dus nog veel onzekerheden in en we hebben het idee dat nog niet de hele Machine Learning community zich daarvan bewust is.” 

Kools vult aan en ziet er nog niet perse een trend in dat onzekerheid wordt meegenomen in een voorspelling. Toch is dat volgens beide data scientists van groot belang, omdat dit de betrouwbaarheid van je model vergroot. 

Als casus neemt Kools de zorg: “Als je een beslissing over een moedervlek wil nemen – of die weg gehaald moet worden of niet – en je laat het ML model beslissen, wil je weten of het advies sluitend is of niet, want je wil het weten wanneer het model niet zeker is van zijn besluit. Ik heb het idee dat we hier meer mee kunnen. Als het ML model niet zeker weet, maar toch besluit om de moedervlek niet weg te laten halen, kan dit problematisch worden."

Bartels voegt toe: “Als je weet dat je meet met data waar een onzekerheid in zit, dan helpt dat in het scopen van je probleem en de aanpak daarvan.” 

Kools: “Juist omdat data science zo vreemd is voor veel mensen, is het goed om te weten dat er ook onzekerheden in kunnen zitten. Vaak denken mensen dat er een soort van magie plaatsvindt waar een feilloze voorspelling uitkomt, die dan als waarheid beschouwd wordt. De eerlijke waarheid is toch om te zeggen dat er altijd onzekerheden voorkomen.”

Voor meer toelichting over de complexiteit achter deze Machine Learning modellen en waarom onzekerheden juist zo van belang zijn bij dit soort modellen, luister je de podcast.

Klik hier om de andere afleveringen te beluisteren.

Machine Learning Data Science Vantage.ai

Reactie toevoegen