Wat leer je in deze aflevering?
Elise Lems, masterstudent Artificial Intelligence aan de Radboud Universiteit, doet onderzoek naar interpreteerbare AI-modellen voor computer vision. Met strengere EU-regelgeving voor AI in kritieke sectoren zoals de zorg wordt het steeds belangrijker dat modellen hun beslissingen kunnen uitleggen, in plaats van te functioneren als ondoorzichtige 'black boxes'.
Kernbegrippen
- Black box modellen
- AI-systemen waarvan de besluitvormingslogica niet transparant is voor gebruikers of toezichthouders.
- Interpreteerbare AI
- Machine learning-modellen die hun redeneerproces en beslissingen tijdens uitvoering zelf kunnen verklaren.
- Prototype-gebaseerde redenering
- Classificatiemethode waarbij modellen nieuwe invoer vergelijken met geleerde typische voorbeelden uit trainingsdata.
- Heatmaps
- Visualisatietechnieken die achteraf aangeven welke gebieden van een afbeelding invloed hadden op een AI-beslissing.
Interview: Elise Lems
Elise, zou je jezelf willen voorstellen aan onze luisteraars?
Ja, hallo, leuk dat ik er ben. Gezellig. Nou ja, ik ben Elise, ik ben 24 jaar. Ik ben momenteel een tweedejaars Artificial Intelligence master's student aan de Radboud Universiteit in Nijmegen. En ik ben momenteel mijn scriptie aan het schrijven, mijn afstudeersscriptie hier bij Info Support. En daarbij doe ik onderzoek naar hoe we interpreteerbare modellen beter kunnen maken met gebruik van technieken die ChatGPT ook gebruikt.
Kun je iets vertellen over je onderzoek? Wat is de beginsituatie en wat ga je proberen te veranderen?
Op dit moment zien we eigenlijk dat heel veel AI-modellen die gebruikt worden, bijvoorbeeld in de zorg, nog erg van die zwarte doos-modellen zijn. Dus we weten: er komt iets in en er komt iets uit, maar eigenlijk weet niemand zo goed hoe dat werkt. En zelfs de makers van zulke modellen weten vaak niet hoe dat goed werkt, omdat er heel veel gebeurt in zo'n model wat gewoon niet begrijpbaar is. Een zwarte doos-model is eigenlijk een AI-systeem waarbij de interne werking ondoorzichtig is. Je kunt input geven en output krijgen, maar het redeneerproces ertussenin blijft verborgen, zelfs voor de makers van het model. Dit is problematisch, vooral in kritieke toepassingen waar transparantie essentieel is. Nu heb je dus een bepaalde techniek die dat soort modellen wel begrijpbaar maakt voor de gebruiker en degene die het model maakt. Maar wat we eigenlijk zien, is dat dit soort modellen die lopen nog wat achter op de beste zwarte doos-modellen die momenteel op de markt zijn. En wat we dus willen gaan proberen, is om een bepaalde techniek te gebruiken die ChatGPT ook gebruikt, die eigenlijk het model verbetert. En daardoor willen we het verschil tussen de zwarte doos-modellen en de interpreteerbare modellen kleiner maken, zodat je makkelijker kan kiezen voor de interpreteerbare modellen.
Wat is het probleem met die zwarte doos-modellen?
Het probleem is eigenlijk dat als je bijvoorbeeld dit soort modellen in hele kritieke situaties gaat gebruiken, zoals in de zorg bijvoorbeeld, of stel je wilt een hypotheek aanvragen, dan weet je eigenlijk niet zo goed waarom er een beslissing wordt gemaakt. Dus stel in de zorg: er wordt bloeddata of borstkanker-mammogrammen naar zo'n model gestuurd en die zegt 'Nou, jij hebt kanker.' Oké, goed. Hoe kom je daar dan bij? Waarom? En op dit moment wordt dat dus niet uitgelegd. En in de Europese Unie zijn ze echt enorm bezig met regelgeving maken die ervoor zorgt dat juist in dit soort kritieke situaties alleen maar modellen worden gebruikt die transparant zijn en die vertellen van 'oké, dit is waarom ik het doe'. En juist omdat dit soort regelgeving erg opkomend is – vorige week heeft de EU een goedkeuring gegeven op een van deze regelgevingen – juist daarom is het nu relevant om interpreteerbare modellen juist te verbeteren, zodat de keuze makkelijker wordt gemaakt om voor zo'n model te kiezen.
Er bestaan toch al mogelijkheden om uitleg te krijgen van hoe computer vision modellen redeneren, zoals heatmaps? Wat maakt jouw aanpak anders?
Dat is eigenlijk wel heel leuk, want je hebt dus die heatmaps en je hebt nog veel meer van dat soort technieken. Maar die zijn vooral eigenlijk begrijpbaar voor mensen die zo'n model zelf bouwen of die de techniek hebben gemaakt. Maar de bedoeling van zo'n uitlegbaar model is dat juist de gebruiker, de eindgebruiker – nou stel we hebben in de zorg dat een dokter, dat is een arts – dat die het ook kan begrijpen. Dus dat hij zegt van 'oh oké, het model vertelt mij dit, dus dit is een tumor, en nou dat zegt hij mij omdat de dichtheid dit is of de vorm is dat. En daarom komt hij tot de conclusie gezamenlijk dat het een bepaalde tumor is.' Een heatmap is een visualisatietechniek waarbij over een foto een gekleurde laag wordt geprojecteerd die aangeeft welke delen van de afbeelding het model belangrijk vond bij het nemen van een beslissing. Dit is echter een post-hoc verklaring – een verklaring achteraf – die niet altijd accuraat weergeeft hoe het model daadwerkelijk redeneert.
Dus het verschil is dat jouw model zelf de redenatie geeft, terwijl heatmaps een schatting zijn van hoe het model denkt te werken?
Ja, klopt. Dus eigenlijk wat je bij heel veel van die technieken ziet die nu heel erg veel gebruikt worden, die zijn allemaal aan het eind, die worden zeg maar toegevoegd. Dus eigenlijk heb je nog steeds een zwarte doos waar eigenlijk een soort van vergrootglas een beetje achteraf op wordt geplakt. Terwijl waar je eigenlijk naartoe wil werken, is dat zo'n model van zichzelf al uitleg gaat geven. Dus dat die zegt van 'oké, dit is mijn redeneringsproces. Dus ik zeg dat dit een kat is, omdat ik dit, dat en dat zie.' En niet achteraf van 'oké, iemand interpreteert mijn...' Het is een beetje alsof je zegt van: je denkt ergens aan en iemand interpreteert jouw woorden als iets. Als in: ik denk dat jij boos bent, maar dat weet je niet, want jij zegt dat niet zelf. Het is gewoon hoe iemand jouw woorden interpreteert.
Dus eigenlijk neemt het model tijdens het redeneren al mee hoe hij tot die conclusie komt?
Ja, dus terwijl het draait. Het model waar wij naar kijken, terwijl hij draait, kijkt hij naar bepaalde delen van vogelfoto's. En dan denkt hij van 'oké, nou, deze delen van een vogel, daar kijk ik dan naar. En die lijken op delen van vogels die ik al een keertje eerder heb gezien.' Dus een beetje als je zelf ook naar een vogel zou kijken, dat je denkt 'hé, hij heeft een rood bosje'. Nou, ik weet dat er – ja, je hebt een roodborstje, je hebt volgens mij ook nog een andere vogel die een rood bosje heeft. Nou, laat ik eens kijken wat ik nog meer kan vinden van die vogel waar die erop lijkt. Is het dan de ene vogel of is het de andere vogel? Uiteindelijk bedenk je van 'nou ik zie dat het kopje op een roodborstje lijkt, hij heeft een rood bosje, hij heeft van die schattige voetjes, dus ik denk dat het een roodborstje is.' En dat is eigenlijk hoe het model waar ik mee werk ook redeneert. Dat legt hij dus eigenlijk inderdaad, terwijl hij dat probeert te voorspellen, dat ook uit.
Wat gebeurt er als het model een verkeerde conclusie trekt?
Wat je dus eigenlijk ziet: stel hij doet het wel verkeerd, nou dan gaan we dus kijken waarom doet hij dat dan verkeerd. Nou vaak zie je dat hij gaat kijken naar bepaalde delen van zo'n foto die dan eigenlijk niet relevant zijn. Dus stel je voor, als we het toch over vogels hebben, dat we een meeuw hebben. Nou als je zelf indenkt aan een meeuw, dan denk je 'hé die zit eigenlijk wel vaak op het strand of bij het water'. Dus hoe zou zo'n foto van een meeuw eruit zien? Nou met waarschijnlijk een blauwe achtergrond of met zand ofzo. Stel je nou voor dat je een foto hebt van een mus die ook bij het water zit. Zo'n model gaat dan denken 'oh maar als ik water zie, dan denk ik zeemeeuw'. Dus dan gaat hij dus bedenken van 'nou ik vind dat eigenlijk wel heel belangrijk, water, dus ik denk dat deze mus een zeemeeuw is.' En zo doet hij dat dus verkeerd. En dat kunnen wij als mensen dan weer interpreteren, dat we denken van 'hey waarom zegt hij dat dan?' En omdat hij dan zegt van 'nou, ik heb deze achtergrond een keer eerder gezien met deze zeemeeuw, dus zeemeeuw'. En dat is dus eigenlijk precies wat we ook proberen uit te filtreren.
Hoe werkt het proces van het trainen van dit model precies?
Tijdens het trainen gaat het model allemaal stukjes van de foto pakken. En dat traint hij mee, waardoor je als je een nieuwe foto krijgt, dat hij gaat kijken van 'welke van die stukjes van de foto komen overeen met waar ik geleerd heb'. En op die manier kan hij aangeven van 'dit stukje van de snavel lijkt typisch op deze snavel die hoorde bij een roodborstje. Dit stukje van een vleugel lijkt op dit stukje van een vleugel en die hoorde ook bij dingen die ik heb gezien tijdens de training van een roodborstje.' Het is dezelfde manier – misschien bij vogels is het wat abstracter – maar als je een eigen huis hebt, word je aangeslagen voor de WOZ-waarde. Wat wordt er dan gedaan? Jouw huis wordt niet genomen als uitgangspunt. Tenminste, er wordt gezegd van: de WOZ-waarde, die bepalen we omdat jouw huis lijkt op deze huizen om jou heen, om deze reden. En daarom denken we dat jouw huis zoveel waard is. Dat is eigenlijk wat het model doet. De WOZ-waarde (Wet Waardering Onroerende Zaken) is de geschatte waarde van een woning die door de gemeente wordt bepaald. Deze wordt onder andere gebruikt voor het berekenen van gemeentelijke belastingen. De waarde wordt bepaald door vergelijking met soortgelijke woningen in de buurt – een proces dat vergelijkbaar is met hoe het prototype-gebaseerde model werkt.
Zijn er bepaalde eisen aan de inputdata waar rekening mee gehouden moet worden?
Nee, in principe niet. Eigenlijk maakt het aan de inputdata niet heel veel uit op dit moment. Dus de dataset die we gebruiken, die kijkt toevallig naar vogels, maar in principe kun je het op elke data die te maken heeft met foto's of andere dingen gebruiken.
En hier komt de menselijke feedback in beeld. Hoe ga je dat precies aanpakken?
Wat wij dus proberen te verbeteren, is dus dat hij eigenlijk leert van 'oké, dit zijn de delen van foto's waar ik wel naar moet kijken en dit zijn delen waar ik niet naar moet kijken'. En dit is dus eigenlijk waar wij mensen in de loop komen. En wat ik ga doen, is dat ik aan mensen ga vragen van 'hé, dit is de uitleg van het model, vertel mij wat je daarvan vindt. Vertel mij wat je een goede uitleg vindt en vertel me wat je geen goede uitleg vindt.' En die uitleg van de mens – dat is dus zijn feedback – die zegt van 'dit is wel goed om naar te kijken, dit is niet goed om naar te kijken'. En eigenlijk proberen we met de uitleg van de mens de uitleg van het model te verbeteren. Dus we proberen eigenlijk het model af te leren om naar de verkeerde dingen te kijken, maar ook aan te leren om juist naar de goede gedeeltes van de foto te kijken.
Wat is dan de relatie met ChatGPT in dit verhaal?
ChatGPT en dat is met meerdere AI-chatbots – wat je vaak hoort, volgens mij was het laatst met Bing ook: als je hem dan vragen ging stellen, werd hij op een gegeven moment heel boos, of dan kwam hij over alsof hij boos was. En dan gaf hij je antwoorden dat je denkt 'oh, oké'. Of je kon hem dingen vragen die eigenlijk niet helemaal door de beugel konden en daar kon hij ook eigenlijk wel goed antwoord op geven. Dus je denkt 'oh, dat is niet helemaal de bedoeling om dat aan bepaalde gebruikers te laten zien.' Nou, wat ChatGPT dus heeft gedaan, is dat hij eigenlijk het model heeft geleerd om bepaalde antwoorden niet te geven, en ook om wat vriendelijker te reageren. En hoe hij dat heeft gedaan, is dus op dezelfde manier aan mensen gevraagd: 'oké, nou het model zegt dit antwoord, ChatGPT die geeft voor een bepaalde vraag deze antwoorden, nou welke vind je wel goed en welke vind je niet goed?' Dus ze zetten twee antwoorden naast elkaar. Dus een mens krijgt twee antwoorden naast elkaar en die besluit van 'deze vind ik beter dan de ander.' Deze techniek heet RLHF: Reinforcement Learning from Human Feedback, oftewel versterkend leren met menselijke feedback. Bij deze aanpak worden AI-modellen niet alleen getraind op data, maar krijgen ze ook feedback van mensen over de kwaliteit van hun output. Dit helpt het model om gedrag te leren dat beter aansluit bij menselijke verwachtingen en waarden.
Dus het model genereert meerdere mogelijkheden en mensen geven aan welke ze beter vinden?
Ja. Hij genereert meerdere antwoorden en die worden inderdaad dan naast elkaar gelegd van 'nou, vind je deze dan beter of vind je die beter?' En zo krijg je eigenlijk ook weer een soort ranking. En dat gerangschikte – zeg maar die verschillende antwoorden – die worden dan gebruikt om vervolgens te zeggen van 'nou, eigenlijk vinden we: als je zoiets zegt, vind ik het eigenlijk fijner dan als je iets anders zegt wat minder vriendelijk is.' Want we denken namelijk dat ChatGPT alles zelf leert. Het gaat over de data, maar er zit zo ontzettend veel mensenwerk omheen om de goede dingen te geven die wij verwachten in ieder geval.
Speelt cultuur en achtergrond ook een rol bij het interpreteren van wat een goed antwoord is?
Ja, en dat is juist zo belangrijk. Daar gaat mijn onderzoek over. Want ook dit model kan heel veel van die – dat noemen ze dan prototypes – naast elkaar houden en zeggen van 'dit is jouw uitleg van al die blokjes van de foto'. Maar wat vinden wij nou belangrijk als mens om te zien? Elk mens is anders, dus iedereen vindt er ook wat anders van. En wat jij vindt wordt ook beïnvloed door waar je vandaan komt, en wie je kent en met wie je omgaat. En zeker met zo'n ChatGPT is het dan van 'oké, wie vraag je daar dan voor om daar een mening over te geven?' Nu zitten wij op het punt van: oké, voor ons maakt het niet heel veel uit. We vragen wel omdat we met vogels werken een aantal vogelexperts. Maar we vragen vooral om heel veel response. Dus we willen vooral heel veel mensen vragen om dat te doen, want met zoiets trainen is eigenlijk massa escassa. Dat is wat we willen.
Maar voor medische toepassingen zou je dan specifieke experts nodig hebben?
Ja, uiteindelijk, als je zoiets wil gebruiken zoals ChatGPT dat doet, worden dus enorm veel specifieke mensen gevraagd om dat te doen. Dus stel je zou uiteindelijk wel iets met kanker willen doen of een andere medische applicatie, dan moet je dus experts gaan vragen, dus dokters, om dat dan voor je te doen.
Kun je een voorbeeld geven van hoe interpreteerbare modellen praktische problemen kunnen voorkomen?
Een van de leuke voorbeelden die helpen bij dat interpreterbaar maken – ik leg vaak de link naar de zorg en ik denk dat het wel een hele mooie is – want een van de gevallen die ooit eens een keer is opgetreden, is dat ze, volgens mij ging het over longkanker, dus röntgenfoto's van wel of niet longkanker gebruikten. En die deden het in de training en met de testset kwamen daar hele nauwkeurige modellen uit. Super nauwkeurig, zag er hartstikke goed uit. In het wild niet. Totaal niet. Performde helemaal niet. En wat gebeurde erdoor, is dat radiologen een soort van hele kleine aantekeningetjes maakten aan de zijkant van de röntgenfoto's. Wat had dat model geleerd? Het begrijpen van die scribbles, van die kleine aantekeningen van een radioloog. Die waren natuurlijk niet meer – als de radioloog niet zegt van 'ik zie dit', dan kon het model daar niet meer uitkomen. Een van de dingen waarvan we hopen met dit onderzoek, is dat dit soort gevallen, dat je die heel makkelijk eruit haalt. Net de zeemeeuw met een blauwe achtergrond. Ik denk dat dat voor iedereen duidelijk is dat je denkt van 'ja maar, ja, hallo'. Maar juist dit soort hele subtiele zaken, waarvan je – als je niet weet hoe je model redeneert – het dus heel moeilijk is om erachter te komen of die wel de juiste besluiten neemt, de juiste uitkomsten geeft, op basis van de juiste redenering.
Dus het model kan een goed antwoord geven op basis van een foute redenering?
Ja, en dat wil je afvangen. In het scenario van de longkanker zou een heatmap volgens mij al best wel snel kunnen zeggen 'kijk helemaal alleen maar aan de zijkant waar de scribble staat'. Maar dit voegt dus nog een extra perspectief toe aan die heatmap functionaliteit waar we in het begin over hadden. Want meerdere manieren om naar een probleem te kijken is altijd beter. Als we het daardoor verklaarbaarder krijgen, lijkt me dat alleen maar mooi.
Waarom is dit onderzoek zo belangrijk in de huidige context?
Ik denk dat het best wel een heel baanbrekend onderzoek is. Er wordt heel veel onderzoek gedaan naar hoe krijgen we het nog nauwkeuriger, nog beter, nog sneller. Terwijl, als we het niet kunnen interpreteren – ik haalde al de EU-wetgeving aan – dan is uiteindelijk een model waardeloos en kan je er heel erg weinig mee. Als je het heel snel fout kan, is het nog steeds fout. In een tijd waarin AI steeds meer wordt ingezet in kritieke beslissingen die direct impact hebben op mensenlevens – van medische diagnoses tot hypotheekaanvragen – is transparantie geen luxe meer, maar een noodzaak. De Europese AI Act, die recent is goedgekeurd, stelt strenge eisen aan het gebruik van AI in hoogrisicogebieden. Systemen moeten niet alleen nauwkeurig zijn, maar ook uitlegbaar en controleerbaar. Het onderzoek van Elise richt zich precies op deze uitdaging: hoe kunnen we AI-modellen maken die zowel goed presteren als begrijpelijk zijn voor de mensen die ermee werken? Door menselijke feedback te integreren in het trainingsproces, kunnen we modellen creëren die niet alleen leren van data, maar ook van menselijke expertise en waarden. De technieken die bij ChatGPT zijn toegepast om het model vriendelijker en veiliger te maken, kunnen dus ook worden gebruikt om computer vision modellen betrouwbaarder te maken. Dit is een mooie illustratie van hoe verschillende AI-domeinen van elkaar kunnen leren en hoe innovaties in het ene gebied toegepast kunnen worden in het andere. Kernpunten en Praktische Adviezen Zwarte doos-modellen vormen een risico in kritieke toepassingen: AI-systemen die geen uitleg geven over hun beslissingen kunnen leiden tot onbegrepen fouten, vooral problematisch in de zorg, financiële dienstverlening en andere sectoren waar transparantie essentieel is. Interpreteerbare modellen moeten concurreren met zwarte doos-modellen: Het doel is het verkleinen van de prestatiekloof tussen begrijpbare en niet-begrijpbare modellen, zodat organisaties makkelijker kunnen kiezen voor transparantie zonder grote concessies te doen aan nauwkeurigheid. Menselijke feedback verbetert AI-modellen: Door experts en gebruikers te vragen welke uitleg van een model goed is en welke niet, kunnen modellen worden getraind om zich te richten op de juiste kenmerken en de verkeerde te negeren. ChatGPT-technieken zijn toepasbaar buiten taalmodellen: Reinforcement Learning from Human Feedback (RLHF), de techniek die ChatGPT vriendelijker en veiliger maakte, kan ook worden toegepast op computer vision en andere AI-domeinen. EU-regelgeving maakt interpreteerbare AI urgent: De recent goedgekeurde AI Act van de Europese Unie stelt strenge eisen aan transparantie en uitlegbaarheid, vooral voor AI-systemen in hoogrisicogebieden. Heatmaps zijn niet genoeg: Post-hoc verklaringsmethoden zoals heatmaps bieden slechts een schatting van hoe een model redeneert. Werkelijk interpreteerbare modellen geven zelf uitleg tijdens het redeneerproces. Context en achtergrond kunnen leiden tot verkeerde conclusies: Modellen kunnen leren kijken naar irrelevante kenmerken (zoals water bij meeuwen) in plaats van naar de daadwerkelijk relevante kenmerken van het object. Prototype-gebaseerd leren maakt AI begrijpelijk: Door foto's op te delen in herkenbare delen en deze te vergelijken met eerder geleerde prototypes, kan een model uitleggen welke kenmerken het heeft herkend en waarom. Domeinexpertise is cruciaal bij menselijke feedback: Voor medische toepassingen is feedback van artsen noodzakelijk, terwijl bij minder kritieke toepassingen bredere feedback kan volstaan. Goede prestaties met verkeerde redeneringen zijn gevaarlijk: Een model kan hoge nauwkeurigheid bereiken door de verkeerde redenen (zoals het herkennen van notities van radiologen in plaats van medische kenmerken), wat pas duidelijk wordt bij interpreteerbare modellen. Transparantie en nauwkeurigheid moeten samengaan: Het is niet genoeg dat een model snel een antwoord geeft – als het antwoord gebaseerd is op verkeerde redeneringen, blijft het fout, hoe snel of nauwkeurig het ook lijkt. AIToday Live is een podcast die zich richt op de nieuwste ontwikkelingen in AI en de impact ervan op verschillende sectoren. In elke aflevering spreken hosts Niels Naglé en Joop Snijder met experts uit het veld om inzicht te krijgen in de mogelijkheden en uitdagingen van AI-technologie. Luister via je favoriete podcast app: Spotify, Apple podcasts, YouTube Music, en meer.
Over de gast
Elise Lems is een 24-jarige masterstudent Artificial Intelligence aan de Radboud Universiteit in Nijmegen, waar ze momenteel haar scriptie schrijft. Haar onderzoek richt zich op het verbeteren van interpreteerbare modellen door gebruik te maken van technieken die ook in ChatGPT worden toegepast. Dit heeft als doel om de transparantie van AI-modellen te vergroten, vooral in kritieke toepassingen zoals de zorg.
Bekijk gastprofielTranscript
[Muziek] Hoi, leuk dat je weer luistert naar een nieuwe aflevering van de AIToday Live. Mijn naam is Joop Snijder, CTO bij Aigency. En mijn naam Niels Naglé, chapter lead Data & AI bij Info Support. En we hebben vandaag een heel erg leuk en interessant onderwerp, want we gaan het hebben over computer vision. En dat gebruikt de gasten die we vandaag hebben, die gebruikt de technieken van ChatGPT voor. Hoe leuk is dat, toch? Top, ik ben erg benieuwd. Ja, en onze gast is Elise Lembs. Elise zou jij willen voorstellen aan onze luisteraars. Ja, nou, hallo, leuk dat ik er ben. Gezellig. Nou ja, ik ben Elise, ik ben 24 jaar. Ik ben momenteel een tweedejaars Artificial Intelligence master's student aan de Rappout Universiteit in Nijmegen. En ik ben momenteel mijn scriptie aan het schrijven, mijn afsteuningsscriptie hier bij InfoSupport. En daarbij doe ik onderzoek naar hoe we interpreteerbare modellen beter kunnen maken. met gebruik van technieken die ChatGPT ook gebruikt. Klinkt interessant. Ja, toch? Ja. En zou je iets kunnen vertellen over hoe ziet dat er dan uit? Wat is je beginsituatie en wat ga je proberen te veranderen? Nou, op dit moment zien we eigenlijk dat heel veel AI-modellen die gebruikt worden, bijvoorbeeld in de zorg, nog erg van die zwarte doosmodellen zijn. Dus we weten, er komt iets in en er komt iets uit, maar eigenlijk weet niemand zo goed hoe dat werkt. En zelfs de makers van zulke modellen weten vaak niet hoe dat goed werkt, omdat er heel veel gebeurt in zo'n model wat gewoon niet begrijpbaar is. En nu heb je dus een bepaalde techniek die dat soort modellen wel begrijpbaar maakt voor de gebruiker en degene die het model maakt. Maar wat we eigenlijk zien, is dat dit soort modellen, die lopen nog wat achter op de beste zwarte doosmodellen... die momenteel op de markt zijn. En wat we dus willen gaan proberen, is om een bepaalde techniek te gebruiken... die Chatgyp ook gebruikt, die eigenlijk het model verbetert. En daardoor willen we het verschil tussen de zwarte doosmodellen... en de interpreteerbare modellen kleiner maken. Zodat je makkelijker kan kiezen voor de interpreteerbare modellen. Ja, en om het nog even wat spannend te houden, schuiven we het chat-gbt gedeelte even op. Maar wat is nu dan bijvoorbeeld het probleem met die blackbox modellen? Nou, het probleem is eigenlijk dat als je bijvoorbeeld dit soort modellen in hele kritieke situaties gaat gebruiken, zoals in de zorg bijvoorbeeld, of in, nou stel je wilt een hypotheek aanvragen, dan weet je eigenlijk niet zo goed waarom er een beslissing wordt gemaakt. Dus stel in de zorg komen ze met... Er wordt iets van bloeddata of borstkanker-mammogrammen. Die worden naar zo'n model gestuurd en die zegt 'Nou, jij hebt kanker. Oké, goed. Hoe kom je daar dan bij? Waarom?' En op dit moment wordt dat dus niet uitgelegd. En in de Europese Unie zijn ze echt enorm bezig met regelgeving maken... die ervoor zorgt dat juist in dit soort kritieke situaties... alleen maar modellen worden gebruikt die transparant zijn... en die vertellen van oké dit is waarom ik het doe en juist omdat dit soort regelgeving erg opkomend is. Vorige week is de EU heeft een goedkeuring gegeven op een van deze regelgevingen. Juist daarom is het nu relevant om interpreteerbare modellen juist te verbeteren zodat de keuze makkelijker wordt gemaakt om voor zo'n model te kiezen. Dus als ik het goed begrijp houden we dus Dus de mogelijkheid om die modellen wel te gebruiken, omdat we die beter uitlegbaar krijgen. Want anders zou het niet meer mogen om het te gebruiken. Ja, dus er komen hele strenge regelgevingen op gebruik van AI. En zeker in de zorg bijvoorbeeld. Dat het moet uitlegbaar zijn, het moet transparant zijn. Anders mag je het waarschijnlijk niet meer gaan gebruiken. Ja. Ja, maar Elise, er bestaan toch al mogelijkheden om uitleg te krijgen... van hoe computer vision modellen redeneren. Je hebt zoiets als heatmaps, dat je zo'n gekleurde plaat over een foto krijgt... en dat die zegt, maar hier, op juist dit gedeelte... daar herken ik de delen van een hond en daarom vind ik dat het een hond is. Wat maakt het bij jou anders? Nou, dat is eigenlijk wel heel leuk, want je hebt dus die heatmaps... en je hebt nog veel meer van dat soort technieken. Maar die zijn vooral eigenlijk begrijpbaar voor mensen die zo'n model zelf bouwen... of die de techniek hebben gemaakt. Maar de bedoeling van zo'n uitlegbaar model is dat juist de gebruiker, de eindgebruiker, nou stel we hebben even in de zorg dat een dokter, dat is een arts, dat ook kan begrijpen. Dus dat hij zegt van, oh oké, het model verdeelt mij dit, dus dit is een tumor. En nou dat zegt hij mij omdat de dichtheid dit is of de vorm is dat. En daarom komt hij tot de conclusie gezamenlijk dat het een bepaalde tumor is. Ja, en die heatmaps, zoals dat dan heet, volgens mij is daar ook een heel groot verschil met het onderzoek wat jij doet. Dat zijn allemaal schattingen van hoe gedacht wordt dat het model werkt. Van buitenaf wordt zo'n model eigenlijk... Er wordt eraan geprikkeld en getrokken en gedaan. en dan wordt er gezegd, nou, dit denken we, met een nieuw model van zo heeft hij geredeneerd. Terwijl je nu heel erg kijkt naar daadwerkelijk interpreterbaarheid van het model zelf. Dus die geeft zelf de redenatie hoe die tot een bepaalde klassificatie is gekomen, toch? Ja, klopt. Dus eigenlijk wat je dus heel veel van die technieken die nu heel erg veel gebruikt worden, die zijn allemaal aan het eind worden die zeg maar toegevoegd. Dus eigenlijk heb je nog steeds een zwarte doos waar eigenlijk een soort van vergrootglas een beetje achteraf op wordt geplakt. Terwijl waar je eigenlijk naartoe wil werken, is dat zo'n model van zichzelf al uitleg gaat geven. Dus dat die zegt van, oké, dit is mijn redeneringsproces. Dus ik zeg dat dit een kat is, omdat ik dit dat en dat zie. En niet achteraf van, oké, iemand interpreteert mijn... Het is een beetje alsof je zegt van, je denkt ergens aan en iemand interpreteert jouw woorden als iets. Als in, ik denk dat jij boos bent, maar dat weet je niet, want jij zegt dat niet zelf. Het is gewoon hoe iemand jouw woorden interpreteert. - Dus eigenlijk ten tijde dat het model aan het ontdekken, benaderen is wat zijn eindconclusie gaat worden, neemt hij dus mee hoe hij tot die beredenering komt. Dus eigenlijk 'at runtime', of hoe we het maar even zo zullen zeggen. Dus terwijl het draait, en niet achteraf. - Ja, dus terwijl het draait, Het model waar wij naar kijken, terwijl hij draait, kijkt hij naar bepaalde delen van vogelfoto's. En dan denkt hij van, oké, nou, deze delen van een vogel, daar kijk ik dan naar. En die lijken op delen van vogels die ik al een keertje eerder heb gezien. Dus een beetje als je zelf ook naar een vogel zou kijken, dat je denkt, hé, hij heeft een rood bosje. Nou, ik weet dat er, ja, je hebt een rooibos, je hebt volgens mij ook nog een andere vogel die een rood bosje heeft. Nou, laat ik eens kijken wat ik nog meer kan vinden van die vogel waar die erop lijkt. is het dan de ene vogel of is het de andere vogel? Uiteindelijk bedenk je van, nou ik zie dat het kopje op een rooie bos lijkt, hij heeft een rood bosje, hij heeft van die schattige voetjes, dus ik denk dat het een rood bosje is. En dat is eigenlijk hoe het model waar ik mee werk ook reërneert. Dat legt hij dus eigenlijk inderdaad, terwijl hij dat probeert te voorspellen, legt hij dat ook uit. Dus gaandeweg probeert hij context te maken En dat is een stappen die de hud-systeem neemt. We waren het weer aan het personaliseren. Het blijft een systeem. Gaat hud-systeem inderdaad de volgende stap doen... om te kijken van, inderdaad, rood bosje, voetjes, vleugels, noem het dan maar op. Zo kom ik er. Neemt hij dus eigenlijk dat helemaal van het begin af aan mee? En wat ik me dan afvraag is... op een gegeven moment maakt hij een bepaalde keuze... die misschien conflicterend is. En dan zou hij weer in de context een paar stappen teruggaan. Ja, dus wat je dus eigenlijk ziet, stel hij doet het wel verkeerd, nou dan gaan we dus kijken waarom doet hij dat dan verkeerd. Nou vaak zie je dat hij gaat kijken naar bepaalde delen van zo'n foto, die dan eigenlijk niet relevant zijn. Dus stel je voor, als we het toch over vogels hebben, dat we een meeuw hebben. Nou als je zelf indenkt aan een meeuw, dan denk je, hé die zit eigenlijk wel vaak op het strand of bij het water. Dus hoe zou zo'n foto van een meeuw eruit zien? Nou met waarschijnlijk een blauwe achtergrond of met zand ofzo. Stel je nou voor dat je een foto hebt van een mus die ook bij het water zit. Zo'n model gaat dan denken, oh maar als ik water zie, dan denk ik zeemeel. Dus dan gaat hij dus bedenken van, nou ik vind dat eigenlijk wel heel belangrijk, water. Dus ik denk dat deze mus een zeemeel is. En zo doet hij dat dus verkeerd. En dat kunnen wij als mensen dan weer interpreteren. Dat we denken van, hey waarom zegt hij dat dan? En omdat hij dan zegt van nou, ik heb deze achtergrond een keer eerder gezien... met deze zemio, dus de zemio. En dat is dus eigenlijk precies wat we ook proberen uit te filtreren. Oké, interessant. Ja, en wat je dus daarmee doet, is dat je dus... En wat jij zegt, doet hij dat onder hun armen? Hij doet het eigenlijk tijdens training. Ja. -Tijdens trainen... Als ik het goed uitleg, hè Elise, jij onderbreekt mij als het niet zo is. Ik begeleid Elise in haar onderzoek. Wat er gedaan wordt tijdens het trainen, dan gaat hij allemaal stukjes van de foto pakken. En dat traint hij mee, waardoor je als je een nieuwe foto krijgt, dat hij gaat kijken van welke van die stukjes van de foto komen overeen met waar ik geleerd heb. En op die manier kan hij aangeven van, precies wat zij zeiden, Dit stukje van de snavel lijkt typisch op deze snavel. Die hoorde bij een rood borstje. Dit stukje van een vleugel lijkt op dit stukje van een vleugel. En die hoorde ook bij dingen die ik heb gezien tijdens de training van een rood borstje. En het is dezelfde manier, misschien bij vogels is het wat abstracter, maar als je een eigen huis hebt, word je aangeslagen voor de WOZ-waarde. Wat wordt er dan gedaan? Jouw huis wordt niet genomen als uitgangspunt. Tenminste, er wordt gezegd van de WOZ-waarde, die bepalen we... omdat jouw huis lijkt op deze huizen om jou heen, om deze reden. En daarom denken we dat jouw huis zoveel waard is. Dat is eigenlijk wat het model, wat zij gebruikt, dat die dat doet. Ja, dus train time is eigenlijk het design time. neem je dit dus mee als ik een model ga maken, het design time wil ik een interpretatie meenemen. Ja, klopt. Dus op het trainer leert hij dus van al die verschillende vogels, dat hij ziet, dat dit allemaal typische delen van die vogels zijn. En die neemt hij dan mee tijdens runtime, als je iets nieuws probeert te vinden. Dan kijkt hij dus naar bepaalde delen van het nieuwe vogel, en dan kijkt hij dus naar de typische delen die hij al een keer geleerd heeft, tijdens de train time. En op basis daarvan zegt hij, Dit lijkt op dat typische gedeelte wat Joop net zegt. Zijn er nog bepaalde eisen aan de inputkant... waar we extra rekening mee moeten houden om die modellen goed interpreterbaar te krijgen? Aan de inputkant? Ja, dus de foto's, de data, de eventuele klassificatie, tagging... dat soort zaken waar extra naar gekeken moet worden? Nee, in principe niet. Oké. Wat... We zijn even zo overgegaan naar de vogels... maar dat heeft een heel duidelijke achtergrond. Want dit model wat we nu beschrijven, bestaat. En dat is het uitgangspunt van haar onderzoek, is dit model, dus dit bestaat. Wat was er... Oh ja, die input data. We komen zo direct namelijk op waar zij dingen aan gaat veranderen, verbeteren. Maar dit model bestaat, deze manier bestaat. En we gaan dit gebruiken als een baseline-model... om te kijken of het onderzoek van Elise ervoor gaat zorgen... dat het model beter wordt en beter uitlegbaar wordt. Maar dat kan ze, denk ik, zelf nog beter uitleggen. Ja, dus eigenlijk maakt het aan de inputdata niet heel veel uit op dit moment. Dus de dataset die we gebruiken, die kijkt toevallig naar vogels. Maar in principe kun je het op elke data die te maken heeft met foto's of andere dingen... die kun je daarvoor gebruiken. Maar wat wij dus inderdaad proberen te verbeteren, is dus dat hij eigenlijk leert van... oké, dit zijn de delen van foto's waar ik wel naar moet kijken en dit zijn delen waar ik niet naar moet kijken. En dit is dus eigenlijk waar wij mensen, zeg maar, in de loop komen. En wat ik ga doen, is dat ik aan mensen ga vragen van... hé, dit is de uitleg van het model, vertel mij wat je daarvan vindt. Vertel mij wat je een goede uitleg vindt en vertel me wat je geen goede uitleg vindt. En die uitleg van de mens, dat is dus zijn feedback, die zegt van... dit is wel goed om naar te kijken, dit is niet goed om naar te kijken. En eigenlijk proberen we met de uitleg van de mens... de uitleg van het model te verbeteren. Dus we proberen eigenlijk het model af te leren om naar de verkeerde dingen te kijken... maar ook aan te leren om juist naar de goede gedeeltes van de foto te kijken. Oké. Helder. Dat is eigenlijk ook het stukje wat ze gebruiken bij Chitchipity. Daarom, daar wil ik naar naartoe inderdaad. Wat is dan de relatie met chatgpt in dit verhaal? Nou, chatgpt en dat is met meerdere chatbots, met meerdere AI-chatbots, wat je vaak hoort. Volgens mij was het laatst met Bing ook. Als je hem dan vragen ging stellen, werd hij op een gegeven moment heel boos. Of dan kwam hij over alsof hij boos was. En dan gaf hij je antwoorden dat je denkt, oh, oké. Of je kon hem dingen vragen die eigenlijk niet helemaal door de beugel konden... en daar kon hij ook eigenlijk wel goed antwoord op geven. Dus je denkt, oh, dat is niet helemaal de bedoeling om dat aan bepaalde gebruikers te laten zien. Nou, wat Chet Chibuti dus heeft gedaan, is dat hij eigenlijk het model heeft geleerd om bepaalde antwoorden niet te geven, en ook om wat vriendelijker te reageren. En hoe hij dat heeft gedaan, is dus op dezelfde manier aan mensen gevraagd, oké, nou het model zegt dit antwoord, van Chet Chibuti, die geeft voor een bepaalde vraag deze antwoorden, nou welke vind je wel goed en welke vind je niet goed? Dus ze zetten twee antwoorden naast elkaar, hè? Dus een mens krijgt twee antwoorden naast elkaar... en die besluit van deze vind ik beter dan de ander. Ja. -Ja. Dus uiteindelijk heb je... Hij genereert meerdere antwoorden... en die worden inderdaad dan naast elkaar gelegd van... nou, vind je deze dan beter of vind je die beter? En zo krijg je eigenlijk ook weer een soort ranking. En dat gerangschikte, zeg maar, die verschillende antwoorden... die worden dan gebruikt om vervolgens te zeggen van... nou, eigenlijk vinden we... Als je zoiets zegt, vind ik het eigenlijk fijner dan als je iets anders zegt, wat minder vriendelijk is. Want we denken namelijk dat ChattyPT alles zelf leert. Het gaat over de data, maar er zit zo ontzettend veel mensenwerk omheen... om de goede dingen te geven die wij verwachten in ieder geval. Ja, en dan denk ik, maar goed, dan gaan we wel weer op ChattyPT verder. Maar dat eigenlijk ook weer aan degene die de ontvanger is, hoe je het interpreteert. En dat zou cultuur aan de achtergrond best wel grote impact kunnen hebben. - Ja, maar juist dit is zo belangrijk. Daar gaat haar onderzoek over. Want ook dit model kan heel veel van die, dat noemen ze dan prototypes, naast elkaar houden en zeggen van, dit is jouw uitleg van al die blokjes van de foto. Maar wat vinden wij nou belangrijk als mens om te zien? - Ja, en volgens mij wat Niels ook net zei, Elk mens is anders, dus iedereen vindt er ook wat anders van. En wat jij vindt wordt ook beoordeeld of daarin wordt meegenomen waar je vandaan komt, en wie je kent en met wie je omgaat. En zeker met zo'n chat GPT is het dan van oké, wie vraag je daar dan voor om daar een mening over te geven. Nu zitten wij op het punt van oké, voor ons maakt het niet heel veel uit. We vragen wel omdat we met vogels werken een aantal vogel experts. Maar we vragen vooral om heel veel response. Dus we willen vooral heel veel mensen vragen om dat te doen. Want met zoiets trainen is eigenlijk massa escassa. Dat is wat we willen. Maar uiteindelijk, als je zoiets wil gebruiken zoals dat Jetripte dat doet, worden dus enorm veel specifieke mensen gevraagd om dat te doen. Dus stel je zou uiteindelijk wel iets met kanker willen doen of een andere medische applicatie, Dan moet je dus experts gaan vragen, dus dokters, om dat dan voor je te doen. Gewoon uit nieuwsgierigheid. Staat de vraag nog uit voor mensen om bijdrage te leveren aan je onderzoek? De vraaglijst gaat er binnenkort uit. En dan zullen we even een linkje op LinkedIn zetten. Oh ja, dan kunnen wij het ook wel opnemen in de show note. Dat is misschien wel leuk. Kunnen luisteraars gelukkig bijdragen aan een beter interpreteerbare oplossing. Dat zou heel mooi zijn. Ja toch? Dat kunnen we zeker doen. Een van de leuke dingen die helpen bij dat interpreterbaar maken, want Elise legt vaak de link naar de zorg en ik denk dat het wel een hele mooie is, want een van de gevallen die ooit eens een keer is opgetreden, is dat ze, volgens mij ging het over longkanker. Dus, hoe noem je dat? Rundgefoto's van wel of niet longkanker. En die deden het in de training en met de test set kwamen daar hele nauwkeurige modellen uit. Super nauwkeurig, zag er hartstikke goed uit. In het wild niet. Totaal niet. Performde helemaal niet. En wat gebeurde erdoor, is dat radiologen een soort van hele kleine aantekeningetjes maakten... aan de zijkant van de rundgefoto's. Wat had dat model geleerd? Het begrijpen van die scribbles, van die kleine aantekeningen van een radioloog. Die waren natuurlijk niet meer, als de radioloog niet zegt van ik zie dit, dan kon daar de machine niet meer uitkomen. Nee. Een van de dingen waarvan we hopen met dit onderzoek, is dat dit soort gevallen, dat je die heel makkelijk eruit haalt. Net de zeemeel met een blauwe achtergrond. Ik denk dat dat voor iedereen duidelijk is dat je denkt van ja maar, ja, hallo. Maar juist dit soort hele subtiele zaken, waarvan je, als je niet weet hoe je model redeneert, is het dus heel moeilijk om erachter te komen of die wel de juiste besluiten neemt, de juiste uitkomsten geeft, op basis van de juiste redenering. Je kan hem... Zeg ik het nou goed? Hij kan dus een goed antwoord geven op basis van een foute redenering. Ja, en dat wil je afvangen. Maar goed, in dit scenario zou ik zeggen... ...dat zou de heatmap volgens mij al best wel snel kunnen zeggen... ...kijk helemaal alleen maar aan de zijkant waar de scribble staat. Maar dit voegt dus nog een extra perspectief toe... ...aan die heatmap functionaliteit waar we in het begin over hadden. Ja, klopt, ja. Nou, weer is beter in dat geval. Als we het daardoor verklaarbaarder krijgen, lijkt me dat alleen maar mooi. Ja toch? - Ja zeker. In die zin denk ik dat het best wel een heel baanbrekend onderzoek is dat Elise doet. Er wordt heel veel onderzoek gedaan naar hoe krijgen we het nog nauwkeuriger, nog beter, nog sneller. Terwijl, als we het niet kunnen interpreteren, ze haalde al de EU-wetgeving aan, dan is uiteindelijk een model waardeloos en kan je er heel erg weinig mee. Als je het heel snel fout kan, is het nog steeds fout. Exact. Precies. - Ja, klopt. Hé, Elise, dank je wel voor de inzichten. Dank je wel om het uit een te zetten. Ik denk, ook vooral in heldere, duidelijke talen mag ik hopen. Niels is een beetje de testobject hier. - Testobject. Dus dank je wel voor je inzichten. - En mocht het niet duidelijk zijn... laat even een reactie achter en neem contact met ons op... want dan zorgen we dat we het nog helder kunnen krijgen. Absoluut. - Goed. Dank je wel. Leuk dat je weer luisterde naar een nieuwe aflevering van AI Today Live. Mis geen aflevering, abonneer je via je favoriete podcast app en krijg automatisch een seintje als er een nieuwe aflevering online staat. TV Gelderland 2021 (C) TV GELDERLAND 2021