Wat leer je in deze aflevering?
In deze aflevering van AIToday Live staat Sako Arts, CTO bij Fruitpunch AI, centraal. Arts deelt zijn expertise over het baanbrekende project AI for Good. Dit initiatief richt zich op het aanpakken van grote maatschappelijke uitdagingen met behulp van kunstmatige intelligentie, in lijn met de duurzaamheid doelstellingen van de Verenigde Naties. Een specifiek voorbeeld dat naar voren komt, is het inzetten van AI voor de bescherming van wilde dieren in Zuid-Afrika, waar technologie en ecologie hand in hand gaan. Het gesprek biedt naast praktijkcases ook inzicht in de uitdagingen en mogelijke oplossingen binnen de wereld van AI for Good, waarmee het luisteraars meeneemt in de impactvolle reis van technologische innovatie naar maatschappelijk nut.
Interview: Sako Arts
Kun je je voorstellen aan onze luisteraars en uitleggen wat Fruitpunch AI precies doet?
Natuurlijk, aangenaam. Ik ben Sako Arts, CTO van Fruitpunch AI. Wij bouwen samen de wereldwijde AI for Good community. Wat dat precies betekent? Nou, AI for Good definiëren wij door de projecten die wij uitvoeren te koppelen aan een van de Sustainable Development Goals van de Verenigde Naties. Dit zijn zeventien internationale doelen voor duurzame ontwikkeling, zoals klimaatactie, schoon water, duurzame energie en het beschermen van ecosystemen. Door deze formele koppeling te maken, zorgen we ervoor dat onze projecten meetbare maatschappelijke impact hebben.
Hoe werkt jullie aanpak in de praktijk?
Onze hoofddoelen zijn het educeren en toepassen van AI for Good, en ons belangrijkste mechanisme daarvoor zijn onze AI for Good challenges. We gaan actief op zoek naar organisaties wereldwijd die een dataset en een probleem hebben, waarbij de oplossing van dat probleem aansluit bij de Sustainable Development Goals. Zodra we zo'n organisatie en project hebben geïdentificeerd, maken we daar een AI for Good challenge van. Dan komt het interessante deel: we crowdsourcen mensen uit onze community om samen in tien weken dat project op te lossen. Op die manier kunnen we voor zo'n organisatie echt een probleem oplossen met AI, maar tegelijkertijd leren we mensen ook hoe je AI in de praktijk toepast. Zoals iedereen met een technische achtergrond weet: de enige manier om technische vaardigheden echt onder de knie te krijgen, is door ze in het echt te doen. Dat faciliteren wij.
Waarom hebben jullie gekozen voor precies tien weken voor zo'n challenge?
Tien weken is eigenlijk een geoptimaliseerde tijdsduur die we door experimenteren hebben ontdekt. We doen dit nu sinds 2020, dus meer dan drie jaar, en hebben in die periode geëxperimenteerd met kortere en langere tijden. Mensen besteden gemiddeld zo'n acht uur per week aan zo'n challenge, dus je doet het typisch naast je werk. Dan hebben we echt gekeken naar de vraag: hoe kunnen we nou daadwerkelijk bruikbare output krijgen? Veel mensen kennen het concept van de hackathon, waar je één, twee of soms drie dagen aan iets werkt. Maar daar bereik je eigenlijk nooit echt iets mee. Je bent aan het spelen met een bepaalde technologie, maar een implementatie die iemand daadwerkelijk kan gebruiken, komt daar vrijwel nooit uit. Met tien weken hebben we genoeg tijd om door alle fases heen te gaan: van probleemverkenning tot daadwerkelijke implementatie.
Hoe groot zijn de teams die aan zo'n challenge werken?
Het totale team dat we crowdsourcen bestaat uit dertig tot vijftig personen. Dat klinkt misschien overweldigend, maar we proberen echt heel veel verschillende perspectieven bij elkaar te halen. Natuurlijk delen we ze wel op in kleinere subteams, want één groot team van vijftig man is niet echt managebaar. Door ze in kleinere subteams op te delen, laten we verschillende groepen hetzelfde probleem vanuit verschillende hoeken tackelen. Dat levert vaak verrassende en innovatieve oplossingen op.
Kun je een concreet voorbeeld geven van een afgeronde challenge?
Mijn favoriet is het project voor wildlife bescherming in Zuid-Afrika, waar ik ook persoonlijk langs ben geweest bij de rangers. Wat daar aan de hand was: ze hadden een fixed wing drone, dat is geen quadcopter met vier rotoren, maar echt een klein vliegtuigje. Deze drone vloog 's nachts over de wildlife reservaten van Zuid-Afrika. De reden dat het een vliegtuig was en dat het 's nachts vloog, heeft alles te maken met het hoofddoel: het detecteren van stropers. Wat ze voorheen deden: rangers zaten in een mobiele cabine de hele nacht naar een zwart-wit infraroodbeeld te staren dat de drone direct live terugstreamde naar dat studiootje. Het probleem daarmee is dat je heel veel menselijke fouten krijgt. Als je de hele nacht naar een zwart-wit beeld zit te staren, dan hou je op met opletten. Daarnaast vliegt dat vliegtuig zo langzaam mogelijk, maar dat is nog steeds zo'n 40 kilometer per uur. Je vliegt dus nog steeds vrij snel over een potentieel interessante target heen. Dit waren significante problemen waardoor het systeem ook niet schaalbaar was. En dat is waar wij instapten met de vraag: kunnen we dit automatiseren met AI? Kunnen we een AI bouwen die automatisch mensen detecteert op die infraroodbeelden?
Welke technische uitdagingen kwamen jullie tegen bij dit project?
Met de huidige staat van technologie is object detection - het automatisch herkennen van objecten in beelden - relatief goed te doen. Maar de leuke extra uitdaging was dat het model moest draaien op de drone zelf. Die drone had namelijk geen mobiele verbinding, geen 4G of 5G. Dat zit ook helemaal niet in die wildlife reservaten. Ze konden alleen maar via een radio terugpraten met die cabine op de grond. Dus we moesten op een of andere manier een signaal terug naar de grond krijgen op het moment dat er een stroper gedetecteerd werd. We hebben daarom een Jetson Nano geïnstalleerd op de drone, een platform van NVIDIA met een mini-GPU, om die AI live te laten draaien. Maar toen kwamen we tegen een volgend probleem: dat computertje verbruikte behoorlijk veel stroom. De range van het vliegtuig ging van ongeveer vier uur vliegen naar anderhalf uur. Dat was natuurlijk veel te weinig.
Hoe hebben jullie het stroomprobleem opgelost?
We hebben uiteindelijk een slim twee-traps AI-model gebouwd. Het eerste model is heel klein en stroombesparend, en detecteert alleen of er iets interessants in het beeld is. Alleen op het moment dat dit kleine model detecteert dat er iets interessants is, dan pas schakelt het zware model in dat daadwerkelijk mensen kan detecteren. Op die manier hebben we een systeem gebouwd dat zowel stroom-efficiënt is als effectief werkt.
Wat gebeurt er als het systeem een stroper detecteert?
We sturen via een radiografisch signaal direct een melding terug naar de grond. Dan gaan er letterlijk alarmbellen in de cabine, het scherm gaat flitsen, en er wordt een boxje getekend rondom de gedetecteerde persoon. In de tweede iteratie van de challenge hebben we ook technologie toegevoegd waardoor de drone dat stuk gaat cirkelen. Dat is de hele reden dat we voor object detection zijn gegaan: zodat we precies kunnen aanwijzen in het beeld waar het point of interest is, de persoon. De drone kan daar dan omheen cirkelen, zodat de rangers erop afgestuurd kunnen worden.
Hoe werkte het systeem voordat jullie AI implementeerden?
Voorheen moesten de rangers, zodra ze iets zagen, eerst de dronepiloot wakker maken. Die drones vliegen namelijk een soort standaard patroon, en als ze eenmaal in de lucht zitten, hoeft de dronepiloot daar niet meer zoveel mee te doen. Maar op het moment dat er iets gevonden werd, moest hij eruit, naar buiten, en het ding gaan besturen. Het was dus een heel arbeidsintensief en foutgevoelig proces.
Waarom ben je zelf naar Zuid-Afrika gegaan voor dit project?
We hadden een aantal projecten draaien in de regio Zuid-Afrika, met verschillende partnerbedrijven en universiteiten daar. We hadden via die kanalen een oproep gedaan of mensen nog een gaaf AI for Good challenge-idee hadden, en dit project kwam daaruit. We hebben toen alles gecombineerd om ook echt een trip te maken, en dat was echt heel cool. Met de rangers sliepen we echt in van die ouderwetse barakken, midden in het wildlife reservaat. Dus het zijn niet die resorts met grote hekken eromheen, maar echt simpele barakken waar het water ook niet stroomde omdat een olifant een dag eerder op één van de zonnepanelen was gaan staan. Daardoor werkte de pomp niet en was er geen lopend water. Dat was wel een bijzondere ervaring.
Wat is de meerwaarde van fysiek on-site zijn bij zo'n project?
Bij de meeste challenges doen we dat eigenlijk niet, want de extra kosten passen niet binnen een challenge budget. We doen projecten echt wereldwijd: Australië, Noord-Europa, Afrika, India. Maar in dit geval was er al een hardware platform, die drone. Daar hielp het wel heel erg om mee te gaan kijken van: wat is nou de problematiek? Hoeveel ruimte is er in dat ding? Wat kunnen we daar wel en niet in installeren? Ook echt helpen met die installatie en daar brainstormen was waardevol. We moesten bij een aantal apparaten bijvoorbeeld remote toegang regelen, en ze hadden daar niet zo veel verstand van netwerkinstellingen. Het helpt als je dat fysiek ter plekke kan doen. Omdat er al een fysiek platform was, was het dus wel heel handig om even langs te kunnen komen en echt te zien hoe alles werkt.
Ben je vanaf het begin betrokken geweest bij Fruitpunch AI?
Fruitpunch AI heeft een tijd bestaan als alleen maar een studententeam, dat was de oorsprong hier op de universiteit in Eindhoven. Ik was toen al betrokken bij dat studententeam. Ik werkte toen al als AI-specialist en had daar een data science afdeling. Mijn huidige co-founder vroeg me op een gegeven moment of ik een leuke presentatie wilde geven voor de studenten. Dat heb ik toen gedaan en zodoende was ik betrokken bij het studententeam. Op een gegeven moment kwam het idee: volgens mij kunnen we dit proberen te schalen, het groot maken buiten Eindhoven. Maar dan moeten we er wel echt een bedrijf van maken. Want als non-profit, als stichting, is groei echt heel lastig. Dan ben je honderd procent afhankelijk van donaties en dan word je heel snel eigenlijk gewoon een marketingclub om die donaties binnen te schrapen. Dus toen zijn we voor het VC-funded startup model gegaan, waarbij je bij investeerders geld ophaalt om je organisatie te kunnen laten groeien. Vanaf dat moment ben ik aangesloten toen we echt als bedrijf doorgingen.
Wat was het eerste project dat jullie als Fruitpunch AI hebben aangepakt?
Heel lang geleden zijn we begonnen met een stukje serious gaming. Daar ging het echt over: kunnen wij reinforcement learning agents zelf bouwen? Reinforcement learning is een vorm van machine learning waarbij een AI leert door trial and error, een beetje zoals een kind dat leert lopen. We trainden die op virtuele omgevingen die we zelf bouwden. Maar de eerste echte AI for Good projecten waren in de AI for Wildlife ruimte. We zijn daar al heel sterk in geworden, met name in ecologie en het identificeren van dieren. En dan hebben we het niet over simpelweg 'er is een hond in beeld', maar veel specifieker.
Kun je een voorbeeld geven van zo'n identificatieproject?
We doen dat bijvoorbeeld met zeehonden in de baaien van New York. We krijgen daar foto's binnen en kunnen dan zien: dit is Perry de zeehond. Dit heet individual identification oftewel het herkennen van specifieke individuen binnen een diersoort. Daarmee kunnen ze dus de populatie tracken. Want dan weet je precies welke zeehonden op elke foto opnieuw terugkomen. Over verschillende jaren heen kun je dan kijken hoe het met de populatie gaat: groeit die, neemt die af, welke individuen overleven? Dat zijn wel echt het type projecten waar ik trots op ben. Een van die zeehonden die daar rondzwemt heet zelfs Sako, vernoemd naar mij. Dat is denk ik mijn grootste eerbetoon tot nu toe.
Hoe herken je individuele zeehonden van elkaar?
Het is uiteindelijk een vorm van gezichtsherkenning, vergelijkbaar met de technieken die je kent van menselijke gezichtsherkenning. Maar het verschilt wel per diersoort welke technologie daar het beste voor werkt. Bij zeehonden kijk je naar gezichtskenmerken, net als bij mensen. We hebben dit ook met zeeschildpadden gedaan, en daar zie je weer dat een hele andere techniek effectief is. Die herken je namelijk op basis van het patroon op het schild. Dat is een soort mozaïek met heel duidelijke contrasten. Bij zo'n mozaïek is het makkelijker om features uit te extracten - dus herkenningspunten te vinden - dan bij iets subtiels als een gezicht.
Werken jullie nu aan nieuwe dieridentificatieprojecten?
Ja, we gaan dat nu ook met beren doen. Daar hebben we een nieuwe uitdaging bij: beren veranderen heel veel over een jaar heen. Ze worden behoorlijk dik als ze heel veel zalm gegeten hebben voor de winterslaap, en vallen dan heel erg af over een jaar. Daarnaast hebben ze wintervacht en zomervacht, en veranderen ze ook qua kleur. Ze veranderen dus heel veel, ook in het gezicht. Dat is de volgende uitdaging op dat gebied.
Wat is het doel van het berenproject?
Het gaat daar om twee dingen. Één is echt het tracken van de populatie. Maar ook het tracken van waar ze zich bevinden. Dat kan heel erg helpen met het managen van het landschap. Als er bijvoorbeeld een vraag is of een bepaald stuk bos gekapt kan worden, kunnen ze nu zeggen: dat kan niet, want hier zijn die beren actief. We weten hoeveel individuen er zijn en waar ze zich ophouden. Aan de andere kant is er ook een stukje dat ze human-wildlife conflict noemen, oftewel situaties waar dieren en mensenpopulaties botsen. Bij beren kan het gebeuren dat zo'n beer inbreekt in een boerderij en dan de lammetjes, koeien of schapen slacht. Of misschien wel herden en andere voedselvoorraad te grazen neemt.
Wat is het probleem met beren die boerderijen binnendringen?
In eerste instantie is het natuurlijk niet zo'n ramp dat een beer één keer een boerderij binnenkomt. Maar het probleem met beren is dat die heel intelligent zijn. Zo'n beer wordt heel snel wat ze een 'probleembeer' noemen, want die leert dat gedrag aan. Die denkt: zo kan ik een snelle snack halen. Dat heeft als probleem dat één zo'n beer alleen maar blijft inbreken bij alle boerderijen die hij kan vinden. Dan wordt het natuurlijk ook een serieus risico voor de volksgezondheid en veiligheid. Uiteindelijk moeten ze zo'n beer dan afschieten, en dat willen we natuurlijk voorkomen. Dit soort technologie wordt dan ook gebouwd om op tijd zo'n beer te kunnen detecteren op camera's en dan afstotende systemen te activeren.
Welke afstotende systemen worden gebruikt om beren af te schrikken?
Dat kan beer spray zijn - dat hebben we in Nederland niet, maar in Amerika is dat een bekend middel. Maar ook harde geluiden of flitsende lichten. Het doel is om die beren af te schrikken en te zorgen dat ze dit ongewenste gedrag niet aanleren. Als je ze vroeg genoeg afschrikt, leren ze dat boerderijen geen goede plek zijn om voedsel te zoeken.
Waar vinden deze berenprojecten plaats?
We doen dit met twee verschillende organisaties. Eentje in Noord-Amerika waar we voornamelijk met bruine grizzlyberen werken. En eentje in Noord- en Oost-Europa, waarbij Roemenië een van de hotspots is. Dat zijn allebei bruine beren, maar ook dat kun je met AI uit elkaar halen - je kunt met de juiste technieken zelfs verschillende populaties van dezelfde soort onderscheiden.
Is het herkennen van beren technisch uitdagend?
Ja, dat kan zeker lastig zijn. Een van de problemen zit vaak in de beschikbare data. Er is relatief weinig data beschikbaar van beren, en wanneer je een classifier - een AI-model dat objecten classificeert - vanaf de grond af traint, dan heb je best wel veel data nodig om dat goed te kunnen doen. Bij sommige projecten was de dataset beperkt en had deze ook geen andere dieren. Wat dat betekent: het is leuk dat het model een beer kan herkennen, maar dan denkt hij heel gauw dat een hond ook een beer is. Als je alleen maar beren hebt getoond, dan wordt alles wat enigszins op een beer lijkt ook als beer geclassificeerd.
Hoe hebben jullie het dataprobleem opgelost?
We hebben van verschillende bronnen data verzameld. Van Sense Inclusive, een organisatie hier in Nederland die met verschillende Europese organisaties samenwerkt om dieren te beschermen, hebben we een dataset met beren gekregen. Van de SLU, eigenlijk de Zweedse equivalent van Wageningen Universiteit, hebben we beelden van heel veel verschillende dieren gekregen: everzwijnen, herten, enzovoort. En uit Noord-Amerika hebben we beelden van verschillende beren. Zodoende hebben we een veel grotere en gevarieerder dataset kunnen verzamelen. Een classifier die kan onderscheiden of iets een beer is of niet ligt zeker binnen de scope van huidige technologie. Maar als je gewoon niet voldoende en gevarieerde data hebt, dan kan het nog wel eens een uitdaging zijn.
Hoe zit het met de kwaliteit van die verschillende datasets?
Die datasets hebben allemaal variërende kwaliteiten. De ene zijn telefoon- of camerafoto's en de andere zijn van camera traps - dat zijn doosjes die tegen een boom hangen en automatisch een foto maken als ze beweging detecteren. Die hebben ook allemaal andere resoluties en beeldkwaliteiten. Eén set is heel goed gelabeld met echt de gezichten van de beren erop geselecteerd. De reden dat je dat wilt doen is omdat je zoveel mogelijk storende elementen eruit wilt snijden voordat je probeert een dier te identificeren. Dan kan het model niet afgeleid worden door de achtergrond of andere elementen. Bij de andere datasets hebben we dat niet, dan hebben we de beren in hun geheel. Dat hebben we er dan zelf nog uit moeten snijden.
Hoe automatiseren jullie het proces van het uitsnijden van beren uit foto's?
In de laatste jaren zijn er een aantal technieken uitgekomen die je heel goed vrijwel unsupervised kan gebruiken. Unsupervised betekent: zonder die specifiek te trainen, of in ieder geval zonder veel training met dit soort data. Die kun je vrijwel meteen inzetten om bijvoorbeeld te zeggen: knip het berengezicht eruit. We hebben dat toevallig vorige week getest en het werkt echt heel goed. Het model heet SAM, Segment Anything Model, en is ontwikkeld door Meta. Een van de mooie dingen aan dit model is dat het doel is om iets te segmenteren - dus echt uit te snijden, niet alleen maar een vierkantje eromheen te tekenen. Het kan dat automatisch doen vanaf de grond.
Hoe werkt het Segment Anything Model precies?
Je hebt een aantal verschillende inputs die je dat model kan geven om tot die segmentatie te komen. Je kunt zeggen 'ik heb helemaal niks', en dan gaat die zelf gewoon het meest relevante segmenteren. Je kunt ook point labels geven - dus je klikt drie keer op het object dat je interessant vindt - en dan neemt het model dat als input. Je kunt ook een bounding box meegeven, een vierkantje om het object, en dan weet het model binnen dat vierkantje het juiste ding uit te snijden. Maar wat bij de beren toevallig heel goed werkte, is de tekstprompt. Je kunt letterlijk 'bear face' als tekst meegeven als input van het model. Dan pakt het zowel de beer als los nog het gezicht. Het weet die dus eigenlijk perfect uit te snijden in de foto's die ik getest heb. Ik zal niet beweren dat het honderd procent accuraat is voor de hele dataset, maar het helpt je al enorm op weg.
Hoe controleren jullie de kwaliteit van de automatische segmentatie?
Het gaat om duizenden foto's, maar we hebben ook een team van vijftig man. Om die allemaal met de hand te laten segmenteren is heel veel werk. Maar om door al die foto's te klikken en die segmentatie te controleren van 'hé, is dit accuraat? Klopt dit?' - dat is wel goed te doen met zo'n team. Op die manier kunnen we de kwaliteit waarborgen terwijl we toch veel tijd besparen.
Hebben jullie ook te maken met uitdagingen rondom dag- en nachtfoto's?
Ja, dat is zeker een uitdaging. We zullen van beide een groot genoeg dataset moeten verzamelen. We hebben van beide data in de dataset, maar ik weet op dit moment nog niet wat het percentage aan nachtfoto's is. Daar zijn we wel benieuwd naar of dat lukt. Het enige probleem is dat de identificatie die we hebben van de beren - waarbij we echt het individu weten, waarbij we weten 'dit is Berrie de beer' - die zijn allemaal overdag gemaakt. Dus uiteindelijk wordt het een drie-traps systeem: eentje die herkent 'is er een beer?', eentje die herkent 'wat is het gezicht van de beer?', en eentje die dan zegt 'dit is Berrie de beer'. Dat laatste stapje zullen we dus nog niet voor 's nachts kunnen doen, tenminste niet in eerste instantie.
Hoe ga je om met de beperkingen van nachtfoto's voor identificatie?
Met dit soort projecten kun je heel makkelijk bewijzen wat wel werkt en wat niet werkt. We proberen daarmee ook allemaal verschillende technieken uit. Een vakgebied zoals individual identification is echt niet uitgespeeld op het gebied van AI. Dat betekent dat je heel veel verschillende, compleet andere types algoritmen hebt die dit in theorie kunnen. Dan moet je nog maar eens uitzoeken welke het beste gaat werken. Het kan nogal verschillen, ook per diersoort. Dat is echt wat we bij die challenges doen: we gebruiken die vijftig teamleden effectief door ze allemaal verschillende algoritmische hoeken uit te laten proberen. Zo komen we tot de beste oplossing en leren we ook wat de ontbrekende of mindere kwaliteit data is voor vervolg acties.
Jullie werken veel in wildlife, maar hebben jullie ook projecten buiten dat domein?
Ja zeker. We doen ook best wel veel in carbon emission monitoring. We proberen in te schatten hoeveel CO2-uitstoot bepaalde activiteiten veroorzaken. De laatste tijd hebben we daar grote stappen mee kunnen maken door de GenAI-revolutie, dus die large language models - de grote taalmodellen zoals GPT. We hebben het zowel toegepast op persoonlijke financiën als op bedrijfsfinanciën. We analyseren de transacties die je doet, bijvoorbeeld van je eigen bank. Die transacties staan echt heel grof beschreven waar ze over gaan. Dat is als mens al bijna niet te vertalen naar wat er nou ook alweer echt was. Dan gebruiken we large language models om context toe te voegen op basis van andere informatie die we hebben over die transactie.
Hoe werken die large language models voor het categoriseren van transacties?
We voeden alle beschikbare informatie over een transactie in het model. Dan weten die modellen daar context bij te trekken die vaak genoeg informatie is om de transactie te categoriseren. Hetzelfde hebben we ook voor bedrijven gedaan. We hebben gekeken naar de facturen die zij betalen. Ook op facturen staat vaak maar vijf woorden of zo beschreven wat een product is dat gekocht wordt. Vroeger - ik doe data science al de afgelopen acht jaar minstens - als iemand dan vroeg 'ik wil iets met deze data doen', dan zei ik 'dat kan niet, want die data zit niet in jouw database'. Dan heb je pech. Maar dat is niet meer zo, want die large language models kunnen zoveel context toevoegen.
Kun je een concreet voorbeeld geven van hoe AI context toevoegt aan factuurdata?
Met die vijf woorden die op een factuur staan en de locatie waar de factuur vandaan komt, kan het model enorm veel afleiden. Op basis van bijvoorbeeld het Duitse woord 'Verpacken', kan het model bedenken: dit is waarschijnlijk een bepaald type verpakte ham, want dat wordt veel in die regio gemaakt. Dus dit is waarschijnlijk deze specifieke ham, die wordt normaal in honderd gram verpakkingen verkocht. Dus waarschijnlijk is het dit product. Op basis daarvan kunnen we dat dan koppelen aan een carbon impact - de CO2-uitstoot die gepaard gaat met productie en transport van dat product. Zodoende kun je op basis van het financiële systeem van een bedrijf in één keer helemaal je scope 3 emissies doorrekenen. Dat is een hele game-changer voor duurzaamheidsrapportage.
Hoe zorg je voor transparantie en uitlegbaarheid van jullie AI-systemen?
Dat is een interessante vraag waar we veel over nadenken. Ik ben altijd zelf wel fan van de geautomatiseerde benaderingen. Want wat je veel ziet in het gebied van ethiek is dat uiteindelijk de conclusie is: ja, dat is leuk dat je daar van alles van kan automatiseren, maar uiteindelijk zul je de use case toch echt helemaal moeten doorgronden en dat met de hand moeten doen. Ik denk dat dat klopt, maar daardoor vind ik het minder interessant, want dan kun je het moeilijk opschalen en automatiseren. Vanuit ons perspectief, waar wij dat voor veel verschillende gebruikers tegelijk willen kunnen doen, zijn de technieken waarmee je echt inzicht krijgt in waar het model naar gekeken heeft heel waardevol.
Welke concrete technieken gebruiken jullie om AI-modellen uitlegbaar te maken?
Bij vision models - modellen die met beelden werken - kun je klassiek vaak inzien waar het model heel erg veel op let. Zo kun je inzicht krijgen in wat je model doet. Maar ook het testen op externe datasets is belangrijk: oké, leuk dat het op mijn trainingsset werkt, maar kan ik dat ook valideren met een paar afbeeldingen die ik van Google trek? Dit soort technieken kun je uit een model trekken van 'hier heeft hij op gelet'. Met het attention mechanism dat in GenAI-modellen is ingebouwd, is dat ook mogelijk. Dat vind ik een belangrijke eerste stap om modellen die zich klassiek black box noemen - volledig ondoorzichtig - grey box te maken, om daar bepaald inzicht in te krijgen. Dat is wel iets dat wij vrijwel elke challenge doen: even valideren van 'hé, heeft ons model nu iets nuttigs geleerd, of is hij eigenlijk zwaar aan het overfitten?' Overfitting betekent dat een model alleen maar haalt wat hij gezien heeft in de trainingsdata, maar niet generaliseert naar nieuwe situaties. Kernpunten en Praktische Adviezen Maatschappelijke impact door AI: Koppel AI-projecten aan concrete doelen zoals de Sustainable Development Goals van de VN om meetbare impact te creëren voor milieu, duurzaamheid en natuurbescherming. Leren door te doen: De beste manier om AI-vaardigheden te ontwikkelen is door aan echte projecten te werken met daadwerkelijke datasets en problemen, niet alleen via theoretische cursussen of korte hackathons. Optimale projectduur: Tien weken met ongeveer acht uur per week blijkt de ideale tijdsspanne voor vrijwilligers om naast hun werk aan complexe AI-projecten te werken en tot bruikbare resultaten te komen. Crowdsourcing met structuur: Grote teams van 30-50 personen kunnen effectief samenwerken als je ze opdeelt in kleinere subteams die verschillende benaderingen uitproberen, wat leidt tot innovatieve oplossingen vanuit meerdere perspectieven. Edge computing overwegingen: Bij AI-toepassingen op drones of andere apparaten zonder stabiele internetverbinding moet je rekening houden met stroomverbruik en verwerkingskracht. Twee-traps modellen kunnen helfen: een licht model voor initiële detectie en een zwaarder model alleen wanneer nodig. Fysieke aanwezigheid bij hardware: Voor projecten met fysieke componenten zoals drones of camera's is het waardevol om on-site te zijn om installatie-uitdagingen te begrijpen en direct te kunnen helpen met technische implementatie. Datakwaliteit boven kwantiteit: Een diverse, goed gelabelde dataset met variatie in omstandigheden (verschillende dieren, belichting, hoeken) is belangrijker dan alleen een grote hoeveelheid data van beperkte kwaliteit. Preventie boven repressie: Bij wildlife management is het effectiever om AI in te zetten voor vroege detectie en afschrikking van probleemgedrag dan om achteraf in te grijpen wanneer dieren al gevaarlijk gedrag hebben aangeleerd. Context door AI toevoegen: Moderne large language models kunnen beperkte informatie (zoals korte factuuromschrijvingen) verrijken met context, waardoor analyses mogelijk worden die eerder onmogelijk waren door datatekorten. Automatisering van populatiemonitoring: Individual identification van dieren via AI maakt het mogelijk om populaties te volgen over tijd, migratieroutes te begrijpen en evidence-based beslissingen te nemen over natuurbeheer. Multi-stage AI-architectuur: Voor complexe taken zoals dieridentificatie werkt een gelaagde aanpak het beste: eerst detecteren of iets een beer is, dan het gezicht isoleren, en tenslotte het specifieke individu identificeren. Moderne segmentatietools: Modellen zoals Segment Anything Model van Meta kunnen met minimale input (tekstprompts, enkele klikken) objecten accuraat uitsnijden, wat enorm veel handmatig labelwerk bespaart. Explainable AI in de praktijk: Maak AI-modellen begrijpelijker door attention mechanisms te visualiseren die laten zien waar het model op focust, en test modellen op externe datasets om te valideren dat ze echt generaliseren. Van non-profit naar startup: Voor schaalbare impact kan een VC-gefinancierd startup-model effectiever zijn dan een volledig op donaties gebaseerde non-profit, omdat het snellere groei mogelijk maakt zonder constant fundraising. Technologie-selectie per use case: Verschillende diersoorten vereisen verschillende AI-technieken voor identificatie (gezichtsherkenning voor zeehonden, patroonherkenning voor schildpadden), dus experimenteer met meerdere benaderingen om te vinden wat het beste werkt. AIToday Live is een podcast die zich richt op de nieuwste ontwikkelingen in AI en de impact ervan op verschillende sectoren. In elke aflevering spreken hosts Niels Naglé en Joop Snijder met experts uit het veld om inzicht te krijgen in de mogelijkheden en uitdagingen van AI-technologie. Luister via je favoriete podcast app: Spotify, Apple podcasts, YouTube Music, en meer.
Over de gast
Sako Arts verscheen als gast in 2 afleveringen van AIToday Live.
Bekijk gastprofielTranscript
Hoi, leuk dat je weer luistert naar een nieuwe aflevering van de AIToday Live. Dit keer vanaf locatie Eindhoven. Hartstikke leuk om dat ook weer eens te doen. Mijn naam Joop Snijder, CTO bij Aigency. Mijn naam Niels Naglé, chapter lead, data AI bij Info Support. En we hebben vandaag de gast Sako Arts. Sako, zou je je kunnen voorstellen aan de luisteraars? Ja natuurlijk, aangenaam. Iedereen die luistert, Sako Arts, ik ben de CTO van Fruitpunch AI. En wij bouwen samen de wereldwijde AI for Good community. Ja, en wat is dat? AI for Good? Nou, AI for Good definiëren wij zelf door de projecten die wij doen, daarvan de doelen te koppelen aan een van de Sustainable Development Goals van de United Nations. Dus dit is hoe we die koppeling ook echt formeel proberen te maken. Oké, mooi. En hoe gaat dat in zijn werking? Ja, nou dus, zoals ik al zei, wij zijn een AI for Good community, maar onze hoofddoelen zijn het educeren en toepassen van AI for Good. En ons mechanisme om dat te doen zijn onze AI for Good challenges. Dus wat we daar doen, we gaan op zoek naar organisaties wereldwijd die een dataset en een probleem hebben, waarvan dus die doelen van dat probleem oplossen, alignen met de Sustainable Development Goals. Oh, mooi. Ja, wanneer we dat dus geïdentificeerd hebben, dan maken we daar een AI for Good challenge van, en dan halen wij mensen uit onze community, die crowdsourcen we, zoals je dat noemt, om samen in tien weken dat project op te lossen. Dus op die manier kunnen we zowel voor zo'n organisatie echt een probleem oplossen met AI, maar aan de andere kant kunnen we ook mensen leren over hoe je AI in de praktijk toepast. Want zoals jullie allebei als engineers weten, de enige manier om technische dingen echt onder de smiezen te krijgen, is door ze in het echt te doen, en dat faciliteren wij. Ah, oké. En waarom die tien weken? Sorry, ik heb het vandaag echt niet. Is daar reis? Ja, tien weken. Ja, dat is eigenlijk een geoptimaliseerde hoeveelheid tijd. We doen het nu sinds 2020, dus we doen het wel meer dan drie jaar. En we hebben geëxperimenteerd met kortere tijden. Mensen besteden hier ongeveer acht uur per week aan, dus je doet het typisch naast je werk bijvoorbeeld. En dan hebben we echt gekeken, oké, hoe kunnen we nou daadwerkelijk output krijgen? Want het concept dat veel mensen wel kennen is de hackathon, weet je wel. Dan zit je één dag, soms twee, drie dagen. Maar daar bereik je eigenlijk nooit echt iets in. Want je bent aan het spelen met een bepaalde technologie, maar een implementatie die iemand kan gebruiken, komt daar nooit uit. En hoe groot is zo'n team dan? Dus het totale team, we crowdsourcen ze 30 tot 50 man. Oh, dat is een flink groepsvergelijking. Ja, dus we proberen echt heel veel verschillende perspectieven daarbij mekaar te halen, maar we delen ze uiteraard wel op in kleinere subteams. Want één groot team van 50 man, dat is niet echt managebaar. En zo delen we ze op in kleinere subteams, en die laten we dan dat probleem eigenlijk tackelen. Kun je één voorbeeld geven van zo'n afgeronde challenge? Zeker, ja. Mijn favoriet is juist voor wild life. Dat heeft ook mee te maken dat ik langs ben geweest in Zuid-Afrika, bij de rangers om dit project te bekijken. Maar wat we daar doen, ze hadden daar een fixed wing drone, die over de wild life reservaten van Zuid-Afrika vliegt. Dan hebben we dus niet over zo'n quadcopter met vier van die rotoren, maar echt een klein vliegtuigje. En de reden daarvoor is omdat die 's nachts vliegt en heel stil moet zijn, het doel van het vliegtuig is het detecteren van pootjes. Wat ze daar voorheen deden... -Stropers, denk ik hè? Stropers, sorry. En soms wil ik even live vertalen, want meestal vertel ik het verhaal aan het Engels. Maar inderdaad, naast stropers. Maar wat er dan gebeurde, dan waren die mensen van die rangers, die zaten in zo'n cabine eigenlijk, een mobiele cabine. En die zaten de hele nacht naar een zwart-wit beeld te staren. Een infrarood beeld dat die drone direct live terugstreamt naar dat studiootje. En het probleem daarmee is, dat je heel veel human error krijgt. Als jij de hele nacht naar een zwart-wit beeld staat te staren, dan hou je op met opletten. Dan komt er ook nog bij kijken dat dat vliegtuig zo langzaam mogelijk vliegt. Maar ja, dat is nog steeds 40 km/u. Dus je vliegt nog steeds vrij snel over een potentieel interessante target heen. Dat waren dus significante problemen, waardoor het ook niet schaalbaar was. En dat is waar we, in het moment dat wij ingestapt zijn, aan het zeggen, kunnen wij dit automatiseren met AI? Kunnen wij een AI bouwen die automatisch mensen detecteert op die infrarood beelden? En met de huidige staat van technologie is dat nog een stuk makkelijker dan dat het toen was. Maar ook toen was dat wel aardig te doen. Object detection is hoe je dat in het veld van AI veelal noemt. Dus het is vrij makkelijk om daar mensen mee te detecteren. Maar de leuke extra uitdaging is, dat moest draaien op die drone. Want zo'n drone die heeft geen cellular connection, die heeft geen 4G, geen 5G. Dat zit ook helemaal niet in die wild life reservaten. Dus ze kunnen alleen maar terugpraten met die cabine. Dus we moeten op een of andere manier een signaal terug naar de grond krijgen, in het moment dat er zo'n stroper gedetecteerd wordt. Dus het moest echt draaien op, in dit geval hebben we Jetson Nano, een platform van NVIDIA, echt op de drone geïnstalleerd. En zorgen dat er eigenlijk een mini-GPU aanwezig was om die AI live op te draaien. Zaaf, dus je had eigenlijk een mini-computertje onder de drone hangen, die het zware werk deed. Ja, die echt het zware werk deed. En toen kwamen we er ook nog achter dat dat mini-computertje, daar zat toch echt wel een vrij heftige proces nog in. En dat betekende dat als we dat model constant draaiden, dan was de range van hoever het vliegtuig kon vliegen, dat was ongeveer vier uur voordat wij dit ding erin schroefden, maar dat werd toen ineens anderhalf uur. Zo veel meer stroom gebruikte dit. En toen kwamen we dus, liepen we eigenlijk tegen het volgende probleem aan. Dat kan eigenlijk niet, weet je wel. Het ging van zes naar twee, maar er kon nog een batterij bij. Uiteindelijk moesten we toch echt nog wel zorgen dat we veel minder stroom gingen gebruiken. En toen hebben we een nog veel kleiner AI-model gebouwd, dat niet detecteert of er een mens is, maar detecteert of er iets interessants in het beeld is. En alleen maar op het moment dat dat hele kleine stroombesparende netwerk, je zou je eigenlijk kunnen zeggen, detecteert van hier is iets interessants, dan pas schakelde je dat zware model in die je mensen kan detecteren. En zo hebben we dus eigenlijk een twee-traps AI-model gebouwd, dat zowel stroom-efficiënt is, en echt op die drone zelf kan draaien. Dus dat is wel een van mijn favoriete projecten. - Moest er dan ook gelijk een signaal zodat de mensen op af konden? Omdat die mensen eerst live zaten te kijken, en als er wat was, dat ze gingen bellen of zo. Hoe werkte dat? Moesten er dan mensen... - Dus we sturen dan via een radiografisch signaal het signaal direct terug naar de grond. En dan gingen er alarmbellen in die... Het scherm ging dan flitsen. En dan kreeg je dus een kleine boxje, werd er dan getekend om een mens. We hebben in de tweede iteratie van de challenge ook techniek toegevoegd, zodat de drone dat stuk ook echt gaat cirkelen. Dat is de hele reden dat we voor object detection gegaan waren, zodat we dus konden pinpointen in het beeld, hier is het point of interest, de persoon. En dat de drone daar ook omheen kan cirkelen. En op die manier gaat hij op dat moment dan dus af eigenlijk. En dan kunnen de rangers erop afgestuurd worden. - Want dat was daarvoor dus niet. Toen de mensen daar zaten te kijken en ze zagen wat, dan ging die vliegtuig gewoon door en ze moesten dan maar een signaal geven. Dat was het moment, ga daar maar kijken. En nu gaat hij dus echt terug en verder. - Wat dan eigenlijk gebeurde, dan moesten ze de drone pilot wakker maken. Want die drones die vliegen een soort van standaard patroon. En dan hoef je dus, als die eenmaal in de lux zit, hoef je als dronepiloot daar niet meer zo veel mee te doen. Op het moment dat hij dus iets vond, dan was hij met zijn antenne uit. En dan naar buiten, weet je wel. En dan moest hij dat ding gaan besturen. - Geweldig. - En wat was de reden waarom je bij deze mee ging? - Ja, hier was, er waren een aantal projecten die wij draaien in de regio Zuid-Afrika. Een aantal partnerbedrijven waar we daar mee zaten, universiteiten. En toen hadden we dus een oproep gedaan, ook via een paar van die kanalen, van hé, weet u nog een gaaf, even een good challenge. En ze kwamen bij hun uit. En toen hebben we dat natuurlijk mooi allemaal gecombineerd om ook echt een trip te doen. En dat was wel heel cool. Met de rangers dus echt in van die ouderwetse barakken slapen, die echt midden in het wild life reservaat. Dus het zijn niet de resorts met grote hekken eromheen, maar echt barakken. Waar het water ook niet stroomde, want een olifant was een dag eerder op één van de zonnepanelen gaan staan. En daardoor werkte de pomp niet en daarmee was er geen water, geen lopend water. Dus dat was wel ... - Oh, geweldig. En wat is dan de meerwaarde dat je echt fysiek bent? Want ik heb altijd het beeld dat het heel waardevol is om on-site te zijn, maar wat heeft het jullie meer gebracht door daar echt aanwezig te zijn, ten opzichte van remote challenges te doen? - Ja, kijk, bij de meeste challenges doen we dat eigenlijk niet, want daar die extra kosten van. We doen ze echt wereldwijd. In Australië, Noord-Europa, Afrika, India. Dus dat past niet binnen een challenge budget. Maar in dit geval was er dus al een hardware platform. En dat was die drone. Dus daar hielp het wel heel erg om mee te gaan kijken van "Hé, wat is nou de problematiek? Hoeveel ruimte is er nou in dat ding? Wat kunnen we daar wel en niet in installeren?" Ook echt helpen met die installatie en daar brainstormen. We moesten bij een aantal van die apparaten uiteindelijk de mensen van buiten bij kunnen, remote in kunnen loggen op die apparatuur die ze daar hadden. Dus ja, ze hadden allemaal niet zo'n verstand van netwerkinstellingen en zo. Het helpt ook wel even als je dat daar fysiek kan doen. Dus zodoende was dat uiteindelijk, omdat er al een fysiek platform was, was dat wel heel handig om even langs te kunnen komen. Ja, cool. Echt even te zien. En ben jij weer vanaf het begin betrokken bij Fruitpunch AI AI? Ja, Fruitpunch AI heeft bestaan een tijd als alleen maar een studententeam. Dus dat is eigenlijk de origine ook hier op de universiteit in Eindhoven. Maar vanaf het moment dat het naar een startup overgegaan is, ik was betrokken bij het Fruitpunch AI studententeam. Ik werkte toen al als AI-specialist, waar ik een data science afdeling had. Rond die tijd vroeg op een gegeven moment mijn nieuwe co-founder mij het best aan. Van 'Hey, kun je een leuke presentatie geven voor ons, voor de studenten?' Dat heb ik toen gedaan en zodoende was ik betrokken bij het studententeam. En toen op een gegeven moment het idee kwam van 'Hé, volgens mij kunnen we dit proberen te schalen.' 'We kunnen het proberen groot te maken, buiten Eindhoven.' Maar dan moeten we er wel echt een bedrijf van maken. Want als non-profit, als stichting, is groei echt heel lastig natuurlijk. Dan ben je 100% afhankelijk van donaties en dan word je heel snel eigenlijk gewoon een marketingclub. Om die donaties nog binnen te schrapen. Dus toen zijn we voor het VC-funded startup gegaan. Dus dat je bij investeerders geld ophaalt om zo je organisatie te kunnen groeien. En vanaf dat moment ben ik ook aangesloten toen we echt voor als bedrijf doorgingen. Cool. Wat was de eerste opdracht die jullie gedaan hebben? Heel erg tijd geleden zijn we ook begonnen met een stukje serious gaming. Daar ging het echt over 'Hey, kunnen wij reinforcement learning agents zelf bouwen?' Om te trainen op virtuele omgevingen die we zelf bouwen. Maar de eerste paar 'for good' projecten waren in deze AI for Wildlife space. Dus we zijn al heel erg sterk in ecologie, het identificeren van dieren. En dan hebben we het niet over 'Hey, er is een hond in beeld.' Nee, we doen dat bijvoorbeeld met zeehonden in de baaien van New York. Dat we daar foto's van binnen krijgen en dan kunnen zien 'Hey, dit is Perry de zeehond.' En daarmee kunnen ze dus de populatie trekken. Want dan weet je dus precies welke op elke foto opnieuw terugstaan. Dus dan kun je over de verschillende jaren heen kijken hoe het met de populatie gaat. Dat zijn wel echt het type projecten. Dat is denk ik ook mijn grootste diploma tot nu toe. Een van die zeehonden die daar rondzwemt die heet Sako. Dat is een hond vernoemd naar... Kijk, waar herken je het verschil aan? Gezichtsherkenning is het uiteindelijk natuurlijk. Dus het zijn technieken die uit die space komen. Dat verschilt een beetje per dier welke hoek van technologie daar het beste in werkt. We hebben dat nu met zeehonden gedaan. Maar we hebben het ook met zeeschildpadden gedaan. En dan zie je weer dat een hele andere techniek effectief is. Omdat je die herkent op de basis van het patroon en het zeggert van een gezicht. En dat is een mozaïek en die heeft dus heel duidelijk contrast. Dus dat is wat dat betreft makkelijker om features uit te extracten. Dus om daar herkenningspunten uit te halen. Bij zo'n mozaïek is dat makkelijker dan bij iets subtiels als een gezicht. En nu gaan we dat dus ook weer met beren doen. En daar hebben we een nieuwe uitdaging met zich mee. Omdat die heel veel veranderen over een jaar heen. En die worden behoorlijk dik als ze heel veel zalm gegeten hebben voor de winterslaap. Dan vallen die heel erg af over een jaar. En dan hebben ze wintervacht en zomervacht. En zo veranderen die heel veel ook in het gezicht. En kleur. Zoals de volgende uitdaging op dat gebied. En gaat dat dan ook om het trekken van de populatie? Dat je weet hoe de populatie eruit ziet? Ja, dat gaat bij deze om twee zaken. Dus één is echt dat trekken van de populatie. Maar ook op die manier het trekken van waar ze zich begeven. En dat kan dan heel erg helpen met het managen van het landschap. Dus nu is er een vraag van, kunnen we wel of niet een bepaald stuk bos kappen? Dan kunnen ze nu zeggen, dat kan niet. Want hier zijn die beren actief. Dat soort dingen zijn er onderdeel van. We weten hoeveel individuen er zijn. Maar aan de andere kant ook een stukje wat ze dan veelal human wildlife conflict noemen. Oftewel daar waar dieren en mensen populaties botsen. En wat je ziet bij beren is dat die... Op een gegeven moment kan het gebeuren dat zo'n beer inbreekt in een boerderij. En dan slagt die de lammetjes of de koeien of de schapen. Of misschien wel gewoon herden en andere voedselvoorraad die die te grazen neemt. En in eerste instantie is het natuurlijk niet zo'n ramp. Maar het probleem met beren is dat die heel intelligent zijn. Dus zo'n beer wordt heel snel wat ze dan weer een probleembeer noemen. Want die leert dat gedrag uit. Die denkt zo kan ik een snelle snack halen. Dat heeft natuurlijk als probleem dat één zo'n beer op dat moment... gewoon alleen maar in gaat breken bij alle boerderijen die die kan vinden. Dan wordt het natuurlijk ook wel een serieus risico voor de volksgezondheid. En dan moeten ze zo'n beer uiteindelijk afschieten. En dat willen we natuurlijk voorkomen. Dus dit soort technologie wordt dan ook gebouwd om op tijd zo'n beer te weten detecteren op camera's. En dan afstotende systemen te activeren. Dus dat kan van die beer spray zijn. Dat hebben we in Nederland niet. In Amerika is dat een ding. Maar ook harde geluiden of flitsende lichten of zo. Om dan die beren maar af te schrikken en te zorgen dat ze niet dit gedrag aanwezen. Ja, wat goed. En waar vindt dit plaats? Dit doen we met twee verschillende organisaties. Eentje in Noord-Amerika waar we voornamelijk bruine grizzlyberen. En eentje in Noord-Europa. Of Noord- en Oost-Europa. Dus Roemenië is één van de hotspots daar. En dat zijn allebei bruine beren. Maar ook dat kun je alweer met AI in mekaar halen. Dus dat is wel heel leuk. En dan is er ook nog één. Dat is een van de allerleukste. En dat is een van de allerleukste. En een van de dingen die hij aangaf, en misschien kan jij daar iets meer over uitweiden, dat het best wel lastig is om beren überhaupt te herkennen. Jij zei net hele specifieke beren, maar dat het heel lastig is om een beer te onderscheiden met bestaande modellen. Ja, dat is een probleem waar Thijs tegen aangelopen is met de technieken die hij geprobeerd heeft. Nu is dat zeker mogelijk, maar een van de problemen daar zit hem ook echt wel in de data. Dat is wel vaak bij dit soort problemen. Er zat relatief weinig data. En wanneer je een classifier in dit geval vanaf de grond af traint, dan moet je best wel veel data hebben om dat goed te kunnen doen. Dus de dataset was beperkt, maar had ook geen andere dieren. Wat dan inhoudt, dan is het leuk dat die beer kan herkennen, maar dan denkt hij heel gauw dat een hond ook een beer is. Precies, dan is alles een beer. Dus zodoende hebben wij naast de data die we via Thijs Hack the Planet binnenkregen hebben, hebben we van Sense Incluse, een organisatie hier ook in Nederland die met verschillende Europese organisaties samenwerkt, ook om dieren te beschermen, hebben we een data set gekregen met daarin beren. We hebben een data set van de, ja eigenlijk de Wageningen Universiteit Tegenhanger in Zweden, de SLU, waar we van heel veel verschillende dieren, van everzwijnen tot herten, camerabeelden hebben gekregen. En we hebben dus die uit Amerika, waar we uit Noord-Amerika hebben verschillende beren. Dus zodoende hebben we een veel grotere data set weten te verzamelen en verwachten we dat eigenlijk, want eigenlijk moet zo'n classifier die beren kan herkennen of niet, dat ligt zeker binnen de scoop van technologie. Dat kan zeker. Maar ja, als je gewoon niet voldoende data hebt, dan kan het nog wel eens een uitdaging zijn. Precies. En dat is dus data die ook door professionals gelabeld is, allemaal voorzien is van de juiste tags en aangegeven hoekjes en... Ja, delen, dat is altijd natuurlijk, want we werken met vier verschillende data sets. En die hebben ook allemaal variërende kwaliteiten. De ene zijn zeg maar telefoon of camerafoto's en de andere zijn camera traps, dus van die doosjes die tegen een boom aan hangen en een foto maken als ze iets langs zien komen. En die hebben ook allemaal andere kwaliteiten en dergelijke. Dus één set is heel goed gelabeld met echt de gezichten van de beren, erop geselecteerd. En de reden dat je dat wil doen is omdat je zoveel mogelijk er eigenlijk uit wil snijden voordat jij overgaat te proberen een dier te identificeren. Dan kan het model niet afgeleid worden van de achtergrond of allemaal dat soort dingen. Maar bij de anderen hebben we dat allemaal niet. Dan hebben we de beren in zich geheel. En dat is in ons geval, dus we hebben dat er toch uit moeten snijden. Maar zeker in de laatste jaren zijn er een aantal technieken uitgekomen, hebben we ook bewezen in bijvoorbeeld de zeeschildpad challenge, die je heel goed vrijwel unsupervised kan gebruiken. Oftewel, zonder die te trainen, of veel te trainen in ieder geval met dit soort data, dat je die vrijwel meteen kan zeggen van 'hé, knip het berengezicht eruit.' Dat hebben we toevallig van de week getest. Dat werkt echt wel heel goed. Het model heet SUM, Segment Anything, is van Meta, Facebook. En daar kun je tegenwoordig ook een tekst prompt. Dus een van de mooie dingen aan het model, het doel is dus om iets te segmenteren, oftewel echt uit te snijden, niet alleen maar om een bokje eromheen te tekenen. En dus het doel daar is om automatisch dat te kunnen doen vanaf de grond. Maar je hebt een aantal verschillende inputs die je dat model kan geven om tot die segmentatie te komen. Dus je kunt zeggen 'ik heb helemaal niks', en dan gaat die zelf gewoon het meest relevante wat je kan vinden voor je segmenteren. Maar je kunt ook point labels, zoals je dat noemt, dus kun je puntjes aangeven van 'ik klik hier drie keer op het object dat ik interessant vind', en dan neemt die dat als input en gebruikt die dat om dan een segmentatie te doen. Je kunt ook een bounding box meegeven. En dan teken je dus een vierkantje om dit object, en dan weet die dus binnen dat vierkantje het juiste ding uit te snijden. Maar wat dus bij de beren toevallig heel goed werkte ook, is de tekst prompt. Dus je kunt ook letterlijk zeggen 'bear face'. Als tekst meegeven als input van het model. En dan weet die dus inderdaad, dan pakt die zowel de beer, maar ook los nog het gezicht. Dus dan weet die die gewoon eigenlijk perfect uit te snijden in de foto's die ik getest heb. Ik zal niet beweren dat het 100% accuraat is voor de hele dataset. - Maar het helpt je al in een eentje op weg. - Ja, dus op die manier kunnen wij automatisch je labeling, en kijk, het gaat om duizenden foto's, maar we hebben ook een team van vijftig man, dus om die allemaal met de hand te laten segmenteren, dat is heel veel werk. Maar om door al die foto's, die segmentatie een keer heen te klikken en te kijken, 'hé, is dit accuraat?' - Klopt dit. - Dat is eigenlijk goed te doen natuurlijk met zo'n team. Dus op die manier kunnen we dat doen. - Geweldig. En heb je dan nou ook nog last van, want je hebt te maken met dag en nachtfoto's, en daar zit natuurlijk wel een enorm verschil tussen. - Ja, dat is wel, daar zullen we gewoon allebei een groot genoeg dataset van moeten verzamelen. Dus we hebben van allebei, hebben we data in de dataset, maar ik weet op dit moment nog niet wat het percentage is aan nachtfoto's. Dus daar zijn we ook wel benieuwd naar of dat lukt. Het enige probleem daarin wel is dat de identificatie die we hebben van de beren, waarvan we echt dus de idee weten, waarbij we weten van 'hé, dit is Berrie de beer', die zijn allemaal overdag gemaakt. Dus dat deel van het netwerk, dus uiteindelijk wordt het een drie-traps raket. Dus eentje die herkent 'is er een beer?' Eentje die herkent 'wat is het gezicht van de beer?' En eentje die dan zegt dan 'dit is Berrie de beer.' - Ja, of Balou. - Ja, of Balou de beer. Waarschijnlijk iets met een been in ieder geval. Maar dat laatste stapje, dat zullen we dus nog niet voor Berrie de nacht kunnen doen. Maar met dit soort projecten kun je natuurlijk ook wel heel makkelijk bewijzen wat wel werkt, wat niet werkt. Want we proberen daarmee ook allemaal verschillende technieken. En zeker een model of een vakgebied zoals identificatie, dat is echt niet uitgespeeld op het gebied van AI. Betekent dat je ook heel veel verschillende, compleet andere type algoritmen hebt, die dit in theorie kunnen. Zoek dan nog maar eens uit welke het beste gaat werken. Het kan dus nogal verschillen, ook per diersoort. En dat is dus echt wat we bij die challenge ook doen. Dat is ook hoe we die 50 man effectief gebruiken. Door ze allemaal verschillende algoritmische hoeken uit te laten proberen. - En je komt weer tot wat is dan de ontbrekende data die je nog niet hebt, of mindere kwaliteit data is. Dus eigenlijk heb je daar ook al learning om vervolg acties op te gaan zetten. - Ja, exact. En dat dan in een mooi tien weken traject. Het heeft een duidelijk begin en een eind en dan kunnen ze weer even starten. - Je zegt dat je veel in de wild life zit. Daar hebben we denk ik nu een paar voorbeelden van gehoord. Heb je er eentje die daar buiten valt? - Ja, we doen dus ook best wel veel in de carbon emission. Dus dat we in proberen te schatten hoeveel carbon gebruikt wordt. De laatste tijd zijn we daar grote stappen mee kunnen maken met echt die de gen AI hype nu. Dus die large language models. Dus we hebben het zowel op persoonlijke finance als op bedrijfs finance gedaan dat we de transacties die jij doet, dus als eerste die van jouw eigen bank. Nou, dat staat echt heel grof beschreven waar die transactie over gedaan is. Dat is als mens al bijna niet te vertalen naar wat er nou ook weer echt was. En dan gebruiken we die large language models om context toe te voegen op basis van andere informatie die we hebben over die transactie. Dus alle informatie wat erin gevoed wordt. En dan weten die modellen daar context bij te trekken die vaak genoeg informatie is om dan de transactie te categoriseren. En hetzelfde hebben we ook voor bedrijven gedaan. We hebben gekeken naar de facturen die zij betalen. En ook voor facturen staat vaak vijf woorden of zo beschreven wat een product is wat er gekocht wordt. En vroeger, ik doe data science al de afgelopen acht jaar minstens. En als iemand dan vroeg van hey, ik wil iets met deze data doen. En dan zeg ik ja, dat kan niet, want die data zit niet in jouw database. Dus dan heb je pech. Maar dat is niet meer zo, want die large language models kunnen zoveel context toevoegen. Dus met die vijf woorden die daar staan en dan de plek van waar de factuur uit verstuurd is, kan die op basis van het Duitse woord vervarken, kan die dan al bedenken van hey, dit is waarschijnlijk een bepaald type verpakte ham, want dat wordt veel in de regio gemaakt. Dus dat is deze ham, dat wordt normaal in 100 gram verpakkingen verkocht. Dus waarschijnlijk is het dit product. En op basis daarvan kunnen we dat dan koppelen aan een carbon impact. En zodoende kun je dus op basis van het financiële systeem van het bedrijf in één keer helemaal doorrekenen. -Zo je hele tweeën missie rapportage maakt. -Ja, kunnen we dan zo doorrekenen. -Mooi, heel mooi voorbeeld. Ja, en we hebben nog iemand, want wij stellen wel de vragen, maar we hebben ook onze virtuele co-host en die wil ook eigenlijk altijd de vraag stellen. -Spannend. [muziek] Aisha. Een intelligente vraag van Aisha. [muziek] Ik ben blij om deel te nemen aan dit gesprek. Ik ben Aisha, de AI hier. Zou je het goed vinden als ik je een vraag stel? Zeker. Wat zijn goede manieren om transparantie en uitlegbaarheid van AI-systemen te vergroten? Dat is een interessante vraag. Ik ben altijd zelf wel fan van toch ook wel de geautomatiseerde. Want wat je veel ziet in het gebied van ethiek is dat uiteindelijk de conclusie toch wel is, ja, dat is leuk dat je daar van alles van kan automatiseren, maar uiteindelijk zul je de use case toch echt helemaal moeten doorgronden en dat met de hand moeten doen. En ik denk dat dat klopt, maar daardoor vind ik het minder interessant, want dan kun je het moeilijk opschalen en automatiseren. Dus vanuit ons perspectief waar wij dat voor veel verschillende gebruikers tegelijk willen kunnen doen, zijn de technieken waarmee je echt inzicht krijgt in waar het model naar gekeken heeft. En dat kun je klassiek bij visiemodellen kun je dat vaak inzien, van oké, hier let het model heel erg veel op. Zo kun je inzicht krijgen in wat je model doet. Maar het ook gebruiken op externe datasets om zo te testen van hé, oké, leuk dat het op mijn trainingsset werkt, maar kan ik dat ook valideren met een paar afbeeldingen die ik van Google trek. Dat is wel ook iets dat je veel gevallen aan zou raden om met de hand te doen. Uiteindelijk is dat toch wel waar je die conclusies op kan trekken. Maar die technieken die je op die manier uit een model weten te trekken van, ja, hier heeft hij opgelet, en dat is met die attention mechanism die in de GenAI model ingebouwd zit, is dat ook mogelijk. Is dat wel echt een eerste stap om te kijken van, om die modellen die zich klassiek black box noemen, om die grey box te maken, om daar een bepaald inzicht in te krijgen. Dat vind ik een belangrijke stap die wij vrijwel elke challenge doen, om even te valideren van, hé, heeft ons model nu iets nuttigs geleerd, of is hij eigenlijk zware aan het overfitten. Precies, dan zit hij alleen maar te halen wat hij gezien heeft. Je diepgaande inzichten zijn erg gewaardeerd. Dank je wel. Graag gedaan. Kijk aan. Sako, ik denk dat wij heel veel inzichten hebben gekregen in wat jullie doen, dus dank je wel daarvoor. Fijn dat we hier mochten komen. Ja, zeker. Tot de volgende, want we gaan er nog eentje maken. Ja, zeker. Top, dank je wel. Leuk dat je weer luistert naar een aflevering van AIToday Live. Vergeet je niet te abonneren, want we hebben het natuurlijk nu gehad over ja, wat... Over proberen. Wat zeg je? Over proberen Proberen. Precies, ja. En ik ben eigenlijk wel benieuwd hoe je je kan opgeven en wat je als bedrijf hiermee zou kunnen. Dus als je je abonneert, dan komt de volgende aflevering en dan hoor je dat vanzelf.