Alle afleveringen
S08E30 - Wat écht verandert bij AI-agents — en wat niet
S08E30

Wat écht verandert bij AI-agents — en wat niet

Seizoen 8 11 min Hosts: Joop Snijder & Niels Naglé
0:00

Wat leer je in deze aflevering?

Waarom falen 70% van de AI-projecten terwijl de technologie steeds beter wordt? Teams jagen de nieuwste modellen na en vergeten de fundamenten die succes bepalen. Joop laat zien dat governance belangrijker is dan het nieuwste model - van het stellen van grenzen tot het monitoren van autonome agents.

Een agent die facturen verwerkt kan zonder duidelijke regels betalingsherinneringen sturen naar klanten die al betaald hebben. Morgen kun je je eerste governance-checklist maken: welke grenzen stel je, hoe monitor je agent-acties, en wie houdt toezicht?

01
Twee ontwikkelingsstromen Technologische onderstroom (taalmodellen, tools, samenwerkingspatronen) verandert inderdaad snel, maar hoofdstroom (adoptie, governance, implementatiestrategie) blijft grotendeels stabilen bepaalt uiteindelijk het succes.
02
Agentgrenzen cruciaal Taalmodellen zoeken altijd wegen om taken uit te voeren, ook ongewenste. 89% van agentprojecten faalt door gebrek aan duidelijke grenzen en monitoring van welke tools wanneer worden aangeroepen.
03
Governance overloopt technologie Wie houdt toezicht, hoe monitor je gedragsverandering van agents bij nieuwe input, en hoe zorg je voor transparantie in besluitvorming? Deze vragen blijven relevant ongeacht het onderliggende model.
04
Experimentopzet tijdloos Doelstelling bepalen, kritische succesfactoren identificeren en implementatiestrategie ontwikkelen werkt hetzelfde of je nu GPT-4 of toekomstige modellen gebruikt.

Kernbegrippen

AI-agents
Autonome systemen die taken uitvoeren door zelf tools en acties te selecteren op basis van doelstellingen.
Agent-grenzen
Vooraf gedefinieerde beperkingen die bepalen welke acties een agent mag uitvoeren en welke tools beschikbaar zijn.
Governance
Regelkader voor toezicht, monitoring en transparantie van AI-systemen en hun besluitvormingsprocessen.
Implementatiestrategie
Plan voor organisatorische adoptie van AI, inclusief doelstellingen, succesfactoren en veranderingsmanagement.

Wat er gezegd wordt

Taalmodellen zijn van nature geneigd om wegen te zoeken om een taak uitgevoerd te krijgen. En dat kunnen wegen zijn die je helemaal niet wilt.

Joop Snijder

Als je vanuit FOMO denkt, Fear of Missing Out. Ik moet bijblijven, het verandert, dus iedere dag anders. Dan kan je daar best onrust in ervaren.

Joop Snijder

Wat kun je morgen doen?

  1. 1 Focus op implementatiestrategie en governance in plaats van alleen de nieuwste technologie
  2. 2 Stel heldere grenzen vast voordat je agents inzet, niet achteraf
  3. 3 Investeer in monitoring en transparantie voor langetermijnsucces

Transcript

Hoi, welkom bij de korte aflevering van AIToday Live. Mijn naam is Joop Snijder, Head of AI bij Info Support. Ik wil het vandaag hebben over iets wat me al een paar keer is opgevallen. Namelijk van de week kreeg ik onder een poster die ik had gemaakt over mijn boek, Doeltreffend met AI-agents, kreeg ik een reactie. Iemand die schreef namelijk: ik snap eigenlijk niet dat dit nog verkocht wordt. Dit soort dingen zijn toch al verouderd. En daarmee bedoelde ze de theorie die gaat over het boek. Het boek is in oktober afgelopen jaar uitgekomen. En grappig genoeg heb ik die opmerking nu een keer of drie, vier gehoord en steeds met dezelfde strekking. De ontwikkelingen gaan zo snel. Dus hoe kan een boek dan nog actueel zijn. En ik wil daar vandaag iets dieper op ingaan, want het zit wat genuanceerder in elkaar dan je misschien denkt. Ik vind het leuk van: laten we beginnen met waarom iemand wel gelijk heeft. Want dat is ook interessant. Maar goed, eerst even terug naar de basis, dat we het allemaal over hetzelfde hebben. Want als we het over AI-agents hebben, wat bedoelen we dan precies. Dus een agent is een stuk software dat deels autonoom kan handelen. En dat betekent dat het bijvoorbeeld een plan kan maken en het heeft tools om dingen uit te voeren. Want een taalmodel kan zelf niets. Het kan niet op het web zoeken. Het kan geen document schrijven, niet uit zichzelf. Het heeft tools nodig. En het heeft een vorm van geheugen. Dat kan korte termijngeheugen zijn, gedurende de sessie, tot aan langdurig geheugen, waarbij dingen worden weggeschreven op schijf of in een database. Zodat de agent ook over sessies heen kan terugkijken. Laten we nu eens even kijken waar die commentaargever gelijk heeft. Want er gebeurt natuurlijk op het hele AI-vlak veel. Maar ik zoom vandaag in. Wat verandert dan wel snel. Wat begon als chatbots, vraag en antwoord. Dat is geëvolueerd naar volwaardige agents. De Claudes, de Gemini's, de ChatGPT's en dat gaat hard. De taalmodellen die eronder zitten, worden steeds beter getraind op agentgedrag. Wat ChatGPT net uitkwam als een vraag- en antwoordmachine, voert het nu daadwerkelijk taken voor je uit. Hoe beter een taalmodel daarop is getraind, hoe preciezer die commando's kan geven: ik wil dat je deze tool uitvoert of die andere. Of maak een presentatie, haal gegevens uit de database, spreek met een MCP-server, dat soort zaken. Daar worden ze gewoon steeds beter en slimmer in. En het taalmodel is wel belangrijk om te weten, dat staat niet op zichzelf. Er zit een schil omheen. De user interface, maar ook het deel dat het taalmodel aanspreekt, zowel ernaartoe als wat er terugkomt. Dat noemen we dan preprocessing en postprocessing. Ook die twee delen, dat wordt steeds slimmer gemaakt, waardoor het geheel sneller en beter wordt. Iets als Claude Code is begin vorig jaar uitgekomen. De software die dat taalmodel aanstuurt, bevat inmiddels hele slimme dingen die het geheel optillen. Dan het bouwen van agents zelf, je zelf agents gaat bouwen. Wat daar snel gaat, is hoe je agents opzet. Hoe je ze programmeert en hoe je agents met elkaar laat communiceren als je richting een echte agentic omgeving beweegt, met autonome beslissingen door meerdere agents tegelijk. Als je bijvoorbeeld een visieplan laat maken, dan heb je een agent die op basis van je notities het plan schrijft. Een andere agent die doet misschien de fact-checking, een andere die kijkt naar de structuur van je plan. En een vierde laten we die optreden als criticus. Die zoekt dan naar gaten, naar wat er gemist wordt. En hoe die agents met elkaar samenwerken. Da zit echt ook wel een groot verschil tussen hoe er vorig jaar naar gekeken werd en hoe er nu gekeken wordt. Er ontstaan namelijk steeds meer patronen. En je zou kunnen zeggen: we leren steeds beter begrijpen hoe teams met elkaar werken, omdat het uiteindelijk teams van agents worden. Je hebt bijvoorbeeld een hiërarchische vorm waarbij één agent de baas is en sub-agents aanstuurt, maar er zijn ook zelfsturende teams, waarbij elke agent zijn eigen taak heeft en daarvoor verantwoordelijk is. Er is ook een variant waarbij je werk overdraagt. Agent 1 doet taak één. Geeft een seintje aan de volgende. En zo ontstaat er een soort van productiepipeline. Een keten van agents, zou je kunnen noemen. Dit soort patronen, daar zijn er echt nog heel veel meer van. Die zien we steeds meer ontstaan. En dan zien we ook steeds sneller zien we daar nieuwe patronen ontstaan. Dus ja, op dat gebied gaat het snel. Taalmodellen worden beter voor agentgedrag. We weten steeds beter hoe we slim omgaan met wat we het taalmodel meegeven en wat eruit komt. En we zien steeds nieuwe samenwerkingspatronen ontstaan. Dus daar heeft degene die dat commentaar gaf echt gelijk. Wat vaak niet wordt begrepen, is dat er ook heel veel steeds hetzelfde blijft. Hoe zet je een goed experiment met agents op. Daarvoor maakt het eigenlijk niet zo heel veel uit welke technologie je gebruikt of welk taalmodel eronder zit. Want dat gaat uiteindelijk veel meer over. Wat wil je bereiken? Wat is je doel? Hoe kom je daar? Wat heb je daarvoor nodig? Wat zijn de kritische succesfactoren? En dat is echt vandaag of morgen niet anders dan gisteren. Wat mag een agent wel of niet. Vooral die "niet" en die wordt zo vaak vergeten. Je moet heel goed nadenken over waar de grenzen liggen van je agent. Taalmodellen zijn van nature geneigd om wegen te zoeken om een taak uitgevoerd te krijgen. En dat kunnen wegen zijn die je helemaal niet wilt, omdat ze tools zodanig kunnen combineren dat ze een pad bewandelen dat het verkeerde resultaat geeft. Of erger. Misschien zelfs al dingen doen die wettelijk helemaal niet mogen. In aflevering 5 van dit seizoen, seizoen 8. Over governance had ik het hier al uitgebreid over. Nu dat ik toch governance noem, laten we die ook even benoemen. 89 De spelregels. 90 Want wie houdt er bijvoorbeeld toezicht op de agents. 91 Wie zorgt ervoor dat ze blijven doen waarvoor ze zijn ontwikkeld. 92 En dat klinkt misschien wat vreemd. 93 Je hebt ze getest en je weet wat ze doen. 94 Dus blijven ze toch doen wat ze moeten doen. 95 Maar als het goed is, zet je een agent in om juist iets te veranderen. 96 En dat betekent dat klanten zich mogelijk anders gaan gedragen. 97 Dat medewerkers anders gaan werken en dat je met andere data te maken krijgt. 98 En daarmee krijgt de agent dus ook mogelijk andere input. 99 En levert dat ook mogelijk andere output. 100 Hoe zorg je ervoor dat je weet wat je agent dan doet, heb je alles ingericht, zodat je precies ziet op welke data hij werkt, welke tools worden aangeroepen en met welke data die tools zelf worden aangeroepen. 101 Want daar heb je vaak geen invloed meer op als de agent eenmaal in productie staat. 102 En dit is precies waarom zoveel agentprojecten mislukken. 103 Dit soort gebrek aan monitoring, grenzen, die spelen daar echt een grote rol in. 104 En dat zijn allemaal zaken die bepalen hoe succesvol je agent is, hoe succesvol die blijft. 105 En dat zijn dingen die ik onder andere in mijn boek heb geschreven. 106 Het gaat er mij helemaal niet om dat mensen mijn boek moeten lezen, hoewel, ik heb natuurlijk niet voor niks geschreven. 107 Daarom is het wel handig om te zien dat er twee stromen zijn. 108 Kijk, de eerste, dat is de technologische onderstroom noem ik dat. 109 Die verandert snel. 110 Daar zitten wij natuurlijk ook bovenop. 111 Ik kijk ernaar en ben vaak best wel blij verrast met wat er alweer nieuw is en wat je daarmee kan. 112 Maar er is ook een grote hoofdstroom. 113 En die gaat echt minder hard. 114 Die gaat over technologieën heen. 115 Die gaat over adoptie. 116 Hoe zorg je dat mensen AI agents omarmen. 117 Het is uiteindelijk nieuwe technologie. 118 En dat hebben we vaker meegemaakt. 119 Wat betekent dit in je organisatie. 120 En als je vanuit FOMO denkt, Fear of Missing Out. 121 Ik moet bijblijven, het verandert, dus iedere dag anders. 122 Dan kan je daar best onrust in ervaren. 123 Kijk je er iets meer beschouwend tegenaan, dan zie je echt wel dat de meest bepalende onderdelen niet zo snel veranderen. 124 En ik zeg dat bewust, want ik kan het niet vaak genoeg herhalen. 125 Dit bepaalt veel meer het succes of het falen van je agent. 126 Dan of je het allernieuwste model gebruikt, of de allernieuwste samenwerkingspatronen tussen agents inzet. 127 Dat is wat ik je wil meegeven. 128 Dus laat je niet gek maken, maar laat je wel goed informeren over wat de technologie kan, wat ze niet kan en hoe je die succesvol inzet. 129 Daarom in de show notes toch nog even een linkje naar mijn boek. 130 Maar belangrijk, zoals altijd. 131 AI is niet de oplossing van elk probleem, maar onmisbaar waar het past. 132 Tot de volgende keer. 133 Vind je dit nou een interessante aflevering? 134 Deel hem dan eens met collega's, vrienden, familie.