De prijsverhoging die je zelf kiest

Leuk dat je weer luistert naar een korte aflevering van AIToday Live. Vandaag gaan we het hebben over de prijsverhoging die je zelf kiest. Dit gebeurt er. Je opent je AI tool. En het nieuwste model staat al voor je klaar. Netjes voorgeselecteerd. Misschien werk je met ChatGPT, misschien met Claude of Copilot en voor dit verhaal maakt het niet uit. Je klikt erop zonder erbij na te denken. Want je wilt er niet achterblijven met een oud model. En precies daar in dat ene klikje zit de prijsverhoging die je zelf hebt uitgekozen. Vandaag gaan we het hebben over geld. Over hoe we betalen voor AI en over een verschuiving die de meesten van ons nog niet doorhebben. Ik kijk hierbij eerst naar Claude. Het is het model dat wij intensief voor onze podcast gebruiken. Anthropic, het bedrijf achter Claude, bracht onlangs Opus 4.7 uit. Kort daarna alweer 4.8, heel snel achter elkaar. En op het eerste gezicht lijkt dat goed nieuws. Betere modellen en we mogen ze ook meteen gebruiken. Maar er zit iets onder. Want toen Opus 4.7 verscheen, leek de prijs in de tabel die zij hebben op de website gelijk te blijven aan die van 4.6. 5 dollar per miljoen tokens aan de invoerkant 25 dollar aan de uitvoerkant. Geen cent verschil. Wat niet in die tabel staat, maar wel in een kader eronder, is dat Anthropic ook een nieuwe tokenizer heeft ingevoerd. En even een stapje terug om even uit te leggen wat de tokenizer is, waarom dat zo belangrijk is, namelijk een token een stukje van een woord. En het is de eenheid waarmee je AI gebruik wordt afgerekend. Een beetje zoals de kubieke meters op je energierekening. En die tokenizer is de manier waarop geteld wordt hoeveel van die stukjes jij verbruikt. Die manier van tellen, hebben zij veranderd. Het gevolg voor exact dezelfde tekst, telt het nieuwe systeem tot wel 35% meer tokens. Dus de prijs per token blijft gelijk, maar er gaan meer tokens door de meter. Dus betaal je tot 35% meer voor hetzelfde werk. Het is een soort van krimpflatie die we uit de supermarkt kennen. Hier is het mooiste vanuit het oogpunt van de leverancier, wij kiezen er vrijwillig voor. Want niemand dwingt je naar het nieuwste model. We gaan er gewoon naartoe omdat nieuwer toch beter voelt. En nu denk je misschien: ik heb gewoon een abonnement, ik betaal mijn vaste bedrag per maand. Wat maakt die manier van tellen mij nu uit? Dat is een goede vraag en het antwoord verschilt, namelijk. Heb je een abonnement met een vaste prijs dan zit er een limiet aan je gebruik. En verstookt het nieuwe model meer tokens, dan ben je simpelweg eerder door je limiet heen. Je krijgt voor hetzelfde geld minder gedaan. En op een gegeven moment houdt het op totdat je je nieuwe limiet weer ingaat. Reken je per token af en dan gebeurt zodra een AI-oplossing of een AI-agent de modellen voor je inzet. En dan is er geen stopknop. Dan loopt de meter gewoon door. Rekening betaalt je organisatie. Of jij als je je baas bent. Dus dezelfde opslag van 35% laat zich dus op twee manieren voelen: bij een abonnement als een plafond, dat sneller in zicht komt. Bij betalen per gebruik als een bedrag, dat elke maand net wat hoger uitvalt dan je had ingeschat. Nu kun je zeggen, ja, misschien zit die nieuwe misschien zit die nieuwe tokenizer gewoon, omdat het model er beter van wordt. Dat is ook precies hoe Anthropic het uitlegt. Het kan ook wel kloppen. Een betere manier van tellen kan een model slimmer maken. Maar er is toch iets wat mij in ieder geval doet twijfelen. De goedkopere modellen, hebben namelijk de upgrade niet gekregen. Om even uitleg te geven. Dus Anthropic kent de structuur van modellen met de namen Haiku Sonnet en Opus met Haiku als goedkoopste en Opus als duurste model. En Claude Sonnet, het middenmodel, staat nog op versie 4.6. En Haiku, het goedkoopste model, dat in veel gevallen prima werkt, staat zelfs nog op 4.5. Dus dat ten opzichte van die Opus 4.8. En beide. Die Sonnet en Haiku. Die werken dus nog met die oude tokenizer. Dus met de oude manier van tellen zonder die 35% opslag. Met andere woorden, wil je het nieuwste. Dan kom je dus automatisch bij Opus uit. Bij Opus betaal je de hoogste basisprijs en de opslag van de nieuwe telling. En de goedkope modellen blijven op de oude meter staan. Toeval misschien. Ik vind het best wel opvallend. Laat ik het concreet maken. Neem dus Haiku 4.5 naast Opus 4.8 op papier is dan Opus vijf keer zo duur. Tel je de nieuwe manier van tellen erbij op, dan word je voor dezelfde tekst bijna, of dan ben je voor diezelfde tekst bijna zeven keer zo duur uit. En dat verschil verdwijnt volledig uit beeld op het moment dat je klakkeloos het nieuwste model aanvinkt. Waarom vertel ik je dit? Omdat ik denk dat we nog maar aan het begin staan van een veel grotere verschuiving. We gaan namelijk steeds meer per token afrekenen. Kijk naar wat er gebeurt. Vanaf één juni stapt Microsoft met GitHub Copilot over op afrekenen per token. Dus je abonnementsprijs blijft gelijk, maar in plaats van een vast aantal verzoeken, krijg je een potje tegoed dat leegloopt. Logisch ook, want bij programmeren met AI-agents verstook je razendsnel veel tokens. En de verwachting is dat Anthropic en Google snel zullen volgen. En wat mooi is, de ontwikkelaar Simon Willison. Die heeft dit best wel heel mooi voorgerekend. Hij betaalt namelijk nu zo'n 200 dollar per maand aan abonnementen. 100 dollar voor een Max-abonnement van Claude. En ook 100 dollar voor zijn voor zijn OpenAI abonnement. Maar als hij per token had moeten betalen voor wat hij in een maand verbruikt, was hij ruim 2000 dollar kwijt geweest. Tien keer zoveel. Daar zit de kern. Het abonnementsmodel is voor de leveranciers namelijk onhoudbaar, omdat de zware gebruikers veel meer verbruiken dan dat ze betalen. De leveranciers moeten dus op zoek naar manieren om meer in rekening te brengen. En hoe prettig is het dan voor hen dat wij vrijwillig naar de duurdere optie lopen. En misschien denk je, dit is het verhaal van Anthropic en mijn tool draait op de GPT-modellen of ik gebruik ChatGPT. Maar bij OpenAI speelt precies hetzelfde. Alleen wat anders verpakt. Waar Anthropic de prijs liet staan en de telling veranderde, deed OpenAI het omgekeerde. Dus met de komst van GPT-5.5 eind april verdubbelde de prijs per token gewoon. En van 2,5 dollar naar 5 dollar aan de invoerkant en van 15 naar 30 dollar aan de uitvoerkant. Dus geen verstopte verhoging dit keer, maar zwart op wit op de prijspagina. Het addertje zit in het verhaal eromheen. Dus OpenAI die zegt dat het nieuwe model zuiniger is en dat het dus minder tokens nodig heeft voor dezelfde taak. De boodschap, ja, de prijs gaat omhoog, maar je verbruikt er minder, dus per saldo valt het wel mee. Klopt dat dan? Onafhankelijke metingen lieten zien dat de werkelijke rekening bij de overstap naar het nieuwe model met de helft tot bijna een verdubbeling steeg. Dus gebruikers melden zo'n 40% hogere kosten, ook al werd het model echt zuiniger. De zuinigheid dekt de prijsverdubbeling dus bij lange na niet. En de rest van het patroon identiek. Dus de goedkopere modellen blijven goedkoper en wie naar het nieuwste model grijpt, betaalt het meest. Dus ook OpenAI bracht zijn programmeertool al in lijn met het afrekenen per token. Zelfde bestemming andere route. Dus de een verstopt de verhoging in de telling. De ander zet hem open neer met een zuinigheidsbelofte eromheen. Het is dus niet dat dit zomaar bij één bedrijf plaatsvindt. Het is de richting waarin de markt beweegt. En dan speelt er nog iets op de achtergrond. En wat mij betreft, verklaart dat de snelheid waarmee dit allemaal gaat en bedoel ik het uitbrengen van deze modellen. Dus zowel OpenAI als Anthropic maken zich namelijk op voor een beursgang. Anthropic deed deze maand al een vertrouwelijke aanvraag. En OpenAI volgt naar verwachting binnen enkele weken. Allebei mikken ze op een notering nog dit najaar. En de bedragen zijn echt duizelingwekkend. Ze halen miljarden en miljarden dollars op tegen waarderingen die groter zijn dan die van gevestigde reuzen. En dat voor bedrijven die nog geen van beide winst maken. Daar zit precies wel de spanning. Dus wie naar de beurs gaat met zo'n prijskaartje moet natuurlijk toekomstige aandeelhouders iets te bieden hebben. Dus je moet laten zien dat er groei in zit, dat je omzet stijgt en dat er een pad naar winst is. En dat verklaart voor mij in ieder geval de stortvloed aan nieuwe modellen. De ene release naar de andere in een tempo dat we eerder niet zagen. Elk nieuw model heeft iets extra's, maar in mijn ogen vooral een verhaal naar de markt. Deze leveranciers die zeggen eigenlijk: kijk, we worden steeds beter, steeds onmisbaarder steeds meer waard. En elke prijsverhoging die we onderweg kunnen doorvoeren zonder dat de klant wegloopt, is een streepje extra op de omzetregel die straks in de beursprospectus komt te staan. Dus zo bezien is die onzichtbare opslag op je tokens niet zomaar een technisch detail. Het is een klein radertje in een veel grotere machine die op volle toeren draait richting de beurs. Wat kun je hier nou mee? Ik vertel je dit niet om je bang te maken voor AI helemaal niet. Ik gebruik deze modellen elke dag met plezier. Maar ik wil dat je wel met een open vizier kiest. En hoe pak je dat dan praktisch aan? Nou mijn advies: draai de gewoonte om. Dus we pakken nu het nieuwste zwaarste model, omdat het er nu eenmaal staat, begin in plaats daarvan met het goedkoopste model en kijk of dat het werk aan kan. Doet het dat dan ben je klaar. Doet het dat niet, ja dan stap je dan neem je een treetje hoger. Kies je een duur model, dus niet andersom. Ik kan dit uit eigen ervaring vertellen. Want voor deze podcast gebruiken we een hele set aan prompts voor je moet je denken aan research, productie, analyses en nog veel meer. We hebben 55 unieke prompts op dit moment in totaal. En wat denk je slechts één daarvan draait op het duurste Opus-model. En dan dus nog niet eens op het nieuwste model. We gebruiken nog steeds versie 4.6. Het overgrote deel 45 stuks van die prompts doet het prima op Sonnet, het middelste model. En de overige negen draaien op Haiku, het goedkoopste model. En ik moet je zeggen, terwijl ik deze aflevering aan het voorbereiden was, ben ik onze eigen prompts nog eens langsgelopen. En ik vond er toen 11 die naar een goedkoper model overgezet kunnen worden, zonder dat de kwaliteit daaronder gaat leiden. Dus elf prompts die ik tot nu toe gewoon te zwaar had ingesteld puur uit gewoonte. Betekent dit dat je altijd voor de goedkope optie moet kiezen? Nee, ik denk het niet. Dat is echt mijn punt niet. Want er zijn taken waarbij het zwaarste model zijn prijs dubbel en dwars terugverdient. Denk aan werk waarbij je echt geredeneerd moet worden, waar misschien één foutje een hoop kost of waar de uitkomst meteen goed moet zijn. Die ene prompt van ons die op Opus draait, doet precies zoiets. Daar is het verschil het geld ook waard. De grens ligt dus niet bij duur is beter. De grens ligt bij de vraag of het goedkopere model de taak aan kan. En voor verreweg het meeste werk is het antwoord echt ja. En voor dat ene stukje waar het echt ingewikkeld wordt, betaal je met een gerust hart voor het beste. En werk je in een organisatie waar AI in producten of in AI agents zit, hou dan je tokenverbruik in de gaten. Want de rekening gaat zich anders gedragen dan dat je gewend bent. Zeker als je straks per token afrekent. Bewustzijn is hier je beste gereedschap. Een prijsverhoging die je niet ziet aankomen, kun je niet afwegen. Eén die je wel doorhebt, wel. Dank je wel weer voor het luisteren. En bedenk zoals altijd: AI is niet de oplossing voor elk probleem, maar onmisbaar waar het past. Tot de volgende.

De prijsverhoging die je zelf kiest

Wat leer je in deze aflevering?

Kernbegrippen

Wat kun je morgen doen?

Transcript

Meer afleveringen