Alle afleveringen
S05E28 - De grenzen van AI: Mythes en realiteiten over zelflerend vermogen
S05E28

De grenzen van AI: Mythes en realiteiten over zelflerend vermogen

Seizoen 5 6 min Hosts: Joop Snijder & Niels Naglé
0:00

Wat leer je in deze aflevering?

Naar aanleiding van veel vragen over hoe machines leren, wordt het wijdverspreide misverstand besproken dat AI zichzelf kan verbeteren. De aflevering legt uit waarom het terugvoeren van AI-gegenereerde antwoorden niet leidt tot betere intelligentie, maar juist tot problemen.

01
AI kan zichzelf niet verbeteren Het idee dat je output van ChatGPT terug kunt voeren om het model slimmer te maken is onjuist. De trainingsdata bevatte al voldoende informatie voor dat antwoord.
02
Model collapse als risico Wanneer AI-gegenereerde content wordt teruggevoerd als trainingsdata, ontstaat 'model collapse'. Het model stort in en geeft steeds meer dezelfde, beperkte antwoorden.
03
Machines begrijpen geen betekenis Taalmodellen voorspellen slechts woord voor woord wat het volgende woord moet zijn. Mensen kennen betekenis toe aan zinnen, machines niet.
04
Veel menselijk handwerk vereist Bij OpenAI leggen mensen verschillende antwoorden op dezelfde vraag voor aan beoordelaars om te bepalen welk antwoord het meest betekenisvol is. Dit wordt vervolgens bijgetraind.

Kernbegrippen

Model collapse
Verslechtering van AI-modelprestaties wanneer AI-gegenereerde content als trainingsdata wordt teruggevoerd, resulterend in repetitieve en beperkte antwoorden.
Taalmodel
Algoritme dat woord voor woord voorspelt wat het volgende woord in een zin moet zijn, zonder werkelijk begrip van betekenis.
Reinforcement Learning from Human Feedback (RLHF)
Trainingsmethode waarbij menselijke beoordelaars verschillende AI-antwoorden evalueren om modellen te verbeteren.
Guardrails
Ingebouwde beperkingen en richtlijnen die bepalen welke vragen een AI-model mag beantwoorden en hoe.

Transcript

Ik heb namelijk de afgelopen week, weken, heel veel vragen gekregen van hoe leren machines nou en er leeft namelijk het idee dat AI zichzelf kan leren en zichzelf verder kan ontwikkelen. waardoor er ideeën, fantasieën gaan ontstaan dat bijvoorbeeld de krachtige taalmodellen die we nu hebben, GPT, dat de antwoorden die daaruit komen, dat je die weer terug zou kunnen voeren aan de machine en dat die zo zichzelf zou kunnen verbeteren waardoor er een soort van nog meer super intelligentie zou kunnen ontstaan. Is dat waar? Nee. Dat is eigenlijk het korte antwoord. Kunnen machines bijgeleerd worden? Ja, maar niet op deze manier. Ik wil dat wel even in het heel kort uitleggen. Als we kijken naar hoe we uiteindelijk machine learning modellen trainen, is dat we ze data geven en vanuit die data proberen ze patronen eruit te halen en vanuit daaruit worden de antwoorden gemaakt. En kijk naar bijvoorbeeld een model dat objecten kan herkennen uit foto's. Wat daar gebeurt is dat daar soms fouten in worden gemaakt. In plaats van dat je een hond ziet, en er staat een hond op de foto, maar de machine zegt "Ik denk dat er een kat op staat." Wat wij dan kunnen doen is dat terugvoeren met ons antwoord erbij en zeggen "Nee, dat is fout. Er staat dit op de foto. En op die manier kan een model opnieuw getraind worden met meer juiste antwoorden. En dat is een heel groot verschil met als we het nou hebben over, als je nou antwoorden, dus Chet Jipiti die heeft bijvoorbeeld een artikel voor jou geschreven en je zou dat artikel zou je uiteindelijk weer terugleveren aan dat model. Dan ben je hem data terug aan het geven die al voldoende was om deze gegevens uit het model te krijgen. De trainingsdata bevatten al het antwoord op de vraag die je gegeven hebt en door deze weer terug te zetten ben je steeds meer gewicht aan het toekennen op de antwoorden die je teruglevert. En daar hebben ze een term voor en dat heet model collapse. Dus wat er gebeurt is dat je model instort, dus hoe meer je eigenlijk dit soort dingen teruglevert, hoe meer het model instort en steeds meer dezelfde antwoorden gaat geven. En dat was nou juist niet de bedoeling toch? Je moet je niet vergissen hoeveel menselijk handelen, menselijke toevoegingen er aan de huidige taalmodellen zitten. Dus om zo'n taalmodel te ontwikkelen hebben we natuurlijk menselijk geschreven teksten, maar wat die machine geleerd heeft is woord voor woord voorspellen wat het volgende woord zou moeten zijn. En de machine heeft daar geen enkele betekenis bij. Wij kennen daar betekenis aan toe aan een zin. Dus als we een zin lezen dan heeft dat betekenis voor ons, niet voor die machine. Dus wat hebben ze bijvoorbeeld bij OpenAI gedaan? Is dat ze allerlei antwoorden op één en dezelfde vraag voor hebben gelegd aan mensen. En ze zeggen van, ja maar welke antwoord heeft nou de meeste betekenis bij deze vraag? En dat wordt bijgetraind. Dus er zit ontzettend veel handwerk, mensenwerk komt eraan te pas om ervoor te zorgen dat wat er uit zo'n model komt, dat dat ergens voor ons op slaat. Daarnaast zitten er ook heel veel vangrils, zou je kunnen zeggen, eromheen. Dat wij als mens ook hebben aangegeven, bij deze vragen wil ik niet dat je antwoord geeft. Of wil ik juist dat je heel specifiek altijd dit antwoord geeft. Hoe maak ik een bom? Daar heb ik geen antwoord op. Dat soort dingen. Dus ja, we kunnen machines bijleren door meer data te geven, andere data te geven, of dat we zeggen "hé, we voeren correcties toe, want het antwoord wat je hier gegeven hebt is niet juist, je moet dit antwoord geven, is eigenlijk ook weer nieuwe data, maar dat de machine als een soort van zelfbedenkend ding vanuit jouw laptop in één keer een intelligentie wordt omdat hij van alles zou kunnen leren. Nee. Wij bepalen wat het doel is. Wij bepalen waar het model op geoptimaliseerd is. En bij taalmodellen is het geoptimaliseerd in eerste instantie correcte zinnen schrijven, grammaticaal, syntactisch. En je kan die data niet terugdoen. Ik hoop dat je weer wat wijzer bent. Tot de volgende keer. [Muziek]