Alle afleveringen
S05E44 - Kracht en uitdagingen van LLMs
S05E44

Kracht en uitdagingen van LLMs

Seizoen 5 6 min Hosts: Joop Snijder & Niels Naglé
0:00

Wat leer je in deze aflevering?

Met de opkomst van ChatGPT is er veel aandacht voor large language models, maar de keuze is inmiddels veel groter met alternatieven als Google Bard, Meta's LLama en Claude. Deze aflevering bespreekt waar je op moet letten bij het kiezen van een taalmodel en welke kracht en uitdagingen deze technologie met zich meebrengt.

01
Leveringsvoorwaarden verschillen per model Elke leverancier hanteert andere voorwaarden, zelfs tussen modelversies onderling. Let goed op of je input gebruikt mag worden voor verdere training van het model.
02
Open source biedt meer controle Bij open source modellen bepaal je zelf wanneer je een nieuwe versie implementeert en wat er met je data gebeurt, wat meer autonomie geeft.
03
Brede toepassingsmogelijkheden van LLMs De modellen kunnen synthetische data genereren, helpen bij het schrijven van tekst en code, spraak synthetiseren, beeldanalyse uitvoeren en complexe datasets begrijpelijk maken.
04
Uitdagingen bij inzet in de praktijk LLMs presteren slecht op taken die feitelijkheid vereisen, hebben geen betrouwbare controle over uitvoerformaat, missen bronvermelding en hebben een afkappunt in trainingsdata.

Kernbegrippen

Large Language Models (LLM's)
AI-systemen getraind op grote hoeveelheden tekst die menselijke taal kunnen begrijpen en genereren.
Open source modellen
Vrij beschikbare AI-modellen waarvan je zelf controle hebt over implementatie en dataverwerking.
Synthetische data generatie
Het kunstmatig creëren van realistische trainingsdata met behulp van AI-modellen.
Leveringsvoorwaarden
Contractuele bepalingen van AI-providers over datagebruik, training en eigendomsrechten per model.

Transcript

ChatGPT is nog het bekendste taalmodel, maar met Google BarD, Metas LLama, Claude en nog veel meer is de keuze reuze. Er zijn verschillen en overeenkomsten. In deze aflevering hoor je de kracht en de uitdagingen van al deze modellen. Luister naar een korte aflevering van AIToday Live. Actuele onderwerpen over AI in 5 minuten. Met de introductie van de ChatGPT is er veel aandacht ontstaan voor large language models. Maar ChatGPT is niet het enige large language model dat beschikbaar is. Er zijn inmiddels diverse grote taalmodellen op de markt van verschillende leveranciers. En het lijkt wel alsof je voor de neus van een etalage van een snoepwinkel staat met je neus er tegenaan en je de keuze hebt uit allerlei lekkernijen. Maar je moet wel opletten wat je kiest. Deze keuzevrijheid is goed, want iedere leverancier heeft andere voorwaarden voor het gebruik van hun modellen. Dit kan zelfs verschillen per modelversie. Zo heeft GPT 3.5 andere voorwaarden dan GPT 4 van OpenAI. Het is dus zaak goed op te letten welk large language model je kiest. Tenminste, welke leverancier welk model. Mag de leverancier bijvoorbeeld jouw input gebruiken om de modellen verder te trainen? Ook kun je nu kiezen voor open source versies. Je bepaalt dan zelf wanneer je een nieuwe versie implementeert en wat er met je data gebeurt. Deze krachtige modellen kunnen enorm veel taken uitvoeren, waardoor veel bedrijven zich afvragen of en hoe ze deze technologie kunnen inzetten. Large language models kunnen bijvoorbeeld realistische en diverse synthetische data genereren. Dit kan helpen bij het trainen van AI-systemen. Ook kunnen ze ondersteuning bieden bij het schrijven van natuurlijke taal en zelfs computercode. Het programmeercode. Verder zijn large language models in staat om mensachtige gespraak te synthetiseren en stemconversie uit te voeren. Ook kunstmatige beeldanalyse, inclusief segmentatie, reconstructie, behoren tot de mogelijkheden. Complexe datasets omzetten in intuïtieve representaties. Dat wil zeggen dat ze grafieke documenten uit kunnen leggen in voor ons begrijpelijke taal. Maar er zijn ook uitdagingen voor het inzetten van large language models. Hoewel de mogelijkheden enorm zijn, zijn er ook genoeg uitdagingen bij het inzetten van deze modellen. Daar moeten we wel rekening mee houden. Ten eerste presteren ze slecht op taken die feitelijkheden vereisen. En er is natuurlijk geen betrouwbare controle over het uitvoerformaat. Zo vraag ik regelmatig om iets in een tabel te zetten. Gaat 9 van de 10 keer goed. En wat denk je? De 10e keer krijg ik het gewoon in een heel ander formaat, bijvoorbeeld uitgeschreven in tekst. Heel erg lastig. Dus betrouwbare controle over het uitvoerformaat kan lastig zijn. Verder is het een uitdaging om prompt zo te schrijven dat ze blijven werken met nieuwere modellen. En bestaande modellen hebben ook een afkappunt in de tijd voor verzamelde trainingsdata. je heel erg op letten. GPT 4, even uit mijn hoofd, september 2021 bijvoorbeeld. Alles wat daarna komt zit niet in de trainingsdata. Daarnaast is er een gebrek aan interpreteerbaarheid, bronvermelding in de gegenereerde tekst. Uiteindelijk wil je natuurlijk ook weten hoeveel iets gaat kosten en is het lastig om operationele kosten van deze modellen in productie in te schatten. Dit beperkt soms de breedte van de inzetbaarheid. Daar moet je echt wel rekening mee houden. Oh ja, en niet te vergeten, de prestaties in niet-Engelse talen zijn over het algemeen lager dan in het Engels. Nou gebruik ik zelf Engels en Nederlands voor dit soort taalmodellen en merk ik dat Nederlands best wel goed werkt. Maar soms begin ik toch gewoon in het Engels. Ga ik op het Engels door en zogauw ik een juiste output heb, dan schakel ik over, laat ik het vertalen naar het Nederlands en kan ik vanuit daaruit verder. Maar je moet wel even opletten dat een aantal van deze tekortkomingen die ik genoemd heb best wel de breedte van de inzetbaarheid kan beperken. Concluderend, er zijn volop keuzemogelijkheden wat betreft large language models en ik denk dat dat ook een hele goede zaak is, want dan kunnen we ook een juiste afweging maken, rekeninghoudend, juist met de factoren zoals de leveringsvoorwaarden, wordt je data gebruikt om te trainen, open source versus commercieel en het precieze gebruikstoel. Als je dat in oogschouw houdt kun je de juiste keuze maken en kunnen large language models heel veel waarde toevoegen. Dank voor het luisteren. Mis geen aflevering, abonneer je via je favoriete podcast app.