Alle afleveringen
S05E72 - De Verjaardag van ChatGPT: van toeval naar fortuin
S05E72

De Verjaardag van ChatGPT: van toeval naar fortuin

Seizoen 5 9 min Hosts: Joop Snijder & Niels Naglé
0:00

Wat leer je in deze aflevering?

In deze aflevering van AIToday Live staan we stil bij één jaar ChatGPT. We bespreken de ontwikkeling van deze invloedrijke AI, van vroege machinevertaling tot de geavanceerde toepassingen van nu, en overwegen de toekomstmogelijkheden die deze vooruitgang biedt. Luister naar onze analyse en gedachten over de impact van ChatGPT op de AI-sector en verder.

01
Google Translate als oorsprong De technologie achter ChatGPT vindt zijn wortels in Google Translate en het sequence-to-sequence algoritme uit 2012, dat tekst omzette naar numerieke vectoren voor betere vertalingen.
02
Attention is all you need paper Google-wetenschappers en de Universiteit van Toronto publiceerden een baanbrekend paper dat bidirectionele context mogelijk maakte, wat een enorme sprong voorwaarts betekende voor taalmodellen.
03
Microsoft's toevallige ontdekking via DDoS Microsoft ontdekte OpenAI toen zij GitHub-code scrapeten, wat werd aangezien voor een DDoS-aanval. Dit leidde tot een investering van 1 miljard dollar in 2019.
04
Google's gemiste kans door zelfbewustzijn-claim Een Google-engineer claimde in 2020 dat hun chatbot zelfbewustzijn had. Google ontsloeg hem en zette het project stil, waardoor ze de boot misten terwijl het later Google Bard zou worden.

Kernbegrippen

Sequence-to-sequence algoritme
Machine learning-methode die invoergegevens omzet in uitvoergegevens via numerieke vectoren.
Attention-mechanisme
Techniek waarmee AI-modellen relevante delen van invoer selectief kunnen verwerken en bidirectionele context begrijpen.
Taalmodel
AI-systeem dat patronen in tekstgegevens leert om tekst te genereren of begrijpen.
Transformers
Neurale netwerkarchitectuur gebaseerd op attention-mechanismen voor efficiënte verwerking van sequentiële data.

Transcript

Het is vandaag 30 november en het is de verjaardag van ChatGPT. Een jaar geleden kwam het uit en daar gaat natuurlijk een hoop veranderen. Mijn leven is in ieder geval veranderd, mijn werkende leven. En het is denk ik wel leuk om juist terug te kijken van hoe zijn we hier gekomen. Want het hangt nogal van een aantal toevalligheden aan elkaar, onverwachte wendingen waarop we op dit punt zijn gekomen. Want als dit een aantal dingen niet gebeurd zouden zijn, zou OpenAI nu niet zijn waar ze nu zouden zijn. En om zo direct vooruit te kijken moeten we eigenlijk even denken aan Winston Churchill die zei hoe langer je terug kunt kijken, hoe verder je vooruit kunt kijken. Dus laten we vandaag eens terugkijken op de verjaardag van ChatGPT. Je zou kunnen zeggen dat de oorsprong van deze technologie begint bij Google Translate. Google Translate ging er natuurlijk om om dingen te vertalen. Dus van de ene taal naar de andere taal. En dat werkte in het begin behoorlijk matig. Als je dat in het begin gebruikte, merkte je dat het meer een soort van woord voor woord vertalen was. En die best wel hele slechte resultaten gaf. Tot op een bepaalde dag en een keer de resultaten heel veel beter werden. En dat had te maken met het zogenaamde sequence to sequence algoritme. En dit klinkt heel technisch en dat is het ook wel een beetje. Maar wat hij eigenlijk deed was een tekst gebruiken en die omzetten naar getalletjes. Dus als een soort van tussentaal waarbij er gekeken werd hoe verhouden de woorden in een zin zich nou tot elkaar. En vervolgens kon hij dat eigenlijk weer ontcijferen en daar een andere taal tegenaan houden. Dus ik gaf bijvoorbeeld in I'm a student. Daar werden allemaal getalletjes aangekoppeld, zogenaamde vector. En die konden dan gedecodeerd worden met allerlei andere talen. Dus dat kon zijn Frans, Nederlands, Duits. Je kon het zo gek niet verzinnen. Dus de decoder zou in het Nederlands zeggen ik ben een student. Nou dat lijkt nog op die woord voor woord vertaling. Maar in het Frans zou het zijn je suis étudiant. Als ik dat goed uitspreek. Het is eigenlijk een hele andere zinsconstructie. Nou daar zijn ze heel lang mee bezig geweest. We hebben het hier over 2012 dat dit was. En op een gegeven moment komt er een paper uit, een wetenschappelijk paper. En dat paper heet 'Attention is all you need'. En het gek is, ook weer Google. Allerlei wetenschappers van Google en de Universiteit van Toronto hebben dan een manier bedacht dat je zowel naar voren als naar achteren kan kijken. Waardoor je eigenlijk meer context hebt. En waarbij de machine die vertaling van het een naar het ander veel beter kan uitvoeren. Een enorme sprong voorwaarts is dat. Nou er zijn allerlei bedrijven die hiermee aan de gang gaan. Waaronder OpenAI. OpenAI heeft in eerste instantie het idee van ja we gaan onderzoek doen naar Artificial General Intelligence. En die bouwen hun eerste GPT. Dan komt GPT2. En dan hebben we het eerste toeval te pakken. Want wat gebeurt er? Op een dag bij Microsoft krijgen ze een DDoS aanval. Dat is waarbij servers zo worden bestookt dat ze bijna onderuit gaan of onderuit kunnen gaan. En Microsoft analyseert dat natuurlijk. En heel raar voor hun is in plaats van dat die DDoS aanval vanaf een obscure locatie kwam, bleek het gewoon van servers uit San Francisco te zijn. Dus dan gingen ze kijken van wie zit hier nou achter. Rondbellen bleek OpenAI te zijn. En die DDoS aanval was namelijk op GitHub. GitHub is de plek die Microsoft gekocht heeft waar heel veel developers open source code op zetten. Dus ze zagen eigenlijk dat OpenAI allemaal programmeercode naar binnen aan het halen was. Die was dat aan het scrapen, aan het leegtrekken. Dus die hebben overlegd van ja wat zijn jullie nou aan het doen? Waar zijn jullie nou mee bezig? Lang verhaal kort. Na een bepaalde periode denkt Microsoft dit zou wel eens wat kunnen worden. En investeert op dat moment 1 miljard dollar in OpenAI. Dus groot nieuws. 2019 hebben we het dan over. En meeste mensen zijn toch wel versteld dat Microsoft hier zoveel geld in stopt. Nou dan scrollen we eigenlijk een jaar verder. En dan komt OpenAI uit met GPT-3. Nog steeds onbekend voor het publiek. Maar dan geven ze mondjesmaat mensen toegang tot een zogenaamde playground. En die playground dat is eigenlijk de voorloper, de echte voorloper van chatGPT. Want dat is een user interface. Maar nog wel heel technisch. Waarin je allerlei technische elementen moest instellen. Zoals de frequency en een inject start text. En van alles en nog wat. En omdat dat zo technisch was, kregen we toch minder aandacht en minder tractie. Ik had het geluk dat ik al eerder toegelaten werd. Waardoor je zag van dit kan echt wel heel erg groot worden. Gaan we nog een stapje verder. En dan waar je ook dat toeval wat er dan gebeurt eigenlijk. Waardoor dingen heel anders lopen dan misschien de bedoeling was. Dan krijg je in juni 2020 zijn we dan. Dan komt er een Google test engineer. En die zegt, Google die heeft een systeem ontwikkeld. En dat was eigenlijk een soort van chatGPT. En die heeft zelfbewustzijn. Dit wordt groot opgepakt in de media. En Google is eigenlijk waarschijnlijk hier zo van geschrokken. Dat ze niet alleen deze test engineer ontslaan. Maar het project ook in de ijskast zetten of in ieder geval niet naar buiten brengen. En waar hij mee bezig was, was het testen wat uiteindelijk Google Bart zou worden. Dus je ziet eigenlijk in de hele historie is het Google, Google, Google. En toch zijn ze niet de eerste die hier mee naar buiten zijn gekomen. En daarmee dus ook niet de grootste. En dan hebben we 30 november 2022. OpenEye brengt chatGPT uit. Ze hebben een user interface waardoor je gewoon kan chatten met een taalmodel. En zij dachten van nou ja weet je, dat zetten we open. Ze hadden dat gemaakt voor hun eigen testmogelijkheden. En hebben dat opengezet en verwachten niet dat dit enige aandacht zou krijgen. En vanaf die dag is het natuurlijk enorm ontploft en zijn we waar we nu zijn. Microsoft was zelfs geschrokken van hoe moeten we nu gaan schalen. In het begin kon je nauwelijks accounts aanmaken of was die niet bereikbaar. Dus het was helemaal niet op voor gesorteerd dat dit zo groot zou zijn. En dat het zo groot opgepakt zou worden. Ook een mate van toeval. Waar ik mee af wil sluiten, want we hebben nu teruggekeken. En als je nou vooruit kijkt, dan zou je deze hele ontwikkeling moeten zien van 2000. Nou eigenlijk nog voor 2012, nog veel langer daarvoor. Vanaf Google Translate tot nu. Is dat er een soort van spekhoek is gemaakt van technologieën. Van laagje voor laagje voor laagje. Die ervoor heeft gezorgd dat we zijn waar we nu zijn. En die laagjes van zo'n spekhoek is heel erg arbeidsintensief. En dat zijn deze laagjes ook geweest. Dus als we nu hele grote doorbraken verwachten, dat is het niet. We krijgen laagje voor laagje. Wat wel zo kan zijn, is dat je een aantal van dat soort dingen mist. En dat je een lekker stuk taart krijgt. De ChatGPT. Waarbij je in één keer denkt van wow, dit is echt heel groot, heel nieuw. Maar bedenk, er zit een grote historie achter. En zo zal het in de toekomst waarschijnlijk ook gaan. Dankjewel voor het luisteren. Hopelijk heb je wat opgestoken. Tot de volgende keer.