Alle afleveringen
S05E62 - Wordt mijn data gebruikt bij het trainen van ChatGPT?
S05E62

Wordt mijn data gebruikt bij het trainen van ChatGPT?

Seizoen 5 6 min Hosts: Joop Snijder & Niels Naglé
0:00

Wat leer je in deze aflevering?

In deze aflevering van AIToday Live leggen we uit hoe jouw data wordt gebruikt bij het trainen van ChatGPT en wat de verschillen zijn tussen de versies 3.5 en 4.0. We onthullen hoe OpenAI omgaat met jouw gebruiksdata en welke privacyregels er gelden. Luister nu en ontdek hoe jouw privacy wordt gewaarborgd bij het gebruik van ChatGPT.

01
Gratis versie traint niet meer Bij ChatGPT 3.5 (gratis) wordt gebruikersdata niet meer voor trainingsdoeleinden gebruikt. De chatgeschiedenis wordt alleen bewaard voor het gemak van de gebruiker zelf.
02
Betaalde versie gebruikt wél data Bij ChatGPT Plus (GPT-4) kunnen vragen en antwoorden wel voor trainingsdoeleinden worden gebruikt. Dit is het omgekeerde van wat gebruikers gewoonlijk verwachten bij gratis versus betaalde diensten.
03
Azure OpenAI biedt meer privacy Via Microsoft Azure OpenAI wordt data niet gebruikt voor training, ongeacht of je GPT 3.5 of 4 gebruikt. Data wordt 30 dagen bewaard voor opsporingsdoeleinden en gaat door een content filter.
04
Enterprise GPT zonder content filter Microsoft biedt ook Enterprise GPT aan die dezelfde privacyregels volgt als Azure OpenAI, maar zonder de content filter die discriminatie en ongewenste inhoud eruit haalt.

Kernbegrippen

ChatGPT Plus
Betaalde versie van ChatGPT (GPT-4) waarbij gebruikersdata voor training kan worden gebruikt.
Azure OpenAI
Microsoft-service die OpenAI-modellen aanbiedt met garantie dat data niet voor training wordt gebruikt.
Content filter
Systeem dat discriminerende, illegale of ongewenste inhoud uit AI-responses verwijdert.
Data retention
Het bewaren van gebruikersdata voor een bepaalde periode, bij Azure OpenAI 30 dagen voor opsporingsdoeleinden.

Transcript

Wordt jouw data nou wel of niet gebruikt om ChatGPT bij te trainen? En wat zijn de verschillen eigenlijk in de versies van 3.5 en 4.0? Dat hoor je in deze korte aflevering van AIToday Live. In de hedendaagse digitale wereld is privacy een hot topic. Veel gebruikers van technologieën zoals ChatGPT van OpenAI vragen zich af hoe hun data wordt behandeld en welke maatregelen er worden genomen om hun privacy te waarborgen. En er zijn veel misverstanden over hoe OpenAI omgaat met jouw gebruiksdata. Een veelgestelde vraag is bijvoorbeeld hoe zit het met het verwijderen van mijn geschiedenis en het gebruik van mijn persoonlijke data? Het antwoord hierop is eigenlijk tweeledig, afhankelijk van de versie van ChatGPT die je gebruikt. En dat zit wat anders in elkaar dan dat je gewend bent. Normaal gesproken is natuurlijk als iets gratis is betaal je met je data. En als je een betaalde versie hebt is dat niet zo. Bij OpenAI is dat precies andersom. Dus de gratis versie, ChatGPT 3.5, daar wordt de data van gebruikers niet meer gebruikt voor trainingsdoeleinden. Dat is al een aantal maanden zo. Als gebruiker heb je nog wel zelf de keuze of je je geschiedenis wil bewaren, ja of nee. Die geschiedenis, dat is wat je aan je linkerkant ziet, dat je chats worden bewaard, die is dan voor jouw eigen gemak. En daar komt OpenAI niet aan. Uiteraard heb je die geschiedenis ook bij GPT 4. En ook hier die geschiedenis, die wordt niet gebruikt, maar wel alle vragen en antwoorden die gegeven worden, kunnen voor trainingsdoeleinden worden gebruikt. Dus in de betaalde versie, GPT 4, ChatGPT Plus abonnement, als je die hebt, dan kan je data voor trainingsdoeleinden worden gebruikt. En dit helpt dan om het model te leren en te verbeteren. Nou biedt Microsoft, een grote investeerder in OpenAI en ChatGPT, Enterprise GPT aan. En deze versie volgt dezelfde privacyregels als ChatGPT via Azure OpenAI. Het verschil is dat Enterprise GPT geen content filter heeft, maar daarover later meer. Via Microsoft, via het Azure platform, kan je de Azure OpenAI aanspreken. Wat moet je daar nou van weten? Wanneer je gebruik maakt van ChatGPT via Microsoft Azure OpenAI, zijn er enkele specifieke zaken waar je rekening mee moet houden. Ten eerste, de opslag van data. Zowel de request als response, dus je vraag als antwoord, worden 30 dagen bewaard. Dit is voornamelijk bedoeld voor opsporingsdoeleinden en om eventueel onderzoek te kunnen doen bij misbruik van de dienst. Na 30 dagen zijn die gegevens weg. Daarnaast hebben zij, wat ik net al noemde, die content filter. Dus alle data gaat door een content filter die mogelijke discriminatie, haat, seksueel getinte inhoud en dergelijke eruit filtert. Dankzij deze filter hoef je als gebruiker minder zelf te controleren op ongewenste content. Dit in tegenstelling tot de eerder genoemde enterprise ChatGPT. Training met enterprise data, dat is nummer drie. Wil je je eigen data gebruiken om het model te trainen, dan gaat deze eerst door de content filter. Vervolgens worden de zogenaamde embeddings gecreëerd. Dat is een technische representatie van je vraag die je lokaal dan weer opslaat in een daarvoor bestemde database. Een vector database in Azure. Dat gaat binnen je eigen resource groep. Dus je bepaalt zelf waar deze database zich bevindt. Bijvoorbeeld in West-Europa en dan geldt ook de wetgeving van West-Europa. Vier waar je op moet letten is de toegang tot data. Na de bewaartermijn van 30 dagen kan en mag Microsoft niet meer bij die data komen. Dat zit gewoon in de overeenkomst opgesloten. En als laatste heb je dan de training en de data. Het is belangrijk om te benadrukken dat je data niet wordt gebruikt voor trainingsdoeleinden wanneer je gebruik maakt van Azure OpenAI. Ongeacht of je nu GPT 3.5 of GPT 4 gebruikt. Zo zie je dat er allerlei verschillende overeenkomsten zijn waar je rekening mee moet houden. Het is wel essentieel, ik ben niet juridisch onderlegd, om altijd de terms en conditions van een dienst in de gaten te houden en zorgvuldig door te lezen. Met de verschillende versies veranderen deze ook. Dus hou die in de gaten. Die documenten bevatten belangrijke informatie over hoe je data wordt gebruikt en welke rechten en verantwoordelijkheden je hebt als gebruiker. Door jezelf goed te informeren kun je bewuste keuzes maken over het gebruik van technologieën zoals GPT. OpenAI en Microsoft Azure OpenAI nemen echt privacy serieus en hebben verschillende maatregelen genomen om jouw data en privacy van gebruikers te beschermen. Het is essentieel om goed geïnformeerd te zijn over deze maatregelen en te begrijpen hoe je data wordt behandeld. Hopelijk heeft deze short je enige duidelijkheid verschaft over dit belangrijke onderwerp en kun je beter overwegingen maken met welke versie je aan de slag wil en ook welke data je aan wil bieden aan welke versie van ChatGPT. Dankjewel voor het luisteren. Vind je deze info nuttig? Geef ons dan eens een 5-sterrenrating op Spotify en daarmee ondersteun je ons enorm.