In deze aflevering van AIToday Live Shorts gaan we diep in op een baanbrekende juridische strijd over kunstmatige intelligentie (AI), auteursrechten en datagebruik. We richten ons specifiek op de recente rechtszaken waarin techreuzen OpenAI en Meta (voorheen Facebook) centraal staan, aangeklaagd door beroemdheden zoals komiek Sarah Silverman en de auteurs Christopher Golden en Richard Kadrey. Deze prominente figuren beweren dat hun auteursrechtelijk beschermde werken zijn gebruikt voor AI-training zonder hun toestemming.De uitkomst van deze rechtszaken kan enorme gevolgen hebben voor hoe we begrippen als 'redelijk gebruik' interpreteren binnen de wereld van AI en auteursrecht. Mis deze boeiende discussie niet – stem af op AIToday Live Shorts.Sarah Silverman sues OpenAI and Meta claiming AI training infringed copyright
Welkom bij een nieuwe AI Today Live Shorts met actueel nieuws binnen 5 minuten over kunstmatige intelligentie. In deze aflevering vandaag een juridische strijd over AI, auteursrechten en grote bedrijven zoals OpenAI en Meta. Tijdens mijn live sessie van Digital Dialogues, die je terug kan luisteren trouwens, kreeg ik een vraag over auteursrechten van trainingsdata van Chet Jipiti en wat daarmee zou gebeuren? Mijn antwoord was op dat moment dat ik weet natuurlijk niet hoe rechters hiernaar kijken, hoe dit soort wetgevingen precies in elkaar zit, maar dat je er wel zeker van kon zijn dat de rechtszaken gaan komen omdat deze modellen getraind zijn op data waarvan het niet al te duidelijk is wat de herkomst is. Daar hoef je geen waarzegger over te zijn en nu is dat spel op de wagen. Want je hebt misschien gehoord dat de Amerikaanse komiek en auteur Sarah Silverman, Ik ken het eigenlijk niet, maar goed voor het verhaal van deze aflevering maakt het niet uit. Die Sarah Silverman die heeft samen met auteurs Christopher Golden en Richard Kadrey, ik denk dat je dat zo uitspreekt, rechtszaken hebben aangespannen tegen open AI en tegen de meta, Facebook, wegens vermeende inbreuk op het auteursrecht. Ze beweren dat de AI modellen die zij hebben, die zijn ontwikkeld dat hun werk zonder toestemming is gebruikt als onderdeel van hun trainingsgegevens. En zij beweren dat hun boeken die zij geschreven hebben, dat dat onderdeel is geworden van die dataset, van de trainingsdata. En dat is beschermend materiaal. En dat is dan zonder toestemming gebruikt. Nou zelf fotografeer ik graag en staan er in ieder geval heel veel foto's van mij op internet. Allemaal met duidelijke acteursrechten. En toch Toch vond ik heel eenvoudig met een website, dat heet 'Have I Been Trained'. Daar kan je nakijken of mijn foto of die ook onderdeel uitmaakt van beeld datasets, die bijvoorbeeld ook gebruikt worden voor het trainen van dit soort modellen, zoals Stable Diffusion of Imagine van Google. Met deze search engine zou je het kunnen noemen, vond ik heel snel foto's die ik zelf gemaakt heb, die inderdaad als onderdeel zijn geweest voor de training van dit soort grote modellen. Niet alleen OpenAI als maker van Chachipiti wordt je van beschuldigd, ook Meta zit in hetzelfde schuitje en die wordt beschuldigd van het gebruik van auteursrechtelijk beschermde werken voor zijn taalmodellen, Lama. De rechtszaak die deze drie mensen hebben aangespand beweert dat Meta toegang heeft gekregen tot beschermde boeken via zogenaamde shadow libraries noemen ze dat. Dat zijn dan natuurlijk bronnen, we kennen het wel, waarbij je illegale content uiteindelijk kan vinden. En als reactie op de toenemende zorgen heeft zelfs de CEO van OpenAI, Sam Eildman, een mogelijke oplossing voorgesteld al. Want hij voelt het natuurlijk ook wel aankomen. En hij stelde een model voor, een businessmodel, waarbij makers betaald kunnen worden als een AI-systeem hun inhoud of stijl gebruikt. En dat die het voelt aankomen lijkt ook wel omdat critici beweren dat openen jaren meta zeggen 'ter dege bewust van zijn' waren dat de modellen auteursrechtelijk beschermd materiaal bezitten. Omdat ze namelijk juist die stukjes waar het copyright en dat soort dingen op staat, dat ze dat opzettelijk lijken te hebben verwijderd. Nu heb je nog ook zoiets als "redelijk gebruik" wat ze dan noemen. En vorige maand publiceerde in Amerika The Author's Guild een open brief waarin zes technologiebedrijven werden beschuldigd van het misbruiken van het werk zonder toestemming of compensatie. En de uitkomst van deze rechtszaken zou kunnen afhangen van het concept van "redelijk gebruik". Er is een wet die toestaat dat auteursrechtelijk beschermd materiaal, lastig woord omdat ik het een keer haalde, onder bepaalde omstandigheden wordt gebruikt. Bijvoorbeeld wanneer het origineel werk wordt getransformeerd. Wanneer heb je het dan nog over redelijk gebruik en wat betekent dan getransformeerd? Dus dat gaat heel erg interessant worden. Leveranciers van modellen weten dat dit eraan zit te komen en een aantal hebben al aangegeven dat mocht je gebruik maken van de uitkomsten van dat model en daarmee dat je rechtszaken krijgt, of jij ook niet inbreuk maakt op het acteursrecht, dan zeg je "ja, dat kopen wij af, wij zorgen ervoor dat we je compenseren dat je in ieder geval de uitkomsten nu kan gebruiken". Best wel spannend hoe dat gaat, hoe dat kan. In ieder geval goed om dit in de gaten te houden als je gebruik wil gaan maken van dit soort modellen in productie. Nou, deze rechtszaken openen in ieder geval een nieuwe deur in de auteursrechten discussie en wat de juridische implicaties gaan zijn. Nou, we gaan het in de gaten houden. Ik denk dat het voor iedereen interessant is. Dus vandaag geen sluitend antwoord op de vraag, maar iets wat wat we wel in de gaten gaan houden.