Verantwoorde AI: vooroordelen, eerlijkheid en hoe je ze meetbaar maakt

AI-systemen nemen geen vooringenomenheid uit de lucht — die komt uit data, uit keuzes van makers, en uit de context waarin een systeem wordt ingezet. Termen als 'responsible AI', 'fairness' en 'bias' worden veel gebruikt maar zelden concreet gemaakt. Wat betekent 'bias' in een HR-algoritme?

Hoe herken je het in een taalmodel dat Nederlandse cv's beoordeelt? En wat is het verschil tussen bias, oneerlijkheid en discriminatie in juridische zin? AIToday Live belicht dit thema met Nederlandse voorbeelden: expliciete guardrails voor genderbias, meetmethoden uit het onderzoek, en casestudies bij banken en gemeenten.

Deze pillar brengt het bij elkaar — van theoretisch kader tot concrete meetmethoden — zodat teams een bruikbaar startpunt hebben om hun eigen AI-systemen te beoordelen, te documenteren en bij te stellen.

Veelgestelde vragen

Beginnen bij de data: is je trainingsset representatief voor de mensen op wie het systeem wordt toegepast? Stel kritische vragen vroeg in het ontwikkelproces, voordat een model in productie gaat. Voeg bewust ondervertegenwoordigde groepen toe aan de dataset, test op uiteenlopende subgroepen en gebruik meetmethoden als demographic parity of equal opportunity. Een centraal responsible AI-team met ambassadors in business units helpt om blinde vlekken tijdig te signaleren, zoals Ger Janssen beschrijft in S07E59.
Responsible AI is geen afvinklijst maar een doorlopend proces: transparant zijn over hoe een systeem werkt, aantoonbaar maken dat het eerlijk en veilig is, en zorgen voor menselijk toezicht en correctiemogelijkheden. In de praktijk betekent het: een risicoclassificatie maken voor elk AI-systeem, documentatie bijhouden, expliciete guardrails inbouwen en medewerkers trainen. De zeven vereisten die de EU hanteert (toezicht, veiligheid, privacy, transparantie, non-discriminatie, welzijn, verantwoording) bieden een bruikbaar kader.
Begin met de vraag: op welke groepen heeft dit systeem invloed en zijn die groepen evenredig vertegenwoordigd in je data en testresultaten? Signalen van bias: prestatie verschilt significant per subgroep (leeftijd, geslacht, etniciteit), gebruikers uit bepaalde groepen melden vaker foute uitkomsten, of het model gebruikt proxyvariabelen (postcode, naam) die correleren met beschermde kenmerken. Audit je model periodiek op fairness-metrics en betrek de doelgroep bij evaluatie, zoals Lisa Pouels uitlegt in S07E97.
Bias is een systematische afwijking in data of model die bepaalde groepen benadelen. Fairness is het gewenste doel: een systeem dat eerlijk behandelt, maar wat eerlijk betekent verschilt per context (gelijke kansen, gelijke uitkomsten, of individuele rechtvaardigheid). Discriminatie is de juridische term: ongelijke behandeling op basis van beschermde kenmerken (ras, geslacht, leeftijd) zonder objectieve rechtvaardiging. Een systeem kan statistisch biased zijn zonder juridisch te discrimineren, en andersom. S07E97 maakt deze begrippen meetbaar en concreet.

Wat gasten hierover zeiden

Ga vroeg in de ontwikkeling van een algoritme al kritische vragen stellen: is de dataset waar ik mijn algoritme op train representatief voor de target population? En dat blijven challengen. Want ethische aspecten zitten zo diep verstopt in ons, pas als je ze raakt weet je dat je ze hebt.

Ger JanssenS07E59

De dataset waarop getraind was, was redelijk gebiased richting de overlevenden. We hebben een veel grotere dataset gebruikt van meer dan 600.000 patienten, verdeeld over een paar honderd ICUs in honderd ziekenhuizen. En nu voorspelt het dus wel stukken beter.

Ger JanssenS07E59

Als we AI ontwikkelen die discrimineert, die onveilig is of die fundamentele rechten schendt, creeren we een technologie die uiteindelijk tegen ons zal werken en niet voor ons. Als we AI ontwikkelen die transparant, inclusief en rechtvaardig is, bouwen we aan een toekomst waarin technologie bijdraagt aan het welzijn van iedereen.

Joop SnijderS07E80

Afleveringen over Verantwoorde AI: vooroordelen, eerlijkheid en hoe je ze meetbaar maakt

S07E59

AI-bias in de zorg: lessen van Philips met Ger Janssen

Ger Janssen vertelt hoe een ICU-voorspelmodel bij Philips gebiased bleek richting overlevers en hoe hertraining op 600.000 patienten over honderden ICU's de voorspelling hersteld.

S07E59 artwork
S07E95

Genderbias in taalmodellen met Julia Klinkert

Julia Klinkert laat zien hoe Nederlandse LLM-output systematisch mannen voortrekt en waarom expliciete guardrails in prompt en systeembericht effect hebben.

S07E95 artwork
S07E97

Fairness meetbaar maken met Lisa Pouels

Lisa Pouels vertaalt academische fairness-metingen naar concrete meetstappen die Nederlandse teams nu al kunnen toepassen op hun eigen modellen.

S07E97 artwork
S07E80

Verantwoorde AI: Europa, VS en China vergeleken

Joop Snijder schetst drie routes naar AI-regulering en laat zien dat de Europese aanpak met zeven vereisten (toezicht, veiligheid, privacy, transparantie, non-discriminatie, welzijn, verantwoording) juist ruimte voor innovatie geeft.

S07E80 artwork
S08E37

Bias in financiële AI: eerlijkheid in witwasdetectie met Daniël Meel

Daniël Meel (ABN AMRO) vertelt hoe zijn team 2500 medewerkers traint op biasbewustzijn en hoe systematisch diverse teams de enige echte remedie zijn voor trainingsdata-bias in detectie-algoritmen.

S08E37 artwork

Verdiep je in Verantwoorde AI

AI-bias herkennen en meten: van Philips ICU tot fairness-metrics →

Een ICU-model getraind op overlevenden voorspelt slecht voor stervenden. Bias in trainingsdata heeft levensgevaarlijke gevolgen — en het meten van fairness vraagt altijd contextgebonden keuzes.

Genderbias in AI: hoe taalmodellen systematisch mannen en vrouwen anders behandelen →

Een developer is automatisch een man. Een verpleegster is jong en vriendelijk. AI-systemen spiegelen de bias uit hun trainingsdata — en die bias beïnvloedt sollicitaties, aanbevelingen en meer.