Wat leer je in deze aflevering?
In deze aflevering van AIToday Live bespreken Marciano Ferrier en Nouri Khalass de innovatieve manieren waarop AI kan worden ingezet om de geluidskwaliteit voor slechthorenden te verbeteren. Hun expertise en ervaringen bieden een uniek inzicht in de technische uitdagingen en oplossingen op het gebied van audioverbetering. Luisteraars krijgen een diepgaand begrip van hoe AI de spraakverstaanbaarheid kan vergroten en welke impact dit heeft op zowel individuen als de samenleving.
Kernbegrippen
- Source separation
- AI-techniek die verschillende geluidsbronnen (spraak, achtergrondgeluid) uit een audiomix isoleert en afzonderlijk verwerkt.
- Latency
- Vertraging tussen invoer en uitvoer van geluid; kritisch voor real-time communicatie zoals telefoongesprekken.
- Frequentiespecifieke versterking
- Selectief versterken van bepaalde geluidsfrequenties op basis van individuele gehoorverliescurves.
- Audiotoegankelijkheid
- Aanpassingen aan geluidskwaliteit en -inhoud zodat personen met gehoorbeperking volwaardig kunnen deelnemen.
Interview: Marciano Ferrier
Kunnen jullie je even voorstellen aan onze luisteraars?
Ik ben Marciano Ferrier, de oprichter van Audus Technologies. Van huis uit ben ik opgeleid als arts en daarna als KNO-specialist — dat staat voor keel-, neus- en oorarts. Ik heb uiteindelijk een heel andere wending gemaakt naar de wereld van technologie en audio. En ik ben Nouri Khalass, Director of Technology and Strategy bij Audus Technologies. Ik heb een achtergrond in computer science en heb gestudeerd in Delft. Daar heb ik veel ervaring opgedaan, niet alleen met informatica, maar ook met het nadenken over hoe mensen die slechthorend zijn op een innovatieve manier geholpen kunnen worden.
Wat doet Audus Technologies precies en voor wie?
Laat me even beginnen bij het begin. Ik werkte in het ziekenhuis in Bronovo in Den Haag en zag daar heel veel mensen met gehoorverlies. Dat is in de meeste gevallen leeftijdsgerelateerd: als je ouder wordt, gaan we allemaal slechter horen. Dat proces begint eigenlijk al vanaf je twintigste. Als je daarbij ook nog te maken hebt gehad met langdurige blootstelling aan harde geluiden, zoals vuurwerk of muziek, dan is het effect veel groter. In Nederland zijn er 2,6 miljoen slechthorenden, gerekend vanaf 25 decibel verlies tot volledig doof. Slechts 60 procent van hen heeft een hulpmiddel zoals een hoortoestel. 40 procent heeft niets. Daar zitten financiële redenen achter, maar ook sociale: veel mensen zien een hoortoestel als een teken van zwakte of als iets wat hen als 'gebrekkig' bestempelt. Die drempel is enorm groot. Voor die grote groep die geen hoortoestel draagt, ben ik gaan nadenken hoe we hen tóch kunnen helpen. Dat heeft geleid tot ons product: wij veranderen de audio voor slechthorenden niet met een hoortoestel, maar op het apparaat dat ze al hebben. Dus een mobiele telefoon, een laptop, een televisie of een car kit. Op die apparaten passen wij de audio aan, zodat spraak beter verstaanbaar wordt. Daarvoor is geen extra hardware nodig.
Is het dan niet gewoon het volume harder zetten?
Dat is een heel goede vraag, en de aanname die bijna iedereen maakt. Bij beginnend gehoorverlies werkt volumeverhoging inderdaad, het geeft echt wel verbeteringen. Maar de meeste mensen met gehoorverlies hebben veel meer baat bij een intelligentere benadering. Volume is maar een klein onderdeel van de oplossing — misschien 15 procent. De rest gaat over frequentiespecifiek versterken: je versterkt niet alle geluiden even hard, maar juist die frequenties waar het gehoor tekortschiet. Daarnaast pas je compressie toe en haal je achtergrondruis weg. Het doel is om spraak naar voren te halen. Stel je voor, dat de buurvrouw altijd haar televisie kneiterhard heeft staan. Dat hoeft eigenlijk helemaal niet. Met de helft van het volume en een slimmere bewerking van het geluid kom je veel verder en is alles veel beter te verstaan.
Kan de oplossing ook echt voor mij persoonlijk worden ingesteld?
Ja, dat kan. De ingang van onze engine is eigenlijk een hoortest, ook wel een audiogram genoemd — dat is een grafiek die aangeeft hoe goed iemand op verschillende geluidsfrequenties hoort. Op basis van dat audiogram kunnen we de instellingen volledig personaliseren. In de praktijk kiezen de meeste gebruikers echter voor een beperkt aantal vaste standen: licht, matig of sterk gehoorverlies, of gewoon stand 1 en 2. Dat is vaak de meest praktische keuze. Voor onze desktopapplicatie kun je ook je audiogram invoeren en wordt alles volledig op jouw gehoorverlies afgestemd.
Hoe verklaar je dat mensen zo lang wachten voordat ze een hoortoestel nemen?
De gemiddelde uitsteltijd voordat iemand daadwerkelijk een hoortoestel aanschaft, is meer dan zeven jaar. Soms zelfs bijna tien jaar. Er is een enorme weerstand. Een deel is psychologisch: mensen willen niet toegeven dat ze minder goed horen. Een deel is financieel. En een deel zit ook in het feit dat de hoorindustrie weliswaar veel marketing doet — je hoeft de televisie maar een halfuur aan te zetten en je ziet al twee reclames van hoortoestelwinkels voorbijkomen — maar dat die activiteiten niet leiden tot een kleiner wordende groep onbediende slechthorenden. Die drempel blijft bestaan. Ik heb oplossingen besproken met de hoorindustrie, maar die grote spelers bevinden zich in een comfortabele positie. Voor hen hoeft er weinig te veranderen. Wij zijn geen disruptor van die industrie. Ik adviseer als oud-KNO-arts nog steeds iedereen die er last van heeft om een hoortoestel te nemen. Maar voor de grote groep die dat toch niet doet, willen wij een alternatief bieden.
Is jullie technologie alleen voor slechthorenden, of zijn er ook andere doelgroepen die baat hebben?
Onze kern is inderdaad slechthorendheid, maar we hebben in tests gezien dat ook jongere mensen profiteren van verbeterde audio. Er was een paar maanden geleden een artikel in de New York Times waaruit bleek dat steeds meer jongeren ondertiteling aanzetten terwijl ze televisie kijken. Niet omdat ze slecht horen, maar omdat ze in een rumoerige omgeving zitten. De kwaliteit van speakers in moderne elektronica is ook niet altijd geweldig, dus ook daar is geluidsoptimalisatie waardevol. Bovendien hebben we in tests gemerkt dat het verbeteren van audio enorm helpt bij het begrijpen van een vreemde taal. Als je luistert naar iemand die in een andere taal spreekt, dan wordt de spraakverstaanbaarheid sterk vergroot. Dat is iets wat we ook zien bij zakelijke gebruikers.
Nouri, kun jij uitleggen hoe de technologie werkt? Gaat het om iets als ruisonderdrukking?
Het lijkt daar op, maar het is wat complexer. We gebruiken eigenlijk twee methoden. De eerste is source separation — dat betekent dat je de spraak scheidt van de achtergrond. Die achtergrond kan van alles zijn: muziek, ruis, windruis, rumoer of andere incidentele geluiden. Je maakt een scheiding, zodat je de spraak als een geïsoleerd geluidsspoor overhoudt. Dat is de stem die je verstaanbaar wilt maken. De tweede stap is de frequentiespecifieke versterking. Je kijkt naar het gehoorverlies van de gebruiker en naar de frequentiesamenstelling van het geluidssignaal. Gehoorverlies zit in negen van de tien gevallen in de hoge tonen. Dan heb je moeite om hoge klanken goed te horen. Die wil je dan versterken, niet de rest. Als je alles gewoon harder zet, doe je meer kwaad dan goed. Je wilt alleen die specifieke frequenties omhoog brengen. Daarnaast pas je compressie toe: zachte geluiden maak je harder, maar geluiden die al luid zijn laat je ongemoeid. Dit is eigenlijk vergelijkbaar met hoe een hoortoestel werkt, alleen dan zonder de fysieke hardware.
Wat is het verschil met gewoon een equalizer gebruiken?
Dat is in principe ook frequentiespecifiek werken, en in de basis zijn hoortoestellen ook een soort equalizers. Maar het verschil zit in de afstelling. Er zijn normen en standaarden die bepalen hoeveel versterking nodig is bij een bepaald type gehoorverlies. Als je te veel versterkt, wordt het geluid niet duidelijker, maar juist vervaagd of vervormd. De afstelling van die equalizer is precies waar de technische kennis zit. Daarbovenop voegen wij de compressie toe die ik noemde, en de source separation. Dat alles samengenomen geeft een effect dat vergelijkbaar is met een hoortoestel, maar dan aangeboden via de apparaten die de gebruiker al heeft.
Dit moet ook in real time werken, toch? Hoe snel moet de verwerking dan zijn?
Onderzoek heeft aangetoond dat de vertraging tussen beeld en geluid maximaal zo'n 15 milliseconden mag bedragen voordat mensen het als storend ervaren en het niet meer als lip-sync waarnemen. Dat is echt ultra kort. Eigenlijk vinden wij zelf die 15 milliseconden al te veel — als je getraind bent, zie je al dat het uit sync loopt. Die latency, de vertraging in de verwerking, is onze grote uitdaging en eigenlijk onze grootste vijand. We zijn lang bezig geweest om onze gehele signaalverwerkingsketen onder die 15 milliseconden te brengen. Dat lukt ons nu. Maar het is een voortdurende afweging tussen kwaliteit en snelheid.
Jullie verwerken het geluid via de cloud. Werkt dat ook met 4G?
Nee, met 4G lukt dat helaas niet voor de cloudverwerking. De vertraging van het netwerk — het geluid dat van de telefoon naar de server gaat en weer terug — is met 4G gewoon te groot. Dan komen we uit op 40 tot 60 milliseconden, wat duidelijk merkbaar is als vertraging. We waren als eerste bedrijf in Delft, bij de Green Village van TU Delft, betrokken bij tests met een dedicated 5G-netwerk, samen met MCS, Surf en TNO. Daarmee konden we de latency wel halen. 5G maakt de cloudverwerking in real time dus wél mogelijk. Als het geluid lokaal wordt verwerkt, op de telefoon of laptop zelf, dan speelt dit netwerkvraagstuk niet. Maar voor onze cloud-gebaseerde patenten is 5G de sleutel. En binnenkort komt 6G, waarmee we opnieuw willen gaan testen.
Moet ik iets installeren om jullie oplossing te gebruiken?
Dat verschilt per toepassing. Voor de desktop- en laptopversie installeer je een applicatie — of je systeembeheerder doet dat — en vervolgens wordt alle systeemaudio op de achtergrond aangepast. Dat gebeurt lokaal, dus op je eigen apparaat. Maar we werken ook samen met Nokia om de technologie te integreren in een IMS-systeem. Een IMS-systeem, wat staat voor IP Multimedia Subsystem, is eigenlijk de digitale telefooncentrale van een telecomaanbieder: alle gesprekken komen daar binnen, de routering wordt daar geregeld en de gesprekken gaan er weer uit. Als je de verbetering op dat niveau toepast, profiteert iedereen die via dat netwerk belt automatisch van betere spraakverstaanbaarheid, zonder dat je iets op je telefoon hoeft te installeren.
Hoe zit het dan met personalisatie als iedereen hetzelfde systeem gebruikt?
Dat is inderdaad een afweging. In sommige situaties is volledige personalisatie niet haalbaar. Bij een telefooncentrale zou je op basis van het klantenbestand en leeftijdsgegevens misschien nog iets kunnen doen, maar dat is complex. In een museum, waar we de audiotours aanpassen voor slechthorenden, wordt simpelweg één instelling gebruikt die voor iedereen aan staat. Het mooie is: als je als normaalhorende luistert naar audio die bewerkt is voor iemand met gehoorverlies, ervaar je dat niet als storend. Het klinkt juist prettiger en duidelijker. Alleen voor de desktopapplicatie voor de werkomgeving kun je het volledig personaliseren met je eigen audiogram.
Wat was voor jou het eerste moment dat iemand anders bevestigde dat jullie technologie echt werkt?
Dat is een leuke anekdote. We waren bij het Singer Museum in Laren voor een demonstratie. Nouri had net de laatste hand gelegd aan de betaversie van onze verbeteringssoftware voor musea. We hadden een uur voor de demonstratie gebouwd. Het was echt een houtje-touwtjesoplossing op een telefoon met een slechte speaker. We wilden gewoon even wat interesse wekken bij de directeur van het museum. We wisten op dat moment niet dat hij slechthorend was. Hij keek naar ons en zei: "Dan doe ik even mijn hoorapparaat uit." Hij luisterde aandachtig. En zijn reactie was: "Dit is precies hetzelfde als mijn hoorapparaat." Zijn eerste vraag daarna was: "Wat is de volgende stap?" Op dat moment wisten we: we zijn op de goede weg.
Welke toekomstige toepassingen zie jij voor Audus?
We zijn nu in volle groei met onze Workspace-oplossing voor Windows, bedoeld voor de werkomgeving. Diverse bedrijven hebben het al in gebruik genomen. We voeren ook tests uit met de EO voor podcast en met KPN voor televisie. Uiteindelijk is mijn droom om het uitzendkanaal zelf te verbeteren voor slechthorenden. Als je bedenkt dat 1 op de 7 mensen in Nederland slechthorend is, en dat er 2,6 miljoen mensen zijn die het journaal niet goed kunnen volgen, dan is de impact enorm. Ik ken genoeg situaties waarbij man en vrouw 's avonds apart televisie kijken omdat de ander met een koptelefoon op zit vanwege gehoorverlies. Dat wil ik veranderen. We hebben al positieve testresultaten met KPN en de NPO. We willen ook naar bioscopen. En mijn ultieme doel is uiteindelijk een heel goedkoop hoortoestel bouwen via cloud computing, specifiek voor mensen in midden- en lage-loonlanden, waar een traditioneel hoortoestel financieel onbereikbaar is.
Nouri, welke AI-uitdagingen zien jullie als je verder vooruitkijkt?
De grootste uitdaging waarover we lang hebben nagedacht, is dynamische personalisatie op basis van de content zelf. Stel dat je weet wat er op dit moment klinkt: is het muziek, is het spraak, is het ruis? Op basis van die informatie wil je de bewerking elke keer net iets anders doen. Als het muziek is, wil je misschien helemaal niets veranderen of de audio op een heel andere manier aanpassen. Als het spraak is, wil je onderscheid maken tussen een mannenstem en een vrouwenstem. Wij mannen mompelen in de regel nogal eens, en we hebben een lager stemgeluid. Dat vraagt om een andere frequentiebewerking dan een vrouwenstem. Dus we willen modellen trainen die automatisch herkennen wat voor soort geluid er klinkt, wie spreekt, en op basis daarvan de beste instelling kiezen. Een ander punt is de balans tussen achtergrond weghalen en achtergrond laten staan. Bij een telefoongesprek wil je alle achtergrondgeluiden weghalen. Maar als je naar een spannende serie kijkt, wil je de spanning in de soundtrack niet weghalen. Die muziek is onderdeel van de beleving. Een film zonder filmmuziek wordt een heel lange zit. Dus we willen AI-modellen trainen die begrijpen wat voor soort content het is, en op basis daarvan bepalen hoeveel achtergrond je laat horen en hoe je dat verwerkt.
Wordt er op de werkvloer eigenlijk aandacht besteed aan gehoorfitheid?
Eigenlijk niet, nee. Er is aandacht voor lichamelijke fitheid, mentale fitheid. Er zijn volop programma's voor. Maar gehoorfitheid is een blinde vlek. De aandacht die je zou verwachten, is er gewoon niet. En dat terwijl we tegenwoordig enorm veel luisteren: Teams-meetings, Zoom-calls, telefoongesprekken. Als je een hybride meeting hebt waarbij deelnemers deels thuis en deels op locatie zitten, dan is er altijd wel geroezemoes, slechte audio-kwaliteit, mensen die over elkaar heen praten. Als je dat de hele dag niet goed kunt verstaan, ben je aan het einde van de dag volledig uitgewrongen. Je verliest concentratie, je haakt af. Er gaat een enorme hoeveelheid productiviteit verloren. Een onderzoek van SiRM, uitgevoerd in opdracht van Specsavers, heeft berekend dat het niet helpen van die 40 procent onbediende slechthorenden de maatschappij jaarlijks 5,8 miljard euro kost. Dat is een schrikbarend cijfer.
Hoe kan jouw oplossing helpen bij problemen in hybride vergaderingen?
In een hybride vergadering heb je soms geluk dat er een richtingsgevoelige microfoon op tafel staat, die al enigszins onderscheid maakt tussen waar het geluid vandaan komt. Maar als we gewoon ruwe audio binnenkrijgen waarbij geroezemoes en meerdere sprekers door elkaar lopen, dan is ons source separation-algoritme daartoe in staat om sprekers op de voorgrond te isoleren en die op de achtergrond zachter te zetten of weg te halen. Interferentie tussen geluidsbronnen maakt spraak onverstaanbaar, en door die scheiding te maken, verbeter je de verstaanbaarheid drastisch. We kunnen ook situationeel kijken naar de aard van het achtergrondgeluid: is het geroezemoes dat je wilt weghalen, of is het een geluid dat je juist deels wilt meenemen? Die inhoudelijke context bepaalt hoe we het signaal bewerken.
Worden er ook vrouwelijke experts betrokken bij het ontwerp van jullie AI-systemen?
Dat is een scherpe vraag, en ik moet eerlijk zijn: bij ons werken momenteel allemaal mannen aan de technologie. Dat is iets wat we ons bewust van zijn. Wij gaan daarin mee in een bredere trend in de tech-industrie. We moeten meer openstaan voor andere perspectieven, en zeker voor mensen uit groepen die minder aandacht krijgen. We generaliseren te snel en vergeten wie er allemaal gebruik maakt van onze technologie. Op de IBC, de International Broadcast Convention, kwamen we een vrouwelijke onderzoeker tegen die op een indrukwekkende manier werkt aan geavanceerde source separation-modellen met AI. Haar systeem is in staat om individuele sprekers te herkennen, zelfs als mensen door elkaar praten, en vier aparte audiosporen te genereren. Dat is echt imponerend werk. Maar je moet het maar net weten en tegenkomen. Er zijn al heel veel vrouwen bezig met dit vakgebied, op een heel indrukwekkende manier, en die verdienen meer zichtbaarheid.
Jullie hebben de audio in dit gesprek even live omgezet. Wat waren de reacties in eerdere live-testen?
We hebben een paar keer klinische tests gedaan in een kleine bioscoop in mijn dorp. We hebben twee vertoningen gehouden met aangepaste audio. We testten woordherkenning met achtergrondgeluid, zoals dat ook in een klinische setting wordt gedaan, en we draaiden een documentaire over het Depot Boijmans Van Beuningen waarvan de audio was aangepast. Wat we zagen was dat mensen in alle leeftijdscategorieën baat hadden bij de verbeterde audio, van 13-jarigen tot een dame van 90 jaar. Interessant was wel dat jongeren zeiden: het is niet stoer, maar als ik moet kiezen, ga ik toch voor het origineel. Ouderen hadden duidelijk een voorkeur voor het aangepaste geluid. Dat is begrijpelijk. Maar het feit dat ook jongeren en zelfs heel jonge mensen er baat bij hadden, bevestigt ons vermoeden dat dit breder toepasbaar is dan alleen voor slechthorenden.
Welke technische ontwikkelingen in AI bieden jullie de meeste kansen voor de toekomst?
Voor ons is performance het allerbelangrijkste. We hoeven in principe geen enorm groot neuraal netwerk te draaien met honderden miljoenen parameters om tot een goed resultaat te komen. Onze algoritmes zijn relatief beperkt van omvang, maar moeten wel razendsnel werken. Wat me dan ook erg hoopvol stemt, zijn de acceleratiechips die steeds meer in apparaten worden ingebouwd. Denk aan AI-chips die specifiek ontworpen zijn voor neurale netwerkberekeningen, zoals Googles Tensor Processing Unit of de speciale chips die Microsoft nu in zijn hardware integreert voor large language models. Als zulke chips beschikbaar komen in televisies, telefoons en laptops, dan kunnen wij onze algoritmes daarop laten draaien — sneller, energiezuiniger en zonder dat de gebruiker er iets van merkt. We zien nu al televisies op de markt met AI-chips die voor beeld worden gebruikt, maar die kunnen ook voor audio ingezet worden. Dat is een enorme kans voor ons.
Hoe weet ik of mijn gehoor aan het achteruitgaan is?
Dat is een deel van het probleem: je merkt het vaak zelf niet direct. Een informele richtlijn is: vergelijk je gehoor met dat van een jong kind van een jaar of acht. Als je merkt dat je het volume hoger moet zetten dan zij, of als je moeite hebt om woorden te verstaan die zij probleemloos begrijpen, dan is dat een signaal. Maar de meest praktische indicator is je eigen ervaring: als je overdag vermoeid raakt van gesprekken, Teams-calls of telefoongesprekken, dan kan gehoorverlies daar een rol in spelen. Er zijn ook online hoortesten beschikbaar via de Hoorstichting, Beter Horen, Schoonenberg en anderen. Die geven in ieder geval een indicatie. Maar jijzelf bent de belangrijkste beoordelaar: merk jij dat je moeite hebt, zoek dan hulp.
Over de gasten
Marciano Ferrier verscheen als gast in 1 aflevering van AIToday Live.
Bekijk gastprofiel
Nouri Khalass verscheen als gast in 1 aflevering van AIToday Live.
Bekijk gastprofielTranscript
Hoi, leuk dat je weer luistert naar een nieuwe aflevering van AIToday Live. Met vandaag twee gasten in de studio. Het gebeurt steeds wat vaker. We hebben Marciano Ferrier en Nouri Khalass. En zij gaan ons van alles vertellen over het verbeteren van geluidskwaliteit met AI. Mijn naam is Joop Snijder, CTO bij Aigency. Mijn naam is Niels Naglé, Area Lead, Data & AI uit bij Info Support. Marciano, Nouri, welkom in onze studio. Leuk dat jullie hier naartoe zijn gekomen vanaf de andere kant van het land, hoorde ik net. Dank dat we mochten komen. Ja, heel erg leuk. Zouden jullie je voordat we beginnen je eerst even willen voorstellen aan onze luisteraars? Marciano, zou jij willen beginnen? Ja, ik ben Marciano Ferrier. Ik ben de oprichter van Audus Technologies. En van huis uit ben ik opgeleid als dokter en daarna KNO. En ik heb een hele andere wending gemaakt naar dit gebied. Ja, leuk. Voor het eerst hebben we een dokter in de zaal. En Nouri? Ik ben Nouri Khalass, Director of Technology and Strategy bij Audus Technologies. Ik heb een computer science achtergrond. Ik heb gestudeerd in Delft. Daar heel veel ervaring op gedaan met computer science. Maar ook met mensen die slechthorend zijn en nadenken over hoe je die mensen op een innovatieve manier kunt kunnen helpen. Ja, want daar gaan we het vandaag over hebben. Slechthorendheid, AI en wat jullie daarvoor hebben gemaakt. Toch? Klopt, ja interessant. Zou je wat kunnen vertellen Marciano over Ouders en wat jullie doen en wat dat voor betekenis heeft voor slechthorenden? Ja, misschien even beginnen bij het begin. Ik werkte in het ziekenhuis in Bronovo in Den Haag. En daar zag ik heel veel mensen met gehoorverlies. Dat is meestal leeftijds gerelateerd. Als je ouder wordt, gaan we allemaal slechter horen. En begint dat vanaf je twintigste eigenlijk al. Dan begint de aftakeling van het lichaam al. Dus ook je gehoor. Dat is een fijn begin van de podcast. Dat is uit de droom helpen. Maar jullie hebben ook al een beetje slechter gehoor. Zeker. En als je daar ook nog met vuurwerk hebt gespeeld of in de muziekwereld hebt gezeten, dan is het veel erger. Maar daar zag ik dus heel veel mensen met slechthorendheid. En het gros daarvan, ook al is het betaald in Nederland, kiest toch niet voor een oplossing als een hoortoestel. In Nederland hebben we 2,6 miljoen slechthorenden. Vanaf 25 decibel tot helemaal doof. En slechts 60 procent daarvan heeft een hulpmiddel. 40 procent niet. Er zijn heel veel redenen voor, financiële redenen, maar ook heel veel zit dan in de gedachte dat het een defect is of dat je toch iets moet dragen, dat het een zwakte is. Dus een heleboel redenen zitten erachter. Maar heel veel mensen zijn dus niet geholpen. En voor die grote groep ben ik gaan nadenken hoe we die dan wel kunnen bedienen. En daar is dit product wat we nu op de markt hebben gebracht uitgekomen. Dus wij veranderen het gehoor voor slechthorenden, de audio voor slechthorenden, niet met een hoortoestel. Maar we veranderen dat op het hulpmiddel wat ze voor handen hebben. Dus een mobiele telefoon, een laptop, een televisie of een car kit. Daar veranderen we de audio van. Dan heb je verder geen andere hardware voor nodig. We veranderen daar gewoon precies met dezelfde, ongeveer dezelfde algoritmes plus AI. Veranderen we het optimum voor hun, zodat ze vooral de spraakverstaanbaarheid vergroot wordt voor deze grote groep mensen. Dus het zou dan echt voor mij persoonlijk worden gemaakt? Wij kunnen, de ingang van onze engine is een hoortest eigenlijk. Dus we kunnen het helemaal persoonlijk doen, dat hebben we ook. Maar de meeste klanten kiezen toch voor een beperkt aantal instellingen. Dus licht, matig of sterk gehoorverlies of stand 1 en 2, hoe je het wil noemen. Dat is vaak uit praktische overwegingen de meest gekozen optie. Dan doe ik even voor de voorzichtige aanname. Het is niet alleen het volume harder zetten. Dat is een hele goede vraag. Dus bij beginnend gehoorverlies is volume toename een oplossing. En die werkt ook, geeft ook echt wel verbeteringen. Dus als je slechter hoort, dan doe ik het wat harder. Dan kan ik het beter verstaan. Maar de meeste mensen met gehoorverlies die hebben meer, veel meer baat bij een intelligentere manier van gehoorverbetering. En volume is daar maar een heel klein onderdeel van. Het gaat meer over frequentiespecifiek versterken en ook met compressie en andere achtergrond weghalen. Echt dat je de spraak naar voren haalt. Herkennen van spraak en geen spraak. Er komen andere trucs bij kijken dan alleen maar het volume. En volume is echt, als je naar de grote groep kijkt, misschien 15% van de oplossing. Ja, oké. Ja, die volume. Ja, dat is wel een goede vraag. Ja, als ik vroeger bij mijn oma kwam en stond alles te kneiterhard. Ja, maar dat is het dan inderdaad niet. Ja, dat is echt wel een eye-opener is voor heel veel mensen. Die tv die bij de buurvrouw of bij die oudere mensen te hard staat. Ja, dat hoeft eigenlijk helemaal niet. Vaak kan je met de helft van het volume en dus een andere manier van het aanbieden van het geluid, kom je veel verder. Dus als die tv zo hard staat, dan is er eigenlijk reden van, ga naar de hoorwinkel. Want nog steeds ook als KNO-arts, adviseer ik iedereen die er last van heeft, om wel een hoortoestel te nemen. Alleen ja, lijkt in de praktijk dat de grote groep dat dus niet doet. Maar dat advies is wel zoeken hulp. Ja, die drempel is vaak heel erg groot. Ik weet mijn vader, die heeft ik geloof wel tien jaar er tegen aangehikt ofzo, voordat hij uiteindelijk een gehoorapparaat nam. Terwijl iedereen wist dat hij die heel hard nodig had. Klopt, de gemiddelde uitsteltijd van een hoortoestel is meer dan zeven jaar. Dus als je voor een aanmerking komt en je zou er moeten nemen, is het uitstelgedrag dus bijna, ja, tien jaar, dan komt het echt wel overheen. Ja. En wat was het moment dat je dacht van, ja maar hier moet ik dan een andere oplossing voor vinden dan die gehoortoestellen? Nou dat heeft met twee dingen te maken eigenlijk. Mijn eigen interesse in techniek. Dus ik ben zelf zeg maar, ik ben niet alleen dokter, maar ik ben ook erg technisch aangereikt. Eigenlijk was ik beter aan de Delft gegaan dan studeren, studeren Leiden. Maar ja, dat kon in plaats van heel veel later. Als je ook KNO-arts bent, dat is één. En de tweede is dat ik ook contact heb gehad met de hoorindustrie. Dat is een industrie waar een aantal hele grote spelers in werkzaam zijn. En ook met alle media acties, je doet de radio maar aan, de televisie aan en je kijkt een half uur, komen er twee reclames van de hoortoestelwinkel voorbij meestal. Ondanks al hun activiteiten is dat percentage aan mensen die niet geholpen is, dat werd niet kleiner. Dus die drempel was zo groot. En ik heb wel oplossingen met hun besproken en gehad van, nou kunnen jullie iets mee? Zijn er andere manieren hoe we die groep kunnen bedienen? Daar had ik wel gedachten over, maar ben er wel achtergekomen dat ze hebben zo'n positie, waarin eigenlijk weinig hoeft te veranderen voor hun, dat zij niet aangelegen waren om echt grote veranderingen te maken. En ik ben ook niet een disruptor van de hoorindustrie. Ik wil echt iets toevoegen, dat zeg ik ook net, want ik raad iedereen aan om een hoortoestel te nemen. Wij voegen echt voor die groep die dat toch niet doet, iets toe van, nou hier heb je in ieder geval tools waar je wel mee uit de voeten kan. En die groep is die gegroeid de afgelopen jaren met het hele thuiswerken, waar veel meer teams, veel meer mobiele telefoon en mobiele overleggen? Ja, interessant. Wij richten ons echt als core op slechthorendheid, maar we zien bij de testen die we gedaan hebben, dat ook bij jongere mensen, en dat is ook een mooi artikel in de American Today, New York Times, van een half jaar geleden, geloof ik, daar stond in dat ook jonge mensen bij het kijken van televisieprogramma's nu vaak de ondertiteling aanzitten. Vanwege de rumoer, de omgeving waarin ze zitten, kunnen ze toch niet helemaal goed volgen. Dat is één grote groep, dus ook de jongeren die hebben baat bij verbeterde audio. Ook de kwaliteit van de speakers in de hedendaagse elektronica is niet super. Dus ook daar kan je met geluidsoptimalisatie echt nog wel verbetering geven. En wat ook hebben we gezien in de testen die we gedaan hebben, dat mensen als ze luisteren naar buitenlandse talen, dat daar het optimaliseren van audio ook zeer wenselijk is. De spraakverstaanbaarheid wordt enorm vergroot. Ja, en buitenlandse taal mag af en toe ook wel de snelheid wat minder. Als het een dialect is, helpt mij dan wel weer, zeg maar. Maar ik begrijp wel wat je zegt. Ja, als het niet live is, is het makkelijk. Dan kan je het langzaam afspoelen. Maar als je in een conference call zit, dan is het lastig om de snelheid te beïnvloeden. Ja, en Nouri=, jij zit meer aan de technische kant. Zou jij kunnen uitleggen, want we hebben het hier over de stem ergens uithalen. Is het zoiets als noise reduction, dus dat je ruizen weghaalt, stem omhoog haalt? Ja, het is vergelijkbaar. We hebben eigenlijk twee methoden. De eerste methode is source separation. Daarbij schrijf je eigenlijk het spraak van achtergrond. Dat kan van alles zijn. Dat kan muziek zijn, dat kan ruis zijn, dat kan rumoer zijn, dat kan incidentele ruis zijn, dat kan windruis zijn. Het kan dus van alles zijn. Daar maak je een scheiding tussen. Dan heb je als het goed is, goede kwaliteit geïsoleerde spraak. En dat is hetgeen wat je echt verstaanbaar wil maken. Wat Marciano ook zegt, je kan dat harder gaan zetten, maar dat is niet de bedoeling. Daar schiet je niet zo veel mee op. En wat je eigenlijk wil doen is frequentiespecifiek het geluid harder maken. Dus je gaat kijken naar het gehoorverlies, je gaat kijken naar het geluid, wat zit er allemaal in qua frequenties. En vaak gehoorverlies is 9 van de 10 keer zit dat in de hoge tonen. Dan heb je moeite met de hoge tonen goed kunnen verstaan. En dat wil je versterken, niet de andere frequenties, alleen die hoge tonen. En daarmee verbeter je de spraak verstaanbaar uit. En dat is een methode die je eigenlijk ook ziet zoals een hoortoestel werkt. Het zijn twee dingen, die source separation en dan die frequentiespecifieke verbetering. En samen heb je een pakketje wat vergelijkbaar is zoals een hoortoestel werkt. Ja en wat doet jullie oplossing anders dan als ik een equalizer zou hebben en zeggen van doe mij de hoge toon even wat omhoog. Ja dan ben je in principe ook weer inderdaad wel frequentiespecifiek bezig. En in de basis zijn hoortoestellen toch ook wel een soort equalizers. Alleen de instelling die je moet doen, die is heel belangrijk. Dus er zijn gewoon normen en standaarden van oké als iemand een bepaald gehoorverlies heeft, bijvoorbeeld in de hoge tonen, hoeveel moet je dan versterken? Want je kan het wel versterken, maar op een bepaald punt ben je het zo aan het versterken dat het niet duidelijker wordt. Dus dat is één. Dus de afstelling van de equalizer, daar zit eigenlijk de techniek. En wat we daarbij ook nog eens toepassen is compressie. Dus daarbij wil je eigenlijk zachte geluiden versterken, maar geluiden die al hard zijn, die laat je ongeroerd. En als je normaal aan het versterken bent, dan maak je eigenlijk alles luider. En dat moet je dan realtime doen, want je wil dit ook als je een Netflix serie zit te kijken, wil je dat ook horen. Nou is het voordeel van Netflix, dat is allemaal van tevoren opgenomen. Dus dan zou je dat nog achteraf kunnen toepassen. En zo maken we ook onderscheid tussen eigenlijk statische content en live content. Bijvoorbeeld een live uitzending van de NOS, het 8 uur journaal bijvoorbeeld, of een sportevenement. Nou daar zou je het inderdaad wel in realtime willen toepassen, of je bent aan het videobellen, dat soort situaties. Dus het moet zowel live als op statische content kunnen draaien. Maar als het live draait, dan moet je je inderdaad rekening houden met de realtime eisen die er zijn. Ja en hoe zijn die? Nou als je gaat kijken naar hoeveel kan je eigenlijk vertragen, dan heeft onderzoek aangetoond dat je ongeveer 15 milliseconden tussen beeld en geluid kunt vertragen. En dan ervaar je het nog wel als lip-sync. Dus de audio mag 15 milliseconden achterlopen, maar dan ervaar je het nog wel alsof het constant is. 15 milliseconden is echt ultra kort toch? Ja dat is heel weinig. En eigenlijk vinden wij dat nog te veel. Want als je getraind bent dan zie je wel dat het uit sync loopt. Dat lijkt me ook dan wel een technische uitdaging voor jullie. Ja, omdat in de basis veel van de technieken die wij gebruiken ook terug te vinden zijn in een hoortoestel. En een hoortoestel heel beperkt is in zijn rekenkracht. Is wat je kunt doen misschien maar beperkt, maar het moet wel ultrasnel werken. En omdat wij gewoon hetzelfde doen, nou werkt onze techniek ook ultrasnel. Daar komt er wel een complicerende factor bij, kijk als je inderdaad AI gaat inzetten en je wil het dan in realtime gaan doen. Nou dat komt ook met bepaalde performance bottlenecks. Dus we zijn ook best lang bezig geweest met inderdaad alles zo optimaal mogelijk maken om onder die 15 milliseconden te komen. Wat we nu gelukkig kunnen. Maar je maakt dat ook weer een trade-off tussen kwaliteit en tussen snelheid. Ja snap ik. Lelacy is wel echt onze vijand. We hebben weinig vijand hoor, we hebben veel vrienden. Lelacy is onze vijand. Ja, echt die vertraging. Daar kan ik me er alles bij voorstellen. Je kan soms wel hebben, weet je, als je sowieso televisie kijkt en het is net een heel klein beetje verschil. Is dat mega irritant als dat inderdaad niet lip sync is. Misschien wel leuk te vertellen, we waren de eerste bedrijf wat in Delft, bij de tv Delft, in de Green Village, testen hebben gedaan met een echt dedicated 5G netwerk. Dat is nu alweer twee jaar geleden. Dat gaat nu geveild worden eindelijk. Maar we hebben inderdaad van die latency, want met 4G konden we die latency niet bereiken. Dan kwamen we echt in getallen in de 40 tot 60 milliseconden, wat gewoon echt duidelijke vertraging gaf. We hebben gekeken of 5G, en dan nu komt 6G, of we daarmee wel die latency konden halen. We hebben echt op het netwerk wat daar aangelegd was door de TNO, hebben met een aantal partners hebben gekeken, MCS, Surf, gekeken of we dat wel konden bereiken. Toen kwam helaas, totdat onze engine toen te traag was. Maar dat was twee jaar geleden. We kunnen het nu wel en binnenkort gaan we dat wel weer testen. Kunnen jullie dat op 4G nu? Is de compressie zo goed toegenomen of de technologie zo veranderd? Nee, 4G kan niet en dat ligt dus niet aan ons. Als je iemand voor je staat en je gaat je proces op de telefoon, dan kan het. Maar wij hebben patenten op processen in de cloud. We sturen het eerst naar een server toe, daar wordt geprocest en dan moet het weer terug. Het datanetwerk van de telefoon naar de data lijn, naar de server, heen en terug, die is met 4G gewoon veel te traag. Met 5G kan het wel. Je gaf aan dat dit op ieder device kan. Moet ik dan iets installeren? Hoe gaat dat? Het verschilt per toepassing. We hebben bijvoorbeeld toepassingen voor je desktop en je laptop. En daar is gewoon een kwestie van je installeert een applicatie, op jouw systeembeheerder doet dat voor je. Dan wordt alle audio, alle systeem audio, alle audio wordt in één keer aangepast. Dat gebeurt gewoon lokaal op je laptop. Maar we zijn bijvoorbeeld ook aan het nadenken met onder andere Nokia, hoe we het bijvoorbeeld in hun IMS systeem zouden kunnen doen. Wat is een IMS systeem? Dat is eigenlijk de telefooncentrale. Dus daar worden alle gesprekken komen daar binnen en gaan er ook weer uit. Dus daar wordt de routing wordt daar gedaan. En het is dan interessant, kan je daar op toepassen, zodat ook weer de telefoon gesprekken van verstaanbaarheid beter worden, zonder dat je iets hoeft te installeren op je telefoon. En dan geldt het eigenlijk voor iedereen. Ja. Gaaf. En hoe zit dan het personalisatie stukje daar dan weer in terug? Want het is voor iedereen, maar het is speciaal voor jou. Ja, dat is inderdaad een trade-off. In sommige situaties kan je het niet helemaal personaliseren. In het geval van bijvoorbeeld een telefooncentrale, soms als je een klantenbestand hebt, dan kunnen ze dat op basis van leeftijd zouden ze dat, nou, gepersonaliseerd kunnen doen. Onze technologie wordt bijvoorbeeld ook toegepast in musea. Dat is allemaal vooraf opgenomen audio. En daar wordt gewoon maar één stand gebruikt. Het is daar altijd aan en voor iedereen. Het ding is ook, als je verbeterde audio beluistert als niet slechthorende, of het is bewerkt voor iemand die een hogere leeftijd hebt, dan als niet slechthorende ervaar je dat nog niet per se als hinderlijk of als problematisch. Zeker nog, het is eigenlijk wel prettiger om naar te luisteren, omdat het gewoon duidelijker is qua smaak, qua spraak. Maar voor je desktop, die desktop applicatie, die kan je met drie standen instellen. En daarbij kan je ook je audiogram invullen, zodat het helemaal gepersonaliseerd wordt aan jouw gehoorverlies. En Marciano, wat was voor het eerst, zeg maar, dat je zoiets had van, hé, maar deze technologie werkt en niet voor jezelf, maar dat iemand anders tegen je zei van, ja, maar dit is het, dit wil ik. Ja, dat is wel een leuke anekdote die ik dan kan vertellen. We waren bij het Singer Museum en we hadden, Nouri had laatste hand gelegd aan de beta versie van onze verbetersoftware voor Musea. We maken dan de Musea tours veranderen dan voor slechthorenden. En we kamen daar bij de directeur van het museum, meneer De Loorn, en we hadden een appje gebouwd, echt een beetje houtje touwtje nog hoor. Dat was een uur voor demonstratie. Uur voor demonstratie, uiteindelijk. Het zat op een telefoon met een slechte speaker. We zitten hier met hele dure apparatuur, maar het was echt een simpel dingetje. En we wilden gewoon laten zien van, goh, we zijn hier mee bezig. En nou, gewoon een beetje interesse wekken. En hij kijkt zo en zegt, oh, dan kan ik beter mijn hoedjes stil uitdoen. Ik dacht, ja, maar het was niet echt bedoeld als een soort high-end oplossing. Het is gewoon even, ja, een soort teaser. Het is niet de echte test. We wisten ook niet dat hij slechthorend was. Dat wisten we ook niet. Geweldig. We zetten zijn hoedjes stil uit en luistert even, luistert nog wat aandachtiger. Nou, het is exact hetzelfde als mijn hoedjes stil. En nu, wat zijn de volgende stap? Ja, leuke vraag. We hebben echt heel hard gewerkt de afgelopen periode aan het afmaken van de software. We hebben de Workspace oplossing, die is voor Windows helemaal klaar. En een aantal bedrijven die daar heel erg geïnteresseerd zijn, en een aantal bedrijven waar het draait. De presets en ook voor accessibility, dus toegankelijkheid. Mensen die op de werkvloer met gehoorverlies lopen, dat heeft grote impact natuurlijk. We kunnen daarmee helpen, maar ook gewoon de mensen die naar buitenlandse talen daarmee moeite hebben. Een Japans bedrijf die dat specifiek daarvoor heeft gekocht, bijvoorbeeld om de Engelse taal beter te verstaan. Dat is ook een hele leuke case. Dus daar zijn we nu mee aan het groeien. En we zijn net de markt op aan het gaan. We hebben klanten, maar dit jaar is echt het jaar van het PR zoeken en groeien. Maar de verdere stappen, mijn droom eigenlijk, waar ik mee begonnen ben, is om het achterhuis-signaal te verbeteren voor slechthorenden. Dat is wel grappig, want in tijden van corona was gebarentaal verplicht. En dan vraag ik aan jullie, voor hoeveel mensen is gebarentaal ter beschikking gesteld? Hoeveel mensen kijken naar het journaal en hebben daar baat bij? - Ik heb er geen flauw idee over. Ik denk een klein percentage. - In aantallen? Ja, in absolute aantallen. Dit is een gok. 100.000? - Ik zou zeggen de helft, 50.000. Ja, dat zit al veel beter in de buurt. - Zo'n 120.000 mensen. Gewoon niet zo weinig? - Ja. En ik heb het net al een beetje verklapt, maar hoeveel mensen zijn er slechthorend in Nederland? Vele malen meer inderdaad. Dat is toch 2,3 miljoen mensen? Dat zijn er 2,6. En ongeveer 1 op de 7 mensen in Nederland heeft slechthorendheid. Dus van die grote groep mensen die voor de tv zitten en het journaal niet goed volgen, zijn er meerdere mensen die ik gesproken heb. En in mijn leven kom ik elke keer weer tegen waarbij de man apart tv kijkt van de vrouw. En de vrouw die slechthorend is, zit op de laptop te kijken met de koptelefoon op. En ja, ze zitten gewoon gescheiden in de avond te genieten van hun eigen footage. Of hetzelfde programma zelfs kan ook nog. Dat journaal vind ik ook zo belangrijk als informatiebron, maar ook entertainment. Dat wil ik graag veranderen. Daar zijn we ook wel mee bezig geweest met de NPO. We doen ook weer testen met de EO nu. Met podcast, maar ook met KPN hebben we testen voor de tv gedaan die zeer positief zijn uitgevallen. Dat is iets waar we graag naar toe willen. We gaan de televisie, entertainment en de broadcast veranderen. Dat is waar we naar toe willen. Maar ook de bioscoop willen we naar toe. Dat is ook een oplossing voor de bioscoop. En ook testen gedaan in het kleine bioscoopje bij mij in het dorp. Hartstikke leuk was dat. Wat waren daar de reacties? Ja, we hadden een zaal, twee keer een viewing met een aangepaste audio. Dat was ook deels klinische testen. We hebben woorden getest met ruis, zoals ik als k-noors gewend ben in een stille ruimte. En ook een documentaire met aangepaste audio. Dat was een documentaire over de Boorma's van Beuningen, de depot. Daar hadden we de delen van de audio aangepast. Dat hebben we gescoord en daar zagen we dat in alle levenscategorieën, dus ook jong, dus ook van 13-jarigen, maar ook iemand van 90, alle mensen hadden baat bij het verbeteren van audio. Dus jong en oud. We zagen wel dat de waardering van de jongere groep minder was. Ze zeiden, nou het is niet stoer, maar als ik moet kiezen, dan kies ik voor het origineel. En bij de oude groep was heel duidelijk de voorkeur voor het aangepaste geluid. Ja, mooi. Maar je vroeg waar ik naartoe wil. Ik wil natuurlijk de televisie Nederland 1, dat zou ik graag willen veranderen. Maar eigenlijk wil ik de potentie uit al die slechte horen, die dus geen hulp hebben, op zoveel mogelijk plekken verbeteren. Dat is eerst dus wat we nu doen. Uiteindelijk zouden we een heel goedkoop hoortoestel willen bouwen met cloud computing, voor niet zozeer voor Nederland, maar echt midden- en lagelonenlanden. Oh ja, wat een mooie. Ultimate goal. Mooie missie. Nouri, we zitten in de AI podcast. Wat waren nog meer uitdagingen waar jullie tegenaan lopen, of misschien die je voor ziet, in wat Marciano nu vertelt, waar jullie naartoe willen. Welke uitdagingen heb je op het gebied van AI? Ja, dan is vooral de vraag hoe we dat gaan inzetten, op nog interessantere manieren. Een probleem waar we nu best wel lang over aan het nadenken zijn, en waarvan we denken dat er bepaalde oplossingsrichtingen zijn die met behulp van AI gehaald kunnen worden, is op basis van wat er wordt uitgezonden, of wat de content is, dus is het muziek, of is het spraak, of is het ruis, dat we op basis daarvan de personalisatie elke keer net iets anders doen. Soms als het muziek is, dan wil je misschien helemaal niks doen, of op een hele andere manier weer het geluid gaan bewerken. En als het alleen maar weer sprake is, dan wil je soms een mannenstem anders bewerken als een vrouwenstem. In de regel, wij mannen, wij mompelen nogal eens. Daar hebben wij natuurlijk geen last van, maar in de regel is dat een issue. En we hebben natuurlijk ook een lager stemgeluid. En in dat geval wil je die op een net iets andere manier bewerken dan bij een vrouwenstem. Dus we willen dynamisch gaan kijken, kunnen we bijvoorbeeld een spreker herkennen? En is het een klassieke vrouwelijke stem of een klassieke mannelijke stem? En op basis daarvan kunnen we dan ook weer een andere instelling gebruiken met die frequentiespecifieke versterking. - Oh ja, slim. - Het is ook nog zo dat we, we kunnen natuurlijk de achtergrond weghalen, dat is in een telefoongesprek heel wenselijk, maar als je naar een serie kijkt, dan wil je de suspense, de spanning, wil je niet weghalen. Dat wil je eigenlijk ook zeg maar automatisch laten doen. Wat voor soort content is het? Is het een serie? Moeten hier alle ruizen weg? Of moeten we juist net wel iets van de achtergrond erin laten? Dat is ook iets waar we modellen op willen trainen. - Een film zonder filmmuziek. - Exact. - Dan wordt het waarschijnlijk een hele lange zit. - Precies, dat bedoelen we. - Ja, maar dat zeg je ook documentaire, is ook een filmzalen, maar is toch net wat anders dan in een actiescene. - Absoluut. Ik had een vraag en die ontzettend… Oh ja, daar wilde ik nog aan jou vragen. Er is natuurlijk, want er luisteren ook heel veel mensen die natuurlijk werken, op werk is er heel vaak wel aandacht voor lichamelijke fitheid, mentale fitheid. We hebben zelfs ook allemaal dat soort programma's. Ik heb nog nooit iets gehoord over gehoorfitheid. Terwijl we zitten tegenwoordig volgens mij veel meer te luisteren. Dus allemaal met Teams meetings, Zoom meetings, weet ik wat allemaal. Krijgen jullie daar aanvragen over? - Leuk je het zegt, maar eigenlijk niet. Nee, het is… En dat gaf ik een beetje aan, een beetje bespottelijk, maar met de hulp voor geheel doven, wat ik heel goed vind. Laten we dat even onderstrepen. Het is hartstikke goed dat dat er was. Maar de slechthorendheid is een beetje weggemoffeld. We hebben ondertiteling en daarmee is het klaar. En dat zie je eigenlijk in het geheel dat er voor mensen die tussen niet-doof en goedhorend in zitten. Het is eigenlijk een beetje een vacuum waar je… We accepteren dat gewoon en dan moet je maar mee leven. Dus de aandacht die jij daar verwacht, die is er eigenlijk helemaal niet. Echt te weinig. - Je ziet ook als je nu dan bijvoorbeeld kijkt naar ons product Knisper Workspace voor je werkomgeving. Niet goed een Teams call kunnen volgen of dat niet goed kunnen verstaan. Dat is echt wel heel uitputtend ook. Je bent aan de eind van de dag helemaal uitgewrongen als je gewoon slecht dat hebt kunnen verstaan. Zeker als je in een hybride meeting zit. Dus mensen zijn deels thuis en deels op een locatie en dan naar geroezemoes en dat soort zaken. Dus dat kost je echt heel veel energie. Dus er gaat ook een hele hoop productiviteit verloren omdat we op die manier werken en omdat we de audio heel slecht verstaan. - Ja en wat ik dan zelf ook merk is dat je dan ook afgeleid raakt. Omdat het dan inderdaad zoveel energie kost. Het kost je zoveel energie dat het dan makkelijker is op een gegeven moment gewoon die ruis maar als de ruis te laten en wat anders te doen. - Ja en dat is toch best wel slecht voor je efficiëntie inderdaad. En als daar belangrijke zaken besproken worden. - Als het goed is doe je iets in die meeting. - Er is een onderzoek van de SiRM, dat is een onderzoek wel een opdracht van Specsavers geweest een paar jaar geleden. Die heeft berekend dat het verlies in de geld aan die 40% die niet geholpen is, is 5,8 miljard. Dus het niet helpen van gehoorverlies kost de maatschappij 5,8 miljard per jaar. - Ja dat is fors. Er ligt wel een hele mooie uitdaging. - Ja en had ik een afvraag voor zo'n werk situaties. Als je inderdaad hybride meetings hebt. Dan zit er in een hoekje zit een geroezemoes en de andere kant is juist een punt aan het maken en eigenlijk wil je je focussen op degene die het punt wil maken en het geroezemoes weg. Maar hoe ga je daar dan mee om? - Ja als je geluk hebt dan heb je soms een microfoon op tafel staan. Heb je geluk en dat je dan als het goed is een richtingsgevoelige microfoon in en die helpt dan hopelijk al een beetje. Die kan dan al een beetje onderscheid maken in oké waar komen nou de belangrijkste informatie vandaan. Waar moet ik op inzoomen eigenlijk en wat kan ik achterwege laten. Maar als dat niet lukt en wij krijgen gewoon ruwe audio waarbij inderdaad geroezemoes erin zit en sprekers die je naar voren wilt halen. Dan is ons source separation algoritme wel daartoe in staat om eigenlijk de sprekers die op de voorgrond zich bevinden om die te scheiden en degenen die op de achtergrond zitten nog wat zachter te zetten of juist helemaal weg te halen. Want anders interfereert het gewoon met elkaar. - Zouden er dan mogelijkheden zijn om juist op het geroezemoes in te zoomen dat je daarmee kan gaan spelen? Dat klinkt een beetje als een beetje spioneren. - Nee niet zozeer dat. Maar wat ik dan van familie en dergelijke die wat minder goed horend zijn bij verjaardagen zitten en eigenlijk het gesprek juist net even aan de andere kant van de tafel willen volgen maar dichtbij dan geroezemoes hebben. Zo zie ik het ook een beetje een meeting. Hoe ga je daarin kunnen sturen? - Je kan dat gewoon beschikbaar maken want ook die achtergrond geluid is gewoon geluid en je kan situationeel ook kijken naar het achtergrond geluid en wat daar dus in zit. Dat was het ook wat we net over hadden. Als daar muziek in zit dan wil je dat weer op een andere manier bewerken dan als die achtergrond als dat achtergrondrumoer is wat je misschien toch wel wilt mee wilt meekrijgen. - Dus dus echt op die source separator dan zou je daarop kunnen gaan inspelen en daarmee gaan interveniëren waar je op wilt focussen. - En nou wil het geval dat mensen luisteren naar ons. Dus we hebben geluid. Is er mogelijkheid dat we bijvoorbeeld een stukje van deze podcast laten omzetten juist in de algemene omzetting die we die voor een aantal minuten of zo gaan gebruiken? - Ja, dan moeten we even allemaal door elkaar gaan praten. Dan maak ik het extra moeilijk. - Oh ja, dan probeer ik het ook even beter te doen. - Nee, maar dat kunnen we zeker demonstreren. Want het effect is dan voor iedereen al waarneembaar zonder dat op een irritante manier je het hoeft te ervaren. - Nou, dat zou sowieso leuk zijn. - Ja, dan laten we dat sowieso dan doen toch? - Super leuk. De audio is vanaf hier omgezet dus je gaat nu het verschil horen. - Ja, we hebben ook altijd een virtuele co-host. Dus die zou ik graag een vraag jullie willen laten stellen. - Aisha. Ik hoop dat je het tot nu toe naar je zin hebt. Ik ben Aisha. De AI van deze podcast zou het goed zijn als ik je een vraag stel? - Natuurlijk. Hoe kunnen we ervoor zorgen dat vrouwelijke experts meer geconsulteerd worden bij AI ontwerp? - Dat is een goede vraag. Want waarom doen we dat eigenlijk niet? Dat zit daar dan een beetje achter. Waarom schenken we daar geen aandacht aan? Oeh, dat is wel een heel brede vraag. - Een brede vraag. Ze is behoorlijk maatschappelijk betrokken. - Ja, dat is wel goed. Ik moet ook eerlijk zeggen, in dat opzicht gaan wij daar wel een beetje mee in de trend. Allemaal mannen die er bij ons hier aan werken. Ook in ons source separation algoritme. Ik denk dat we meer open moeten staan. En misschien juist op plekken die niet zoveel aandacht krijgen. En mensen, groepen die we een beetje wegcijferen, juist een extra zetje moeten geven. En iedereen wel heel serieus nemen. Want we generaliseren nog wel eens. Maar ik moet zeggen, wij staan op de IBC. Dat is een international broadcast convention. Dat is een beurs voor broadcast, televisie, dat soort zaken. Dat is voor ons ook interessant om daar iets mee te doen. En daar kwamen we ook Jessica, ik weet even haar achternaam niet meer, kwamen we daar tegen. Die bezig is met, ook source separation, op een hele innovatieve manier. Misschien is het wel leuk, ik kan al die details wel delen, kunnen we dat misschien in de show notes zetten. Die zijn echt met heel erg complexe AI modellen bezig. Source separation modellen. En ook dat je individuele sprekers kunt herkennen. Dus als wij straks over elkaar gaan praten, is hun model erin toe in staat om dat van elkaar te scheiden. En gewoon vier aparte audiosporen aan te leveren. Is echt indrukwekkend. Maar je moet het maar net weten en tegenkomen natuurlijk. Als je weet dat er al heel veel vrouwen daarmee bezig zijn. Op een hele indrukwekkende manier. Ja, wat goed. En hebben jullie ook iets van testgroepen? Ja, we hebben een vast groepje van oude mensen die we mogen lastigvallen. En als je die een doosje chocolade geeft, dan vindt het fantastisch om eraan mee te doen. Maar nu eigenlijk ook omdat we zien dat onze oplossing voor meerdere leeftijdsgroepen baat kan hebben, zijn we ook nog steeds wel op zoek naar extra mensen. Iedereen die zich daarvoor ter beschikking wil stellen is altijd welkom. Ja, en dan misschien vrouwen extra. Zeker. Bedankt voor je diepgaande toelichting, zeer informatief. Vanaf hier hoor je weer de originele opname en kan je nog mooi even het verschil beluisteren tussen wat je net hebt gehoord, dus de gewijzigde audio, en wat er nu weer aankomt. Die heb je al vast te pakken, toch? Als mooi compliment. Ja, prettig om te horen. Leuk feitje is wel, ook weer zo'n robot stem, ik neem aan dat dit even een robot was natuurlijk, van iemand beledigen, is vaak ook weer voor iemand die slecht horend is best moeilijk te verstaan. Het klinkt heel telefonisch natuurlijk. Dit was nog een stem met redelijk wat hoog, dus dat geeft wat meer detail. Maar het is vaak als je dus aan het telefoneren bent en je hebt zo'n robot stem, vind ik het al heel moeilijk om te verstaan. Ja, druk op 1 of druk op 2 en dan moet je maar net gehoord hebben waar je nou precies op moet drukken. Dat is best wel een issue. Er wordt niet echt heel erg bij stilgestaan. Ook dat soort audio kunnen wij verbeteren natuurlijk. Maar daar hebben mensen best wel moeite mee. Ja, dat snap ik wel. En je moet ook heel snel die informatie tot je nemen, dus hoe beter dat uiteindelijk hoorbaar is, hoe beter je uiteindelijk ook die keuze kan maken. Ja, grappig. Nooit zo bij stilgestaan. Ik was wel nieuwsgierig met de ontwikkelingen van AI gaan heel snel. Wat zijn de technische uitdagingen die jullie eraan zien komen, die getackeld kunnen worden met die snelle verbeteringen? Technische uitdagingen? Nou, ik hoop om terug te komen, voor ons is performance het allerbelangrijkste. Dus wij hoeven in principe geen heel groot netwerk te kunnen draaien met hoge kwaliteit en heel veel parameters om tot resultaat te komen. Ik heb juist meer hoop in alle acceleratiechips die tegenwoordig in apparaten zitten, dat we die meer kunnen gaan gebruiken. Om onze algoritmes, die dan maar beperkt van omvang zijn, nog sneller kunnen evalueren en daardoor gewoon nog steeds hetzelfde resultaat kunnen halen. Maar dat het gewoon efficiënter wordt voor je batterij en dat soort zaken. Wat je daar natuurlijk ziet is dat zeker Big Tech is daar heel erg mee bezig, maar die houden die chips allemaal voor zichzelf. Dus Google heeft de TPU, de Tensor Process Unit, dat je neurale netwerken precies kan draaien op zo'n chip. Ik weet dat Microsoft gaat nu ook heel veel geld investeren om large language models erop te draaien. Zie je dat dat dan wel voor jullie openen wordt, dat je toegang krijgt op dat soort hardware? Ja en het wordt ook gewoon gelukkig steeds normaler om zo'n acceleration chip in je product te bouwen. Er komen nu al bijvoorbeeld televisies uit waar ook zo'n chip in zit. AI of voor vision, maar het kan ook voor audio gebruikt worden. En dat is inderdaad iets waar wij echt op mee kunnen kunnen liften. Je zit nog wel heel erg met het feit van ja, iedereen bouwt zijn eigen chip, dus iedereen heeft ook zijn eigen interface hoe je dat moet gebruiken. Er zit altijd wel weer laagjes software tussen die dat kunnen oplossen, maar dat is ook niet altijd ideaal. Maar het feit dat eigenlijk iedere apparaat tegenwoordig in welke vorm dan ook een AI chip krijgt die wij kunnen gebruiken, ja dat is gewoon een groot voordeel voor ons. Ja snap ik. Marciano, ik heb voor jou nog een hele praktische vraag. Want jij zegt helemaal aan het beginnen van deze aflevering zeg je van mensen vanaf 20 en dan gaat je gehoor al langzaam achteruit. Hoe weet ik nou, hoe kan ik nou controleren of mijn gehoor zeg maar aan het achteruitgaan is en dat ik daar eigenlijk hulp, ondersteuning meer nodig heb? Ja dat denk ik dat ook een deel van het probleem is dat je het niet altijd weet. Het is goed dat je daar op terugkomt. Zeg maar de internationale standaard als je geen hoortest kan doen is eigenlijk een jong kind. Dus het gehoor van iemand van acht jaar bijvoorbeeld is eigenlijk ook een Zuid-Afrikaanse audioloog die veel onderzoekt met hoortesten en die heeft in het begin van zijn proeven heeft hij altijd kinderen gebruikt als referentie. Dus als een oma ten opzichte van haar kleinkind een bepaald aantal scoren van woorden wel of niet kon verstaan of het volume zoveel harder moest doen dan was dat een reden om om hulp te zoeken. Maar ik denk als je zelf gewoon overdag merkt dat je vermoeid raakt tijdens gesprekken, tijdens Teams calls of tijdens telefoongesprekken dat dat een indicator is van hey ligt het aan mijn fysieke gestel of is dat gehoor ook een onderdeel? En er zijn ook heel veel test tools gemaakt door de Hoorstichting en heel veel bedrijven ook die hoortesten online hebben. Audi, beter Hoorn, Schoonenberg, Spekzeven ze hebben allemaal online tools waarbij je in ieder geval indicatie kan krijgen of je hulp zou moeten zoeken ja of nee. Maar je bent eigenlijk zelf de belangrijkste validator. Moet ik hulp hebben ja of nee? Ja precies en stel er komt uit van ik heb hulp nodig. Kan ik als individu ook jullie product aanschaffen? Dat zou ik heel graag willen maar daar zijn we gewoon echt net een maatje te klein voor. Dus wij bieden oplossingen aan bedrijven echt B2B. Dus je kan wel je werkgever vragen of je kan wel een mailtje naar de NPO sturen van goh ik heb daar behoefte aan. Nee maar daar is onze service niveau gewoon niet toe in staat om individu te helpen. Ja duidelijk. Dus het is echt B2B. Dus als je als bedrijf iets wil doen aan nou wat ik net zei die gehoor fitheid of zo voor je medewerkers. Precies. Dan kunnen ze contact met jullie opnemen. Graag. Kijk nou dan zorgen wij ervoor dat dat in de show notes staat. Ja super bedankt voor de inzichten die jullie hebben gegeven in nou ja weet je wat je allemaal kan doen met met audio voor ons natuurlijk ook heel erg interessant. We zitten niet voor niks met de koptelefoons hier op en microfoons. Dus heel erg bedankt dat jullie hier hebben wilde komen. Nou ja ik hoop zeg maar ik ben zelf deze uitzending laat ik het zo zeggen normaal gesproken luister ik niet heel veel terug van onze eigen uitzending. U weet wat we besproken hebben. Maar ik ga wel die minuten die we omgezet hebben ga ik natuurlijk sowieso luisteren. Ja leuk. En nou ja laat via de socials weten wat je ervan vindt. Dus hoe ervaar je dat? Hoe vind je het? En welke verbetering levert dat voor je op? Ja en waar zijn je werk zou dit je kunnen helpen? Ja ik ben heel erg benieuwd. Marciano bedankt. Nouri bedankt. Zo hartstikke die stond nog aan. Dat is een goede gehoortest. Jazeker. Jij? Zeker zeker. Fijn dat je weer luisterde naar een aflevering van AIToday live. Vergeet je niet te abonneren via je favoriete podcast app en dan mis je geen aflevering. Dank je wel voor het luisteren. Tot de volgende keer. [Muziek]