Wat leer je in deze aflevering?
Welkom bij een nieuwe aflevering van AIToday Live - de hel genaamd Excel! In deze aflevering bespreken we de problemen rondom het gebruik van Excel als een database en de impact ervan op de kwaliteit van data. Onze gast(en) leggen uit waarom Excel niet geschikt is als een volwaardig database systeem en delen mogelijke oplossingen, zoals het behandelen van Excel als een applicatie en het gebruik van tools zoals Python of data warehouses. Leer hoe je Excel op de juiste manier kunt gebruiken en ontdek oplossingen om datakwaliteitsproblemen aan te pakken.
Kernbegrippen
- Datakwaliteit
- Mate waarin data accuraat, volledig en consistent is voor betrouwbare analyses en besluitvorming.
- Single source of truth
- Één centrale, gezaghebbende databron die alle organisaties gebruiken om inconsistenties te voorkomen.
- Data governance
- Regelwerk en processen voor beheer, kwaliteit en verantwoording van data binnen organisaties.
- Datacontract
- Afgesproken regels en standaarden voor structuur, kwaliteit en gebruik van data tussen systemen.
Transcript
Hoi, welkom bij een nieuwe aflevering van AIToday Live. Mijn naam is Joop Snijder, CTO bij Aigency. Mijn naam Niels Naglé, Chapter Lead, Data & AI bij Info Support. En vandaag hebben we te gast Harm. Harm, je bent voor de tweede keer bij ons in de studio. Ja, dat klopt ja. Ja, geweldig. En we gaan het vandaag hebben over de hell of Excel. Maar voordat we daar aan beginnen, zou je jezelf eerst even nog willen voorstellen aan de luisteraars? Oh ja, dat is goed. Ja, voor al die luisteraars die de eerste uitzending niet gehoord hebben. Het ging vooral over mezelf, maar nu gaan we het meer over inhoud hebben. Ja toch? Ja. Mijn naam is Harm Bodewes, 55 jaar. Ik heb al een lang carrière in de IT achter de rug. En ik heb een jaar of drie geleden de switch gemaakt naar Data Science. En sindsdien werk ik als zelfstandig adviseur Data Analytics, Data Science. Ja, en je doet ook een podcast toch? Ja, klopt. Ik ben ook een van de hosts van de Data Logo. Ja, om niet te vergeten. Precies. Ja. Nou, we gaan het hebben over de hell of Excel. Zou je kunnen uitleggen wat je daaronder verstaat, de hell of Excel? Ja, dat kan ik zeker. Ik vind het heel moeilijk trouwens om dat in twintig seconden te doen. Maar wacht, dan gaan we deze hele uitzending aanleggen. Ja toch? Zeker. Nou, wat ik continu merk in mijn werk is dat we last hebben van datakwaliteitsproblemen. Dus de data scientist kan pas zijn werk doen als hij goede kwaliteit data heeft, bijvoorbeeld. En die datakwaliteitsproblemen zijn eigenlijk heel vaak een jaar of twintig en daarna ontstaan door het verschrikkelijke tool Excel. Ik ga daar een aantal voorbeelden van geven in deze opname. Heel graag. Wij komen dat ook in onze dagelijkse praktijk tegen. Zeker. Dus in die zin voelen we met je mee. Wat is je allergrootste frustratie? Laten we daar eens mee beginnen. Nou, mijn grootste frustratie is dat Excel op een manier gebruikt wordt waar het helemaal niet voor bedoeld is. Toen ik studeerde, heel lang geleden, was ik studentenassistent en ik hielp bij een werkcollege S2020. Ik weet niet of jullie dat kennen, maar dat was een spreadsheet. Dat was toen heel modern op een Vaxcomputer. En wat de studenten moesten doen is, bijvoorbeeld concept prijselasticiteit. Je gooit de prijs 1% omhoog, wat betekent dat voor de vraag naar producten? Gaat die 1% omlaag of gebeurt er niks? Zo kon je door één variabele in een spreadsheet te wijzigen, een rekenblad, ging dat hele spreadsheet doorrekenen. Fantastisch, wat waren we daar blij mee. We zijn nu 20, 25 jaar later of misschien wel meer. En op een gegeven moment kwam Excel op de markt, een Microsoft product. En dat tool wordt op allerlei manieren gebruikt. Het is niet alleen maar een spreadsheet, het is een database, het is een tekenpakket, het is een, ik weet niet wat. Het is gewoon veel te makkelijk, het is veel te toegankelijk. Een applicatieplatform bijna wordt het gebruikt. Nou ja, en vooral waar we natuurlijk mee te maken hebben op het gebied van data science en machine learning, is dat het gebruikt wordt als database. Het is een gigantische dataopslag. Ja, en het begint eigenlijk al op het moment dat jij Excel opent en je maakt een nieuw werkblad. Op dat moment gaat het eigenlijk al verkeerd. Want je gaat data invoeren, dus er zit helemaal geen formaat op die data, er zitten geen integriteitsregels op die data die je invoert. Je kunt eigenlijk alles invoeren. En daar begint het eigenlijk al. En waarom is dat een probleem? Het probleem is dat we eigenlijk fantastische database systemen hebben die je daarvoor zou moeten gebruiken, waar wel dit soort controles direct bij invoer gedaan worden, waar wel referentiële integriteit wordt gecontroleerd. Ja, waardoor de datakwaliteit eigenlijk gewaarborgd is. Ja, Excel is gewoon geen database systeem. Nee. Punt. Ja, helemaal mee eens. Maar er zijn heel veel mensen die het fundamenteel met jou oneens zijn. Want zeg maar, dit gaat van kleine bedrijven tot de grootst mogelijke enterprises leven op Excel. Ja, en de ergste mensen, dat zijn financiële mensen. Want dit is natuurlijk het enige wat ze snappen, Excel. En ja, dat is lekker makkelijk. Ik kan een mooie draaitabel maken. Ik kan gegevens bij elkaar optellen. Ik kan vermenigvuldigen. Ik kan eigenlijk alles wat ik wil. En ik kan al die data lekker bij mezelf houden. Ik doe opslaan als, op mijn eigen computer natuurlijk. En ik heb eigenlijk mijn eigen database gecreëerd, die met geen enkel ander systeem koppelt. Het is een ramp. Ja. Het is voor jullie heel herkenbaar. Ja, zeker. Met name hoe het gebruikt wordt. En invoer geen controles. Maar ja, hoe ga je er dan mee om als het ingezet is? Want we hebben er allemaal mee te maken. Er zit hele belangrijke data in, die niet in een bronsysteem zit. Voor mij zijn het eigenlijk twee vragen, Niels. Dus inderdaad, hoe gaan we er mee om als databron, zeg maar. Maar de tweede vraag is, hoe gaan we dit in de toekomst voorkomen? Laten we eens beginnen met praktisch nummer één. Toch? We hebben het, hè? Ik bedoel, ze zijn daar. Ze zullen er voorlopig ook nog zijn, Excel, Sheets. Hoe gaan we er mee om? Nou, wat ik zie, wat data scientists vaak doen, je hebt, als je CRISPR DM gebruikt, een methode voor data scientists, dan ga je eerst business understanding, dan doe je data understanding. Op een gegeven moment kom je weer data preparation. En dat betekent eigenlijk dat je alle data klaarzet, zodat de data scientist een mooi model kan gaan maken. Vaak wordt er dan iets van data frames in Pandas, als je voor Python hebt gekozen, gebruikt. En dan ga je eigenlijk in Pandas allerlei trucjes uithalen om die corrupte data, ik noem het maar even zo, ik vind het altijd leuk om dingen zwart-wit te zeggen, maar dat hoor ik in ieder geval zo, om die corrupte data te herstellen, zodat de data scientist vervolgens schone data heeft om zijn model te maken. De vraag is natuurlijk, hoe is dit probleem überhaupt ontstaan? Hoe komt het dat die data vies is? Hoe kunnen we betere kwaliteit data krijgen? Nou, en niet al onze luisteraars zijn data scientists, dus ik denk dat het wel goed is om te benoemen waarom dit zo'n probleem is. Want in dat opschonen moet die data scientist allemaal keuzes maken. Gooit hij data weg? Gaat hij dingen verzinnen? Zegt hij nou, laten we de gemiddeldes invullen? Er worden heel veel keuzes gemaakt onder water, die je misschien helemaal niet weet, waarbij je ook niet weet wat de functionele impact is. Dus dat betekent dat er best wel problemen kunnen ontstaan tussen wat je verwacht en wat er uiteindelijk uitkomt, toch? Ja, dat klopt helemaal wat je nu zegt. En problemen die uiteindelijk heel bepalend zijn voor het resultaat van het voorspelmodel. Want wat jij nu zegt, van nou ja, ik zie allemaal outliers, ik pak maar even het gemiddelde, of ik haal een aantal outliers uit het model, of lege velden haal ik gewoon weg. Ja, dus heel bepalend voor de kwaliteit van de output. Ja, ik denk dat we daar wel een stapje snel gaan over de business understanding, en dat we dus eigenlijk het wel echt als een applicatie of een bron moeten zien, en dat we dus ook zo moeten aanvliegen. En dus ook met de invoer en de mensen die die Excels creëren, echt om tafel gaan, maar hoe is dit ontstaan en het als een applicatie behandelen? En dus ook die vragen die we normaal gesproken aan onze bronnen stellen, ook aan die Excel gaan stellen en aan die personen die die invoer doen. Ja, nou volgens mij is het probleem, dat is trouwens een hele goede vraag, Niels. Volgens mij is het probleem, dus het laat 20 of 30 jaar geleden al ontstaan, op het moment dat Microsoft Excel op de markt bracht. Het is gewoon te makkelijk, het is te toegankelijk. En ik zie op dit moment eigenlijk een vergelijkbaar fenomeen met bepaalde data science platformen, zoals SAS Viya, ik weet niet of je dat kent. Dat is ook zo makkelijk in gebruik, dat mensen eigenlijk niet meer na hoeven denken over wat ze fouten kan doen zijn. Ik denk dat dat het probleem is. En het probleem natuurlijk is dat we met machine learning dat gebruiken als fundament, dus je bent eigenlijk op drijfstand bij je aan het bouwen. Nou ja, en iedereen snapt wel dat dat niet heel handig is. Ja, dat klopt. Maar jij wilde, want ik interrumpeerde jou. Twee punten, ja. Nou nee, ik interrumpeerde je, want ik zei van, om even uit te leggen waarom het het probleem is, dat je überhaupt zeg maar, dat dan het inladen bent en dat de data scientist je keuzes maakt. Ja, nou het feitelijke probleem is natuurlijk, we hebben het tegenwoordig allemaal heel veel over data driven decision making, en over one single source of truth. En je moet bij het maken van beslissingen in een bedrijf, waarvan een bepaalde universele waarheid kunnen uitgaan. En die is er niet. En nou zijn er in de loop der jaren ook allerlei data quality tools op de markt gekomen, informatica, information builders, zoveel het is allemaal. Maar het is eigenlijk dweilen met de kraan open, zodat we toestaan dat Excel nog steeds als databron, als database systeem gebruikt wordt. En het gaat nog verder, wat ik eigenlijk ook vind, heel veel BI tools hebben een knop bovenin een menu hangen van export to Excel. En daar ga je weer. Dus dan heb je een heel mooi BI systeem gemaakt, en dan denk je, nou dit ziet er mooi uit, ik exporteer die data naar een Excel bestand, ik ga de output van dat Excel bestand volgens mij weer bewerken, dan creëer je eigenlijk een nieuwe single source of truth. En daar gaat het eigenlijk al fout. Ik heb helaas de oplossing ook niet. Het is een hele deprimerende uitzending, dus het gaat alleen maar om problemen. Ja, zonder oplossing. Want daardoor krijg je een hele rare cirkel wat je zegt. Dus die Excel wordt ingeladen, daar gaan we allemaal slimme of semi-slimme dingen mee doen, dan krijg je je rapportje uit, en dat rapportje ga je exporteren naar Excel, en zo om, en zo om. Je krijgt allemaal nieuwe databronnen die gebaseerd zijn op verkeerde andere databronnen. Misschien kan de data mesh een oplossing zijn, maar daar gaan we het een andere keer over hebben, volgens mij. En ik weet overigens ook wel, er zijn veel grotere problemen in de wereld, om het een klein beetje te leren. De oorlog in de Gaza, noem maar op. Maar ik vind dit echt wel een hele grote ergernis. Nou, en het is niet alleen denk ik een ergernis, het is echt een probleem als je daadwerkelijk machine learning systemen hierop wil gaan bouwen. Want het is natuurlijk ook heel belangrijk om bijvoorbeeld je data te versioneren. Dat je weet, dit model is gebaseerd op deze data, zodat je altijd weet waar het op gebouwd is. En als dat iedere keer zomaar andere versies zijn, het is een databron die gewijzigd kan worden, zonder dat daar enige toezicht op is. Wat ben je dan nog aan het doen? Dat is echt een groot probleem als je serieus je professioneel mee aan de slag wil. Ja, ik denk dat dat wel belangrijk is. Want in het begin is het ook niet erg, het gemak om te kunnen starten, dat is denk ik ook wel het mooie van Excel. Want je kan het ergens in kwijt, je hoeft niet een hele applicatie te hebben, dus daar zit een stuk gemak in. Maar de mate hoe je het gaat inzetten, wat de impact ervan is en het belang ervan is, dan is op den duur Excel gewoon niet meer de place to be. En moeten we daar andere materialen voor inzetten, andere technologieën voor inzetten, om ervoor te zorgen dat die kwaliteit gegarandeerd kan zijn, in plaats van eerste instantie best fit oplossing. Ja, maar de grote vraag blijft natuurlijk hoe. Ik weet niet hoe jullie dat, vanuit Info Support bijvoorbeeld, jullie klanten adviseren. Kijk, niet anders dan andere systemen, ga ik ook voor Excel gewoon ervan uit dat het een applicatie is. Dus dat betekent dat we een datacontract afstemmen, dat we daar bepaalde regels op instellen. En dan zetten we dus een huishouding eromheen, als Excel nou eenmaal de omgeving is waar ze in werken. Dan zetten we daar eigenlijk een soort van kaders omheen, met contracten, met datakwaliteit en geven het ook gewoon terug. Wat staat er in zo'n datacontract? Datacontract staat in, nou ja, als we het even echt op Excel hebben, welke tabbladen zitten erin? Wat voor tabellen zitten erin? Wat voor datatype is dat? Is het een lege kolom, betekent dat ook wat? Allemaal van dat soort zaken, die je ook in een applicatie in de technologie misschien al vastlegt, die maak je ook voor Excel. Ja, ik denk dat dit wat jij nu zegt, dat werkt misschien in de wat grotere bedrijven, maar in de kleine MKB-bedrijven, ja, die zullen dat soort mensen jou waarschijnlijk glazig aankijken. Beste Niels, waar heb je het over? Ja, en dan is de vraag inderdaad, wat is daar wel een fit? Ja, Excel, ik heb de oplossing ook nog niet hoor. We hebben nog een kwartiertje, we gaan die oplossing nu bedenken. Ja, maar op zich, dat zou nog best wel een hele aardige kunnen zijn, toch? Ik kijk even naar Niels, weet je, Niels is de dataman in ons midden. Je bent de MKB, je bent de financiële man. Wat zou een eerste stap kunnen zijn? Ja, de eerste stap is een inventarisatie. Waar wordt het op dit moment voor ingezet? En waar gebruiken we het? Dus waar wordt het ingevoerd en waar wordt het gebruikt? Om daar al een verschil in te gaan maken, dan heb je je eerste stap gezet van waar zit de invoer en waar zit het gebruik? Ik denk dat dat vaak al heel diffuus is met de Excel-oplossingen die we vaak zien bij organisaties. En als we dan weten waar de invoer zit, dan zou ik daar op scopen om te gaan kijken van hoe gaan we daar het probleem tackeln. En ja, tackeln dat kan in heel veel zinnen. Dan ga ik toch nog een ander vies woord roepen, maar XS. Formulieren maken waar je al wel checks in kan doen. Voor kleine organisaties denk ik daar al een eerste stap is die je kan maken van Excel naar XS. Als kleine database. Als kleine database. Ja, dit is een goeie die je nu noemt, want Microsoft XS, ik vond dat in de kern eigenlijk best wel een mooi product. Ik kom het alleen nergens meer tegen. Nee, omdat de andere tools en de SQL-service en de cloud-oplossingen natuurlijk ook veel gebruiksvriendelijker geworden zijn. Dus ook daar kan je kijken naar wat is een alternatief in de cloud die je gewoon in één keer al tot je beschikking hebt. Die misschien wel een beetje Excel-achtig aanvoelt en gebruik heeft. Ik weet niet, ik kan niet zo even 1, 2, 3 en toe opkomen die dat op dit moment heeft. Ik denk dat er twee oplossingsrichtingen zijn. En de eerste is Data Mesh, dat noemde ik zelf al eventjes kort. En wat jij net zegt Niels, contracten, duidelijke specificaties, duidelijke kwaliteitseisen. Dat zijn eigenlijk ook elementen van het Data Mesh denken. En Data Mesh is in de kern dat je data als een product beschouwt. En dat je het eigenaarschap van de data producten in de business legt. Waarmee de business users, inclusief de financiële mensen, zich ook echt verantwoordelijk voelen voor de kwaliteit van de data. Ik denk dat dat oplossing 1 is. En oplossing 2, nou dat ga ik zo anders wel even toe. Nee, maar ik denk dat je daar een hele belangrijke noemt. Het stukje verantwoordelijkheidsgevoel. Alleen ja, je kan zeggen, Joop, jij bent nu verantwoordelijk voor het stukje data. Ja, ik voel hem niet. Nee, daar zit wel vaak de uitdaging in. Het voelen en verantwoordelijk stellen en wat betekent het als die data fout zit. Dat overbrengen naar de owners van de data, dat is op zich toch wel een hele moeilijke. Ja, en ik denk dat dat een beetje met de tweede oplossing te maken heeft. Dat je die owner, moet je ook de tools geven, de gereedschappen. Zodat die dat ownership kan pakken. Zodat Joop dat ook gaat voelen. Ik ben owner van bepaalde data. En wat raad je mij aan dan? Nou, dan raad ik aan, niet Excel, maar je hebt wel hele mooie andere tools. Waarmee je bijvoorbeeld je master data kunt beheren. Dat kun je ook zelf iets maken in een low-code platform zoals OutSystems of Oracle Apex. Of weet ik veel wat. Maar zorg in ieder geval dat je datakwaliteitsproblemen bij de bron aanpakt. Datakwaliteitsproblemen ontstaan altijd bij invoer, is mijn stelling. Ja, en wat ik jou dan gun, Joop, als jij owner bent van de data, is inzicht. Inzicht in wat is nou eigenlijk de kwaliteit. Zodat jij kan beoordelen van, is dit voor mij voldoende kwaliteit? Voor mij, om Joop stempel erop te zetten. Als dit fout is, dan weten jullie, kunnen bij mij terecht, ik ben verantwoordelijk hiervoor. Nou, ik gooi even wat olie op het vuur. Want ik heb een andere adviseur gehad. En die zei van, je kan tegenwoordig Python gaan programmeren in Excel. Daar kan ik toch alles mee oplossen? Ja, dat vind ik dus ook een ramp. Dat moet wettelijk verboden worden, deze optie. Dat is een beetje hetzelfde verhaal. En je hebt ook van die zogenaamde solvers in Excel, ken je dat? Ja, zeker. Of bedoel je dat nu? Nee, nee, nee, nee, de solvers zijn natuurlijk echt... Ik vind de solvers nog wel redelijk. Want dan kan je ook nog van die what-if scenario's en dat soort dingen, waar Excel eigenlijk voor bedoeld is. Een doorrekenen van scenario's. Maar ze gaan echt, dat je naast VBA, dat je ook gewoon in Python kan gaan programmeren. Om het namelijk nog toegankelijker te maken om te programmeren in Excel. Ja, en dan de echte data scientists die ik ken. Dat wil zeggen de wiskundigen en de statistici, die groeien hier natuurlijk van. Waarom is dat natuurlijk? Omdat het een soort onderschatting van hun eigen vakgebied is. Denk ik. En je kunt, neem ik aan, ik heb dit nooit gebruikt hoor, Python in Excel. Nee, dat is een heel nieuw werk. Ik neem aan dat je dan heel makkelijk op basis van de data die je hebt ingevoerd in Excel, waarschijnlijk van slechte kwaliteit. Dat je daar een decision tree of zo uit kunt halen of een random forest of weet ik veel wat. Dus je gooit rommeldata in zo'n algoritme. Je hebt geen idee hoe zo'n algoritme werkt. En er komt een uitkomst uit van, nou je moet meer dit gaan doen. Je moet meer van deze producten gaan verkopen. Ja, bijvoorbeeld. Het is heel explosief. Het is rommeldata. Het is een algoritme waarvan je niet snapt hoe het werkt. En daarop op basis daarvan ga je beslissingen nemen. Wat kan daar goed aan doen? Je zou Python ook in kunnen zetten om juist die data validatie te gaan doen in Excel natuurlijk. Je kan alle code schrijven die wel net zoals VBA ook al mogelijk was. Kon je ook al je kwaliteitscontroles in VBA afdichten zodat wat ingevoerd werd weer gecontroleerd. Daar kan je nu ook Python voor inzetten. Ik zeg niet dat je het moet doen natuurlijk, maar zo kan je Python ook. Ik denk dat het juist goed is wat je zegt. Het komt nu ook al. En het gebeurt nu niet. Ik geloof niet dat het een toevoeging gaat zijn. Nee, maar ik kom nog genoeg Excels tegen waar een hele VBA applicatie achter zit die ook allemaal dingen aan het doen is. Oh, dat geloof ik zeker. Dat is misschien al een beter stapje dan alle gewone losse sheets die je hebt. Wat ik me wel eens afvraag, ik ben wel benieuwd hoe jullie daarover denken. Microsoft heeft een bepaalde strategie natuurlijk. En dat is waarschijnlijk een zo groot mag ik de aandeel behalen. Kun je op een gegeven moment tools een beetje te toegankelijk maken voor Jan met de pet? Kan dat? Dat is het al. Ik denk dat er al veel tools zijn, ook een hele loco platform, waar heel veel voordelen aan zitten. Maar je hebt niet meer de kijk onder de motorkap. En als het ergens ingezet wordt waar de impact en waar het heel erg belangrijk is, dan moet je gewoon weten wat daar gebeurt en wil je daar invloed op hebben. Dat is ook waarom wat mij betreft maatwerk software in de kern van de organisatie moet zitten. En dat alles wat je er omheen hebt, prima dat je dat bij of andere low-code oplossingen ervoor neerzet. Maar is het echt in de kern van de organisatie, ben ik voor maatwerk software, zodat je het aan je eigen proces kan aanpassen om je impact daarmee enorm te vergroten. En ook gewoon anders te kunnen zijn dan de organisatie om je heen. Ik ken IT'ers die gruwelen trouwens van low-code platformen. Gewoon in het algemeen, maakt niet uit. Oh daar zit er eentje. Ja, zeg maar, waar ik in geloof is als je nog in een idee fase zit, in een pilot fase, pok fase, dat als je heel snel moet itereren, zijn dit soort dingen allemaal geweldig. En dan kan het niet toegankelijk genoeg zijn, want dan wil je namelijk zo snel mogelijk weten of je idee, of dat ook levensvatbaar is, of dat uiteindelijk van waarde is. Wat je bij al dit soort, daarom volgens mij zeg je ook de hell of excel, je gaat uiteindelijk iets inzetten waar het niet voor is gemaakt. Dus je probeert uiteindelijk vierkantjes en rondjes te drukken en dat gaat niet. Dus ieder low-code platform in welke vorm dan ook, heeft zo zijn grenzen. En als je serieus business erop gaat uitvoeren, zul je tegen die grenzen aanlopen en moet je het duwen en het trekken en maak je het, denk ik, kapot. Dus wat je gaat zien is dat je onderhoudbaarheid wordt heel slecht, je aanpasbaarheid wordt heel erg slecht. Dus het wordt steeds moeilijker om daar verder op te bouwen. Ik noemde net al een fundament van drijfzand. Nou, dit is dan geen drijfzand, maar het is wel. Je moet eigenlijk je POC direct opruimen, zeg je. En low-code platformen moet je eigenlijk dus alleen maar in een POC fase gebruiken, dat is ook wat je zegt. En de hell of excel ontstaat eigenlijk door die POC's. Precies. Iets wat ontstaat gaat stiekem via allerlei tussenweggetjes toch in productie. En op een gegeven moment wordt het een soort ERP-systeem, wereldwijd. Ja, we willen soms ook gewoon te snel en maar doorgaan en maar doorgaan. Soms moet je gewoon echt even stilstaan, kijken naar wat is de waarde, dan moet je het daarna ook de waarde geven die het dan ook verdient. En dat is de stap die dan niet gezet wordt, want dan gaan we weer door naar de volgende POC, want ja, het werkt toch. En daar zit het risico wel in van de toegankelijkheid van de tools. Ja, ik heb het idee dat wij met z'n drieën wel eens zijn. Ja toch? Dat is de beste van de wereld. Nou, en ik denk dat dat weggooien, dat is echt een hele moeilijke stap voor mensen, want je hebt daar tijd, geld, energie in zitten. En dan voelt het alsof je waarde weggooit, terwijl de waarde zat natuurlijk in de validatie van je idee en niet in dat stukje Excel. Dus die omzetten naar iets wat robuust en schaalbaar en onderhoudbaar is, dat gaat je zoveel meer opleveren. Alleen, dat vinden mensen heel moeilijk. Ja, en dat schaalbare, dat zou een data warehouse kunnen zijn. Volgens mij gebruiken we nu die term voor het eerst in deze opname. Dat is toch, denk ik, die robuuste oplossing die je dan kunt hebben. Die ook real-time kan zijn, real-time data warehouse. Dus dat is iets wat prima kan met de technologie van tegenwoordig. Alleen, het kost natuurlijk altijd veel geld en tijd om zoiets goed op te zetten. En op een gegeven moment wordt management zenuwachtig en zegt van, ja, met die Excel kan ik ook geen beslissingen nemen. Sterker nog, eigenlijk vertrouw ik gewoon op mijn onderbuik. Ik heb helemaal geen IT nodig. Dat zijn de ergste. Ja, dat zal nog heel lang een lastig probleem zijn. Ja, maar we hebben het niet opgelost, denk ik, in deze uitzending. Denk het ook niet, hè? Misschien wel wat handvaten, geboden waar mensen mee aan de slag kunnen, toch? Ja, en luisteraar, heb jij wel echt de Moonshot ID hiervoor? Neem contact met ons op. Ik denk dat we het stapje voor stapje moeten zetten, maar wie weet. Laat het ons weten, inderdaad. Harm, we hebben ook een nieuw onderdeel in ons programma. Die had je eerder moeten zeggen. Ja, toch? Die had jij nog niet meegemaakt. We hebben onze virtuele co-host Aisha. O, ja, ja, nee, die heb ik gehoord. Kijk, zij wil je ook een vraag stellen. Ben benieuwd. Aisha. Aisha. Aisha. Aisha. Aisha. Een intelligente vraag, Aisha. Vriendelijke groeten. Ik ben Aisha, de AI van deze podcast. Zou ik je een vraag mogen voorleggen? Ja hoor, tuurlijk. Ben je ooit te slim afgeweest door een AI? Zou je dat verhaal kunnen delen? Dat is een goede vraag. Zeggen, ben je ooit te slim afgeweest door een AI algoritme? Dus, met andere woorden, ben je ooit verrast door een AI algoritme? Ja, bijvoorbeeld. Waar je zelf niet opgekomen zou zijn. Ja, ik denk, kan ik dat AI nemen? Ja, tegenwoordig mag je alles AI nemen. Ik denk, ik heb een heel simpel voorbeeld. Strava. Sporters onder ons kennen dat. Strava heeft een optie om routes voor jou te maken. Ik was vorig jaar in Italië op vakantie. Ik had een mooie route in gedachten. Ik wil van A naar B. Zonder dat ik over allerlei snelwegen moet en drukke wegen moet oversteken. En ik druk op een paar knoppen. Ik heb werkelijk nog nooit zo'n mooie fietstocht. Dus het antwoord is volmondig, beste Aisha. Dit was de beste vraag trouwens van het hele interview. GELACH Het antwoord is, beste Aisha, ja, dit is gebeurd. En dit gaat de toekomst veel vaker gebeuren. Leuk om vanuit jouw perspectief een antwoord op mijn vraag te krijgen. Thanks. Nou, dat lijkt me een hele mooie, positieve afsluiter. Leuk dit. Ja? Ja. Zij verrast ons ook regelmatig met dit soort vragen. Ik moet zeggen, ik moest er zelf ook wel even over nadenken. Wat mij meteen te binnen schoot, is wij maken ook zogenaamde requirements, stellen we op. Specification by example. Waarbij je eigenlijk in een soort van semi-formele taal opschrijft wat je verwacht van een model. En dan geef je voorbeelden in tabelvorm. Waarmee je het eigenlijk test. En nou, bij de tweede test, dat begon Copilot, de AI-assistent van Microsoft bij het programmeren. Die begon gewoon al hele tabellen van voorbeelden te geven. Dus die begreep de test die ik aan het schrijven was. En dat verraste mij enorm. En het grappige was, waarmee ik nog meer misschien verrast werd, is dat ik op een gegeven moment ook zo'n test aan het schrijven was. Toen kwam hij niet met die tabellen. Dat is raar. En in eerste instantie dacht ik, dat is jammer dat hij dat dan niet begrijpt. Maar toen dacht ik, misschien ben ik nu te ambigu, het is te onduidelijk in mijn test. En toen schreef ik hem om en toen kreeg ik echt 10 voorbeelden of zo met hele goede testen. Dus het was ook een soort van trigger voor mij. Maar uiteindelijk was ik niet duidelijk genoeg. Dus eigenlijk wordt je geholpen om je documentatie en je specificatie structureel beter te maken. Dus dan was hij me behoorlijk te slim af. Misschien kan Aisha ook helpen om het probleem van de hel af te halen. Zeg nou iets raars. Ja, dat gaan we dan een andere keer vragen denk ik. Harm, hartstikke bedankt voor al je inzichten. Voor de, ik denk wel, leuke frustraties toch? Ja, zeker. Het is uiteindelijk toch best een hele gezellige uitzending geworden. Ja, laten we er vooral ook om lachen. Zeker, zeker. Dank je wel. Graag gedaan. Leuk dat je weer luisterde naar een aflevering van AIToday Live. Vergeet je niet te abonneren via je favoriete podcast app en mis geen aflevering. Dank je wel.
Over de gast
Harm Bodewes is een ervaren IT-professional die zich de laatste jaren heeft gespecialiseerd in Data Science. Na een lange carrière in de IT heeft hij de overstap gemaakt en werkt nu als zelfstandig adviseur op het gebied van Data Analytics en Data Science. Naast zijn werkzaamheden als adviseur is hij ook actief als podcasthost, waarbij hij zijn kennis en ervaringen deelt met een breder publiek. Met zijn expertise op het snijvlak van technologie en data-analyse brengt hij waardevolle inzichten in de uitdagingen en kansen binnen het domein van Data Science.
Bekijk gastprofiel