Computable - Interview Menno van Doorn: Agentic AI

Interview Menno van Doorn

Niet te snel de sleutels
aan agents geven

Agentic ai is nu nog te vroeg, zegt VINT-directeur Menno van Doorn. ‘Er sluimert een nieuwe softwarecrisis, waarbij bedrijven zich verschuilen achter autonome systemen.’

Tekst: Teus Molenaar Beeld: Sogeti, SHUTTERSTOCK

Organisaties moeten zich beter bewust worden van de risico’s van ‘agentic ai’, stelt Menno van Doorn, directeur van het Verkenningsinstituut Nieuwe Technologie (VINT) van Sogeti. ‘Ik zou er uiterst voorzichtig mee zijn; je geeft niet zomaar de sleutels van jouw bedrijf uit handen aan software die zelfstandig beslist en handelt.’

VINT doet al dertig jaar onderzoek naar de impact van technologie en publiceert hierover regelmatig rapporten en boeken. De studie Schaarste in overvloed; het grote ai-experiment’ roept op tot bewust experimenteren met generatieve ai: niet alleen om de technologie te begrijpen, maar ook om onze eigen rol in een ai-gedreven wereld te herdefiniëren. Van Doorn: ‘Bij generatieve ai werk je in een sandbox: je maakt plaatjes, teksten, video, muziek of je genereert een nieuw eiwit voor wetenschappelijk onderzoek. Als je kunstmatige intelligentie wil gebruiken om een marketingplan uit te werken en te testen, dan kan dat jouw werk als marketeer versnellen. Je doet niemand schade, er is geen klant die je ermee lastigvalt. Je bent gewoon met je eigen creatieve proces bezig. En de mens is altijd in de loop.’

‘Ik zou de planning in de gezondheidszorg niet door virtuele agents laten afhandelen’

Agentic ai gaat duidelijk een stap verder: ai agents zijn ontworpen om autonoom te handelen, doelen te stellen, en complexe taken uit te voeren met minimale menselijke tussenkomst. ‘Agentic ai grijpt direct in op je processen, en daar ligt het risico’, zegt Van Doorn. Het kan dus wel eens fout gaan met ai-agents. ‘Agentic ai werkt probabilistisch: het rekent met waarschijnlijkheden, niet met zekerheden. Waar klassieke software ‘if-this-then-that’-logica volgt, maakt agentic ai keuzes op basis van kansmodellen.’ In het recente rapport dat Sogeti publiceerde over Agentic ai, Autopilot Yes/No’, worden die verschillen toegelicht.

Agentic ai kan confabuleren, zegt Van Doorn. Dit verwijst naar het gedrag waarbij iemand verhalen vertelt die niet kloppen met de werkelijkheid, vaak zonder dat die persoon zich daarvan bewust is. Het is dus geen opzettelijke leugen, maar een manier waarop het brein gaten in het geheugen probeert op te vullen. ‘Je kunt je er als bedrijf niet achter verschuilen’, verwijst Van Doorn naar de rechtszaak die was aangespannen tegen Air Canada. Een klant kreeg verkeerd advies van de chatbot en wilde daarvoor gecompenseerd worden ‘De luchtvaartmaatschappij gaf voor de rechter de chatbot de schuld, maar de rechter ging daar uiteraard niet in mee. Je kunt je niet verschuilen achter de software – een chatbot of een algoritme – die je gebruikt.’

Geen herstelknop

‘Gewoonlijk zou je zeggen: Air Canada heeft ervan geleerd, ze passen het aan in de software. Dat gaat echter niet op in het nieuwe paradigma. Het is namelijk geen bug, het is een feature van de virtuele agent, een eigenschap. Chatbots gaan zo prettig met klanten om juist omdat ze probabilistisch werken. Maar ze kunnen ook heel prettig het verkeerde advies geven. Het zijn taalmodellen; goed in taal, goed in overtuigen. Er is dus geen herstelknop waarmee je de software aan kunt passen om problemen de volgende keer te voorkomen. De hamvraag is of het ooit beter wordt. En kunnen we dan wel vol gas gaan? Ik verwacht van niet’, zegt Van Doorn. ‘Juist omdat het een eigenschap is, niet iets wat is te verbouwen. Ik zou de architectuur van bijvoorbeeld een bank niet herbouwen met virtuele agents. Of de planning in de gezondheidszorg door hen laten afhandelen. Daar is het nu allemaal nog te onbetrouwbaar voor.’

‘Als je naast iedere chatbot een mens zet om te checken, is dat is veel te inefficiënt’

Vibe coding

Een interessante tussenstap is vibe coding, legt Van Doorn uit. ‘Dan maak je met de probabilistische ai deterministische software. Daar kun je de bugs wel uithalen maar de code heeft weer niet de kracht van de taal die moderne ai-agents zo interessant maken.’ Letterlijk staat vibe coding voor coderen op gevoel. Je wil iets maken op basis van de ‘vibe’, jouw gevoel en die ai genereert vervolgens de volledige applicatie voor jou. ‘Een kind kan de was doen zo lijkt het, maar met coderen zonder kennis ga je nat’.

Van Doorn verwijst naar Andrew Ng, één van de invloedrijkste ai-experts ter wereld. Ng noemt vibe coding een ongelukkige term. De naam suggereert dat het een nonchalante bezigheid is. In werkelijkheid vindt hij ai-assisted coding een diep intellectuele oefening. Hij zegt dat het hem ‘uitput’, omdat het veel denkwerk vereist — van het formuleren van goede prompts tot het begrijpen van gegenereerde code en fouten. ‘Kan me goed voorstellen dat Ng vibe coding uiterst vermoeiend vindt’, stelt Van Doorn. ‘Want je bent constant aan het scannen waar het de bocht uitvliegt en hoe je dat moet herstellen. Dus jouw aandachtspanne en waarschijnlijk ook de kennis die je moet hebben van waar je mee bezig bent, die maken samen of je een level verder komt. Het klinkt heel makkelijk: ik kan geen letter programmeren, maar toch een programma in elkaar zetten. Als je niet de juiste prompts weet te maken, zou het zomaar kunnen dat de software niet iets gaat verbeteren, maar juist verslechteren. Dan gaat hij zijn oude code overschrijven of datalekken produceren. Dit zijn wel hele fundamentele dingen natuurlijk. Volgens Andrew Ng hebben we straks ook meer software-experts nodig in plaats van minder.’

Hier ziet Van Doorn een relatie met de softwarecrisis uit de jaren zestig, toen programmatuur steeds complexer en duurder werd, en moeilijker te onderhouden. Er sluimert een nieuwe softwarecrisis, waarbij bedrijven zich verschuilen achter autonome systemen, terwijl de verantwoordelijkheid bij henzelf blijft liggen. Bovendien is nog niet duidelijk hoe software engineering anno 2025 vibe coding precies onder controle moet krijgen. Extreem belangrijk als je mag aannemen dat de regels code die door amateurs worden geschreven gaan exploderen.

‘Er zitten ontegenzeggelijk positieve kanten aan ai. Maar het is nu nog te vroeg om op ai te vertrouwen die agency heeft’

Kwaliteitsgarantie

Sogeti heeft een naam hoog te houden als het gaat om quality assurance en het testen van software. ‘Hoe verifieer je een proces waarin ai iets creëert dat precies doet wat jij wil en niet uit de bocht vliegt; en hoe test je dat? Voor iedere organisatie is het heel belangrijk om dit op orde te hebben. Wij moeten die kwaliteitsgarantie kunnen bieden. Het accent komt door al die nieuwe ai-mogelijkheden zo steeds meer op quality assurance te liggen. Traditioneel draait it om efficiency en effectiviteit. Maar als je naast iedere chatbot een mens zet om te checken, is dat is veel te inefficiënt. Het is een duivels dilemma, want de mens is lui en vertrouwt al snel te veel op de uitkomsten van ai. Zo wees een recente studie uit dat artsen die hun werk door een ai lieten controleren minder opletten en meer fouten maakten, omdat ze ervan uitgaan dat ai hun fouten er wel uitzeeft. Daar is een nieuw woord voor: cognitive offloading. Zo ontdekken we dat uiteindelijk de kwaliteit van gen ai, vibe coding en agentic ai zwaar afhankelijk is van de mens die checkt en test. De nieuwe generatie software engineer moet alerter zijn dan al haar voorgangers.’

Nu nog te vroeg

Niet dat Van Doorn gen ai of ai agents wil afserveren (mocht dat al kunnen, want ze zijn er inmiddels in groten getale). Maar hij wil de garantie dat er niks fout gaat. Wat we nodig hebben is niet alleen technologische innovatie, maar bestuurlijke reflectie: wie bestuurt er straks nog echt? ‘Er zitten ontegenzeggelijk positieve kanten aan ai. Maar het is nu nog te vroeg om op ai te vertrouwen die agency heeft. Je hebt soms hele complexe planningstaken in situaties op een vliegveld bijvoorbeeld. Ik zou dan een virtuele agent laten meedraaien als een teamlid of zo. Dus laat ze met ideeën komen en dan ervan leren en begrijpen. Dat is zeker nuttig. Maar om dan de planning te overhandigen aan dat ‘ding’, nee. Misschien over tien jaar; wie weet waar deze ontwikkeling naartoe gaat, misschien zelfs wel nooit. Maar nu is het in ieder geval nog te vroeg.’