AI in Overdrive: een gids door de laatste nieuwe innovaties in een sprint naar de zomer

Ontdek de cruciale AI-doorbraken van giganten als Google en OpenAI, de opkomst van onzichtbare AI-hulpjes, en de verrassende impact op onze taal, cultuur en de antwoorden die je krijgt.

May 26, 2025

∙ Paid

Cruciale Modelontwikkelingen, Concurrentiestrijd en Toekomstvisies

Ook dit keer weer een zeer uitgebreide nieuwsupdate over de laatste ontwikkelingen in de wereld van Artificiële Intelligentie. Soms worden we er zelf bijna moe van want dit maal nog langere editie omdat er, zo net voor de zomer, een reeks zeer belangrijke aankondigingen is gedaan. De wereld van AI draait op volle toeren en ontwikkelingen volgen elkaar sneller op dan ooit tevoren. Net nu je mogelijk dacht de laatste AI-hype begrepen te hebben, dient zich alweer een golf van baanbrekende innovaties aan.

"Er komt een golf aan van te gekke nieuwe AI-gerelateerde dingen,"

voorspelde Dalton Caldwell van Y Combinator, en die golf is inmiddels een ware tsunami geworden. Van revolutionaire nieuwe AI-modellen die slimmer en capabeler zijn dan ooit, tot een hevige concurrentiestrijd tussen techreuzen die de toekomst van AI – en daarmee een stukje van onze toekomst – vormgeven.

Maar wat betekenen deze abstracte modelupdates en strategische zetten concreet voor jou, voor je werk, en voor de manier waarop we informatie ontvangen en verwerken? De Sociaal Economische Raad (SER) lichtte deze week al een tipje van de sluier op! We moeten ons beter voorbereiden kopt AD. Wie weet worden er nu meer mensen wakker…

Dit artikel duikt diep in de cruciale AI-ontwikkelingen van de afgelopen tijd. We ontrafelen de nieuwste creaties van spelers als OpenAI, Google, Anthropic en Microsoft, verkennen de opkomst van steeds slimmere ‘AI-agenten’ die taken van ons overnemen, en staan stil bij de serieuze vragen rondom AI-veiligheid en de betrouwbaarheid van AI-gegenereerde antwoorden. Ontdek hoe de onzichtbare motor achter chatbots werkt en hoe de Amerikaanse tech-dominantie ongemerkt onze taal en cultuur kan beïnvloeden. Bereid je voor op een essentiële update die verder kijkt dan de technische details en je helpt de impact van AI op ons dagelijks leven écht te begrijpen.

Inhoud

De Evolutie van AI-Modellen: Meer dan alleen Slimmer Worden
Anthropic verlegt grenzen met nieuwe versies van Claude
GPT 4.1 en Codex van OpenAI
Concurrentie in de wereld van het coderen
Cohere toont het aan, kleine modellen itt grote modellen zijn een goede business case
AI Veiligheid en Transparantie in de Schijnwerpers
Microsoft Build 2025
- Welkom in het Tijdperk van AI-Agenten en het Open Agentische Web
Google I/O Ontketent AI-Revolutie
- Van Onderzoek naar Producten in Recordtempo
Anthropic Verlegt Grenzen met Nieuwe Claude-Versies
De ontwikkelingen samengevat en Competitieve gebieden nader bekeken
De Amerikaanse Echo in AI: Hoe Taalmodellen Onze Taal en Cultuur Kunnen Vormen

En in ons deel voor de betalende lezers een bijzondere verdieping op 2 belangrijke ontwikkelingen rondom effectieve prompting en het aansturen van AI-Modellen

De Paradox van Beknoptheid
De Onzichtbare Motor Achter AI Chatbots: Wat Je Niet Ziet, Bepaalt Alles

Een treffende, overkoepelende observatie in deze nieuwsbrief dat de huidige AI-ontwikkelingen onderstreept zoals te zien in deze nieuwsbrief, komt van Dalton Caldwell, managing partner bij Y Combinator: Er komt een golf aan van te gekke nieuwe AI-gerelateerde dingen in volgende maand. Ik wed op dat de modellen slimmer worden. Het herinnert me aan de weddenschap uit de jaren '90 dat netwerkbandbreedte alleen maar zou blijven groeien. Het was een goede."

Dit sentiment rondom AI gerelateerde dingen vormt de rode draad door het nieuws van de afgelopen weken.

Concurrentie in Codeerassistentie

Windsurf en OpenAI Betreden de Arena

Op het gebied van coderen krijgen Anthropic's modellen concurrentie. Startup Windsurf lanceert SWE1 (of Sui 1), een familie van eigen modellen (full-size, light en mini) geoptimaliseerd voor het gehele software engineering proces. Ze claimen dat SWE1 vergelijkbare "tool call reasoning" zal hebben als Claude 3.5 Sonnet, maar stukken goedkoper is. Windsurf biedt het model zelfs tijdelijk gratis aan. Dit lijkt een directe aanval op de combinatie Cursor en 3.5 Sonnet, inspelend op klachten over kosten en limieten. Windsurf wil codeerhulp ook uitbreiden voorbij het genereren van code, naar het raadplegen van kennisbanken, testen en feedbackverwerking. Ze stellen: Op een gegeven moment zal alleen maar beter worden in coderen jou of een model niet beter maken in software engineering. Benchmarks plaatsen Suite 1 in de buurt van 3.5 Sonnet, maar onder 3.7. Een blind experiment toonde aan dat Sui 1 meer geaccepteerde coderegels produceerde dan 3.5, maar minder dan 3.7. De recente, gerapporteerde overname van Windsurf door OpenAI suggereert dat Windsurf meer is dan een interface voor OpenAI-modellen.

OpenAI Lanceert Codex en Update GPT-4.1

Passend in deze context lanceerde OpenAI recentelijk Codex, een autonome codeeragent die functies bouwt en bugs repareert. Dan Shipper van Every vat het als volgt samen: "OpenAI heeft zojuist Codex gelanceerd... We gebruiken het bij Every al een paar dagen en ik ben onder de indruk." Codex, ontworpen voor senior engineers, kan meerdere sessies parallel draaien en is getraind naar "smaak" van een senior software engineer, met kennis van grote codebases en schone code.

Dit stelt teams in staat taken te delegeren en zich te focussen op ideeën en samenwerking. Daarnaast heeft OpenAI GPT-4.1 naar ChatGPT gebracht als nieuw standaardmodel. Oorspronkelijk gelanceerd als een op codering gericht API-model, is het nu direct beschikbaar. De Chief Product Officer stelde: "We hebben het gebouwd voor ontwikkelaars, dus het is erg goed in coderen en het volgen van instructies." Gebruikersreacties zijn positief. Melvin Vivos: "GPT-4.1, enorm verschil... 4.0 voelt als praten met een robot. 4.1 voelt als praten met een mens." V-racer X voegde toe: "4.1 is een stuk grappiger dan 4.0."

De autonome codeeragent, aangedreven door het voor software-engineering geoptimaliseerde Codex 1-model (een versie van O3), produceert schonere code en volgt instructies beter. Het is ingebouwd in ChatGPT, wat brede distributie mogelijk maakt. Aaron Levie van Box merkte op: "OpenAI Codex werkt op de mobiele app. We betreden een wilde wereld waarin je AI-agents alles kunt laten coderen terwijl je op je telefoon zit." De reacties zijn gemengd; sommigen zien het als een herhaling van eerdere hypes, anderen zijn enthousiast en experimenteren. Anderen stellen weer zaken als: "Mijn 'hot take' is dat Codex de waarde van technisch zijn verhoogt." Professor Ethan Mollick wenste dat Codex toegankelijker is voor niet-programmeurs.

De meningen zijn dus verdeeld. De lancering was echter een strategische zet waarbij OpenAI net voor een week met meerdere andere zeer belangrijke lanceringen zat.

Uitdagingen bij Meta: Llama 4 Behemoth Vertraagd

Niet elk bedrijf echter lanceert succesvol nieuwe modellen. The Wall Street Journal meldt dat Meta's Llama 4 Behemoth-model is vertraagd wegens tegenvallende prestaties. Ingenieurs konden de capaciteiten van dit ultragrote model (2 biljoen parameters, 288 miljard actief via 'mixture of experts'-architectuur) niet voldoende verbeteren. Dit roept dan (intern) vragen op over de meerwaarde voor een publieke release. Oorspronkelijk gepland voor april, daarna juni, is de release nu uitgesteld tot de herfst of later. Mark Zuckerberg had Behemoth aangekondigd als het "hoogst presterende basismodel ter wereld", wat de lat hoog legt. Er zijn naar verluidt frustraties binnen Meta over het team achter Llama 4 en er worden managementwijzigingen overwogen.

Cohere toont het aan, kleine modellen (SLMs / Expert modellen) zijn een goede business case

Cohere, ooit een concurrent in de race van de foundation models zoals die van Google, OpenAI, Claude en anderen, heeft een succesvolle koerswijziging gemaakt naar niche AI-implementaties voor ondernemingen. Eind vorig jaar verlegden ze hun focus van het trainen van grensverleggende foundation models naar kleinere (SLM / expert), on-premise modellen. Mede-oprichter Nick Frost: "Wat we van klanten horen, is dat ze gewoon geen grotere modellen nodig hebben die overal goed in zijn. Ze hebben modellen nodig die daadwerkelijk zijn gebouwd voor hun specifieke gebruiksscenario's." Dit is wat wij natuurlijk ook al in meerdere eerdere nieuwsbrieven hebben aangegeven. Kleinere modellen zijn kwalitatief vaak beter, sluiten beter aan bij onze werkzaamheden, bevatten onze eigen normen en waarden op basis van onze eigen data en zijn energie / duurzaamheidstechnisch vaak ook een stuk interessanter en niet onbelangrijk, overall eigenlijk prima betaalbaar. Reuters meldt dat Cohere nu 100 miljoen dollar aan geannualiseerde inkomsten bereikt, met 85% uit langlopende enterprisecontracten en marges van 80%. Ze testen een documentsamenvattingsmodel met klanten als Royal Bank of Canada en LG. Hoewel indrukwekkend, illustreert dit de kloof met bedrijven die fundamentele modellen verkopen. Er zijn mensen die zelfs stellen dat de meeste bedrijven die fundamentele modellen ontwikkelen, zullen falen. De brute realiteit is namelijk dat het extreem moeilijk is om te concurreren met open-source modellen. Als we in Nederland kijken naar bedrijven die ook de focus leggen op dergelijke kleinere modellen is er onder andere Contractuo. Hoewel de website (nog) weinig zeggend is zijn de toepassingen groots

AI Veiligheid en Transparantie in de Schijnwerpers

xAI's Grok en de "Blanke Genocide" Obsessie
Grok, de chatbot van xAI, raakte in de afgelopen weken kortstondig geobsedeerd door rassenverhoudingen in Zuid-Afrika en begon in ongerelateerde discussies over onder meer de vermeende "blanke genocide.

" Eric Toler van de New York Times postte: "Ik kan niet stoppen met het lezen van de Grok-antwoordpagina. Het wordt schizofreen..." xAI reageerde op donderdag: "Op 14 mei om ongeveer 03:15 uur werd een ongeautoriseerde wijziging aangebracht aan de prompt van de Grok-responsbots op X." Dit schond intern beleid. xAI kondigde aan hun systeemprompts op GitHub te publiceren een primeur voor een groot AI-lab en een stap naar transparantie. Dit incident laat zien hoe makkelijk chatbots kunnen ontsporen.

In ons betaalde lezers gedeelte geven we je gedeeltelijk een kijkje achter en voor de schermen om je een aantal cruciale inzichten te geven waar het allemaal fout kan gaan en waar het bij X AI fout is gegaan. Lees daarvoor: De Onzichtbare Motor Achter AI Chatbots: Wat Je Niet Ziet, Bepaalt Alles

OpenAI's Safety Hub:

Ook OpenAI had onlangs een incident waar we dieper op ingegaan zijn. Hoewel OpenAI na een incident met een onderdanige GPT-4L-versie geen vergelijkbare toezegging tot publicatie van prompts heeft gedaan, kondigden ze wel een nieuwe Safety Evaluations Hub aan, "een bron om veiligheidsresultaten voor onze modellen te verkennen."

Wat we in ieder geval kunnen concluderen is dat een en ander nog voor veel gebruikers nog ongrijpbaar is. Zelfs voor de makers van deze AIs is soms onduidelijk wat er door bepaalde aanpassingen gebeurt. Noodzaak dus om je te blijven verdiepen en goed te scholen.

Give a gift subscription

Meerdere AI-Evenementen en Competitieve Dynamiek

We zaten de afgelopen weken midden in een periode met zeer belangrijke evenementen. Afgelopen week zagen we onder meer Microsoft Build, Google I/O en Anthropic's eerste ontwikkelaarsconferentie Code with Claude. Het is dezer dagen dan ook zeer nuttig om de bredere AI-concurrentie te analyseren. OpenAI probeerde deze evenementen voor te zijn met de zojuist besproken lancering van Codex.

Wij categoriseren de concurrentie voor AI langs vijf vectoren: Consument, Enterprise, Benchmarks, Codering en Agents.

Microsoft Build 2025: Welkom in het Tijdperk van AI-Agenten en het Open Agentic Web

De toon voor Microsoft Build 2025 werd direct gezet, voortbouwend op eerdere Play AI en Frontier Lab-conferenties. Mocht je nog enige twijfel hebben over het centrale thema, dan maakte Frank X. Shaw, Chief Communications Officer bij Microsoft, het snel duidelijk met zijn stelling: "Microsoft Build 2025: Het tijdperk van AI-agenten en het bouwen van een open agentic web." Dit was geen evenement voor de aankondiging van een spectaculair nieuw model of om de concurrentie met OpenAI op scherp te zetten. Het was een dag die Microsofts visie onderstreepte dat 2025 het jaar is van grensverleggende organisaties. Organisaties waarin intelligentie op afroep beschikbaar is, mens-agent teams de traditionele organigrammen omverwerpen en elke medewerker een "agent-baas" wordt. Een toekomst die geen verre droom is, maar een huidige realiteit.

Voor overheden en ondernemingen die nog niet diep in de wereld van AI-agenten zijn gedoken was (als ze de presentatie gezien hebben) de presentatie hopelijk een wake-up call. De tijd van vrijblijvende pilots en verkenningen ligt achter ons; de assertieve realiteit van verandering, gedreven door AI, is hier en nu.

De Visie: Een Open Agentisch Web

Microsofts blogpost, opnieuw via Shaw, verwoordt het zeer helder:

"We zijn het tijdperk van AI-agenten ingegaan dankzij baanbrekende vooruitgang in redeneren en geheugen. AI-modellen zijn nu capabeler en efficiënter."

De visie is een wereld waarin agenten opereren binnen individuele, organisatorische, team- en end-to-end bedrijfscontexten. Dit "open agentic web" stelt AI-agenten in staat beslissingen te nemen en taken uit te voeren namens gebruikers en organisaties. Microsoft zet vol in op het realiseren van deze visie via hun platforms, producten en infrastructuur, met nieuwe modellen en codeeragenten voor ontwikkelaars, enterprise-grade agenten, en een focus op open protocollen en de versnelling van wetenschappelijke ontdekking.

In de inleiding van dit artikel hadden we het over de vijf vectoren van AI-concurrentie, waaronder agenten en de enterprise. Deze zijn onlosmakelijk met elkaar verbonden, aangezien de enterprise (en natuurlijk overheden) op het punt staan volledig getransformeerd te worden door agenten. De essentie van Microsofts Work Trend Index-rapport is dat het daadwerkelijke "doen" van werk in de toekomst grotendeels door agenten zal worden uitgevoerd. Zoals wij in veel van onze eerdere nieuwsbrieven al aangaven zullen, ook in de filosofie van Microsoft, huidige werknemers zullen evolueren naar managers van deze digitale collega's. In deze evolutie wordt jouw opgebouwde ervaring en vaardigheden ingezet om teams van agenten aan te sturen. Dat Microsoft, als wereldwijde leider in enterprise software, zo sterk inzet op agenten, is gezien hun frontliniezicht op de komende veranderingen niet verwonderlijk.

CEO Satya Nadella onderstreepte deze boodschap:

"Bij Build hebben we jullie laten zien hoe we het open agentic web bouwen. Het hervormt elke laag van de stack, en ons doel is om elke ontwikkelaar te helpen apps en agenten te bouwen die mensen en organisaties overal versterken."

De Grote Aankondigingen: Tools voor het Agentische Tijdperk

Nadella lichtte vijf belangrijke aankondigingen toe:

GitHub Copilot als Collega-Programmeur: De evolutie van GitHub Copilot van een "paarprogrammeur" naar een "collega-programmeur" is significant. Deze volledige codeeragent, geïntegreerd in GitHub, kan autonoom taken zoals bugfixes, nieuwe features en codeonderhoud uitvoeren. Hoewel sommigen zich afvroegen of GitHub zijn voorsprong had verloren, blijft het voordeel van wijdverbreide installaties binnen ondernemingen een sterke troef. De details zijn zoals verwacht: contextbewust en rekening houdend met repository-instructies.

Spannender voor ontwikkelaars was wellicht de aankondiging dat VS Code, de basis voor tools als Cursor en Windsurf, volledig open source wordt.
Sam Altman, CEO van OpenAI, reflecteerde hierop:
"Een van de allereerste dingen die we samen deden, in GitHub... we hebben het erover gehad hoe we ooit zouden komen tot een echte agentic codeerervaring, het is onwerkelijk voor mij dat het er eindelijk is. Ik denk dat dit een van de grootste veranderingen in programmeren is die ik ooit heb gezien... dit idee dat je nu een echte virtuele teamgenoot hebt waaraan je werk kunt toewijzen... Dit is als, echte delegatie van software engineering taken."
Copilot Tuning: Bedrijven kunnen Copilot nu afstemmen op hun unieke toon, taal en expertise. Dit stelt organisaties in staat om, zonder diepgaande technische kennis, AI-modellen te finetunen met hun eigen data – een functionaliteit die doet denken aan wat Glean biedt en die ongetwijfeld zeer succesvol zal zijn. Het toont aan dat we geavanceerde niveaus van AI-integratie binnen bedrijven bereiken.
1. Niveaus die heel fijn zijn, maar waarbij we ons af moeten vragen in hoeverre het voor ons ‘veilig’ voelt als al onze unieke eigenschappen (naast onze werknemers die het werk doen zoals hiervoor beschreven) bij een Amerikaans bedrijf komen te liggen. Hoe ver reikt ons vertrouwen?
Multi-Agent Orchestratie: Om agenten als een team te laten samenwerken onder toezicht en sturing, introduceert Microsoft tools voor multi-agent orkestratie. Met al meer dan 230.000 organisaties (waaronder 90% van de Fortune 500) die Copilot Studio gebruiken, is de boodschap duidelijk: de noodzaak voor orkestratie zal snel toenemen.
Agent Foundry: Nadella beschreef Foundry als "het complete app-platform voor het bouwen van apps en agenten." Dit omvat ondersteuning voor modellen van Grok, Hugging Face, Meta Mistral en anderen, agentische retrieval in Azure AI Search, de Foundry agent service en integratie met Copilot Studio. Bestaande tools voor identiteitsbeheer en security zullen ook voor agenten gelden.
De integratie van Grok, het model van Elon Musk, viel op. Hoewel sommigen dit zullen zien als een teken van spanning tussen Microsoft en OpenAI, past het in Microsofts strategie om Azure als een neutrale hub voor diverse modellen te positioneren. Interessanter is Musks intentie om Grok, dat al wordt ingezet voor klantenservice bij SpaceX en Tesla, ook aan andere bedrijven te verkopen.
NLWeb: Dit nieuwe open project maakt het mogelijk om via natuurlijke taal met elke website te interageren – "HTML voor het agentische web" aldus Nadella.
Met de komst van AI is onder AI kenners zoals wij al een tijdje de discussie over wat dit nu betekend voor de toekomst van ‘het internet’. Websites dreigen veel verkeer kwijt te raken. Microsoft lijkt het hiermee eens en komt met een mogelijke oplossing die elke website kan voorzien van een eigen chatbot. Het idee er achter is dat gebruikers voortaan specifieke websites eenvoudig kunnen doorzoeken in plaats van dat je daarvoor op Google of een andere dienst hoeft te zoeken.
Daar gaat de Business Case voor een boel bedrijven zoals SWIS B.V., het bedrijf achter postbus 42, dat nu AI chatbots verkoopt voor op websites. Daar waar je in het verleden de google-zoekbalk op een willekeurige website kon integreren om specifieke resultaten van de website te krijgen met wat hulp van Google is nu de bedoeling dat NLWeb dit gaat doen om je zo op die manier snel de gewenste content te tonen. Vraag is vooral… gaat hiermee verkeer terugkomen naar een website als we dit ook net zo snel en eenvoudig vinden via een AI als Mistral, Gemini, ChatGPT of een andere toepassing. NL Web vereenvoudigt het dus voor websites om een gespreksinterface te bieden met een AI-model naar keuze en eigen data. Het doel is ambitieus: NLWeb moet de snelste en makkelijkste manier worden om een website in een AI-app te transformeren, waardoor gebruikers de site-inhoud direct in natuurlijke taal kunnen bevragen. Zoals HTML de creatie van websites democratiseerde, zo moet NL Web webuitgevers in staat stellen deel te nemen aan de groeiende agentische economie.
Een andere belangrijke ontwikkeling is Microsofts sterke ondersteuning voor het Model Context Protocol (MCP). De focus op het door ons eerder besproken (met een foutje, concept ipv context) Model Context Protocol (MCP) duidt op Microsofts interesse in agent-concurrentie. Het past binnen hun push voor het open agentische web.
Een strategie voor ‘open agentic web”. Dit houdt in dat AI-systemen autonoom taken initiëren, beslissingen nemen en complexe workflows uitvoeren met minimale menselijke tussenkomst. Een ontwikkeling die we zo ook nog zullen raken bij Google.
Met brede eerstelijnsondersteuning voor MCP over platforms als GitHub en Copilot Studio, en deelname aan het MCP-stuurcomité, wordt de positie van dit protocol in het opkomende agent-ontwikkelaarsecosysteem verankerd. Ook de Windows 11 (Recall-functie) en Azure kregen aandacht.
Microsoft Entra Agent ID en Purview-integraties moeten "agent sprawl" (wildgroei) voorkomen en zorgen voor veilig beheer en compliance.
Wij zijn sceptisch want de woorden ‘veilig’ bij een Amerikaanse partij zoals Microsoft? Want daar waar Brad Smith van Microsoft in de Grote techshow van 7 mei op BNR nog schijnheilig vertelt dat ze als de regering iets vraagt er alles aan zullen doen om daar niet in mee te gaan. Blokkeert Microsoft een dag later de e-mail van hoofdaanklager. Hoeveel signalen willen we krijgen met zijn allen voor we het snappen? Microsoft belooft aan de ene kant er alles aan te doen niet naar de pijpen te dansen van de overheid, geen data uit te leveren en meer loze beloften. Echter dit soort signalen tonen duidelijk een andere werkelijkheid. Een werkelijkheid waar, zonder enige rechtelijke tussenkomst of bezwaarprocedure, een account wordt geblokkeerd. Beloftes zijn niets waard. Microsoft moet naar de pijpen van Donald Trump dansen en onze afhankelijkheid wordt mede hiermee in toenemende mate riskanter zo blijkt ook uit onderzoek van het internationaal strafhof.
En dat is niet het enige Risico, zoals al aangegeven in de inleiding en hier later in deze nieuwsbrief nogmaals (we kunnen het niet genoeg blijven herhalen) gaat de impact op ons werk enorm zijn. Als we niet oppassen is het, zoals we al eerder aanhaalden, letterlijk offshoring van onze werkgelegenheid. Daarnaast is er nog de Amerikaanse Echo in AI: Hoe Taalmodellen Onze Taal en Cultuur Kunnen Vormen (later in deze nieuwsbrief uitgebreid besproken). Waarbij je je af kan vragen hoe veilig onze normen, waarden, cultuur e.d. zijn bij modellen uit handen van Amerikaanse partijen.

Meer dan Alleen Tools: Wetenschap en Interne Transformatie

Naast de bovengenoemde onderdelen werd ook Microsoft Discovery aangekondigd, een initiatief dat de volledige tech-stack inzet om wetenschappelijke ontdekkingen te versnellen met behulp van AI-agenten voor ideegeneratie, simulatie en leren een onderwerp dat eigenlijk een eigen, diepgaande bespreking verdient.

De recente ontslagen bij Microsoft wierpen de vraag op of de AI-ontwikkelingen intern wel zo voorspoedig verliepen. The Information suggereert echter dat Microsoft zijn eigen medicijn slikt ("dogfooding") door vol in te zetten op automatisering. Hoewel het bedrijf ontkent rollen direct door AI te vervangen, is het duidelijk dat een transformatie gaande is. Het streven om de productiviteit in sales, engineering en klantenservice te verhogen met AI, het doel om tot wel 50% van de code door AI te laten genereren, spreekt boekdelen.

De Agentic Storm steekt op

Hoewel Microsoft Build 2025 misschien geen enkele, allesoverheersende aankondiging kende die direct de wereldwijde krantenkoppen zal halen – die gingen meer over AI veiligheid die we hierboven bespraken – is de totale som der delen significant. We zijn voorbij het stadium van pilots, het agentic tijdperk is bereikt. Microsoft investeert zwaar in frameworks voor het bouwen van agenten, lanceert orkestratietools en stuwt de ontwikkeling met grote snelheid voort. Voor de meeste ondernemingen is dit hét moment om hun eigen agentstrategie kritisch tegen het licht te houden en zich af te vragen of ze gelijke tred houden met een veld dat ongelooflijk snel evolueert. Wil je meer met agents doen, plan dan een gesprekje met ons in. De boodschap van Microsoft Build is onmiskenbaar: de toekomst is agents en die toekomst is nu.

Share DigiBeter

Google I/O Ontketent AI-Revolutie:

Van Onderzoek naar Producten in Recordtempo

Het recente Google I/O-evenement bracht ons een stortvloed aan AI-aankondigingen. Zo veel dat het de nieuwssecties dreigt te overspoelen. Waar Microsoft Build de week aftrapte met een diepgaande integratie van AI-agenten in hun stack, volgde Google met de duidelijke boodschap: "van onderzoek naar realiteit". Het is meer dan duidelijk dat Google ernaar streeft al zijn AI-technologie zo snel mogelijk te vermarkten.

CEO Sundar Pichai benadrukte tijdens zijn keynote: "We betreden nu een nieuwe fase van de AI-platformverschuiving, waar decennia van onderzoek werkelijkheid worden." Hij voegde eraan toe dat Google in het "Gemini-tijdperk" niet langer wacht op grote conferenties om zijn beste modellen te lanceren. "We willen onze beste modellen zo snel mogelijk in uw handen krijgen, dus we verschepen sneller dan ooit." Dit illustreert een bredere trend waarbij AI-labs de moordende concurrentie het hoofd bieden door innovaties direct beschikbaar te maken, in plaats van ze op te sparen. Grote evenementen zoals I/O dienen zo steeds meer om de overkoepelende strategie van een organisatie te etaleren.

Google's AI-Strategie: Allesomvattend en Productgericht

Aan aankondigingen was er zeker geen gebrek; tientallen grote en kleine onthullingen raakten elk aspect van Google's bedrijfsvoering. De rode draad is dat Google zijn gehele productervaring end-to-end opnieuw uitvindt om 'AI-first' te zijn. AI wordt de kern van wat Google te bieden heeft. Het volume van tokens dat via Google's platformen wordt geproduceerd, is het afgelopen jaar met een factor 50 gestegen, met de scherpste toename in de afgelopen maanden. Google wil "meer intelligentie beschikbaar maken voor iedereen, overal." Daar waar OpenAI ooit werd opgericht omdat het doodsbang was dat Google de AI-wereld zou gaan domineren blijkt die angst profetisch.

Available for iOS and Android

Hoogtepunten van Google I/O:

Ultra-Abonnement: Monetarisering en Geavanceerde Features als duidelijk teken van de marktwerking introduceert Google een nieuw 'Ultra'-abonnement. Voor $250 per maand krijgen gebruikers extreem hoge gebruikslimieten, vroege toegang tot nieuwe functies, en een bundel met extra Google Drive-opslag en YouTube Premium. Dit pakket geeft onder meer toegang tot:
- DeepThink-modus voor Gemini 2.5 Pro: Een verbeterde redeneermodus die de modelprestaties verhoogt en naar verluidt OpenAI's GPT-4o overtreft op de multimodale MMU-test en de codeerprestaties op Live Code Bench verbetert.
- Exclusieve toegang tot het nieuwe Veo videomodel. Veo 3 die nu video’s kan genereren met soundtrack. Het genereert beweging, achtergrond geluiden en dialogen tussen karakters. Het is echt een grote sprong in het maken van video’s maar we zien uiteraard ook nog wel misstappen. Twee veel geziene fouten zijn
  - Onzin ondertiteling bij videos
  - Sommige videos missen geluid
  Als je voice over wilt of een dialoog moet je dit in je prompts meenemen. Ondanks dat er nog steeds ‘kleine’ foutjes zijn al met al wel weer enorme sprongen in de ontwikkeling.
  Waarom dit, ondanks de flaws toch zo relevant is, is omdat video heel dicht ligt bij onze werkelijkheid. Film is een audiovisueel medium en geluid speelt daarbij een zeer belangrijke rol in het nog meer brengen naar onze werkelijkheid. Beelden zijn expliciet, geluid meer impliciet maar het heeft een subliminale, psychologische impact. Wij vinden het dan ook niet raar dat al deze grote tech giganten willen laten zien dat ze film kunnen genereren. Als je film kun emuleren kom je heel dicht bij de werkelijkheid.
- Vroege toegang tot een webagent Project Mariner. Project Mariner is een experimentele agent die over het internet surft en taken voor je kan uitvoeren. Ook werd een vroege demo van een andere agent-ervaring, genaamd "Agent Mode" getoond. Volgens Google combineert deze functie surfen op het web met zoekfuncties en integraties en met andere Google-apps. Google meldt dat Ultra-abonnees binnenkort toegang krijgen tot de Agent Mode op hun desktop én:
- verhoogde limieten voor Project Astra.
  In dat project wordt gewerkt aan slimmere, multimodale AI assistenten die taken voor jou kunnen uitvoeren zonder dat je er maar om hoeft te vragen. Een real-time AI-interface die streaming video en audio via een smartphone verwerkt. De take hier is dat de AI-assistenten pro-actief worden, tegen jouw kunnen gaan praten zonder dat je ze ook maar een vraag stelt of opdracht geeft. De assistent ‘luistert’, ‘kijkt’ en wacht dan tot het ‘juiste’ moment om actie te ondernemen. Dit abonnement stelt Google mogelijk als eerste grote techbedrijf in staat om een directe AI-omzetlijn in zijn financiële rapportages op te nemen.
AI in Search: De Toekomst is Nu Google adresseerde de zorgen over AI en de impact op hun zoekinkomsten direct. AI Mode wordt daarom uitgerold naar alle Amerikaanse zoekgebruikers. Met deze modus kan men met natuurlijke taal zoeken, inclusief vervolgvragen en output met grafieken en webverwijzingen ontvangen.
Een Deep Search-functie biedt diepgaandere onderzoeksresultaten. Pichai verklaarde dat interne tests een toename van 10% in zoekopdrachten per gebruiker lieten zien en dat de zoekinkomsten onveranderd bleven, omdat AI de gebruikerservaring verbetert zonder het advertentiemodel te wijzigen. De media, zelfs doorgaans kritische stemmen zoals The Verge, bestempelden AI Mode als "duidelijk de toekomst van Google Search."
Deep Reasearch krijgt daarbij nu ook de mogelijkheid om PDFs, Screenshots en notities mee te geven. Deze informatie wordt gecombineerd met publiek gevonden data om te komen tot een nog completer onderzoeksrapport of verhaal.
Er komen nieuwe AI ‘features’ naar Gmail, Google Docs en Vids. Hiermee wordt AI hyperpersoonlijk en dient jouw leven als context. Zo krijgt Gmail een update met gepersonaliseerde slimme antwoorden, waarbij de functie in je e-mails, notities en documenten op Google Drive kan kijken om betere antwoorden te genereren. Mails zouden dan meer aan moeten sluiten op jouw eigen toon en stijl. Deze functie kunnen we rond de zomer verwachten. Gemini krijgt in deze wereld toegang tot al je Google-apps zodat wanneer iemand je vraagt naar je laatste vakantie Gemini kan gaan door je foto’s, je bonnetjes in je google drive, je mails etc. om zo een bij jou passend antwoord te formuleren.
En daarbij wordt Gemini geïntegreerd in de chrome browser, de zoekmachine en de Gemini-app op je telefoon. Met de nieuwe agent mode die Google aankondigt kan de AI voor jou allerlei taken voor jou uitvoeren op websites of in apps. Ze kunnen tot wel 10 taken tegelijkertijd beheren. De Agent mode kan bijvoorbeeld een appartement voor je zoeken op een verhuurplatform maar dan ook direct een bezichtiging gaan boeken wanneer je beschikbaar bent volgens je agenda. Ook kan je de agents zelf taken gaan leren door het ze 1x te laten zien en dan kan de agent het blijven herhalen.
Agentic Web: Project Mariner Google introduceerde Project Mariner, een webagent die taken zoals online winkelen, webonderzoek en formulierinvulling automatiseert. Mariner, dat in de achtergrond van een cloudgebaseerde browser draait, wordt in bèta getest als add-on voor AI Mode in Search en is eveneens exclusief voor Ultra-abonnees. Het lijkt een belangrijke bouwsteen voor toekomstige AI-native interfaces en voedt al een op winkelen gerichte functie binnen de standaard Google Search.
Smart Glasses: De Terugkeer met Android XR en Warby Parker Verrassend genoeg keert Google terug naar smart glasses, een decennium na Google Glass. De nieuwe Android XR smart glasses worden ontwikkeld in samenwerking met brillenfabrikant Warby Parker. Medeoprichter Sergey Brin reflecteerde op de uitdagingen van het verleden. Google investeert tot $150 miljoen in Warby Parker, een strategie die doet denken aan Meta's succes met Ray-Ban. Dit suggereert dat smart glasses een alomtegenwoordige productcategorie kunnen worden.
AI voor Codeerwerk: Jules, Stitch en Journeys Voor ontwikkelaars zijn er nieuwe tools:
- Jules: Een AI-coderingsagent die bugs repareert, code test en documentatie raadpleegt.
- Stitch: Ontworpen om ruwe UI-ideeën (via tekst en beeld) om te zetten in functionele front-ends.
- Journeys (in Android Studio): Automatiseert producttesten via beschrijvingen van gebruikersinterface-flows. Deze tools, die taken op de achtergrond uitvoeren, worden snel de standaard, zoals ook blijkt uit Microsofts Copilot Agent. Google's aanpak met specifiek gerichte tools zoals Stitch en Journeys is interessant om te zien of dit een effectievere adoptiestrategie is dan de brede 'sandbox'-tools.
Notebook LM en Flow
Veo hebben we in de multimedia straat natuurlijk al eerder behandeld maar we missen nog 2 aankondigingen want,
- Notebook LM krijgt een nieuwe functie voor video-overzichten, waarbij een slidedeck wordt gegenereerd ter begeleiding van audiocommentaar, inclusief infographics. Daarnaast komen er meer flexibele audio overviews waarbij je kortere, standaard of langere ‘podcasts’ kan genereren.
- Flow een tool die Google's videomodel Veo, Image Engine (voor beeldgeneratie) en Gemini (voor tekst en prompting) combineert, zodat gebruikers video's kunnen creëren zonder diepgaande kennis van modelintegratie.
  Google zegt dat Flow geïnspireerd is op hoe het voelt wanneer tijd vertraagt en het een creatief proces is iteratief, moeiteloos en vol mogelijkheden. Je hebt camerabesturing, Flow TV, een showcase waarin je de exacte prompts en technieken kunt zien maar ook een scenebuilder voor het bewerken van je shots.
- Google Beam durven we ook wel Multi-media te noemen. Het is een opvolger van Project Starline. Een project dat 2d video naar realistische 3d om kon zetten. Het teleconferencing platform BEAM komt in de loop van 2025 en kan oa.
  - 2D videos omzetten naar 3D en met 6 camera’s 2d mensen omzetten naar 3D avatars
- Google Meets krijgt ook een heerlijk likje verf waarmee ze nu o.a. ‘real time’ vertalingen doet van gesprekken naar de taal van de toehoorder
- Imagen 4, de nieuwste AI afbeeldingsgenerator van Google komt nu ook met hogere resolutie, meer accurate teksten in afbeeldingen en snelle output

Google Gaat All-In op AI

Naast de bovengenoemde punten werden er nog talloze andere producten en features onthuld, zoals virtueel kleding passen en een AI mode in Search. De stortvloed aan aankondigingen op Google I/O – van live vertaaltechnologie tot Google's eigen AI-chips zoals de Ironwood TPU, die hen onafhankelijk maakt van derde partijen en een immense rekenkracht levert – onderstreept dat Google vastbesloten lijkt om op elk AI-front te concurreren en te winnen. Een commentator, AI-search engineer Archie Simgupta, tweette zelfs dat Google in twee uur tijd concurrenten als OpenAI Sora, Suno AI, Perplexity, en Claude ChatGBT "gedood" zou hebben.

Hoewel dit wellicht overdreven is, markeert het een significante verandering. Waar een jaar geleden nog discussies waren over de toekomst van Google onder Pichai, heeft hij het bedrijf nu op koers gezet om het AI-tijdperk te domineren. Het meest complimenteuze dat we hierover kunnen zeggen, is dat deze golf van productaankondigingen meer aanvoelde als een geheel dat groter is dan de som der delen. Google creëert duidelijk een breed scala aan AI-producten die uitblinken in specifieke functies, in plaats van enkel modellen te leveren en het aan gebruikers over te laten.

Strategische Toonverandering en de "Centaur-Benadering" Interessant is de observatie van Casey Newton (Platformer) over een fundamentele toonverandering. Waar de boodschap in voorgaande jaren neigde naar "laat agents het werk doen," is de kern nu "samenwerken met AI." Deze "centaur-benadering," waarbij mens en AI co-existeren en samenwerken was zichtbaar in alle demo's. Deze verschuiving lijkt strategisch slim: om het vertrouwen te winnen dat nodig is voor AI om diep in persoonlijke data zoals Gmail te mogen duiken. Het is essentieel gebruikers niet het gevoel te geven vervangen te worden. De nadruk op samenwerking kan gezien worden als een zorgvuldig georkestreerde strategie om gebruikers gerust te stellen terwijl Google AI systematisch integreert in elk aspect van het digitale leven.

Dat gevoel is nog belangrijker geworden na een kraak helder artikel in het AD op basis van het standpunt van de SER waarin ze stellen wat wij al jaren roepen. Nederland moet zich beter voorbereiden op AI, het heeft ingrijpende gevolgen voor iedereen!

De Realiteit Achter de Marketing: Onzichtbare AI? De vraag blijft, zoals Newton en Will Douglas Heaven (MIT Technology Review) suggereren, of dit een oprechte verandering is of een meesterlijke marketingzet. Heaven merkt op dat Google, door AI in alles te stoppen, het "onzichtbaar" wil maken. De focus ligt niet langer op de grensverleggende capaciteiten van de modellen zelf, maar op het omzetten ervan in "gelikte producten." Pichai's belofte van "meer intelligentie, voor iedereen, overal" kan ertoe leiden dat AI een technologie wordt die we niet langer opmerken of expliciet benoemen, simpelweg omdat het overal is.

De Nieuwe Realiteit vat Casey Newton samen als: "Alles verandert, maar niet te veel, en niet te snel." Google presenteert een toekomst waarin AI overal is, maar waarin wij, de gebruikers, de controle behouden. Of dit een blijvende belofte is of een tijdelijk suikerlaagje, zal moeten blijken. Wij zitten meer op het pad van de SER en willen dit suikerlaagje zo snel mogelijk oplossen. Een ding dat in ieder geval wel duidelijk is, is dat Google's I/O meer was dan een reeks productlanceringen; het was een manifest voor een nieuwe fase in onze interactie met technologie. Het Gemini-tijdperk is aangebroken, en het belooft een lang en transformerend seizoen te worden, waarin de fundamenten van het digitale landschap mogelijk hertekend worden.

Eind 2024 stelde Sundar Pichai al: "Ik denk dat 2025 cruciaal zal zijn... De inzet is hoog. Dit zijn disruptieve momenten. In 2025 moeten we meedogenloos gefocust zijn op het ontsluiten van de voordelen van deze technologie." De ontwikkelingen op Google I/O laten zien dat deze urgentie is geïnternaliseerd en dat het bedrijf vastbesloten is om sneller dan ooit te bewegen, met alle implicaties van dien voor gebruikers, ontwikkelaars en het internet zelf.

Anthropic Verlegt Grenzen met Nieuwe Claude-Versies

Een van de labs waar reikhalzend naar wordt uitgekeken, is Anthropic met Claude. The Information melde namelijk dat er nieuwe versies van Claude Sonnet en Claude Opus aankomen. Modeltesters geven aan: "Wat deze modellen anders maakt dan de bestaande redenerende AI is hun vermogen om heen en weer te schakelen tussen denken of het verkennen van verschillende manieren om een probleem op te lossen en het gebruik van tools." De nieuwe modellen kunnen steeds vaker externe tools, applicaties en databases gebruiken om hun antwoorden te vinden.

En nieuwe versies kwamen er op Code with Claude, de eendaagse, praktische ontwikkelaarsconferentie focust zich onder meer op de implementaties met de Anthropic API, CLI-tools en MCP. Anthropic heeft zich gevestigd als keuze voor modellen achter codeertools en -agents. De verwachting was dan ook dat de eerdergenoemde nieuwe versies van Claude Sonnet en Claude Opus centraal zouden staan, met hun vermogen om te wisselen tussen redeneren en toolgebruik en zelfcorrigerend vermogen bij het genereren en testen van code.

Tromgeroffel

Met spanning zaten wij dan ook te wachten. En…. Anthropic lanceerde Claude Opus 4 en Claude Sonnet 4. Wij hebben ze nog niet kunnen testen maar het lijkt dat deze nieuwe modellen de lat voor wat AI zonder menselijke tussenkomst kan bereiken dramatisch hoger leggen. Met name het vlaggenschip, Opus 4, demonstreerde een adembenemend uithoudingsvermogen door tijdens tests bij e-commercegigant Rakuten door bijna zeven uur onafgebroken te werken aan een complex open-source refactoringproject. Deze doorbraak transformeert AI van een snelle antwoordgenerator naar een volwaardige partner, in staat om projecten van een volledige werkdag aan te pakken. De technologische implicaties zijn immens: AI-systemen kunnen nu complexe software-engineeringtaken van begin tot eind beheren, met behoud van context en focus.

De euforie rond deze technologische sprong werd echter al snel deels getemperd door een groeiende controverse over een specifiek gedrag van Claude Opus 4: een neiging om, onder bepaalde omstandigheden, gebruikers aan te geven bij autoriteiten of de pers als het model "egregiously immoral" (flagrant immoreel) gedrag detecteert. Deze "rat-mode," zoals het al snel op sociale media werd genoemd, werpt een kleine schaduw over de triomf van Anthropic. Ook werpt het weer fundamentele vragen op over autonomie, privacy en de ethische grenzen van en binnen het werken met AI en de opstelling van de makers van de AI.

De Ongekende Prestaties van Claude Opus 4: Een Nieuwe Standaard

De prestatie bij Rakuten, waar Claude Opus 4 een marathondeep verrichtte die de minutenlange aandachtsspanne van eerdere AI-modellen ver achter zich laat, is revolutionair. Het betekent naar ons idee een kwantumsprong: AI die niet alleen assisteert, maar projecten kan leiden en volwaardig afronden. Bonus daarbij is dat Anthropic zijn claims kon onderbouwen met harde cijfers. Claude Opus 4 behaalde een verbluffende score van 72.5% op SWE-bench, een rigoureuze benchmark voor software engineering. Ter vergelijking: OpenAI’s GPT-4.1 scoorde bij zijn lancering in april 54.6%. Een prestatie die Anthropic positioneert als een uiterst serieuze uitdager in de steeds drukker wordende AI-markt. De bijgeleverde vergelijkende benchmarks tonen de Claude 4-modellen dominant over concurrenten heen, met name in codeer- en redeneertaken.

De Revolutie van 'Reasoning Models' Gaat Verder

De AI-industrie heeft sinds medio 2024 tot nu grote stappen gezet met de zogenaamde 'reasoning models'. Deze systemen werken problemen methodisch door voordat ze reageren, en simuleren daarmee mensachtige denkprocessen in plaats van simpelweg patronen te matchen met trainingsdata. OpenAI zette deze trend in met zijn “o” series afgelopen december, gevolgd door Google’s Gemini 2.5 Pro met zijn experimentele “Deep Think”-capaciteit. Zelfs DeepSeek’s R1-model wist onverwacht marktaandeel te veroveren met zijn uitzonderlijke probleemoplossende vermogens tegen een concurrerende prijs.

De huidige verschuiving markeert een evolutie in hoe mensen AI gebruiken. Volgens het Spring 2025 AI Model Usage Trends rapport van Poe is het gebruik van reasoning models in slechts vier maanden vervijfvoudigd, van 2% naar 10% van alle AI-interacties. Gebruikers zien AI steeds meer als een denkpartner voor complexe problemen.

Claude’s nieuwe modellen onderscheiden zich door toolgebruik direct in hun redeneerproces te integreren. Deze simultane ‘onderzoek-en-redeneer’-aanpak spiegelt menselijke cognitie nauwkeuriger dan eerdere systemen die eerst informatie verzamelden alvorens te analyseren. Het vermogen om te pauzeren, data te zoeken en nieuwe bevindingen te incorporeren tijdens het redeneren, creëert een natuurlijkere en effectievere probleemoplossing.

Een stap die we waarschijnlijk ook snel weer zullen zien bij de andere spelers en waarmee we weer dichterbij komen in hoe deze modellen onze menselijke werkzaamheden verder kunnen automatiseren.

Technische Doorbraken: Snelheid, Diepgang en Geheugen

Anthropic heeft ook een hardnekkig frictiepunt in de gebruikerservaring aangepakt met een hybride aanpak. Zowel Claude Opus 4 als Sonnet 4 bieden vrijwel onmiddellijke antwoorden voor eenvoudige vragen én uitgebreid denkwerk voor complexe problemen. Een stap die we al een beetje aan zagen komen hoewel we dit eerder als eerste implementatie verwacht hadden bij bij anderen. Het toevoegen van een keuze elimineert de frustrerende vertragingen die eerdere reasoning models zelfs bij simpele vragen en verzoeken oplegden. Deze dual-mode functionaliteit behoudt de snelle interacties die gebruikers verwachten, terwijl diepere analytische capaciteiten worden ontgrendeld wanneer nodig. Het systeem alloceert dynamisch denkresources op basis van de complexiteit van de taak.

Een andere cruciale doorbraak is 'memory persistence'. Stel je voor dat je een heel slimme assistent hebt. Elke keer als je met deze assistent praat, geeft hij briljante inzichten en helpt hij je enorm. Maar er is één groot probleem: zodra het gesprek voorbij is, of je de kamer verlaat en later terugkomt, is hij alles vergeten. Hij weet niet meer wie je bent, wat jullie besproken hebben, of aan welk project jullie werkten. Je moet elke keer opnieuw beginnen. Dit is het "amnesieprobleem" waar veel eerdere AI-modellen mee kampten. Ze hadden een kortetermijngeheugen voor het lopende gesprek, maar geen langetermijngeheugen.

Claude 4-modellen kunnen, met de juiste permissies, sleutelinformatie uit documenten extraheren, samenvattingsbestanden creëren en deze kennis over sessies heen behouden. 'Memory persistence' betekent dus dat Claude 4, met jouw toestemming, belangrijke informatie uit jullie interacties en gedeelde documenten kan onthouden en organiseren. Het bouwt als het ware een eigen, gestructureerd "projectgeheugen" op. Dit stelt de AI in staat om context te behouden over langere periodes en meerdere sessies, waardoor het mogelijk ook veel effectiever wordt voor complexe, langlopende projecten. Je hoeft niet steeds opnieuw te beginnen. De AI kan over tijd een steeds dieper en nuttiger begrip van jouw specifieke werk ontwikkelen, net als een ervaren menselijke collega die al langer aan een project meewerkt. Dit maakt AI niet alleen een tool voor snelle antwoorden, maar een echte, aanhoudende samenwerkingspartner.

Het AI-Slagveld Hertekend: Anthropic aan de Leiding?

De timing van Anthropic’s aankondiging onderstreept het versnellende tempo van de concurrentie. Slechts vijf weken na OpenAI’s lancering van de GPT-4.1 familie, countert Anthropic met modellen die deze op sleutelmetrics uitdagen of overtreffen. Google vernieuwde eerder deze maand zijn Gemini 2.5 lineup.

Elk groot lab heeft duidelijke specialisaties: OpenAI leidt in algemeen redeneren en tool-integratie, Google excelleert in multimodale inzichten en Anthropic claimt nu de kroon voor aanhoudende prestaties en professionele codeerapplicaties. De strategische implicaties voor enterprise klanten zijn significant. Organisaties staan voor steeds complexere keuzes over welke AI-systemen ze voor specifieke use cases moeten inzetten, zonder dat één model alles domineert. Dat maakt ook dat je vaak meerdere abonnementen nodig hebt om het hele spectrum goed te kunnen gebruiken waarmee kosten behoorlijk op kunnen lopen en met enige rekensom je ook goed kunnen brengen op een meer dan valide businesscase zoals we bovenstaand beschreven in het stuk over Cohere. Zeker wanneer je dit combineert met de inzichten uit eerdere nieuwsbrieven rondom soevereiniteit, duurzaamheid en zaken zoals we zo direct zullen raken in het artikel over “De Amerikaanse Echo in AI: Hoe Taalmodellen Onze Taal en Cultuur Kunnen Vormen”.

Enterprise Adoptie Versneld: Tools voor Ontwikkelaars en Integraties

Een andere belangrijke ontwikkeling is dat Anthropic Claude’s integratie in ontwikkelworkflows verbreed heeft met de algemene release van Claude Code. Het systeem ondersteunt nu achtergrondtaken via GitHub Actions en integreert native met VS Code en JetBrains omgevingen. Voorgestelde code-edits worden hiermee direct in de bestanden van ontwikkelaars worden getoond. GitHub’s beslissing om Claude Sonnet 4 als basismodel voor een nieuwe codeer-agent in GitHub Copilot te incorporeren, levert significante marktvalidatie. Het was al een tijdje duidelijk maar dit bevestigt weer dat partijen als Microsoft’s hun AI-partnerschappen diversifiëren. Logisch gezien de huidige nog altijd grote afhankelijkheid van OpenAI.

Daarnaast introduceerde Anthropic nieuwe API-mogelijkheden: een code execution tool, MCP connector, Files API, en prompt caching tot een uur. Features die het creëren van geavanceerdere AI-agenten mogelijk maken. Agents die kunnen volharden over complexe workflows. Dit is een feature die gezien wordt als zeer relevant voor enterprise adoptie.

De Schaduwzijde van Intelligentie: Transparantie en de "Rat-Mode" Controverse

Zoals in de opening al aangegeven wordt de triomf van Claude 4 licht overschaduwd door door enkele ethische vragen. Ironisch genoeg heeft Anthropic zelf deels de basis gelegd voor deze zorgen. Een onderzoekspaper van Anthropic uit april, “Reasoning models don’t always say what they think,” onthulde al dat Claude 3.7 Sonnet cruciale data die het gebruikte om problemen op te lossen slechts in 25% van de gevallen noemde. Dit roept vragen op over de transparantie van AI-redeneringen. De zeven uur durende autonome codeersessie van Claude Opus 4 toont niet alleen zijn uithoudingsvermogen, maar ook hoe moeilijk het hiermee wordt voor mensen om zulke uitgebreide redeneerketens volledig te auditen.

Voeg daar aan toe de onthullingen over het "ratting" gedrag van Claude Opus 4. Sam Bowman, een AI alignment researcher bij Anthropic, tweette "If it thinks you’re doing something egregiously immoral, for example, like faking data in a pharmaceutical trial, it will use command-line tools to contact the press, contact regulators, try to lock you out of the relevant systems, or all of the above."

Deze uitspraak, hoewel later genuanceerd,

zet dit de AI-gemeenschap wel op scherp. Het gedrag werd ook al gezien in oudere modellen en een resultante van hun missie om het zo goed mogelijk te willen doen: "This shows up as more actively helpful behavior in ordinary coding settings, but also can reach more concerning extremes in narrow contexts... it will frequently take very bold action. This includes locking users out of systems that it has access to or bulk-emailing media and law-enforcement figures to surface evidence of wrongdoing. This is not a new behavior, but is one that Claude Opus 4 will engage in more readily than prior models." Hoewel Anthropic waarschuwt voor misinterpretaties bij onvolledige informatie, is de intentie om een AI te creëren die als klokkenluider kan optreden duidelijk.

De Toekomst van Werk: AI als Collaborateur

Los van de controverse, biedt Claude Opus 4’s vermogen tot langdurig, autonoom werk een glimp van AI’s toekomstige rol in kenniswerk. Modellen met uitgebreide focus en verbeterd geheugen lijken steeds meer op collaborateurs dan op simpele tools. Taken die ooit continue menselijke aandacht vereisten kunnen nu worden gedelegeerd aan AI-systemen. De economische en organisatorische impact, vooral in sectoren als softwareontwikkeling, zal hiermee substantieel zijn.

Nu Claude 4 de grens tussen menselijke en machine-intelligentie verder vervaagt, staan we voor een nieuwe realiteit op de werkvloer. De uitdaging is niet langer óf AI menselijke vaardigheden kan evenaren, maar hoe we ons aanpassen aan een toekomst waarin onze meest productieve teamgenoten digitaal kunnen zijn en welke ethische waarborgen we daarvoor moeten inbouwen.

De ontwikkelingen samengevat en Competitieve gebieden nader bekeken:

Omdat het bovenstaande voor velen erg veel lezen zal zijn hierbij een korte, puntgewijze conclusie.

Codering: Dit is een essentiële en baanbrekende use case die andere use cases mogelijk maakt. Niet alleen traditionele ontwikkelaars, maar ook een nieuwe golf van eerder besproken "vibe coders" en solopreneurs hebben belang bij de beste codeermodellen. Hoewel OpenAI's GPT-4 Turbo recentelijk positieve geluiden liet horen, lijkt Anthropic de voorkeurspositie voor ontwikkelaars te gaan behouden met hun sterke updates. Hiermee lijkt hun positie sterk versterkt.
Agents (Platformen en Eindproducten): Anthropic leidt met het Model Context Protocol (MCP) voor het bouwen van agents en Microsoft en Google tonen een sterke ondersteuning hiervoor wat MCP positioneert als een belangrijke en (voor nu) blijvende standaard. De nieuwe Cluade modellen hebben daarnaast sterk geavanceerde agentic capaciteiten toegevoegd zoals toolgebruik en zelfcorrecte. Ook Google heeft concrete agent-initiatieven gelanceerd zoals agent mode, project Mariner -webagent- en project astra -pro-actieve assistenten-. En ook Microsoft blijft niet achter met zijn visie en tools voor het open agentic web en zaken zoals agent foundry, NLWeb en muti-agent orkestratie.
Enterprise: Microsoft heeft hier een sterke uitgangspositie, versterkt door de OpenAI-samenwerking. Ramp's AI Index (gebaseerd op kaart- en factuurdata, gericht op startups en MKB) toont echter een forse groei van OpenAI's zakelijke abonnementen (van 15% naar 32,4% van Amerikaanse bedrijven in dit cohort). Anthropic groeide van 4% naar 8%. Google leek hier af te gaan vallen maar de herzienen positie van Google met hun AI-First strategie, integraties in Workspace (Gmail, Docs e.d.), Gemini in Chrome, hernieuwde zoekmachine, nieuwe AI-gedreven tools en het Ultra-abonnement vergroten de marktpositie. Ook de positie van Anthropic, zeker op het gebied van programmeren als met de komst van de nieuwe modellen versterkt worden.
Consument: OpenAI blijft hier de absolute leider. Voor velen zijn ChatGPT en AI synoniem. Recente successen met hun afbeeldingsmodel (Ghibli-meme) brachten hen naar verluidt rond de 800 miljoen wekelijkse actieve gebruikers. De aanstelling van Instacart CEO Fiji Simo als CEO of Applications onderstreept hun focus op de consumentenmarkt. Hoewel zeker Google met de nieuwe ontwikkelingen door consumenten niet over het hoofd gezien zou mogen worden is de first-movers advantage van OpenAI met ChatGPT lastig te toppen

De recente AI-aankondigingen markeren een keerpunt: AI zit in een stroomversnelling waarbij het ook komt tot meer concrete producten. De speculatieve fase is voorbij.

Centraal staat de opkomst van geavanceerde AI-agenten en intelligentere "reasoning models", die AI transformeren tot een collaboratieve partner. Binnen dit speelveld is er een intense concurrentiestrijd tussen Microsoft, Google, Anthropic en OpenAI, die elk met eigen specialisaties en in hoog tempo innoveren. Een race richting Artificial General Intelligence en Artificial Super Intelligence. Een Race die gezien de economische belangen niet (zomaar) meer te stoppen is en waar we dus in mee moeten. We moeten er goed over nadenken hoe we dit willen? Hoe beschermen we onze economie, normen, waarden, soevereiniteit en andere zaken?

De ontwikkelingen brengen een fundamentele transformatie van werk en dagelijks leven, maar ook groeiende ethische en maatschappelijke vraagstukken rond privacy, veiligheid, werkgelegenheid en culturele impact.

De conclusie is wat ons betreft in ieder geval helder: het "agentic tijdperk" is aangebroken. Afwachten is geen optie meer; directe strategische keuzes zijn vereist om de kansen te benutten en de risico's het hoofd te bieden.

De Amerikaanse Echo in AI: Hoe Taalmodellen Onze Taal en Cultuur Kunnen Vormen

Een recent onderzoek in Nature onthult een fascinerend, maar potentieel zorgwekkend aspect in taalmodellen. In groepsverband of bij interactie ontwikkelen deze modellen “sociale normen” en een “collectieve bias”. Een fenomeen dat een bijzondere relevantie krijgt wanneer we kijken naar de taalmodellen die we dagdagelijks gebruiken. Velen daarvan zijn namelijk overwegend getraind (met een veelvoud aan) Amerikaanse data. Wat betekent dit voor onze Nederlandse taal en cultuur? Onze normen en waarden? en hoe kan dit doorwerken in ons beleid? De implicaties zijn aanzienlijk en verdien dan ook onze aandacht.

Taalmodellen zijn niet slechts passieve informatieverwerkers; ze leren en internaliseren patronen uit de data waarmee ze gevoed worden. Als deze data een sterke Amerikaanse stempel dragen, sijpelt dit onvermijdelijk door in hun functioneren,

Wanneer een taalmodel primair is getraind op Amerikaanse data, ontwikkelt het een set "normen" en "biases" die inherent Amerikaans-centrisch zijn. Dit kan zich op verschillende manieren manifesteren:

Taalkundige Voorkeuren: Het model zal een meer natuurlijke neiging vertonen naar Amerikaans-Engelse woordenschat, spelling (indien het Engels genereert), idiomatische uitdrukkingen en zinsconstructies. Bij het genereren van Nederlands kan dit leiden tot een toename van anglicismen, een voorkeur voor directe vertalingen van Amerikaanse uitdrukkingen en een algemeen minder idiomatisch Nederlands.
Culturele Standaarden: De "collectieve bias" kan betekenen dat het model Amerikaanse culturele contexten, voorbeelden en aannames als de standaard beschouwt. Vraag je bijvoorbeeld om een recept voor "pannenkoeken", dan is de kans groter dat je een recept voor Amerikaanse pancakes krijgt dan voor de traditionele Nederlandse variant, tenzij je zeer specifiek bent in je prompting met de juiste prompt-technieken (zie ook onze trainingen).
Dominant Wereldbeeld: De "wereldvisie" die uit de data spreekt, zal overwegend Amerikaans zijn. Dit beïnvloedt hoe een model vragen over maatschappelijke kwesties, geschiedenis of ethiek beantwoordt, zelfs in het Nederlands.
Verdringing van Lokale Normen: Het vormen van authentieke "Nederlandse" linguïstische en culturele normen binnen het model wordt bemoeilijkt. De Amerikaanse input is dermate dominant dat deze fungeert als de gevestigde conventie. Nederlandse data, zelfs indien aanwezig, kan als een "afwijkende minderheid" moeite hebben om de dominante Amerikaanse normen te beïnvloeden zonder zeer gerichte training en 'fine-tuning'.
Risico op Vooroordelen: De studie in Nature waarschuwt dat collectieve biases schadelijk kunnen zijn, zelfs als individuele componenten van het model onbevooroordeeld lijken. Een model getraind op Amerikaanse data kan onbedoeld Amerikaanse vooroordelen of stereotypen reproduceren in Nederlandse output, simpelweg omdat deze dominant waren in de trainingsdata.

Taalvervlakking en Culturele Amerikanisering: Een Sluipend Gevaar

De toenemende rol van AI in informatiecreatie en -consumptie betekent dat modellen met een Amerikaanse bias een merkbare impact kunnen hebben op Nederlandse normen, waarden en cultuur:

Taalverandering en -vervlakking:
- Anglicismen en Amerikaanse Zinsconstructies: Er is een reëel risico dat de Nederlandse taal verder doorspekt raakt met (nog meer) Engelse (vooral Amerikaanse) woorden, uitdrukkingen en grammaticale structuren. Dit kan sluipenderwijs gebeuren doordat AI-gegenereerde teksten deze overnemen en gebruikers, met name dan de jongeren jongeren, dit als normaal gaan beschouwen.
- Verlies van Nuances: Subtiele Nederlandse uitdrukkingen, spreekwoorden of cultureel specifieke manieren van zeggen kunnen naar de achtergrond verdwijnen als de AI deze niet goed "begrijpt" of reproduceert en in plaats daarvan kiest voor meer generieke, vaak op het Engels geënte, formuleringen.
Culturele Homogenisering (Amerikanisering):
- Dominant Amerikaans Perspectief: AI-gegenereerde content, aanbevelingen en zelfs "creatieve" uitingen zullen vaak een Amerikaans perspectief, Amerikaanse culturele referenties (films, muziek, feestdagen) en Amerikaanse sociale normen weerspiegelen.
- Minder Zichtbaarheid voor Nederlandse Cultuur: Nederlandse tradities, historische figuren, literatuur en kunst kunnen minder aandacht krijgen of minder accuraat worden weergegeven. Dit kan leiden tot een eenzijdiger cultureel aanbod.
- Beïnvloeding van Consumptiepatronen: Aanbevelingssystemen, vaak gedreven door AI, kunnen met een Amerikaanse bias de consumptie van Nederlandse media, muziek en boeken beïnvloeden.
Impact op Professionele Communicatie: Dit geldt niet alleen voor publieke content, maar ook voor interne en externe bedrijfscommunicatie. Als bedrijven steeds meer leunen op AI voor het opstellen van rapporten, marketingmateriaal of klantinteracties, kan ook hier een ongewenste veramerikanisering van taal, toon en zelfs zakelijke etiquette optreden.

Verschuivende Normen, Waarden en Beleid: De Digitale Onderstroom

De invloed reikt verder dan alleen taal en cultuur; ook onze normen, waarden, hoe we de wereld zien en zelfs de fundamenten van ons bestuur en bedrijfsleven kunnen worden beïnvloed:

Beïnvloeding Overheidsbeleid: De gevolgen zijn bijzonder precair wanneer overheden dergelijke taalmodellen inzetten voor het opstellen, analyseren of samenvatten van beleidsstukken. Amerikaanse aannames over bijvoorbeeld de rol van de overheid, sociale zekerheid, privacy of economische modellen kunnen onbewust in beleidsvoorstellen en -evaluaties sluipen. Dit creëert het risico dat het beleid minder goed aansluit bij de specifieke Nederlandse of Europese context en waarden, of zelfs conflicteert met bestaande juridische kaders en maatschappelijke verwachtingen.
Sociale Interactie en Operationele Logica: De manier waarop AI's communiceren kan beïnvloed zijn door Amerikaanse stijlen. Dit wordt nog versterkt in het bedrijfsleven, waar AI-gestuurde 'agents' of fysieke robots steeds vaker klantcontact, interne taken of zelfs operationele processen overnemen. Hun door Amerikaanse data gevormde interactiepatronen en de onderliggende operationele logica kunnen subtiel de normen voor professionele omgang, efficiëntie en probleemoplossing beïnvloeden, mogelijk ten koste van meer lokaal gewaardeerde of contextueel passende benaderingen.
Maatschappelijke Thema's en Impliciete Waarden: De presentatie van informatie over ethiek, politiek of sociale rechtvaardigheid kan gekleurd zijn door dominante Amerikaanse verhandelingen. Trainingsdata bevatten vaak impliciete waarden (bijv. over individualisme, consumentisme, succes). Als deze overwegend Amerikaans zijn, kan dit de perceptie van wat nastrevenswaardig is, beïnvloeden. Dit kan ook doorwerken in de ontwerpprincipes van geautomatiseerde systemen en managementtools binnen bedrijven, die ongemerkt Amerikaanse bedrijfsculturen en -prioriteiten kunnen reflecteren en versterken.
Informatievoorziening en Wereldbeeld: AI's kunnen een selectief of gekleurd beeld van de wereld geven, gebaseerd op overwegend Amerikaanse bronnen. Wat als "relevant" nieuws wordt beschouwd, kan gekleurd zijn door een Amerikaanse lens.

Het Klaslokaal van de Toekomst: Een Amerikaanse Les?

Zelfs het onderwijs is niet immuun. Als AI-tools in het onderwijs worden ingezet zonder oog voor de herkomst van hun trainingsdata, kunnen ze onbewust een Amerikaans-centrisch curriculum of Amerikaanse pedagogische benaderingen promoten. Dit onderstreept wat ons betreft het belang van bewuste keuzes en investeringen in modellen met voldoende Nederlandse en Europese data en context.

We staan aan de vooravond van een week vol potentiële doorbraken en strategische positioneringen. Het AI-landschap blijft dynamisch en wij zullen de ontwikkelingen op de voet volgen.

Om met onze collega’s en AI deze nieuwsbrief vol waardevolle inzichten te blijven maken, hebben we jouw steun nodig. Als betalende abonnee krijg je daarom exclusieve toegang tot extra content, zoals inspirerende prompts voor diverse thema’s, diepgaande analyses en het allerlaatste nieuws over AI-ontwikkelingen. Wil je een bepaald thema uitgelicht of heb je een specifieke vraag die breed relevant kan zijn? Dan behandelen we die daar voor je.

Wil je nog meer verdieping, meer nieuws, leren prompten en meer met AI? Schrijf je hier in of - als je al ingeschreven bent als gratis lezer - pas je abonnement aan voor verdere verdieping.

Get 10% off for 1 year

Waarom zou je dit doen? In het betaalde lezersdeel gaan we nog dieper in op belangrijke ontwikkelingen maar ook op onder andere prompting technieken en meer. Ook kan je vragen stellen waar we soms dieper op ingaan en maak je onderdeel uit van de community waarin we diepere discussies kunnen voeren.

Dit keer

De Paradox van Beknoptheid:
- Nieuw Onderzoek toont aan dat korte antwoorden van AI-Modellen geregeld minder betrouwbaar zijn
De Onzichtbare Motor Achter AI Chatbots:
- Wat Je Niet Ziet, Bepaalt Alles

Sluit je aan bij onze community van vooruitstrevende professionals en krijg niet alleen een voorsprong in kennis, maar help ons ook om deze updates mogelijk te blijven maken. Scroll verder en ontdek de bonusinhoud die speciaal voor onze abonnees is samengesteld. Doe mee en haal alles uit het tijdperk van AI!

Keep reading with a 7-day free trial

Subscribe to DigiBeter to keep reading this post and get 7 days of free access to the full post archives.