Thinking Machines wil AI voorspelbaarder maken

Thinking Machines Lab, opgericht door voormalig OpenAI-topvrouw Mira Murati, wil een hardnekkig probleem oplossen: de grilligheid van AI-modellen.

In een eerste blogpost onthulde het lab hoe het willekeur in AI-antwoorden wil bestrijden. Onderzoeker Horace He stelt dat betere controle over GPU-processen de sleutel kan zijn. Dit zou betrouwbaardere AI opleveren voor wetenschap, bedrijven en trainingstechnieken.

Tot nu toe werd de oorzaak van die inconsistentie meestal gezocht in floating point afrondingsfouten en parallelle berekeningen op GPU’s. Omdat optellingen met drijvende-kommagetallen niet associatief zijn, kan de volgorde van berekeningen kleine verschillen veroorzaken. In combinatie met het feit dat GPU’s duizenden threads parallel uitvoeren en de afwikkelvolgorde daarvan niet altijd gelijk is, leek dat de logische verklaring. Het nieuwe onderzoek laat echter zien dat dit beeld niet volledig klopt. Veel GPU-kernels leveren wel degelijk bit-identieke resultaten als ze meerdere keren met dezelfde input worden uitgevoerd.

De echte boosdoener blijkt het gebrek aan batch-invariance te zijn. Dat houdt in dat de uitkomst van een berekening voor één input kan veranderen afhankelijk van de batchgrootte waarin die input verwerkt wordt of het aantal andere verzoeken dat gelijktijdig op de server draait. Drie kernonderdelen van transformer-architecturen blijken gevoelig. Namelijk RMSNorm, matrixvermenigvuldiging en attention. De manier waarop die operaties geoptimaliseerd zijn voor performance maakt dat de rekenvolgorde kan veranderen bij verschillende batchgroottes, wat weer leidt tot minieme afrondingsverschillen die uiteindelijk in de output zichtbaar worden.

Kleine vertraging

Thinking Machines Lab heeft deze operaties herschreven zodat ze batch-invariant zijn. Dat betekent dat de reducties en optellingen altijd in dezelfde volgorde plaatsvinden. Dit ongeacht de batchgrootte of serverload. Daarmee verdwijnen de kleine numerieke verschillen. Zo worden de resultaten echt deterministisch. In experimenten bleek dat duizend herhalingen van dezelfde prompt zonder batch-invariance tachtig verschillende antwoorden opleverden. Dit terwijl met de nieuwe aanpak alle duizend runs exact hetzelfde resultaat gaven. De prijs die daarvoor betaald wordt is een matige vertraging in performance, vaak tussen de twintig en vijftig procent, maar de onderzoekers benadrukken dat dit in de praktijk acceptabel is.

Volgens Thinking Machines is dit meer dan een technisch detail. Voor onderzoek betekent het dat experimenten beter reproduceerbaar worden. Voor bedrijven maakt het debuggen en testen eenvoudiger en betrouwbaarder. In reinforcement learning wordt het zelfs een doorbraak genoemd, omdat training en sampling nu bit-identieke resultaten kunnen leveren en daarmee echt on-policy kunnen verlopen.

Thinking Machines Lab presenteerde dit werk als eerste bijdrage in een nieuwe blogserie met de naam Connectionism. Het bedrijf zegt meer publicaties, code en onderzoeksresultaten te willen delen om de open onderzoekscultuur te versterken. Thinking Machines haalde inmiddels twee miljard dollar aan seed funding op en wist een team van voormalige OpenAI-onderzoekers aan zich te binden.

Het bedrijf werkt aan zijn eerste product, dat zich zal richten op onderzoekers en startups die hun modellen willen aanpassen of customizen. Of de batch-invariance technieken daar direct in verwerkt worden is nog niet bevestigd, maar de visie is duidelijk: AI moet niet alleen krachtig zijn, maar ook consistent en betrouwbaar.

Lees meer over Applications

Expert aan het woord

Tech calendar

Thinking Machines wil AI voorspelbaarder maken

Kleine vertraging

Blijf op de hoogte, abonneer!

Solita FunctionAI: kosten en databeveiliging van je LLM’s op 1 plaats

Axis Communications zet cybermuur op rond gewilde IoT-apparaten

Check Point en Infinigate breiden samenwerking uit naar België

Weerbaarheid gaat verder dan een cyberaanval afweren

In-depth conversation about Agentforce IT service and how it wants to change the ITSM market

SAP Business Network: $6.5 trillion B2B collaboration platform

ServiceNow goes after the mid-market with its AI-based Core Business Suite

Is ServiceNow competing with Salesforce? We talk to Amit Zavery

Wat heb je nodig om de evolutie van Agentic AI te blijven volgen?

De illusie van AI-productiviteit: waarom leiders zich op het verkeerde doel richten

Hoe voldoe je aan de groeiende eisen van AI-gedreven security?

Versterk je securitystrategie met Synology ActiveProtect Appliance

Synology Solution Day 2025

Dell Technologies Forum

BrickCon The Databricks Community Conference

Appdevcon

Webdevcon

Dutch PHP Conference

Waarom automatisering onmisbaar is in moderne cybersecurity

Wat is cyberrisico en waarom doet het ertoe?

XDR uitgelegd: waarom brede zichtbaarheid cruciaal is

Cyberverzekeringen en garanties: onmisbare bouwstenen?