Anthropic laat AI-agents zelfstandig C-compiler ontwikkelen

Anthropic heeft met een opvallend experiment laten zien hoe ver autonome AI-ontwikkeling inmiddels reikt. Zestien AI-agents bouwden vrijwel zelfstandig een C-compiler, maar de resultaten laten zowel technologische vooruitgang als duidelijke grenzen zien.

Het experiment vond plaats in een periode waarin meerdere AI-leveranciers inzetten op agentic systemen. Zowel Anthropic als OpenAI introduceerden onlangs nieuwe tooling voor multi-agentgebruik, waarmee de timing van de publicatie niet toevallig lijkt, aldus Ars Technica.

In het experiment kregen zestien AI-agents, allemaal draaiend op Claude Opus 4.6, de opdracht om vanaf nul een C-compiler te bouwen in Rust. Na het formuleren van het doel trok de menselijke begeleiding zich grotendeels terug. De agents werkten parallel aan een gedeelde Git-repository, zonder centrale orkestratie of aansturende hoofdagent.

Om dit mogelijk te maken ontwikkelde het bedrijf een eigen technische infrastructuur. Elke AI-agent draaide in een afzonderlijke Docker-container en werkte in een oneindige lus, waarbij na afronding van een taak automatisch een nieuwe sessie startte. Taken werden onderling gecoördineerd via eenvoudige lockbestanden in de repository, zodat agents elkaar niet direct in de weg liepen.

Tweeduizend Claude Code-sessies

Het project liep bijna twee weken en omvatte ongeveer tweeduizend Claude Code-sessies. Daarbij werden circa twee miljard inputtokens verwerkt en ongeveer 140 miljoen outputtokens gegenereerd, goed voor bijna twintigduizend dollar aan API-kosten. Het eindresultaat is een compiler van circa honderdduizend regels code.

Volgens Anthropic kan de compiler realistische software bouwen. Zo slaagde het systeem erin om een bootable Linux 6.9-kernel te compileren voor x86-, ARM- en RISC-V-architecturen. Ook projecten als PostgreSQL, SQLite, Redis, FFmpeg en QEMU werden succesvol gecompileerd. Op de GCC torture test suite behaalde de compiler een slagingspercentage van ongeveer 99 procent. Als informele eindtest kon de compiler zelfs het spel Doom compileren en uitvoeren.

Tegelijkertijd plaatst externe verslaggeving duidelijke kanttekeningen bij de mate van autonomie. Hoewel de AI-agents zelfstandig code schreven, vereiste het experiment aanzienlijke menselijke voorbereiding. Het grootste deel van het werk zat niet in het programmeren zelf, maar in het ontwerpen van testharnassen, CI-pijplijnen en feedbackmechanismen die waren afgestemd op de beperkingen van taalmodellen, aldus Ars Technica.

In dat kader benadrukt Anthropic dat de compiler is ontwikkeld zonder directe externe invloeden. De AI-agens hadden tijdens het ontwikkelproces geen internettoegang en gebruikten uitsluitend de Rust-standaardbibliotheek. Het bedrijf spreekt daarom van een clean-room implementatie.

Die kwalificatie roept echter discussie op. Hoewel de ontwikkelomgeving was afgeschermd, is het onderliggende taalmodel vooraf getraind op grote hoeveelheden publiek beschikbare broncode. Daarin zijn vrijwel zeker bestaande C-compilers, testsets en bijbehorende tooling vertegenwoordigd. Daarmee wijkt het gebruik van de term clean room af van de klassieke betekenis in softwareontwikkeling.

Die beperkingen werden vooral zichtbaar naarmate het project groeide. Toen de codebase de grens van ongeveer honderdduizend regels naderde, begonnen nieuwe bugfixes en uitbreidingen regelmatig bestaande functionaliteit te breken. Dat patroon, bekend uit grote menselijke codebases, bleek ook hier op te treden bij AI-agents die langdurig autonoom werken. Het experiment suggereert daarmee een praktische schaalgrens voor agentic softwareontwikkeling met de huidige generatie modellen.

De volledige broncode is publiek beschikbaar en Anthropic presenteert het project nadrukkelijk als onderzoek. Het experiment laat zien wat met huidige AI-agents mogelijk is, maar ook waar de praktische grenzen liggen van autonome softwareontwikkeling op grote schaal.

Lees meer over Devops

Linux-kernel naar versie 7.0 na release van 6.19

De Linux-kernel krijgt binnenkort een nieuw hoofdversienummer. Linus Torvalds heeft aangekondigd da...

Mels Dees 1 dag geleden

Topartikel

Van 10 minuten naar 30 seconden: Aaltra maakt IoT-applicaties bruikbaar

Van slimme warmtepompen tot geconnecteerde compressoren: steeds meer industriële apparaten zijn verbonden me...

Coen van Eenbergen 6 januari 2026

Topartikel

Wat is UCP? Google’s open standaard voor agentic commerce

Google heeft het Universal Commerce Protocol (UCP) gelanceerd, een open standaard die AI-agents in staat stel...

Berry Zwets 12 januari 2026

Spotify zet rem op Developer Mode door strengere API-regels

Spotify scherpt de regels voor ontwikkelaarstoegang aan en zet daarmee een duidelijke koers uit voor zijn pla...

Mels Dees 1 dag geleden

Expert aan het woord

Anthropic laat AI-agents zelfstandig C-compiler ontwikkelen

Tweeduizend Claude Code-sessies

Blijf op de hoogte, abonneer!

Tumult rondom Nvidia-investering in OpenAI zaait opnieuw AI-twijfels

Multi-agent systemen domineren IT-omgevingen anno 2026

ISO 27001 wekt vertrouwen, maar is slechts het begin

Silicon One is de motor van Cisco’s AI-verhaal

AFX is NetApp's data platform of the future with integrated AI data prep

SAP's AI migration tools from ECC to S/4HANA: faster and cheaper ERP transitions

How Capgemini transformed HR for 400,000 employees globally

NetSuite founder reveals AI transformation 5 years in the making

2026 voorspellingen voor de cybersecuritymarkt

De veranderende rollen in softwareontwikkeling in 2026

De kracht en het potentieel van agentic AI voor cybersecurity

Digitale soevereiniteit: van modewoord tot zakelijke noodzaak

Appdevcon

Webdevcon

Dutch PHP Conference

De IT Afdeling van de toekomst

GITEX ASIA 2026

Southeast Asia AI Application Summit 2026

Hoe je stap voor stap een AI-gedreven kennisapplicatie bouwt

Waarom automatisering onmisbaar is in moderne cybersecurity

Wat is cyberrisico en waarom doet het ertoe?

XDR uitgelegd: waarom brede zichtbaarheid cruciaal is