OpenAI brengt een nieuwe desktopapplicatie uit. Hiermee kunnen ontwikkelaars meerdere AI-agents tegelijk aansturen bij softwareontwikkeling.
Deze Codex-app is voorlopig beschikbaar voor macOS. Het moet een centrale werkomgeving bieden voor taken die door verschillende agents parallel worden uitgevoerd.
Volgens OpenAI sluit de tool aan op een veranderende manier van werken waarbij ontwikkelaars niet langer één enkele assistent gebruiken, maar meerdere agents inzetten die zelfstandig langdurige taken uitvoeren.
Sinds de introductie van Codex is de rol van AI binnen ontwikkelprocessen volgens het bedrijf verschoven. Waar agents eerst vooral werden gebruikt voor gerichte codeaanpassingen, worden ze nu ingezet voor bredere trajecten die het hele ontwikkelproces bestrijken. Ontwikkelaars delegeren taken, laten processen naast elkaar draaien en vertrouwen agents projecten toe die uren of zelfs dagen kunnen lopen. Bestaande IDE’s en terminaltools zijn daar volgens OpenAI niet op ingericht, waardoor behoefte ontstond aan een aparte omgeving voor dit type samenwerking.
Agentic software development is een trend
Met de app lijkt OpenAI bovendien aan te sluiten bij een bredere trend van zogeheten agentic software development, waarbij AI-agents grotendeels zelfstandig programmeerwerk uitvoeren. Tools als Claude Code en Cowork worden daarbij vaak genoemd als voorlopers in deze werkwijze.
De Codex-app moet die rol vervullen door agents in afzonderlijke projectthreads te laten werken. Gebruikers kunnen wisselen tussen taken zonder context te verliezen en wijzigingen van agents direct beoordelen. De applicatie ondersteunt worktrees, zodat meerdere agents in dezelfde repository actief kunnen zijn zonder conflicten te veroorzaken. Iedere agent werkt in een geïsoleerde kopie van de code, waardoor verschillende oplossingsrichtingen parallel verkend kunnen worden zonder de lokale gitstatus te beïnvloeden.
Een belangrijk onderdeel van de nieuwe aanpak zijn zogeheten skills. Daarmee kan Codex meer doen dan alleen code genereren. Skills combineren instructies, scripts en toegang tot externe hulpmiddelen, zodat de agent ook taken kan uitvoeren zoals het ophalen van ontwerpbestanden, het beheren van projectinformatie of het genereren van documentatie. Binnen OpenAI worden dergelijke uitbreidingen al langer gebruikt om terugkerende taken te automatiseren, variërend van het analyseren van foutmeldingen tot het opstellen van rapportages
Flexibele interface
Volgens OpenAI-topman Sam Altman is het onderliggende model, GPT-5.2-Codex, momenteel het krachtigste model van het bedrijf voor programmeertaken, maar was het tot nu toe minder toegankelijk in gebruik. De nieuwe app moet die drempel verlagen door de modelcapaciteiten te koppelen aan een flexibeler interface.
Die claim verdient nuance. TechCrunch meldt dat GPT-5.2 weliswaar bovenaan staat in TerminalBench, maar dat modellen als Gemini 3 en Claude Opus vergelijkbare scores behalen binnen de foutmarge. Ook bij SWE-bench is geen duidelijk voordeel zichtbaar. Tegelijkertijd zijn dit soort agentic toepassingen lastig eenduidig te meten en spelen verschillen in gebruikerservaring een grote rol.
Daarnaast introduceert de app ondersteuning voor Automations. Hiermee kan Codex volgens een vast schema op de achtergrond taken uitvoeren. Resultaten verschijnen in een wachtrij waar ontwikkelaars ze later kunnen beoordelen. OpenAI ziet dit als een manier om repetitief werk te verminderen zonder voortdurend toezicht.
De applicatie bevat standaard sandboxing op systeemniveau. Agents mogen alleen werken binnen de toegewezen map of branch en vragen expliciet toestemming voor acties met verhoogde rechten, zoals netwerktoegang. Teams kunnen deze regels aanpassen aan hun eigen werkwijze.
De Codex-app is nu beschikbaar voor macOS-gebruikers met een betaald ChatGPT-abonnement en tijdelijk ook voor gebruikers van de gratis variant. Een Windowsversie staat volgens OpenAI op de planning.