Anthropic maakt met Claude Opus 4.6 coderen met AI beter

Anthropic introduceert Claude Opus 4.6, een AI-model dat behoorlijk capabel is in codeertaken. Dit dankzij verbeterde planning, een contextvenster van 1 miljoen tokens en de nieuwe functie adaptive thinking.

Anthropic kan een aantal benchmarks voorleggen waaruit blijkt dat het model beter presteert dan concurrenten. Claude Opus 4.6 scoort het hoogst op Terminal-Bench 2.0. Deze benchmark beoordeelt agents op basis van hun capaciteiten in terminal-omgevingen. Hiervoor onderwerpt Terminal-Bench 2.0 iedere agent die aan de benchmark gevoed wordt aan een aantal standaard taken. Opus 4.6 haalt daar een score van 65,4. De vorige Anthropic-versie, Opus 4.5, scoorde hier nog 59,8. GPT-5.2-codex, dat in december verscheen, komt met 64,7 het dichtst in de buurt.

Ook presteert het beter op Humanity’s Last Exam voor multidisciplinaire reasoning dan concurrenten, met een range van 40-53,1 versus de 36,6 tot 50 van GPT-5.2 Pro. GDPval-AA, dat aantoont hoe capabel een model is voor kenniswerk in finance en juridische sectoren, is eveneens in het voordeel van Opus 4.6 (1606 ten opzichte van de 1462 van GPT-5.2).

Nieuwe functies voor ontwikkelaars

Met de nieuwe adaptive thinking-functie krijgen ontwikkelaars meer controle over hoe diep het model nadenkt. Waar eerder alleen extended thinking aan of uit kon, kan Claude nu zelf bepalen wanneer grondigere redenering nuttig is. Vier effort-niveaus (low, medium, high en max) bieden hierin extra flexibiliteit. Met deze niveaus kan de gebruiker bepalen hoeveel tokens Claude gebruikt voor een reactie. High is de standaardinstelling, maar dit is dus aan te passen. Onderstaand overzicht geeft een idee wat wanneer nuttig is.

Er is een tabel met AI-inspanningsniveaus met beschrijvingen en typische gebruikssituaties; het niveau "Hoog" is gemarkeerd, wat wijst op een hoge capaciteit en geen vaste parameterlimieten.

Context compaction is een andere toevoeging. Bij langlopende taken vat Claude automatisch oudere context samen wanneer het contextvenster nadert. Daardoor kunnen agents langer doorwerken zonder limieten te bereiken. De 1 miljoen tokens context is een primeur voor Opus-modellen, al geldt premiumpricing vanaf 200.000 tokens.

Claude in Excel kreeg een upgrade voor complexere taken. Het model plant nu vooraf, verwerkt ongestructureerde data en voert wijzigingen in één keer door. Claude in PowerPoint verschijnt als research preview voor Max-, Team- en Enterprise-abonnementen. Het leest layouts en slide masters om presentaties te maken die passen bij de huisstijl.

In Claude Code kunnen gebruikers nu agent-teams samenstellen die parallel werken. Dat is vooral handig voor taken als codebase reviews die opsplitsen in onafhankelijk werk. De pricing blijft 5 dollar per miljoen input-tokens en 25 dollar per miljoen output-tokens.

Veiligheid en prestaties

Anthropics systeem card laat zien dat Opus 4.6 qua veiligheid minstens zo goed scoort als andere frontier-modellen. Het vertoont weinig misleidend gedrag in safety evaluations. Ook heeft het de laagste over-refusal rate van recente Claude-modellen, wat betekent dat het minder vaak onterecht weigert te antwoorden op onschuldige vragen.

Het model haalt 76 procent op de 8-needle 1M variant van MRCR v2, een needle-in-a-haystack-test. Sonnet 4.5 scoorde daar 18,5 procent. Die verbetering moet ‘context rot’ tegengaan, het verschijnsel waarbij prestaties afnemen bij lange gesprekken. Claude Opus 4.6 is vanaf vandaag beschikbaar via claude.ai, de API en alle grote cloudplatformen.

Tip: Anthropic lanceert Claude Opus 4.5 en belooft een AI-doorbraak

Lees meer over Devops

Topartikel

Wat is UCP? Google’s open standaard voor agentic commerce

Google heeft het Universal Commerce Protocol (UCP) gelanceerd, een open standaard die AI-agents in staat stel...

Berry Zwets 12 januari 2026

Linux 7.0 nadert stabiele fase na onrustige start

De ontwikkeling van Linux 7.0 lijkt in rustiger vaarwater te komen na een onstuimige start. Waar de eerste we...

Mels Dees 23 uren geleden

Topartikel

Yenlo groeit uit tot schaalbare integratiepartner

Na jaren bouwen aan het fundament, gooit Integratie- en API-beheerexpert Yenlo de deuren open voor de volgend...

Berry Zwets 16 maart 2026

Krachtig coding-model van Cursor blijkt van Chinese komaf

Update 23 maart: Cursor imponeerde afgelopen week met Composer 2. Toch blijkt het merendeel van dit model nie...

Berry Zwets 1 dag geleden

Expert aan het woord

Anthropic maakt met Claude Opus 4.6 coderen met AI beter

Nieuwe functies voor ontwikkelaars

Veiligheid en prestaties

Blijf op de hoogte, abonneer!

IBM rondt miljardenovername Confluent af

Europese datacentermarkt is een puzzel met steeds meer stukken

AI-chatbots vertellen je nog steeds hoe je een bom maakt

Je vaatwasser wordt niet geleverd: waarom supply chains falen

Cisco's 102.4 terabit chip supercharges AI data centers

MuleSoft agent fabric: governing AI agents across platforms

Why this CIO ditched Microsoft for Google and Slack

Salesforce reveals its own Agentic IT Service Platform

Hoe slimme, secure en simpele vergadertechnologie het verschil kan maken op de hybride werkplek

API’s zijn de ruggengraat van onze digitale economie

Van huddle tot boardroom: hoe ClickShare vergaderen herdefinieert

2026 voorspellingen voor de cybersecuritymarkt

De IT Afdeling van de toekomst

GITEX ASIA 2026

Southeast Asia AI Application Summit 2026

SAS Innovate 2026

Team '26

Red Hat Summit

Hoe je stap voor stap een AI-gedreven kennisapplicatie bouwt

Waarom automatisering onmisbaar is in moderne cybersecurity

Wat is cyberrisico en waarom doet het ertoe?

XDR uitgelegd: waarom brede zichtbaarheid cruciaal is