Claude Fable 5 is Mythos voor het grote publiek

Claude Fable 5 is Mythos voor het grote publiek

Na maanden van speculatie is een LLM op het niveau van Mythos Preview eindelijk een volledig beschikbaar AI-model van Anthropic. Het neemt de vorm aan van Claude Fable 5, een beperkte versie van het inmiddels roemruchte Mythos. Ondertussen zal Mythos 5 in beperkte mate beschikbaar zijn voor securityonderzoekers en minder beperkingen hebben.

Met de belofte om “de wereld fundamenteel ten goede te komen”, straalt Anthropic een zekere zelfverzekerdheid uit rond Fable 5. We zullen geleidelijk ontdekken of dat gevoel terecht is. Met de hoge prijs van 10 dollar per miljoen invoertokens en 50 dollar per miljoen uitvoertokens (hoewel dit een flinke korting is ten opzichte van de kosten van Mythos Preview), is Fable 5 verre van goedkoop. Niettemin zullen gebruikers met een betaald abonnement toegang hebben tot het model tot 22 juni, waarna het zal overschakelen op gebruikskredieten totdat de capaciteit het toelaat dat Anthropic Fable 5 weer aanbiedt zoals het nu beschikbaar is.

De benchmarks zeggen niet zo veel

De afgelopen jaren zijn AI-benchmarks (vooral die vanuit LLM-bouwers zelf) nauwelijks een voorspeller geweest van prestaties in de praktijk en een positieve ontvangst. We hebben bijvoorbeeld gezien dat Meta’s Llama 4-model goed presteerde in deze tests, maar geen noemenswaardige adoptie wist te bereiken. Ondertussen werden de scores voor sommige benchmarks te hoog om nog voldoende onderscheidend te zijn, deels vanwege het feit dat LLM-makers optimaliseren voor bepaalde vragen en natuurlijk omdat de LLM’s daadwerkelijk beter worden.

Hoe dan ook, Mythos 5 en Fable 5 scoren iets hoger of veel hoger dan Opus 4.8, GPT-5.5 en Gemini 3.1 Pro. Er is echter een belangrijk voorbehoud bij de scores van Fable 5: elke vraag over onderwerpen die als gevaarlijk worden beschouwd (cyberbeveiliging, biologie, scheikunde en modeldistillatie) wordt doorgeschakeld naar Opus 4.8, een aanzienlijk minder capabel model. We hebben wat met Fable 5 gespeeld en het blokkeert inderdaad onze eerste pogingen om deze beveiligingen te omzeilen, maar het is nog steeds ruimschoots capabel.

Een demonstratie

Elke LLM heeft een bepaalde persoonlijkheid. Dat wil zeggen: elk model zal een specifiek type antwoord op een vraag herhalen dat voorspelbaar en soms beperkend is. Voorbeelden hiervan zijn eerdere Claude-LLM’s die de zin “Je hebt helemaal gelijk!” ‘uitroepen’, of de vreemde obsessie van GPT-5.1 tot en met GPT-5.4 met gremlins. Wat meteen opvalt bij Fable 5 is de duidelijke neiging om commentaar te geven op de vraag van de gebruiker. Claude bevindt zich nog steeds grotendeels in het domein van “LLM-achtige” antwoorden (wat volgens het model zelf deels te maken heeft met wat er van het model wordt gevraagd), maar het lijkt wel een beetje zelfreflectie te tonen op de input. Dit kan natuurlijk heel goed dezelfde echo zijn van een zelfreflectie die LLM’s “aangeleerd” krijgen, waarmee menselijk denken overtuigend nagebootst kan worden.

Bovendien laat het model zien hoe moeilijk het is om redenerende modellen te onderscheiden van LLM’s die dat niet doen. Afgezien van het feit dat het even duurt om een vraag te beantwoorden, zal Fable 5 zijn gedachtegang veel meer in het daadwerkelijk weergegeven antwoord opnemen dan andere LLM’s die we hebben getest.

Het is nog vroeg dag en we hebben het slechts een handvol vragen gesteld. Maar goed, het kwam wel met een party trick zoals gevraagd. Het schreef correct een kort essay waarin de eerste letter van elke zin een boodschap vormde, terwijl het de lengte van elke zin met 1 woord vergrootte totdat deze 22 woorden bereikte. Het voerde deze zelfopgelegde taak precies goed uit – en het schreef zelfs software om zichzelf te controleren. (De verborgen boodschap was, nogal sarcastisch, “the proof is in the pattern“). Zelfs de tekst zelf was een commentaar op de taak die we het hadden gegeven. Indrukwekkend voor een trucje, en ver buiten het bereik van modellen als GPT-3.5 of latere modellen die in 2023 tot 2025 uitkwamen.

Een voorsprong voor de verdedigers

De implicaties van de release van Fable 5 zijn nog onduidelijk. Wat we wel weten, is dat beveiligingsmaatregelen bijna altijd worden omzeild. De hoge kosten voor deze LLM zullen dalen of worden overtroffen door een model met vergelijkbare capaciteiten. Maar zelfs als dat niet gebeurt, hebben we keer op keer gezien hoe red teamers en kwaadwillenden manieren vinden om nieuw ontdekte mogelijkheden te misbruiken. De gedachtegang van Anthropic draait om het voor zijn op de laatste groep te zijn door de eerste groep in staat te stellen.

Zowel via officiële communicatie als via anekdotische verhalen hebben we het gevoel dat de verhalen over de mogelijkheden van Mythos niet al te overdreven zijn. Dit betekent dat Anthropic veel vertrouwen moet hebben in zijn vermogen om misbruik te voorkomen – of het weet welke machtsvertoon het kan opbrengen vlak voordat het naar verluidt naar de beurs gaat. Indien dat het geval is, verslaat het OpenAI op meerdere manieren.

Lees ook: EU-cyberbeveiligingsagentschap krijgt toegang tot Anthropic Mythos