Open-source AI legt OpenAI en Google het vuur aan de schenen

Lang waren alle leidende LLM’s closed-source. Nu voegen de modellen van Meta, Anthropic en Alibaba zich bij gevestigde partijen OpenAI en Google.

Dat blijkt uit benchmarks van AI-beoordelaar Galileo. De tweede “LLM Hallucination Index” laat zien dat Claude 3.5 Sonnet van Anthropic de koppositie pakt. Daarmee delft OpenAI voor het eerst het onderspit, laten de onderzoekers weten. Ook Meta’s Llama 3.1 en Alibaba’s Qwen2-72B-Instruct gooien hoge ogen op open-source gebied. Laatstgenoemde benadrukt het gestage verlies aan dominantie voor Amerikaanse spelers, zoals ook Mistral Large 2 onlangs liet zien.

Closed-source nog gemiddeld beter

Closed-source modellen scoren nog steeds gemiddeld hoger dan de open-source alternatieven. Dat toont de Galileo-test op basis van 22 modellen. De winstmarge is alleen wel aanzienlijk kleiner dan voorheen.

Ook opvallend zijn de prijsverschillen tussen de “volledige” versie van een LLM en een compacte variant. Terwijl Claude 3.5 Sonnet 3 dollar kost per miljoen prompts, is Gemini 1.5 Flash met dat aantal slechts 35 dollarcent. En dit terwijl Flash niet opvallend slechter is dan Sonnet, aldus Galileo-CEO Vikram Chatterji. Organisaties zullen een groot belang hechten aan dit kostenplaatje voor een professionele AI-inzet.

Stagnatie?

GenAI blijft zich verbeteren. Toch is er van enige stagnatie sprake aan de top, en niet alleen een explosieve opkomst van open-source AI. Nog steeds zitten we te wachten op GPT-5, dat ondanks eindeloze verbluffende beloftes in geen velden of wegen te bekennen is. De Galileo-benchmark kan dus niet alleen positief geïnterpreteerd worden.

Het feit dat OpenAI geduchte concurrentie kent, lijkt het bedrijf al parten te spelen. Astronomische trainingskosten worden niet gecompenseerd door de inkomsten vanuit abonnementen of API-calls.

Lees verder: Business-model OpenAI werkt niet: faillisement dreigt

Lees meer over Analytics

Topartikel

VS blokkeert AI-model Anthropic Fable: wat betekent dit voor Europa?

De Verenigde Staten hebben voor het eerst een geavanceerd AI-model geblokkeerd voor niet-Amerikaanse gebruike...

Coen van Eenbergen 23 juni 2026

Topartikel

DevRev daagt SaaS uit: AI data-integratie moet (en kan) beter

De 'SaaSpocalypse' zou wel eens vanuit de SaaS-laag zelf kunnen komen

Sander Almekinders 23 juli 2026

Progress koopt AI- en dataplatform Domo voor 400 miljoen

Progress Software legt 400 miljoen dollar op tafel voor Domo. De overname moet de AI- en datamogelijkheden va...

Berry Zwets 24 juli 2026

Snowflake Cortex AI Gateway moet AI-agents in toom houden

Snowflake introduceert Cortex AI Gateway, een centrale laag waarmee bedrijven zowel eigen als externe AI-agen...

Berry Zwets 23 uren geleden

Expert aan het woord

Tech calendar

Open-source AI legt OpenAI en Google het vuur aan de schenen

Closed-source nog gemiddeld beter

Stagnatie?

Blijf op de hoogte, abonneer!

Paniek rond start productie ASML-alternatief in China

Claude Opus 5: nagenoeg Fable voor de helft van de prijs

DevRev daagt SaaS uit: AI data-integratie moet (en kan) beter

CPU’s beleven eindelijk hun AI-doorbraak

SAP executive addresses API policy and openness concerns

Why enterprises are choosing HPE for private cloud AI

Why OpenTelemetry is winning the observability battle

AI security threats facing open source ecosystems in 2026

Liquid cooling dwingt datacenters tot andere ontwerpkeuzes

Slimmer vergaderen begint met het juiste ecosysteem

Ondersteun kritieke workloads met all-NVMe active-active storage voor non-stop bedrijfsvoering

Datasoevereiniteit begint bij grip: niet alleen op databases, maar óók op data zelf

Dreamforce

GOTO Copenhagen 2026

NetApp INSIGHT 2026

Manhattan EMEA Exchange

Klarrio: Architectuur is grootste knelpunt of grootste versneller

Hoe je stap voor stap een AI-gedreven kennisapplicatie bouwt

Waarom automatisering onmisbaar is in moderne cybersecurity