Google DeepMind heeft vorige week de Interactions API beschikbaar gemaakt als publieke beta. De nieuwe API is een fundamentele verandering in hoe ontwikkelaars met AI-modellen werken: van stateless naar een stateful architectuur met server-side contextbeheer. Daarmee volgt Google het pad dat OpenAI in maart 2025 insloeg met zijn Responses API.
De afgelopen twee jaar werkten ontwikkelaars met generative AI via een zogenaamde ‘completion’-model: je stuurt een prompt, je krijgt een antwoord, en daarmee eindigt de transactie. Bij vervolgvragen moet keer op keer de hele gespreksgeschiedenis worden meegestuurd, vandaar ook dat het stateless is. Die stateless architectuur werkt echter niet goed voor complexe AI-agents die diverse tools willen gebruiken, uitgebreide context moeten bijhouden en over langere tijd moeten nadenken om tot de beste oplossing te komen.
De nieuwe Interactions API moet hierin een oplossing bieden door server-side state te ondersteunen. Ontwikkelaars hoeven dan niet langer de volledige conversatiegeschiedenis te beheren en mee te sturen. In plaats daarvan sturen ze een zogenaamde previous_interaction_id mee. Op basis van die interaction_id kan Google de conversatiegeschiedenis ophalen van zijn servers, inclusief voorgaande resultaten van tools en AI-modellen.
Background execution voor langlopende taken
Een andere grote aanpassing is zogenaamde background execution. Zodra je gaat werken met complexe workflows die meer dan enkele minuten nodig hebben om af te ronden. Loop je al snel tegen timeout foutmeldingen aan. Een standaard webverzoek mag vaak maar 60 tot 600 seconden duren, afhankelijk van de webserver configuratie. Als je een process of agent hebt die veel webpagina’s moet doorzoeken, rapporten moet analyseren, dan loop je snel tegen HTTP-timeouts aan.
De Interactions API biedt ontwikkelaars de mogelijkheid een agent te starten met background=true, de verbinding wordt dan direct verbroken en het resultaat kan later worden opgehaald.
“Models zijn systemen aan het worden en kunnen op termijn zelfs zelf agents worden,” schreven DeepMind’s Ali Çevik en Philipp Schmid in het officiële blogbericht. “Proberen om deze mogelijkheden in generateContent te proppen zou hebben geleid tot een te complexe en fragiele API.”
Google versus OpenAI: transparantie of efficiëntie?
Google kiest hiermee voor een soortgelijk pad als OpenAI, maar geeft er wel zijn eigen draai aan. OpenAI stapte in maart 2025 al af van stateless met zijn Responses API. Beide stappen af van stateless om context beter beschikbaar te maken, maar de gekozen route is wel degelijk anders.
OpenAI’s Responses API introduceerde Compaction – een functie die conversatiegeschiedenis comprimeert, het focust puur op de output en verwijdert tussentijdse tool outputs en reasoning chains. Dit zorgt voor een betere token-efficiëntie maar creëert een black box waarin het eerdere redeneren van het model verborgen.
Google’s Interactions API houdt daarentegen de volledige geschiedenis beschikbaar en composable. Het datamodel laat ontwikkelaars toe om berichten te debuggen, manipuleren, streamen en erover te redeneren. Google stelt transparantie en volledige doorzoekbaarheid belangrijker dan compressie.
Native MCP-ondersteuning en beschikbare modellen
Google omarmt ook het open ecosysteem door native ondersteuning voor Model Context Protocol (MCP) te bieden. Dit laat Gemini-modellen direct externe tools aanroepen die gehost worden op remote servers, zondat dat ontwikkelaars hiervoor code hoeven te schrijven. Op die manier kan allerlei informatie snel worden binnengehaald en context worden verbeterd.
De Interactions API is nu beschikbaar in publieke beta via Google AI Studio. Het ondersteunt het volledige spectrum aan Google’s laatste generatie modellen: Gemini 3.0 (Gemini 3 Pro Preview), Gemini 2.5 (Flash, Flash-lite en Pro) en de Deep Research Preview agent.
De prijsstructuur blijft gelijk, de standaardtarieven voor input en output tokens van de modellen zijn van toepassing. Het is daarbij wel afhankelijk hoelang de geschiedenis van de interacties bewaard moet worden. De gratis tier heeft een retentie van 1 dag, de betaalde tier houdt de interacties 55 dagen beschikbaar.