AWS trapt AI-gaspedaal in voor meer diepgang en bredere adoptie

Nova 2-modellen, Nova Forge, Trainium3, AI Factories en meer

AWS trapt AI-gaspedaal in voor meer diepgang en bredere adoptie

AWS stort tijdens re:Invent 2025 een enorme lading AI-updates uit over het publiek en de markt. In het oog springen de nieuwe eigen Nova 2 frontier modellen die het via Amazon Bedrock aanbiedt. Trainium3 UltraServers moet ervoor zorgen dat er training en inferencing weer significant sneller gedaan kunnen worden. Verder springen ook enkele waardevolle updates aan AgentCore in het oog en gaat AWS met AI Factories hardware, diensten en beheer leveren in datacenters van klanten.

Een grote verrassing zoals de aankondiging van de eerste generatie Nova-modellen zat er dit jaar niet in de openingskeynote van AWS-CEO Matt Garman. Daarmee willen we echter zeker niet beweren dat de innovatie eruit is bij AWS. Integendeel zelfs. AWS bouwt dit jaar het aanbod sterk uit en gaat verder de diepte in om het aanbod volwassener te maken. Met andere woorden, de AI-ambities van AWS krijgen nog wat meer body. Vanuit praktisch oogpunt, met name vanuit de eindgebruikers, is dat uitermate waardevol.

Nova 2 Lite en Nova 2 Pro

Waar de aankondiging van de Nova-modellen vorig jaar richting het einde van de keynote zat, trapt Garman dit jaar de keynote er min of meer mee af. Het kan maar duidelijk zijn dat het AWS menens is. Vanaf nu zijn er vier nieuwe Nova 2-modellen beschikbaar in Amazon Bedrock.

Amazon Nova 2 Lite is volgens AWS een snel en kosteneffectief reasoning-model voor dagelijkse workloads. Het model biedt een toegankelijk instappunt voor ontwikkelaars die geavanceerde AI-capaciteiten willen benutten zonder aanzienlijke rekenkracht nodig te hebben.

Amazon Nova 2 Pro is het meest intelligente model in de line-up en specifiek ontwikkeld voor zeer complexe, multistep-taken. Het model kan aan de slag met multi-document analyse, video reasoning en software-gerelateerde taken.

Beide modellen beschikken over extended thinking met step-by-step reasoning en task decomposition. Ontwikkelaars krijgen de beschikking over drie niveaus van zogeheten thinking intensity (laag, medium en hoog). Het idee is dat ze hiermee de balans tussen snelheid, intelligentie en kosten kunnen bepalen en bewaken.

Wat ons betreft opvallend was dat AWS veel nadruk legt op de prestaties van de nieuwe modellen ten opzichte van de concurrentie, modellen die de meeste mensen veel beter zullen kennen dan Nova. Denk aan ChatGPT, Gemini, Claude. Dat viel ons vorig jaar bij de lancering van Nova ook al op. Het geeft aan dat AWS op dit vlak een underdog is en zich nog echt moet bewijzen in de markt. Dat is op veel andere vlakken op het gebied van public cloud precies andersom. Deze verhoudingen alleen al maken dit wat ons betreft interessant om te blijven volgen. AWS gaat er verder ook op prijs zeer competitief in, zien we in het overzicht op de website van AWS.

Nova 2 Sonic en Nova 2 Omni

Naast de ‘standaardmodellen’ Nova 2 Lite en Nova 2 Pro heeft AWS echter nog twee interessante modellen. Nova 2 Sonic is een AI-model dat specifiek is gericht op spraak-naar-spraak. Ontwikkelaars die functionaliteit aan applicaties willen toevoegen die gebruikers in staat stelt om (in de eigen taal) te converseren met een AI, die ook in die taal terug praat. Je hoeft volgens AWS niet enorm strikt te focussen op een enkel onderwerp. Het model handelt zaken asynchroon af. Dat houdt onder andere in dat je van onderwerp kunt veranderen zonder dat dit het model van de wijs brengt.

Het laatste model is er eentje dat alle mogelijke modaliteiten die je tegenkomt in AI bij elkaar probeert te brengen. test, plaatjes, video, spraak, Nova 2 Omni moet overal mee overweg kunnen en levert text en plaatjes als output. Volgens AWS is het hiermee de eerste die een dergelijk model aanbiedt. Het doel van Nova 2 Omni is onder andere om de kosten van de inzet van AI-modellen binnen te perken te houden. Er hoeven nu niet verschillende modellen aan elkaar geknoopt te worden. Dat scheelt niet alleen in kosten, maar ook in complexiteit van de totale omgeving van organisaties.

Nova Forge: bouw je eigen frontier model

Wat ons betreft de interessantste aankondiging als het gaat om Nova, is Nova Forge. Hiermee wil AWS de markt voor het bouwen van frontier modellen een boost geven. Nova Forge is namelijk een aanbod waarmee organisaties hun eigen frontier-modellen kunnen bouwen. Zoals de naam aangeeft, zijn dit frontier modellen op basis van de eigen Nova-modellen. Het is dus ook een manier voor AWS om de eigen modellen (en daarmee ook Amazon Bedrock) bij een breder publiek onder de aandacht te brengen.

AWS heeft zelfs al een naam bedacht voor de frontier modellen die met Nova Forge gebouwd worden: Novellas. Elke Novella is in feite een combinatie van de eigen data van klanten en de mogelijkheden die Nova biedt. Interessant is verder dat Nova Forge meerdere model checkpoints aanbiedt aan klanten. Die kunnen pre-trained, mid-trained en post-trained Nova model checkpoints inzetten. Hiermee kunnen ze op meerdere momenten tijdens de training van hun eigen Novella hun data met Nova combineren. Het onderliggende frontier model is op dit moment Nova Lite, maar klanten van Nova Forge krijgen ook als een van de eersten toegang tot Nova 2 Pro en Nova 2 Omni.

Trainium3 versnelt AI-training (en -inferencing)

Veel updates die AWS vandaag doet op het gebied van AI hebben te maken met producten en diensten die het aanbiedt bovenop de eigen infrastructuur. Die infrastructuur is echter ook continu in ontwikkeling. Tijdens re:Invent kondigt het bedrijf aan dat de nieuwste Amazon EC2 Trn3 UltraServers algemeen beschikbaar zijn.

De Trainium3 UltraServers zijn voor AWS best bijzonder en belangrijk. Het zijn namelijk de eerste chips die zijn gebakken op een 3nm-procédé. In totaal zitten er 144 Trainium3 chips in een enkele Trainium3 UltraServer. Deze nieuwste generatie levert vanzelfsprekend weer significant betere prestaties dan de voorloper. 4.4 keer hogere prestaties, 3,9 keer meer geheugenbandbreedte en ook een prestatie per watt die vier keer hoger ligt dan die van de Trn2 UltraServers. Een Trainium3-chip biedt 2,52 petaflops aan FP8-rekenkracht. Dat komt dus neer op 362 petaflops in totaal.

Trainium3 is nu de snelste AI-accelerator die AWS aanbiedt op Amazon Bedrock. Verder viel het ons ook op dat er geregeld nadruk werd gelegd op het feit dat Trainium niet alleen geschikt is voor het trainen van AI-modellen, maar ook erg geschikt voor inferencing. AWS heeft uiteraard ook nog de Inferentia-lijn hiervoor, maar kennelijk kan Trainium hier dus ook uitstekend voor ingezet worden. Het wordt wellicht tijd om de naamgeving eens onder de loep te nemen, want dit maakt het allemaal wel wat verwarrend. Het is wel begrijpelijk dat AWS hier de nadruk op legt, want inferencing is waar richting de toekomst veel groeit te verwachten valt.

Bedrock AgentCore krijgt updates

AWS onthult vandaag ook nieuwe Bedrock AgentCore-functionaliteit. De nieuwe features moeten de ontwikkeling van agentic AI een stuk eenvoudiger maken. AgentCore helpt organisaties bij het opzetten van en autonome en (hopelijk) effectieve en slimme self-service workflows. Belangrijk hierbij is dat die blijven werken zoals ze in eerste instantie bedoeld zijn. Om daar zeker van te zijn, kunnen organisaties specifieke richtlijnen instellen, hallucinaties verminderen en ervoor zorgen dat bots of workflows voldoen aan vooraf vastgestelde policies.

Kijken we naar de specifieke nieuwe mogelijkheden die AWS toevoegt, dan zijn dat er drie: Policy, AgentCore Evaluations en AgentCore Memory. De toevoeging van Policy aan AgentCore moet het mogelijk maken voor organisaties om duidelijke grenzen aan te geven aan applicaties rondom wat ze wel en niet mogen. Interessant is dat Policy in AgentCore Gateway draait. Dit is om twee redenen interessant. Allereerst betekent dit dat het geen onderdeel uitmaakt van de code van de agents zelf. Ten tweede zorgt dit ervoor dat het vrijwel in real time kan reageren. Hiermee moet het mogelijk zijn om agents continu in het gareel te houden.

AgentCore Evaluations moet ontwikkelaars een handje gaan helpen. Hiermee kunnen die ervoor zorgen dat er continu inzicht is in de kwaliteit van de agents. Dit doet het door het gedrag te evalueren. Evaluations is niet zozeer gericht op het aangeven van de grenzen, maar meer op hoe agents het doen binnen die grenzen. AWS heeft dertien zogeheten evaluators alvast gebouwd en meegeleverd. Denk dan aan kwaliteitscriteria zoals correctheid, accuratesse bij het selecteren van tools, veiligheid, of agents hun doel bereiken en ook echt helpen om agents beter te laten functioneren. Ontwikkelaars kunnen zelf ook evaluators maken en toevoegen aan AgentCore Evaluations.

De laatste toevoeging aan AgentCore die we hier bespreken is AgentCore Memory. Dat doet in principe wat de naam doet vermoeden. Waar veel AI agents als het ware hun geheugen verliezen zodra er een nieuwe interactie start, zorgt AgentCore Memory ervoor dat de agent in de loop van de tijd de gebruikers beter leert kennen. De AI agents kunnen leren van eerdere interacties en ervaringen. Deze inzichten kunnen ze dan toepassen bij nieuwe en toekomstige interacties.

AWS Frontier Agents voor softwareontwikkeling

AWS presenteerde vandaag een naar eigen zeggen nieuwe klasse AI-agents. Deze noemt het Frontier Agents. Ze functioneren als het ware als verlengstuk voor development teams. Deze agents kunnen volledig autonoom onder andere projectvoorstellen doen, code genereren en dependencies aanpassen.

Volgens AWS bleek uit pilots dat het met de Frontier Agents mogelijk is om maanden werk in enkele dagen te kunnen doen. De Professional Services Delivery Agent start projecten op basis van diagrammen of vergadernotities. Hij genereert projectvoorstellen en werkomschrijvingen in enkele uren. Volgens AWS nam dat voorheen weken in beslag.

De agent werkt samen met gespecialiseerde sub-agents die code schrijven, testen en uitrollen. Voor COBOL-mainframes, VMware-workloads en .NET-applicaties schakelt het systeem automatisch de AWS Transform-service in. Lees dit artikel voor meer informatie daarover. Het migreren van software betekent vaak ook het aanpassen van dependencies. AWS claimt dat de agent op basis van Transform dit grotendeels overneemt.

AWS kondigt niet alleen het concept van de Frontier Agent aan. Het lanceert er ook meteen drie. Dit zijn de Kiro Autonomous Agent, Security Agent en DevOps Agent. De eerste kun je zien als een verlengstuk van de Kiro IDE die AWS zelf aanbiedt. Die is er vooral op developers te helpen bij het bouwen van applicaties. De Security Agent moet ervoor zorgen dat applicaties veilig en beveiligd zijn en blijven. Met de DevOps Agent moet het tot slot eenvoudiger worden om problemen met applicaties snel op te lossen.

Nieuwe AI Factories in datacenters van klanten

Met AWS AI Factories kunnen organisaties hun bestaande infrastructuur omzetten naar AI-omgevingen. De service richt zich op het versnellen van AI-adoptie zonder dat bedrijven hun hele infrastructuur hoeven te vervangen. Met AI Factories kunnen organisaties dus doorbouwen op de investeringen die ze al hebben gedaan in hun IT-omgeving.

Met andere woorden, de oplossing integreert met bestaande systemen en breidt deze uit met AI-capaciteiten. Dit maakt het voor organisaties eenvoudiger om de stap naar productie-ready AI te zetten. Let wel, er moet wel AWS-hardware in het eigen datacenter gezet worden om dit mogelijk te maken. Het is dus niet alleen een dienst, maar ook fysieke hardware. Dat is nog best wel wat. Naast AI-accelerators gaat het ook om netwerk, opslag, databases en security. Je maakt van je eigen datacenter dus min of meer een mini-AWS-datacenter. Daarbovenop draaien namelijk ook de nodige services van AWS. AWS beheert de omgeving ook.

De reden waarom AWS dit aanbiedt ligt op zich voor de hand. Het maakt het in ieder geval in theorie eenvoudiger voor organisaties om aan de slag te gaan met AI. Met name voor overheden en gereguleerde industrieën kan dit een uitkomst zijn. Ze hoeven niet de cloud in, maar kunnen gebruikmaken van de eigen omgeving.

AWS wil markt groter maken

Als we de AI-aankondigingen van AWS die we in dit artikel hebben besproken moeten interpreteren, dan is het duidelijk dat het bedrijf de markt voor AI wil uitbreiden. Veel van de aankondigingen moeten het voor meer organisaties mogelijk maken om aan de slag te gaan met (agentic) AI. Uiteraard doet het dit ook om relevant te zijn en te blijven in deze markt.

De nieuwe Nova-modellen moeten AWS beter op de kaart gaan zetten als aanbieder van eigen frontier modellen, met goede prestaties aan een scherpe prijs. Met Nova Forge heeft het nu zelfs nog een extra ijzer in het vuur. Uiteraard moet het daarbij wel voorzichtig zijn dat het niet het doel voorbijschiet waar het met Amazon Bedrock altijd op heeft gehamerd. Dat is dat het keuze wil aanbieden in modellen die klanten kunnen kiezen.

AWS laat verder ook zien dat het hard blijft doorontwikkelen om de onderliggende infrastructuur krachtiger en breder toepasbaar te maken. De nieuwe Trainium3 UltraServers zijn hier een goed voorbeeld van, maar AWS AI Factories draagt hier ook aan bij. Tot slot is het goed om te zien dat AWS ook de verantwoordelijkheid neemt om ervoor te zorgen dat AI-agents optimaal gebruik kunnen maken van alles wat AI-modellen en AI-stacks kunnen bieden.

Al met al hebben we deze week wellicht niet echt hemelbestormende dingen gezien van AWS, maar wel een sterke verbredings- en verdiepingsslag. Dat is op veel manieren wat ons betreft waardevoller dan weer een nieuwe blinkende aankondiging die nog in de kinderschoenen staat.