Microsoft Magma brengt agentic AI naar robotsystemen

Microsoft Research presenteert Magma. Dit is een geïntegreerd AI-basismodel dat visuele- en taalverwerking combineert om software-interfaces en robotsystemen te besturen.

Dit meldt Ars Technica. Als de resultaten ook buiten Microsofts interne tests standhouden, dan betekent dit een belangrijke stap vooruit voor een veelzijdige multimodale AI die zowel in de fysieke als digitale wereld interactief kan opereren.

Microsoft beweert dat Magma het eerste AI-model is dat niet alleen multimodale data verwerkt, zoals tekst, afbeeldingen en video, maar er ook direct op kan handelen. En dit ongeacht of het gaat om het navigeren van een gebruikersinterface of het manipuleren van fysieke objecten. Het project is een samenwerking tussen onderzoekers van Microsoft, KAIST, de University of Maryland, de University of Wisconsin-Madison en de University of Washington.

Er waren eerder soortgelijke AI-gestuurde robotica-projecten. Denk aan Google’s PALM-E en RT-2 of Microsofts ChatGPT for Robotics. Die gebruikten grote taalmodellen (LLM’s) als interface. Maar in tegenstelling tot veel eerdere multimodale AI-systemen, die aparte modellen nodig hebben voor perceptie en controle, integreert Magma deze capaciteiten in één basismodel.

Stap naar agentic AI

Microsoft positioneert Magma als een stap naar agentic AI. Daarbij gaat het om een systeem dat autonoom plannen opstelt. En dat complexe taken kan uitvoeren namens een mens, in plaats van alleen vragen te beantwoorden over wat het ziet. Microsoft schrijft in zijn onderzoeksrapport dat Magma plannen kan formuleren en acties uitvoeren. Als de gebruiker een doel omschrijft dan is Magma in staat dat doel te bereiken.

Microsoft is niet de enige die agentic AI nastreeft. OpenAI experimenteert met AI-agenten via projecten zoals Operator. Die applicatie kan UI-taken in een webbrowser uitvoeren. Google verkent agentic AI met meerdere agentic projecten, waaronder Gemini 2.0.

Meer dan een perceptueel model

Magma bouwt voort op transformer-gebaseerde LLM-technologie. Hierbij worden trainingsgegevens in een neuraal netwerk ingevoerd. Toch verschilt het van traditionele taalmodellen als GPT-4V. In plaats van zich alleen te richten op verbale intelligentie, voegt Magma ook ruimtelijke intelligentie toe. Door training met een mix van afbeeldingen, video’s, robotica-data en UI-interacties, beweert Microsoft dat Magma een écht multimodale agent is. En niet slechts een perceptueel model.

Lees meer over Applications

Topartikel

De paniekzaaierij van Anthropic over AI is niet wat het lijkt

"Recursieve AI" blijft puur speculatief

Erik van Klinken 5 juni 2026

Voormalig hoofd AI bij Meta noemt xAI van Musk een “mislukking”

In een ongewoon openhartige beoordeling van een AI-concurrent heeft Yann LeCun, oprichter van AMI Labs en voo...

Erik van Klinken 2 dagen geleden

Kleine groep gebruikers houdt toegang tot Mythos

Anthropic heeft de toegang tot zijn meest geavanceerde AI-modellen voor een groot deel van de gebruikers stil...

Mels Dees 1 dag geleden

Topartikel

Claude Fable 5 is Mythos voor het grote publiek

Na maanden van speculatie is een LLM op het niveau van Mythos Preview eindelijk een volledig beschikbaar AI-m...

Erik van Klinken 9 juni 2026

Expert aan het woord

Tech calendar

GITEX AI EUROPE 2026

30 June 2026 Messe Berlin Exhibition Center, South Entrance

GOTO Copenhagen 2026

28 September 2026 TAP1, Raffinaderivej 10, 2300 København S, Denmark

Whitepapers

Microsoft Magma brengt agentic AI naar robotsystemen

Stap naar agentic AI

Meer dan een perceptueel model

Blijf op de hoogte, abonneer!

GitHub Copilot, AI-assistent van het eerste uur, staat zwaar onder druk

Post-Mythos security is ook nog heel erg pre-Mythos security

AI zet decennia cybersecurity op zijn kop

SpaceX koopt Cursor voor 60 miljard

AI observability and container security with Wiz at KubeCon

How Linkerd brings simplicity to service mesh and AI security

How to migrate from Redis to Valkey with zero downtime

How Harness secures AI-generated code across the SDLC

Liquid cooling dwingt datacenters tot andere ontwerpkeuzes

Slimmer vergaderen begint met het juiste ecosysteem

Ondersteun kritieke workloads met all-NVMe active-active storage voor non-stop bedrijfsvoering

Datasoevereiniteit begint bij grip: niet alleen op databases, maar óók op data zelf

GITEX AI EUROPE 2026

GOTO Copenhagen 2026

Klarrio: Architectuur is grootste knelpunt of grootste versneller

Hoe je stap voor stap een AI-gedreven kennisapplicatie bouwt

Waarom automatisering onmisbaar is in moderne cybersecurity