Het oudgediende Microsoft zette in maart 2024 een eigen AI-team op. Het doel: van de afhankelijkheid van OpenAI af zijn en zelf een vuist maken tegen Google, Meta, Anthropic en co. De eerste eindproducten zijn een feit, MAI-Voice-1 en MAI-1-preview. Wat betekent deze eerste zet van Microsoft AI?
Microsoft’s eigen Copilot-aanbod is overwegend mogelijk gemaakt door een deal met vroege GenAI-koploper OpenAI. De ChatGPT-bouwer ontving 10 miljard dollar en gaf Microsoft in ruil hiervoor directe toegang tot modellen als GPT-4 en nu GPT-5. Die stand van zaken leek eigenlijk altijd een tijdelijke oplossing voor Microsoft, dat een flinke achterstand te verwerken heeft om zelf LLM’s te bouwen op ‘state-of-the-art’-niveau.
Afstemmen
Opvallend genoeg kiest Microsoft voor een model dat stemmen genereert om het spits af te bijten. MAI-Voice-1 levert AI-gedreven spraak op basis van een eenvoudige prompt. In een Copilot Labs-ervaring valt vooral de hoogwaardige audiokwaliteit op, maar de precieze invulling voor een groter publiek laat nog op zich wachten. Vermoedelijk hoopt Microsoft dat gebruikers van AI-pc’s hun microfoon aanzetten en gaan praten met Copilot.
Het is nog vroeg om dit te stellen, maar we achten de kans groot dat Microsoft en Google op den duur dit strijdtoneel zullen uitbouwen. Daar waar Gemini op Android tegenwoordig de functionaliteit van Google Assistant aan het overnemen is, kan op Windows een soortgelijke AI-kompaan van dienst zijn. De vraag is of dit werkelijk de voorkeur geniet boven tekstgedreven communicatie met AI-tools.
In de arena
Met het tweede model, MAI-1-preview, stapt Microsoft welhaast letterlijk in de arena. Specifiek heeft het bedrijf dit model losgelaten op LMArena, een blinde smaaktest tussen verschillende LLM’s. Op dit platform beantwoorden meerdere modellen dezelfde prompt van een gebruiker, waarbij laatstgenoemde aangeeft welke men prefereert.
MAI-1-preview moet het fundament leggen voor een eerste eigen universeel AI-model van Microsoft. Dat wil zeggen: het moet de functionaliteit van OpenAI’s modellen binnen Copilot overnemen en meer features later mogelijk maken.
Van één naar meer
Microsoft heeft naar eigen zeggen grote ambities, maar het geloof bij de techreus is dat één AI-alleskunner in de vorm van een MAI-1 onvoldoende is. Meerdere gespecialiseerde modellen zouden werkelijk de grote stap moeten betekenen. Of dit in de vorm is van Gemini’s “Gems”, waarbij gebruikers een karakter of nadruk kunnen leggen bij het gedrag van Gemini, is onduidelijk.
Het is net zozeer mogelijk dat Microsoft kiest voor compacte LLM’s, ook wel Small Language Models. Eerder lanceerde het al een reeks aan Phi-modellen die even compact als beperkt waren. De hoop binnen Redmond is dat de expertise van Microsoft AI (MAI) genoeg is om mee te doen met, hoe raar het ook klinkt, de ‘grote jongens’ onder de AI-bedrijven.
Lees ook: Microsoft maakt zijn Phi-4 kleine taalmodel open-source Â