Google heeft het gebruik van zijn Gemini-modellen door Meta aan banden gelegd omdat het niet voldoende rekenkracht beschikbaar heeft. De maatregel vertraagt interne AI-projecten bij Meta en laat zien dat ook de grootste technologiebedrijven tegen de grenzen van hun AI-infrastructuur aanlopen.
Volgens de Financial Times liet Google Meta rond maart weten dat het niet de volledige gevraagde capaciteit voor Gemini kon leveren. De beperkingen gelden nog steeds en hebben ertoe geleid dat Meta sommige AI-projecten moest uitstellen of aanpassen. Daarnaast zou het bedrijf medewerkers hebben gevraagd zuiniger om te gaan met AI-tokens, de eenheid waarmee het gebruik van AI-modellen wordt gemeten.
Niet alleen Meta zou met de beperkingen te maken hebben gekregen. Ook andere klanten van Google ondervinden volgens ingewijden gevolgen van de schaarste, al is de impact daar kleiner. Meta springt eruit door de uitzonderlijk grote vraag naar Gemini-capaciteit.
De situatie maakt duidelijk dat de enorme investeringen in AI-infrastructuur de vraag nog altijd niet kunnen bijbenen. Grote technologiebedrijven steken tientallen miljarden dollars in chips, datacenters en energievoorziening, maar zien de behoefte aan rekenkracht nog sneller groeien. Vooral inferentie, het uitvoeren van AI-modellen nadat deze zijn getraind, legt steeds meer beslag op de beschikbare capaciteit.
Google probeert die druk op te vangen door extra infrastructuur in te huren. Eerder deze maand sloot het bedrijf een overeenkomst ter waarde van 920 miljoen dollar per maand met SpaceX voor aanvullende AI-capaciteit. Tijdens de presentatie van de kwartaalcijfers in april gaf CEO Sundar Pichai al aan dat Google op korte termijn door een gebrek aan rekenkracht wordt beperkt. Volgens hem had de clouddivisie meer omzet kunnen boeken als alle klantvraag direct kon worden ingevuld.
Muse Spark moet afhankelijkheid verkleinen
De afhankelijkheid van Meta van Gemini is opvallend. Hoewel het bedrijf miljarden investeert om een leidende positie op AI-gebied te veroveren, maakt het intern op grote schaal gebruik van een model van een directe concurrent. Gemini wordt ingezet voor onder meer het detecteren van oplichting, moderatie van schadelijke content, klantenservice, advertentiefunctionaliteit en programmeertaken.
Volgens bronnen koos Meta aanvankelijk voor Gemini omdat het beter presteerde dan de eigen opensourcemodellen uit de Llama-familie. Inmiddels zou het bedrijf steeds vaker overstappen op het nieuwe Muse Spark-model. Dat model wordt intern als concurrerend met Gemini gezien en moet de afhankelijkheid van externe AI-aanbieders verkleinen.
Tegelijkertijd werkt Meta aan een forse uitbreiding van de eigen infrastructuur. Anders dan Google beschikt het bedrijf niet over een publieke cloudomgeving waarop de AI-investeringen kunnen meeliften. Daarom bouwt Meta versneld nieuwe datacenters voor zowel het trainen als het uitvoeren van AI-modellen. Daarvoor is tot en met 2028 een investeringsprogramma van 600 miljard dollar aangekondigd.
Google en Meta hebben geen inhoudelijk commentaar gegeven op de berichtgeving. De capaciteitsproblemen illustreren wel dat de strijd om AI niet langer alleen draait om de kwaliteit van modellen, maar ook om toegang tot voldoende rekenkracht. Zelfs marktleiders blijken die niet altijd direct beschikbaar te hebben.