CoreWeave lanceert serverless platform voor reinforcement learning

CoreWeave lanceert serverless platform voor reinforcement learning

CoreWeave, aanbieder van GPU-as-a-Service, zet een stap in de uitbreiding van zijn AI-diensten met de lancering van een serverless platform voor reinforcement learning. Het bedrijf wil bedrijven helpen om complexere AI-modellen sneller te trainen, zonder dat ze zelf in dure hardware hoeven te investeren.

Dat meldt The Register. Reinforcement learning, of RL, is een methode binnen machine learning waarbij een model leert door positieve resultaten te belonen en fouten af te straffen. De techniek is de afgelopen tijd populair geworden als manier om taalmodellen verder te verfijnen. Zo werd het redeneervermogen van DeepSeek R1 mede bereikt door gebruik te maken van RL-technieken.

Het nieuwe platform, Serverless RL, combineert technologie uit twee recente overnames van CoreWeave: OpenPipe en Weights & Biases. OpenPipe richtte zich op het bouwen van op RL gebaseerde AI-agenten, terwijl Weights & Biases een serverless infrastructuur biedt voor GPU-versnelde workloads. Door deze kennis te bundelen wil CoreWeave het proces van modeloptimalisatie toegankelijker maken voor een breder zakelijk publiek.

CoreWeave positioneert zich als een GPU-as-a-Service-aanbieder die zich volledig richt op AI-rekenkracht. De infrastructuur van CoreWeave spits zich sterk toe op Nvidia-hardware. Dat levert een hoge mate van efficiëntie op, maar maakt het platform tegelijk afhankelijk van één leverancier. De GPU-clusters zijn opgebouwd rond Nvidia’s eigen netwerkarchitectuur, inclusief InfiniBand-ondersteuning. Ze worden aangestuurd met CoreWeave’s eigen beheersoftware. Daarmee mikt het bedrijf op klanten die grootschalige AI-training of inference willen uitvoeren zonder zich te verdiepen in de onderliggende infrastructuur.

De serverless architectuur is cruciaal voor het nieuwe platform. Workloads worden automatisch verdeeld over beschikbare GPU’s, zodat ongebruikte capaciteit optimaal wordt benut. Veel AI-toepassingen zijn bovendien stateless, waardoor ze geen informatie hoeven op te slaan tussen sessies. Bedrijven kunnen hun modellen daardoor trainen zonder eigen servers of virtuele machines te beheren. CoreWeave benadrukt dat klanten alleen betalen voor het aantal tokens dat tijdens het fine-tuningproces wordt gegenereerd.

Afhankelijkheid van grote klanten verminderen

De introductie van Serverless RL past binnen CoreWeave’s bredere strategie om minder afhankelijk te worden van een handvol grote klanten. Volgens het beursprospectus dat eerder dit jaar werd ingediend, was in 2024 nog 77 procent van de omzet afkomstig van slechts twee partijen. Dat aandeel lijkt inmiddels af te nemen, met nieuwe klanten als Google en IBM, maar de afhankelijkheid blijft groot. 

Tegelijkertijd is er onrust rond de GPU-aanbieder. Microsoft, jarenlang een belangrijke partner, zou ontevreden zijn over gemiste deadlines en leveringsproblemen en heeft naar verluidt enkele overeenkomsten beëindigd. Dat besluit zou CoreWeave miljarden kunnen kosten, aangezien Microsoft eerder toezeggingen deed ter waarde van ongeveer tien miljard dollar voor de komende vijf jaar.

Daarnaast nam CoreWeave onlangs Monolith AI over, een onderneming die kunstmatige intelligentie inzet om natuurkundige en technische simulaties te versnellen. Daarmee probeert het bedrijf zijn positie te verstevigen als leverancier van gespecialiseerde AI-infrastructuur voor uiteenlopende industrieën.