Nebius lanceert een AI-platform onder de naam Token Factory. Het moet bedrijven helpen open-source en aangepaste taalmodellen in productie te brengen.
Token Factory combineert verschillende onderdelen van het AI-productieproces. Denk aan inferencing, fine-tuning en toegangsbeheer binnen één omgeving. Het ondersteunt tientallen open modellen, waaronder DeepSeek, Llama, GPT-OSS van OpenAI, NVIDIA Nemotron en Qwen. Bedrijven kunnen er ook hun eigen modellen op draaien. De dienst draait op Nebius’ bestaande AI Cloud-infrastructuur.
De introductie komt op een moment dat veel organisaties overstappen van experimentele AI-projecten naar praktische toepassingen. Daarbij groeit de behoefte aan open modellen die meer vrijheid geven dan commerciële alternatieven. Het gebruik van zulke modellen brengt echter uitdagingen met zich mee, bijvoorbeeld rond beveiliging, schaalbaarheid en kostenbeheersing. Token Factory moet deze problemen deels wegnemen door automatisering van beheer en monitoring.
Volgens medeoprichter en zakelijk directeur Roman Chernin is het platform ontwikkeld om teams te ontlasten die hun AI-oplossingen willen opschalen zonder voortdurend handmatig in te grijpen. Hij stelt dat bedrijven vooral behoefte hebben aan snelheid, betrouwbaarheid en voorspelbare kosten, en dat Token Factory daar op inspeelt door infrastructuurbeheer grotendeels te automatiseren.
De onderliggende infrastructuur, Nebius AI Cloud 3.0 (Aether), biedt onder meer monitoring, beveiliging en prestaties die zijn getoetst aan industriestandaarden zoals MLPerf Inference.
Transparante kosten per token
Token Factory richt zich op het optimaliseren van modellen na de trainingsfase. Gebruikers kunnen open modelgewichten omzetten naar productieklare systemen met transparante kosten per token. Fine-tuning en distillatie zijn ingebouwd, waarmee modellen kunnen worden aangepast aan bedrijfsdata terwijl de responstijd en kosten volgens Nebius met tientallen procenten kunnen dalen.
De dienst biedt mogelijkheden voor directe implementatie van modellen, zonder aparte infrastructuuropset. Daarnaast ondersteunt Token Factory functies voor teambeheer, projectafscheiding, single sign-on en rollenbeheer, zodat organisaties beter kunnen voldoen aan interne en wettelijke eisen.
De beveiliging voldoet aan standaarden zoals SOC 2 Type II, HIPAA en ISO 27001. Datacenters bevinden zich in de Europese Unie en de Verenigde Staten, met ondersteuning voor datalocatie-eisen en zero-retentionbeleid.
Token Factory vervangt het eerdere Nebius AI Studio en is per direct beschikbaar. Bestaande gebruikers worden automatisch overgezet. Volgens Nebius ondersteunt de nieuwe omgeving inmiddels meer dan zestig open modellen, waaronder toepassingen voor tekstgeneratie, code en beeldverwerking.
Het in Amsterdam gevestigde Nebius is actief in cloudinfrastructuur voor AI en heeft onderzoekscentra in Europa, Noord-Amerika en Israël. Het bedrijf is genoteerd aan de Nasdaq en ontwikkelt zowel software als hardware voor rekencapaciteit, opslag en modelbeheer.