Google Cloud breidt Vertex AI uit, klanten meer dan 100 LLM’s tot hun beschikking

Google Cloud biedt toegang tot meer dan 100 LLM’s, maar laat klanten ook LLM’s op maat maken. Google heeft zijn bestaande LLM’s bijgewerkt en modellen van allerlei partijen toegevoegd aan het aanbod. De modellen kunnen nu ook naadloos worden geïntegreerd in de applicaties van organisaties, met dank aan Extensions.

Het is inmiddels alweer zes maanden geleden dat Google Vertex AI onthulde. Nu komt daar een serieuze uitbreiding bovenop. Het succes van Vertex AI is volgens Google enorm. Veel enterprise-organisaties gebruiken Vertex AI en elke maand komen er 15 keer meer klanten bij.

Met Vertex AI kunnen klanten nieuwe machine learning-modellen bouwen, maar ook bestaande AI-modellen op maat maken met eigen enterprise data. Ook kunnen modellen worden geïntegreerd met allerlei API’s waardoor automatisch acties kunnen worden uitgevoerd. Een model kan dus naadloos worden geïntegreerd en uitgerold binnen bestaande applicaties van een organisatie, waarbij er rekening kan worden gehouden met privacy en veiligheid en het gebruik van verantwoordelijke AI.

Het belangrijkste onderdeel van Vertex AI is waarschijnlijk de Model Garden, waardoor klanten aan de slag kunnen met foundational AI-modellen. Ze kunnen middels API’s toegang krijgen tot meer dan 100 LLM’s waar ze vervolgens mee aan de slag kunnen. Of het nu gaat om het genereren van een reactie op een conversatie zoals ChatGPT, of het genereren van code, afbeeldingen en tekstsamenvattingen.

Nieuwe en bijgewerkte modellen

Google heeft allemaal nieuwe modellen toegevoegd die Vertex AI nog krachtiger maken. Zo is het Llama 2-model van Meta toegevoegd en het Falcon-model van de Technology Innovative Institute. Het Claude 2-model van Anthropic is aangekondigd en moet binnenkort beschikbaar zijn.

Eigen LLM’s nog beter

Google Cloud heeft daarnaast ook de eigen modellen voorzien van de nodige updates. Hiermee komt de expertise van het Google Deepmind-team ook beschikbaar voor klanten. PaLM 2 is nu beschikbaar in 38 talen en kan reactie vormgeven met de eigen enterprise data van de klant. Ook zijn langere antwoorden en samenvattingen van zeer lange documenten, zoals research papers, mogelijk. PaLM 2 ondersteunt 32.000 tekens, genoeg om een 85 pagina’s tellend document als input te voeren.

Voor het genereren van programmeercode heeft Google het Codey-model. Dit model heeft volgens Google een update gekregen en zou nu 25 procent meer accuraat moeten zijn. Tot slot heeft Imagen een update gekregen om nog beter afbeeldingen te genereren. Het is mogelijk om afbeeldingen te bewerken en om watermerken toe te voegen.

Op maat maken van bestaande AI-modellen

Een veel belangrijkere nieuwe feature is waarschijnlijk het op maat maken van bestaande modellen. Je kan als organisatie nu je eigen data gebruiken om het PaLM 2-model voor tekst te verbeteren op basis van je bedrijfsdata. Hierdoor ondersteunt het model de manier van schrijven binnen je organisatie, maar ook de context van documenten beter. Iets wat in bepaalde industrieën erg waardevol zal zijn. De bedrijfsdata wordt overigens niet toegevoegd aan het PaLM 2-model. Eventuele bedrijfsgeheimen kunnen zo niet uitlekken.

Ook is het mogelijk om via een prompt reinforcement learning toe te passen. Gebruikers kunnen het model dus vertellen wat juist en onjuist is. Dit noemt Google Reïnforcement Learning met Human Feedback (RLHF). Tot slot kan het Imagen-model worden aangepast zodat alle afbeeldingen de brand guidelines van de organisatie in acht nemen. Dit kan door maximaal 10 afbeeldingen toe te voegen die voldoen aan de brand guidelines.

Op maat maken AI-model met Vertex AI Extensions

De foundation modellen die Google Cloud beschikbaar stelt zijn enorm krachtig, maar tegelijk ook meteen verouderd. Na het beschikbaar stellen van de modellen worden ze namelijk niet meer bijgewerkt met nieuwe informatie die beschikbaar komt. Dat is voor sommige use cases erg lastig. Soms heb je actuele data nodig om tot een goed resultaat te komen. Of wil je je eigen enterprise data gebruiken om het resultaat van het AI-model te verbeteren.

Hiervoor moet je het model dus eigenlijk op maat maken. Dat zou extreem kostbaar worden als je voor elke klant het model opnieuw moet trainen als je deze op maat wilt maken. Google werkt daarom met extensies. De Vertex AI Extensions bieden een set met developer tools, waarmee modellen middels API’s kunnen worden verbonden met real-time data, of webhooks om acties uit te voeren. Hierdoor kunnen ontwikkelaars zeer krachtige applicaties bouwen, denk aan digitale assistenten, zoekmachines en automatische workflows.

De mogelijkheden zijn enorm. Organisaties kunnen bijvoorbeeld een HR-databases toevoegen en vervolgens een chatbot creëren die HR-taken uitvoert voor werknemers. Ontwikkelaars kunnen hun interne codebases toevoegen en de code laten checken op bugs en kwetsbaarheden. Dit kan ook automatisch worden herhaald als er nieuwe kwetsbaarheden opduiken.

Het toevoegen van een CRM- of Service-omgeving kan ervoor zorgen dat klanten sneller hun problemen kunnen oplossen middels een chatbot, of sneller een afspraak kunnen plannen waarbij er al diagnose is uitgevoerd en de organisatie weet wat voor onderhoud er nodig is.

Zowel voor ontwikkelaars als data analisten is de Model Garden een ideale speeltuin, aldus Google. We gaan de komende maanden ongetwijfeld zien hoe Vertex AI wordt ontvangen.

Google Cloud breidt Vertex AI uit, klanten meer dan 100 LLM’s tot hun beschikking

Nieuwe en bijgewerkte modellen

Eigen LLM’s nog beter

Op maat maken van bestaande AI-modellen

Op maat maken AI-model met Vertex AI Extensions

Blijf op de hoogte, abonneer!

Cisco komt met Antares SLM’s: hoe sporen deze modellen kwetsbaarheden in code op?

Claude Opus 5: nagenoeg Fable voor de helft van de prijs

Het water- en energieverbruik van datacenters in de juiste context

Helios: AMD groeit naar rack-scale AI-systeem

AI security threats facing open source ecosystems in 2026

Why OpenTelemetry is winning the observability battle

How Nutanix is tackling multi-cloud Kubernetes and AI workloads

Microsoft reveals how it scales Kubernetes for OpenAI

Liquid cooling dwingt datacenters tot andere ontwerpkeuzes

Slimmer vergaderen begint met het juiste ecosysteem

Ondersteun kritieke workloads met all-NVMe active-active storage voor non-stop bedrijfsvoering

Datasoevereiniteit begint bij grip: niet alleen op databases, maar óók op data zelf

Dreamforce

GOTO Copenhagen 2026

NetApp INSIGHT 2026

Manhattan EMEA Exchange

Klarrio: Architectuur is grootste knelpunt of grootste versneller

Hoe je stap voor stap een AI-gedreven kennisapplicatie bouwt

Waarom automatisering onmisbaar is in moderne cybersecurity