4min Analytics

Google Cloud onthult updates voor Gemini, Imagen, Gemma en Vertex AI

Insight: Analytics

Coen van Eenbergen9 april 2024 16:059 april 2024 16:05

Tijdens Google Cloud Next gaat het ook dit jaar veel over AI. Google Cloud brengt de nodige updates mee voor de bestaande LLM’s binnen Vertex AI. Zo is Gemini 1.5 Pro per direct in public preview, introduceert het Imagen 2.0 om afbeeldingen te genereren en heeft het CodeGemma onthuld. Er is echter nog meer nieuws te melden.

Google heeft ons vorig jaar kennis laten maken met BART. Dit zou een revolutonair AI-model gaan worden. Inmiddels heeft de introductie van Gemini de prestaties van BART doen verbleken. Vandaag zijn we alweer aangekomen bij Gemini 1.5 Pro. Het is een verbeterde versie van Gemini, met als krachtigste feature de enorme hoeveelheid input die in een prompt te steken is om vervolgens AI op toe te passen. Gemini 1.5 Pro heeft namelijk een input context window van 1 miljoen tokens. Dat is meer dan welk model dan ook op dit moment.

Tip: Google introduceert eerste eigen ARM-CPU, genaamd Axion

Imagen 2.0

Met Imagen was het al mogelijk om afbeeldingen te genereren. Met Imagen 2.0 kan dit wederom een stuk beter, maar is het eveneens mogelijk om ‘live’ afbeeldingen te genereren op basis van text prompts, met een afspeelduur van 4 seconden. Hoe organisatie dit effectief in kunnen zetten, zal nog even moeten blijken. Wat we veel belangrijker vinden aan Imagen 2.0 is de mogelijkheid om afbeeldingen te bewerken. Zowel binnen als rondom de afbeelding kunnen zaken worden aangepast. Gebruikers kunnen bijvoorbeeld op een eenvoudige manier elementen uit een foto laten verwijderen of juist laten toevoegen. Daarnaast is het mogelijk om een digitaal watermerk toe te voegen. Organisaties als Shutterstock en Rakuten werken al met Imagen 2.0.

CodeGemma

Binnen de Gemma-familie van LLM’s introduceert Google nu twee versies van CodeGemma. Dit betreft een versie met 7 miljard parameters en een model met 2 miljard parameters. Hiermee is het mogelijk om programmeercode te verbeteren, maar ook om tijdens het programmeren complete functies te genereren of simpelweg geholpen door code verder af te maken. Het CodeGemma 7B-model draait in de cloud en werkt middels een integratie in de IDE, maar het 2B-model is klein genoeg om op een laptop te draaien.

De CodeGemma-modellen zijn getraind op datasets met meer dan 500 miljard tokens. Ze zijn specifiek getraind om code beter te begrijpen dan de Engelse taal. Hierdoor zijn de modellen volgens Google in staat om veel accuratere code te genereren. De modellen kunnen uiteraard met verschillende programmeertalen overweg, waaronder Python, JavaScript, Java en meer.

Vertex AI-verbeteringen

Ook binnen Vertex AI heeft Google Cloud de nodige verbeteringen in petto. Zo wordt het eenvoudiger om prompts te beheren. Het grootste pijnpunt op dit moment was experimenteren, migreren en het monitoren van prompts. Met Vertex AI Prompt Management is dat verleden tijd, je kan nu prompts delen binnen een tam, inclusief versioning, dus je kan altijd teruggrijpen naar eerdere versies. Hiernaast biedt Google de mogelijkheid om middels AI suggesties te doen om je prompt verder te verbeteren.

Daarnaast kunnen gebruikers twee vergelijkbare prompts naast elkaar leggen en de resultaten vergelijken om te zien welke prompt het beste resultaat produceert. Op die manier kunnen organisaties eenvoudiger stappen voorwaarts maken in prompt engineering.

Vervolgens heeft Google zogenaamde Evalution Tools geïntroduceerd, die gebruikers helpen om te bepalen welke prompt met welk model het beste resultaat oplevert. Daarbij wordt gekeken hoe goed de prompt is nageleefd door het model, hoeveel de output nog lijkt op de input, wat de kwaliteit ervan is, maar ook hoeveel tijd het kost. Op die manier is eenvoudiger te bepalen welk model beter is.

Enterprise Truth, modellen actueel houden met eigen data

Alle foundation models zijn getraind op datasets en na een bepaalde datum stoppen die. Dat betekent dat alle modellen elke dag een stukje ouder en minder actueel zijn. Voor sommige toepassingen is dat een probleem, want organisaties willen de mogelijkheid hebben om te werken met actuele data. Daarvoor introduceert Google wat het noemt Enterprise Truth, waarbij je een bestaand model kan grounden met je eigen data, zodat die toch kan beschikken over de data die je nodig hebt.

De data die je koppelt aan het model, wordt er dus niet aan toegevoegd, maar tijdens het uitvoeren van jouw prompts beschikt het model wel over die data om de output te genereren. Mocht je bijvoorbeeld een dagelijkse samenvatting willen genereren van een beursdag, dan is het wel handig als je het model de koersstanden voedt. Dit kan echter ook iets eenvoudigs zijn als de knowledge base van je eigen organisatie.

De hoeveelheid updates voor de LLM’s en Vertex AI liegen er niet om. Google blijft op een hoog tempo nieuwe AI-oplossingen en modellen ontwikkelen. Dit terwijl veel organisaties nog zoekende zijn hoe ze AI nu precies moeten gaan inzetten.

Lees ook: Google Cloud biedt sovereign cloud voor AI in elk datacenter

Lees meer over Analytics

Databricks breekt met LTAP-architectuur de grens tussen OLTP en OLAP

Databricks introduceert LTAP (Lake Transactional/Analytical Processing), een nieuwe architectuur die de schei...

Berry Zwets 1 dag geleden

Salesforce koopt Fin: AI-agents voor de klantenservice

Salesforce heeft een definitieve overeenkomst getekend om Fin, een ontwikkelaar van AI-agents, over te nemen ...

Laura Herijgers 2 dagen geleden

Een jaar IFS Nexus Black: grote impact op FSM en maakindustrie

IFS Nexus Black bestaat rond deze tijd een jaar. Met dit programma wil IFS de ontwikkeling van AI-oplossingen...

Sander Almekinders 13 mei 2026

De interface is dood, leve de agent: ServiceNow gaat headless en opent zijn platform

Deur staat open voor agents van derden

Coen van Eenbergen 13 mei 2026

Expert aan het woord

Liquid cooling dwingt datacenters tot andere ontwerpkeuzes

De opkomst van AI-workloads verandert de spelregels voor datacenters....

Slimmer vergaderen begint met het juiste ecosysteem

De moderne vergaderruimte vraagt meer dan goede hardware alleen. Voor...

Ondersteun kritieke workloads met all-NVMe active-active storage voor non-stop bedrijfsvoering

De bedrijfsinfrastructuur heeft een keerpunt bereikt waarop geplande ...

Datasoevereiniteit begint bij grip: niet alleen op databases, maar óók op data zelf

De afgelopen tien jaar groeide het vertrouwen in hyperscalers explosi...

Tech calendar

GITEX AI EUROPE 2026

30 June 2026 Messe Berlin Exhibition Center, South Entrance

GOTO Copenhagen 2026

28 September 2026 TAP1, Raffinaderivej 10, 2300 København S, Denmark

Whitepapers

Klarrio: Security by design als fundament voor software

Klarrio heeft een whitepaper uitgebracht over zijn aanpak van securit...

Klarrio: Architectuur is grootste knelpunt of grootste versneller

Klarrio heeft een whitepaper uitgebracht over de rol van architectuur...

Hoe je stap voor stap een AI-gedreven kennisapplicatie bouwt

Kennis is de motor van elke organisatie, maar vaak ook haar grootste ...

Waarom automatisering onmisbaar is in moderne cybersecurity

Welkom bij ‘Het einde van cyberrisico’s’. We hebben een serie v...