Gemini 1.5 Flash is uitgebracht in een kleinere en snellere variant. Google maakt Gemini 1.5 Flash-8B beschikbaar aan een goedkoper tarief.
Uit de aankondiging van Gemini 1.5 Flash-8B lijkt dit kleinere model een betere optie te zijn dan het oorspronkelijke Gemini 1.5 Flash. Het nieuwe model komt aan de helft van de prijs, met een verdubbeling in de snelheid waarmee output gegenereerd wordt.
Grootte is niet de prioriteit bij de smartphone
Doorgaans zijn kleinere modellen minder interessant doordat de prestaties afnemen en alleen eenvoudige taken nog uitvoerbaar zijn. In deze zaak is dat geen nadeel. Gemini 1.5 Flash werd in het voorjaar voorgesteld als de kleinste versie binnen de Gemini 1.5-familie. Het heeft een duidelijk gebruiksscenario: de smartphone-markt. AI-workloads voor dit scenario zijn per definitie klein, doordat de hardware alleen geschikt is voor kleinere prestaties dan bijvoorbeeld op een workstation.
Voor deze minder complexe taken blijkt Gemini 1.5 Flash-8B sneller te kunnen reageren dan Gemini 1.5 Flash. Dit schrijft Gemini API Senior Product Manager Logan Kilpatrick in de aankondiging. Uit de benchmarktesten blijkt het model zeer geschikt voor taken zoals chatten, het omzetten van spraak naar tekst en vertalingen van lange teksten.
Beschikbaar voor ontwikkelaars
De aankondiging is gericht op ontwikkelaars. Zij krijgen toegang tot het model via de Google AI Studio en de Gemini API. Het model kan tot 4.000 verzoeken per minuut verwerken. Tot 14 oktober is het gebruik gratis. De prijs die daarna geldt, is volgens Kilpatrick de laagste prijs die Google vraagt binnen de Gemini-familie. Een overzicht vind je hieronder.
Tip! Gemini Live kan straks in 40 verschillende talen recepten aanbieden