Google werkt aan een AI agent die zelfstandig een webbrowser kan gebruiken om eindgebruikers te helpen alledaagse taken te automatiseren. Hiermee gaat de techgigant de concurrentie aan met Anthropic die een soortgelijke feature onlangs in bèta presenteerde.
Volgens The Information werkt Google in het diepste geheim aan ‘Project Jarvis’. Dit project houdt een ‘computergebruikende’ AI agent in dat een webbrowser, in dit geval natuurlijk Chrome, kan gebruiken voor het uitvoeren van alledaagse taken van eindgebruikers.
Functionaliteit Jarvis
De AI agent geeft antwoord op de prompts van eindgebruikers door regelmatig screenshots te nemen van wat op hun computerscherm zichtbaar is. Dit heeft dan weer wat weg van de Recall-functie van Windows op Copilot+-pc’s. Vervolgens interpreteert de AI agent deze screenshots voordat deze actie onderneemt met (automatisch) klikken op een knop of tekst in een veld invullen.
De functionaliteit van ‘Jarvis’ zou zich in eerste instantie richten op onderzoek, online winkelen en het boeken van vluchten. De feature komt mogelijk al in december dit jaar in preview en vormt weer een uitbreiding van Google’s Gemini LLM. In december zou ook de laatste iteratie van Gemini worden gepresenteerd.
Concurrentie met Anthropic
Met de komst van Jarvis gaat Google de concurrentie aan met Anthropic. Deze AI-leverancier introduceerde onlangs voor zijn Claude 3.5 Sonnet LLM als update een gelijkwaardige agent die de computer van een eindgebruiker kan overnemen.
Ook deze specifieke agent kan zoeken op het internet, maar ook lokale bestanden bekijken en als actie op knoppen klikken. Hiermee kan de AI agent dan bestanden of programma’s voor eindgebruikers openen.
Lees ook: Claude 3.5 Sonnet kan je volledige computer gebruiken na update