Het geheime wapen van Google Search is snelheid. Dat heeft de AI-gedreven uitdager Perplexity maar al te goed door. Met hulp van de AI-chips van Cerebras levert het nu Sonar, de “beste AI-antwoordmotor”. Wat houdt het in?
Sonar by Perplexity is allereerst gericht op ontwikkelaars. Het biedt de mogelijkheid om via een API razendsnel antwoorden te genereren. Een direct alternatief voor Google Search is het dus niet; dat is Perplexity.ai wel. Wat Sonar bijzonder maakt, is dat het vanaf het eerste moment gericht is op Cerebras-hardware. We hebben deze AI-chips al eerder genoemd als een alternatief voor het oppermachtige Nvidia. Nu wordt de belofte van extreem snelle AI-berekeningen concreet verpakt in de nieuwe AI-zoekdienst.
Lees ook: Toont Perplexity de AI-gedreven toekomst van zoekmachines?
De hoogst bereikte snelheid is 1.200 tokens per seconde, stelt Perplexity. Dat zit in de buurt van het record van Cerebras, waar naar eigen zeggen 1.500 tokens per seconde werd gehaald op de DeepSeek-R1-versie van Llama 3.3-70B.
Klein, behendig, razendsnel
Het Sonar-model is ook een aangepaste versie van Meta’s Llama 3.3-70B. Het hanteert net als de meeste AI-gebaseerde API’s het OpenAI-format, zodat de compatibiliteit met bestaande code gegarandeerd is. Er zijn vier varianten beschikbaar: Sonar, Sonar Pro, Sonar Reasoning en Sonar Reasoning Pro. De basale optie is bedoeld voor goedkope, snelle zoekresultaten, Pro voor diepgaande vragen en de Reasoning-modellen voor de meest weloverwogen AI-antwoorden. Reasoning draait op DeepSeek-R1, dat ook native draait op Cerebras-hardware.
De Pro-opties hanteren scale pricing, dus hoe meer er ingekocht wordt, hoe voordeliger Perplexity het maakt. We nemen aan dat de vier API’s regelmatig zullen worden gecombineerd. Zoekopdrachten variëren nu eenmaal van eenvoudig naar complex, en het schakelen tussen elk model voorkomt dat appbouwers onnodige kosten oplopen door altijd Reasoning Pro in te zetten, bijvoorbeeld.
Beloftes van snelle zoekmachines zijn allesbehalve nieuw. Jaren geleden benadrukte Google al het belang van bijna onmiddellijke resultaten na een query. Veel investeringen in R&D en infrastructuur zijn nodig geweest om de huidige hegemonie van Google Search te realiseren. En Google zit niet stil: AI Overviews zijn in beperkte vorm al geïntroduceerd. Toch is het reëel om je af te vragen of GenAI een nieuwe kandidaat opwerpt die Google op den duur in populariteit overtreft. Perplexity heeft nog een lange weg te gaan, maar bezit er wel de juiste ingrediënten voor.
Cerebras zelf is feitelijk tegenover Nvidia wat Perplexity in verhouding tot Google is: de voornaamste uitdager, gevoed door een nieuwe AI-aanpak. De chipmaker vertrouwt op ‘wafer-scale’ chips, de grootste halfgeleiders die praktisch te bedenken zijn, waarop AI-modellen in hoog tempo draaien. Wel ontbreekt nog het software-ecosysteem dat Nvidia heeft opgebouwd, en die ‘moat’ is van formaat.
Lees ook: Waarom Nvidia’s rivalen denken dat ze het kunnen overtreffen