Microsoft breidt Azure AI Services uit met nieuwe GPT-4o Mini-audiomodellen. Deze maken het mogelijk om spraak-naar-tekst- en tekst-naar-spraakfunctionaliteiten efficiënter te implementeren, met behoud van kwaliteit.
De nieuwe GPT-4o Mini-audiomodellen zijn nu als preview beschikbaar binnen Azure AI Services. De modellen zijn ontwikkeld om audio-gerelateerde AI-taken uit te voeren met minder rekenkracht dan hun grotere tegenhangers.
Twee versies
Het gaat om de beschikbaarheid van GPT-4o-Mini-Realtime-Preview en GPT-4o-Mini-Audio-Preview. Volgens Microsoft hebben beide modellen het grote voordeel dat ze geavanceerde audio-mogelijkheden bieden tegen een fractie van de kosten van de GPT-4o-audiomodellen. Gebruikers kunnen rekenen op 25 procent van de kosten van de bestaande GPT-4o-audiomodellen.
Beide versies zijn compatibel met de bestaande Realtime API en Chat Completion API voor integratie met applicaties, zodat alles naar behoren functioneert.
Het verschil tussen GPT-4o-Mini-Realtime-Preview en GPT-4o-Mini-Audio-Preview zit hem in de doeleinden. De eerste maakt real-time, voice-gebaseerde interactie mogelijk, wat handig kan zijn voor customer service en virtuele assistenten. GPT-4o-Mini-Audio-Preview is op zijn beurt gericht op high-quality audio-interacties. Dat komt bijvoorbeeld van pas voor sentimentanalyse en tekst-naar-audio contentcreatie.
Tip: Azure AI Studio algemeen beschikbaar gemaakt met GPT-4o en Phi-3-vision