Nvidia kondigt de lancering aan van microservices waarmee AI-developers generatieve AI-toepassingen kunnen bouwen die data in meerdere talen kunnen opslaan en ophalen. Dit maakt het eenvoudiger om nationale taalbarrières te doorbreken.
Om gegevensverwerking voor generatieve AI in verschillende talen nauwkeuriger te maken, introduceert Nvidia meertalige mogelijkheden met behulp van Nvidia NeMo Retriever. Deze software kan gegevens in verschillende talen en formaten begrijpen en omzetten in tekst. Dit maakt contextbewuste resultaten mogelijk.
Met NeMo Retriever kunnen ontwikkelaars pipelines bouwen voor het verzamelen en ophalen van informatie voor AI-modellen. Dit omvat het extraheren van gestructureerde en ongestructureerde gegevens uit tekst, documenten, tabellen en soortgelijke bronnen. Het model voorkomt duplicaten door informatie om te zetten in een taal die door AI begrepen wordt en deze in een vectorendatabase op te slaan met behulp van embeddings.
Wiskundige representaties
Embeddings zijn complexe wiskundige representaties die eigenschappen en relaties tussen woorden, zinnen en andere soorten gegevens vastleggen. Hiermee kan bijvoorbeeld de “nabijheid” in betekenis tussen woorden of zinnen worden begrepen, zoals tussen “kat” en “hond”, die beide huisdieren zijn. Aan de andere kant zijn “toaster” en “hond” minder verwant, hoewel beide vaak in huizen voorkomen.
Volgens Kari Briski, vice-president van generatieve AI-software bij Nvidia, verhoogt het gebruik van Retriever voor het embedden en ophalen van gegevens in de oorspronkelijke taal de nauwkeurigheid. In een interview met SiliconANGLE merkte Briski op dat het merendeel van de AI-trainingsdata in het Engels beschikbaar is, wat vaak leidt tot een “lost in translation”-effect bij vertalingen.
“Nauwkeurigheid is essentieel. En de meeste open data in de wereld is in het Engels, wat de reden is voor de drang naar soevereine AI,” zei Briski. “Het versterken van andere talen door data en retrievers in hun natuurlijke taal te ondersteunen zal de nauwkeurigheid verbeteren.”
Bij de eerste release van Retriever vroegen klanten al snel om meertalige ondersteuning vanwege de verloren nauwkeurigheid bij gebruik van vertaalsoftware. Bedrijven werken niet in slechts één taal. Ze kunnen Engelse documenten, Duitse tests, Japanse onderzoeksrapporten of Russische teksten gebruiken. Als dergelijke informatie door meerdere vertaalhulpmiddelen wordt gehaald, daalt de nauwkeurigheid steeds verder.
Check op relevantie
Naast gegevensverzameling kan NeMo Retriever resultaten evalueren en opnieuw rangschikken om ervoor te zorgen dat antwoorden correct zijn. Wanneer een query via de Retriever wordt verstuurd, onderzoekt deze de vectorendatabase en rangschikt de antwoorden op relevantie, wat een extra laag van nauwkeurigheid toevoegt.
Nvidia heeft samengewerkt met DataStax om NeMo Retriever te gebruiken voor het vectoriseren van content van Wikipedia. Dankzij de technologie en gespecialiseerde software van Nvidia kon het bedrijf 10 miljoen gegevensitems in AI-geschikte formaten vectoriseren. Dit lukte in minder dan drie dagen. Terwijl dit een proces is dat normaal 30 dagen zou duren.
Andere partners van Nvidia, waaronder Cohesity, Cloudera, SAP SE en VAST Data, integreren al ondersteuning voor deze nieuwe microservices. Dit om grote meertalige gegevensbronnen te ondersteunen. Dit omvat technieken zoals retrieval-augmented generation (RAG), waarmee voorgetrainde generatieve AI gebruik kan maken van realtime gegevensbronnen voor rijkere en relevantere informatie. Door meertalige bronnen aan te passen, kunnen bedrijven nog meer gegevens benutten.
Momenteel werkt NeMo Retriever voor meertalige toepassingen alleen voor tekstophaling en antwoorden. Dat meldde Briski. “We werken aan zaken zoals multimodale data, inclusief afbeeldingen, pdf’s en video’s voor de toekomst,” voegde ze toe. “We focussen ons nu op tekst. Als je tekst goed onder de knie hebt, kun je daarna uitstekend werk leveren met andere modaliteiten.”
Lees meer: Officieel onderzoek naar mogelijk monopolie Nvidia