Nvidia-model Fugatto kan audio afmaken en aanpassen

Het model kan stemmen aanpassen en geluiden genereren, maar er zijn voorlopig geen plannen om de technologie op korte termijn beschikbaar te maken.

Fugatto, voluit Foundational Generative Audio Transformer Opus 1, belooft vooral waardevol te worden voor muziek-, game- en filmproducenten. Nvidia betreedt hiermee een concurrerende markt waarin al meerdere spelers zich richten op het genereren van audio of video op basis van prompts. Zo onthulde OpenAI eerder dit jaar het nog niet beschikbare Sora-model, dat video’s kan genereren op basis van tekst. Nvidia’s model onderscheidt zich echter door zijn meer geavanceerde capaciteiten.

Fugatto kan een audiobestand significant aanpassen. Zo kan een stukje pianospel worden omgezet in een audiobestand waarin het klinkt alsof een man zingt. Ook kan een gesproken boodschap door het model worden aangepast naar een ander accent. Voor de training van het nieuwe model maakte Nvidia gebruik van open-source data.

Het is echter nog onduidelijk of en hoe het model op de markt komt. Dit hangt deels samen met de zorgen over misbruik van audio- en videomodellen. “Elke generatieve technologie brengt altijd wat risico’s met zich mee, omdat mensen het kunnen gebruiken om dingen te genereren die we liever niet zouden willen”, aldus vice president of applied deep learning research Bryan Catanzaro van Nvidia. “Daar moeten we voorzichtig mee zijn, en daarom hebben we geen directe plannen om dit uit te brengen.”

Tip: Onduidelijkheid over trainingsdata Sora-model voor genereren video’s

Lees meer over Analytics

Topartikel

VS blokkeert AI-model Anthropic Fable: wat betekent dit voor Europa?

De Verenigde Staten hebben voor het eerst een geavanceerd AI-model geblokkeerd voor niet-Amerikaanse gebruike...

Coen van Eenbergen 1 dag geleden

Expert aan het woord

Tech calendar

GITEX AI EUROPE 2026

30 June 2026 Messe Berlin Exhibition Center, South Entrance

GOTO Copenhagen 2026

28 September 2026 TAP1, Raffinaderivej 10, 2300 København S, Denmark

Whitepapers

Nvidia-model Fugatto kan audio afmaken en aanpassen

Blijf op de hoogte, abonneer!

Chris Wright: Metal-to-agent staat aan de basis van schaalbare enterprise AI

AI zet decennia cybersecurity op zijn kop

Nederlands ToqanClaw is Europees OpenClaw-alternatief

Scaling at speed: Hoe AI de blauwdruk van het moderne datacenter herschrijft

Cisco doubled down on compute for the AI and edge era

How Harness secures AI-generated code across the SDLC

How Google scaled Kubernetes to 130,000 nodes for AI workloads

How JFrog secures binaries in the age of AI coding assistants

Liquid cooling dwingt datacenters tot andere ontwerpkeuzes

Slimmer vergaderen begint met het juiste ecosysteem

Ondersteun kritieke workloads met all-NVMe active-active storage voor non-stop bedrijfsvoering

Datasoevereiniteit begint bij grip: niet alleen op databases, maar óók op data zelf

GITEX AI EUROPE 2026

GOTO Copenhagen 2026

Klarrio: Architectuur is grootste knelpunt of grootste versneller

Hoe je stap voor stap een AI-gedreven kennisapplicatie bouwt

Waarom automatisering onmisbaar is in moderne cybersecurity