Google Cloud biedt als eerste cloudprovider virtuele machines (VM’s) aan met Nvidia’s nieuwe RTX PRO 6000 Blackwell GPU’s. Deze nieuwe G4 VM’s zijn geschikt voor uiteenlopende toepassingen, zoals AI-inferentie, roboticasimulaties, generatieve contentcreatie en geavanceerde grafische verwerking.
Dit schrijft The Register. Volgens leidinggevenden bij Google Cloud, waaronder Nirav Mehta en Roy Kim, zijn de G4 VM’s inzetbaar voor zowel zware als kostenbewuste workloads. De virtuele machines combineren acht Nvidia RTX PRO 6000 GPU’s met twee AMD Turin CPU’s. Ze maken gebruik van Google’s eigen Titanium-processoren voor extra prestaties.
De RTX PRO 6000 Server Edition, gepresenteerd tijdens Nvidia’s GTC-evenement eerder dit jaar, volgt de oudere L40-serie op. Het richt zich op AI-taken, modeloptimalisatie en datavisualisatie, zoals bij digital twins. Elke GPU levert 3.753 teraFLOPS aan rekenkracht bij FP4-precisie, beschikt over 96 GB GDDR7-geheugen en een geheugenbandbreedte van 1,6 TB/s. De G4 VM’s bieden daarmee in totaal 768 GB GPU-geheugen, 384 virtuele CPU-kernen en 12 TiB aan lokale SSD-opslag. Dit laatste is uitbreidbaar tot 512 TiB via Hyperdisk. Vergeleken met de vorige G2-generatie is dat vier keer zoveel rekenkracht en geheugen, en zes keer meer bandbreedte.
Snelle resultaten
Dankzij het grotere geheugen en de hogere datasnelheden zijn deze VM’s beter in staat om complexe AI-modellen te draaien en sneller resultaten te leveren. De eerder uitgebrachte A4- en A4X-VM’s, die ook op Blackwell-GPU’s draaien, zijn meer gericht op training en inferentie en missen de grafische verwerkingsmogelijkheden van de G4-reeks.
Ook marktanalysebureau IDC ziet de introductie als een teken dat Google serieus inzet op krachtige cloudoplossingen. Volgens IDC-president Crawford Del Prete laat Google hiermee zien dat het gericht is op het ondersteunen van uiteenlopende klantbehoeften, met krachtige infrastructuur die geschikt is voor zware AI- en data-intensieve toepassingen. Hij merkt op dat dit vooral aantrekkelijk is voor klanten die bereid zijn extra te investeren voor maximale prestaties, mede doordat Google zijn AI-diensten samenbrengt in een geïntegreerd ‘AI Hypercomputer’-concept.
Hoewel de technologie nu al beschikbaar is, moeten geïnteresseerden voorlopig nog contact opnemen met een Google Cloud-vertegenwoordiger. De G4 VM’s bevinden zich immers nog in een previewfase. Wereldwijde beschikbaarheid wordt verwacht tegen het einde van het jaar.