Cisco zet eerder aangekondigde samenwerking met Nvidia om in een volledige stack die organisaties kunnen gebruiken om GenAI-workloads te draaien. De nieuwe stack gaat door het leven als Cisco Nexus HyperFabric AI clusters.
Eerder dit jaar schreven we al over een samenwerking tussen Cisco en Nvidia. Op zich was dat niet zo bijzonder, want iedereen werkt tegenwoordig samen met Nvidia. Het ging toen onder andere om zogeheten validated designs die de twee leveranciers opstelden. Hiermee is het mogelijk om AI-workloads optimaal te draaien, is het idee. Daarnaast kondigde Cisco aan dat het Nvidia-GPU’s in UCS rack en blade servers ging aanbieden en ging het de AI-software van Nvidia op de eigen prijslijst zetten.
Cisco Nexus HyperFabric AI clusters
Met Cisco Nexus HyperFabric AI clusters gaat het bedrijf echter een stuk verder in het partnership met Nvidia. Dit is een volledige turn-key AI-stack. Het is een combinatie van het netwerk van Cisco (dus Ethernet-gebaseerd) en de accelerated compute onderdelen en software van Nvidia. Het datagedeelte van Cisco Nexus AI clusters wordt verzorgd door VAST data. Die leverancier levert het unified dataplatform.
Cisco Nexus HyperFabric AI clusters moet het mogelijk maken voor organisaties om een volledige AI-stack in te richten in de private cloud, oftewel on-prem omgeving. Het idee is dat organisaties hiervandaan niet alleen hun AI-stack kunnen ontwerpen en uitrollen, maar ook monitoren en beheren. De uitkomst hiervan moet een AI-infrastructuur zijn die gegarandeerd goed werkt in enterprise-omgevingen. Naast prestaties speelt ook de eenvoud een belangrijke rol. Organisaties kunnen AI-infrastructuur dankzij centrale beheermogelijkheden uitrollen over de gehele gedistribueerde IT-omgeving.
De onderdelen van Cisco Nexus HyperFabric AI clusters
Een volledige AI-stack is een tamelijk complexe verzameling van onderdelen. Cisco Nexus HyperFabric AI clusters bestaan dan ook uit behoorlijk wat verschillende onderdelen om compute, netwerk en storage samen te brengen. Hieronder zetten we deze op een rijtje.
- Cisco Nexus 6000-serie spine/leaf switches voor de Ethernet-backbone. Deze kunnen 400G en 800G bandbreedtes leveren. De ASICS-afdeling van Cisco speelt hierin een belangrijke rol, met de ontwikkeling van het Silicon One-aanbod.
- Om bovenstaande bandbreedtes te kunnen realiseren, maakt het nieuwe aanbod gebruik van QSFP-DD optische transceivers van Cisco zelf. Deze zijn verkrijgbaar in 400G- en 800G-varianten.
- Beheer vanuit de cloud via het Nexus-dashboard en Cisco Intersight.
- Nvidia levert de AI Enterprise software. Onderdeel daarvan zijn de NIM Microservices die het bedrijf recent heeft aangekondigd. Dit zijn vooraf ingerichte en gevulde containers met microservices voor inferentie. Deze moeten ervoor zorgen dat het uitrollen van AI in organisaties weer een stukje sneller gaat.
- Nvidia Tensor Core GPU’s, te beginnen met de H200 NVL.
- AI is niet compleet zonder het over DPU’s te hebben tegenwoordig. Voor Cisco Nexus HyperFabric AI clusters is gekozen voor de BlueField-3 DPU van Nvidia. Daarnaast is er ook nog een BlueField-3 SuperNIC om het netwerk verder te versnellen.
- Een en ander is gebouwd om het Nvidia MGX reference design voor servers.
- Tot slot is er zoals al aangegeven gebruikgemaakt van het unified dataplatform van VAST data.
Cisco Nexus HyperFabric AI clusters zijn vanaf Q4 van Cisco’s fiscale jaar inzetbaar voor een aantal door Cisco geselecteerde klanten, waarna algemene beschikbaarheid snel zal volgen. Jonathan Davidson, EVP en GM voor Cisco Networking geeft daarnaast aan dat Cisco ook storage-leveranciers zoals Pure Storage en NetApp het HyperFabric-ecosysteem in gaat trekken.