Microsoft stelt een van ’s werelds snelste supercomputers beschikbaar via Azure

Microsoft heeft een eigen supercomputer gebouwd en maakt de infrastructuur beschikbaar via Azure om extreem grote AI-modellen te kunnen trainen. Het project werd gerealiseerd in samenwerking met OpenAI.

De supercomputerconfiguratie in Azure focust vooral op het trainen van grote AI-modellen. Volgens Kevin Scott, CTO bij Microsoft, zijn de potentiële voordelen heel groot omdat je niet langer één type AI-model kan trainen.

“Je kan nu met de nieuwe configuratie honderd spannende dingen tegelijk doen in NLP (Natural Language Processing) of computer vision. Wanneer je de combinaties begint te zien van deze perceptuele domeinen, gaan we nieuwe applicaties zien die we ons vandaag amper kunnen inbeelden.”

Het doel van Microsoft is om hun grote AI-modellen, trainingsoptimalisatietools en supercomputingcapaciteit beschikbaar te stellen via Azure AI Services en GitHub. Zo kunnen ontwikkelaars, data scientists en zakelijke klanten AI-modellen op grote schaal berekenen.

Top 5 snelste supercomputers

De supercomputer is één systeem met meer dan 285.000 kernen, 10.000 gpu’s en 400 Gbps aan netwerkconnectiviteit voor elke gpu-server. Volgens Microsoft is de machine de vijfde snelste supercomputer die vandaag wereldwijd beschikbaar.

OpenAI speelt een belangrijke rol in de Azure supercomputer. Het kreeg van Microsoft carte blanche om de perfecte supercomputer te ontwikkelen voor AI-modellen. “We zien dat systemen op grotere schaal een belangrijke component vormen voor het trainen van krachtigere modellen”, zegt Sam Altman, CEO van OpenAI.

Azure AI opent hiermee de toegang tot krachtige compute met dezelfde set van AI-acceleratoren en netwerken als traditionele supercomputers. Microsoft stelt daarnaast ook de nodige tools beschikbaar om grote AI-modellen gedistribueerd en geoptimaliseerd te trainen op de beschikbare clusters.

Turing-model openbron

Op de Build 2020-conferentie kondigt Microsoft aan dat het zijn Turing-modellen openbron maakt. Hetzelfde geld voor de recepten om te trainen in Azure Machine Learning. Hierdoor krijgen ontwikkelaars dezelfde tools in handen als Microsoft zelf.

Verder krijgt DeepSpeed een nieuwe versie. De openbron leerbibliotheek voor PyTorch verlaagt de benodigde rekenkracht voor grote gedistribueerde modeltrainingen. De update is volgens Microsoft veel efficiënter dan de versie die drie maanden geleden werd gelanceerd.

Tot slot is er voortaan ondersteuning voor gedistribueerde trainingen op ONNX Runtime. Deze openbron bibliotheek laat draagbare modellen toe over diverse hardware en besturingssystemen.

Lees dit: Supercomputers voor de kmo: waarom iedere organisatie wel een HPC-systeem kan gebruiken

Wie de beschikbare installatie van Microsoft overkill vindt voor zijn AI-modellen, kan ook altijd terecht bij het Vlaams Supercomputer Centrum (VSC). Zij stellen aan grote bedrijven maar ook aan kmo’s, start-ups en scale-ups rekeninfrastructuur beschikbaar, evenals consultancy en training.

Lees al hier het nieuws rond de virtuele editie van Microsoft Build 2020.