Cerebras CS-1: ’s werelds grootste chip in ’s werelds krachtigste doos

Start-up Cerebras lanceert met de CS-1 een compleet HPC-systeem op maat van AI-workloads. De CS-1 is gebouwd rond een splinternieuwe chip met 1,2 biljoen transistors: een record.

Cerebras, relatief bescheiden technologiestart-up, zet zichzelf in de schijnwerpers met de introductie van de CS-1. Dat is een all-in-one-HPC-systeem opgebouwd rond een immense chip met 1,2 biljoen transistors. Cerebras voorziet de unieke en krachtige chip van hardware die er optimaal mee overweg kan. De CS-1 is daarom geen losse processor of accelerator, maar een totaaloplossing met koeling, netwerkfunctionaliteit, geheugen en opslag aan boord. Cerebras lanceerde de CS-1 eerder deze week en liet meteen weten een eerste klant aan boord te hebben.

Het Amerikaanse Argonne National Laboratory, een nationaal laboratorium voor wetenschappelijk en technisch onderzoek, is de eerste partij die in de innovatie CS-1 investeert. Volgens het laboratorium helpt Cerebras in het lab onderzoek doen naar kanker, traumatisch en hersenletsel. Naast vele andere belangrijke gebieden voor de samenleving mogelijk te maken, aldus Techcrunch.

Wafer Scale Engine

Volgens Cerebras levert de CS-1 prestaties van meer dan 1.000 high end-gpu’s gecombineerd. Het systeem, dat ontwikkeld werd om bliksemsnel AI- en deep learning-workloads te verwerken in een datacenter, is gebouwd rond de enorme Wafer Scale Engine (WSE). De start-up lanceerde deze AI-chip voorzien van 1,2 biljoen transistors en een grootte van 46.225 vierkante millimeter, in augustus. Sindsdien is de WSE ’s werelds grootste processor. 

De specificaties van de Wafer Scale Engine en de CS-1 spreken tot de verbeelding:

  • 400.000 kernen
  • 18 GB on-chip geheugen (opnieuw een record)
  • 9 PB per seconde on-die geheugenbandbreedte 
  • 12 gigabit ethernetverbindingen om data in en uit de CS-1 te verplaatsen
  • 20 kilowatt vermogensverbruik 

Het Amerikaanse Department of Energy (DoE), leider binnen het HPC-segment, was de eerste klant van de WSE. De instelling gebruikt de enorme chip als basis voor toegepaste wetenschappen en onderzoek naar medicijnen met super-scale AI, maar kocht de WFE niet aan als onderdeel van een totaaloplossing zoals de nu geïntroduceerde CS-1.

Hardware op maat

Noem het gerust opmerkelijk dat Cerebras ervoor kiest om bestaande hardware te herbouwen om hun systeem van stroom te voorzien. Het bedrijf zou namelijk ook gewoon bestaande componenten kunnen gebruiken. Toch is dit volgens Andrew Feldman, CEO en mede-oprichter van Cerebras, een bewuste keuze: “Als je een Ferrari-motor zou bouwen en in een Toyota zou stoppen, kun je geen raceauto maken.”

Als je een Ferrari-motor zou bouwen en in een Toyota zou stoppen, kun je geen raceauto maken

Feldman: “Het plaatsen van snelle chips in Dell of andere servers levert geen fast compute op, maar het verplaatst slechts de bottleneck”. Volgens hem is de CS-1 juist bedoeld om de onderliggende WSE-chip de infrastructuur te geven die nodig is om volledig te presteren. Cruciaal aan die infrastructuur is een krachtig waterkoelingssysteem om deze enorme chip en platform op de juiste temperaturen te houden. 

Waterkoeling

Ook de keuze om de CS-1 te voorzien van waterkoeling bleek volgens de CEO het meest optimaal. Dat is opvallend, aangezien water van oudsher bekend staat als een ingewikkelde technologie voor datacenters. “We hebben naar andere technologieën gekeken zoals onderdompeling in vloeistof, en naar oplossingen gericht op fase-verandering. Toch bleek water buitengewoon geschikt te zijn in het verplaatsen van warmte”, weet Feldman.

Een diagram van het Cerebras CS-1 coolingsysteem. (Foto Cerebras)

Locality

De WFE is geen voor de hand liggende chip om mee te werken. De technische vereisten voor de omkadering van de immense chip zijn enorm en de productie ervan is niet voor de hand liggend. Het grote formaat betekent dat de succesvolle opbrengst per wafer erg klein is vergeleken met traditionelere chips.

Locality verkleint de latency en verhoogt de prestaties.

Toch wegen de voordelen op tegen de nadelen. Specifiek is locality de sleutel. De grote chip is in staat een heel machine learning-model te hosten. De benodigde data staat met een traditionele aanpak verspreid binnen een server of zelfs een cluster. Data moet gestreamd worden naar de processors en dat kost tijd. Door data en compute bij elkaar te brengen op de grote WFE is de latency minimaal en kan de CS-1 sneller rekenen.

Softwareplatform

De CS-1 is een uniek systeem dat de nodige softwareondersteuning vereist. Ook daar zorgde Cerebras voor. De start-up kondigde nog de lancering van een uitgebreid softwareplatform aan, waarmee ontwikkelaars populaire ML-bibliotheken kunnen gebruiken om hun AI-workflows te integreren met het CS-1-systeem. Denk dan bijvoorbeeld aan ML-bibliotheken als TensorFlow en PyTorch. “We hebben het afgelopen jaar met meer dan honderd klanten gesproken over de behoefte aan een nieuw AI-systeem en de softwarelaag die daar bovenop moest komen. We hebben door de jaren geen geleerd, dat je de softwarecommunity moet ontmoeten waar zij zich op dat moment bevinden. Anders dan dat je ze verzoekt meer jou kant uit te komen”, aldus Feldman.