Nvidia heeft SchedMD overgenomen. Dit is het bedrijf achter de ontwikkeling en het onderhoud van Slurm, een open-source workload manager die een centrale rol speelt in high-performance computing (HPC) en grootschalige AI-omgevingen.
Slurm wordt gebruikt om rekentaken te plannen en resources te verdelen binnen grote serverclusters in onderzoek, industrie en overheid.
SchedMD werd in 2010 opgericht door de oorspronkelijke ontwikkelaars van Slurm. Het bedrijf richt zich niet alleen op de doorontwikkeling van de software, maar levert ook commerciële ondersteuning en advies aan organisaties die Slurm in productie inzetten. Volgens SiliconANGLE bedient SchedMD enkele honderden klanten, waaronder overheidsinstellingen, banken en organisaties in de zorgsector.
Slurm is ontworpen voor omgevingen waarin grote aantallen parallelle taken worden uitgevoerd. Het systeem bepaalt welke rekenmiddelen wanneer worden ingezet en voorkomt dat workloads onnodig vertragen door slecht verdeelde resources. In de praktijk betekent dit onder meer dat GPU’s niet ongebruikt blijven terwijl andere overbelast zijn. Slurm kan clusters beheren met meer dan 100.000 GPU’s, wat het geschikt maakt voor zowel supercomputers als grootschalige AI-training.
Slurm en Kubernetes verschillen van elkaar
In AI-omgevingen wordt Slurm vaak vergeleken met Kubernetes, dat eveneens wordt gebruikt voor clusterbeheer. Beide platforms kunnen workloads plannen en verdelen, maar Slurm is sterker gericht op HPC-achtige scenario’s met strikte eisen aan prestaties en schaalbaarheid. Zo biedt Slurm meer mogelijkheden voor fijnmazige scheduling, bijvoorbeeld door taken die veel data met elkaar uitwisselen fysiek dicht bij elkaar op het cluster te plaatsen. Kubernetes kan vergelijkbare optimalisaties uitvoeren, maar vereist daarvoor vaak aanvullende extensies.
Naast Slurm onderhoudt SchedMD ook een tweede open-sourceproject, Slinky. Dat maakt het mogelijk om Slurm bovenop Kubernetes te draaien. Hierdoor hoeven organisaties geen aparte clusters te beheren voor cloud-native workloads en traditionele HPC-taken.
Nvidia stelt dat Slurm open source en leverancier-neutraal blijft na de overname. De software blijft daarmee geschikt voor heterogene omgevingen waarin hardware van verschillende leveranciers wordt gecombineerd. Voor bestaande gebruikers verandert er op korte termijn weinig. Nvidia neemt de ondersteuning, training en verdere ontwikkeling over voor de klanten van SchedMD.
De overname past in een bredere beweging waarbij grote technologiebedrijven een grotere rol krijgen in het onderhoud van essentiële open-source infrastructuur. Slurm is een fundamenteel onderdeel van veel HPC- en AI-omgevingen. De mate waarin het project zijn onafhankelijke positie behoudt, zal op termijn zichtbaar worden in de governance en ontwikkelkeuzes rond de software. Voorlopig blijft Slurm een vrij beschikbare en breed gebruikte scheduler binnen grootschalige rekenomgevingen.