GPU-tekort drijft Fujitsu tot het optimaal benutten van bestaande hardware

Fujitsu heeft een nieuwe technologie aangekondigd die CPU’s en GPU’s optimaal benut. Processen die eenn hoge ‘execution efficiency’ hebben, krijgen voorrang. Het Japanse bedrijf hoopt organisaties uit de brand te helpen die worden geplaagd door het wereldwijde GPU-tekort, veroorzaakt door de alom aanwezige AI-hype.

Eerder dit jaar stelde Nvidia dat datacenters op de schop moeten. Meer GPU’s om intensieve workloads die daarvan afhangen, te ondersteunen. Fujitsu heeft echter een andere oplossing bedacht. Een duidelijke naam is nog niet bekend, maar men zal de technologie op den duur in een softwarepakket gaan leveren.

Benutten van CPU en GPU

Allereerst spreekt Fujitsu over een technologie die CPU en GPU optimaal benut. Daarbij onderscheidt het programma’s die eventueel ook verwerkt kunnen worden door een CPU en andere die van GPU’s afhankelijk zijn. Men doet dit door te voorspellen hoeveel tijd de hardware-acceleratie kost per programma, waarbij GPU’s in real-time worden herverdeeld om programma’s met een hoge prioriteit te verwerken.

In het voorbeeld hieronder wil een gebruiker 3 programma’s verwerken met een enkele CPU en twee GPU’s. De twee GPU’s worden optimaal benut terwijl de CPU als een tweede optie te hulp schiet, zodat de totale tijd om de drie programma’s te verwerken geminimaliseerd wordt. Het alternatief zou vermoedelijk zijn dat een programma moet wachten tot een GPU vrijkomt, die eerst door twee andere programma’s worden bezet.

Een voorbeeld van ‘allocation switching’ tussen CPU en GPU. Bron: Fujitsu

Minder wachten

Een andere oplossing van Fujitsu is er een die het in real-time schakelen tussen meerdere programma’s sneller maakt. Een HPC-systeem met meerdere computers zou met deze technologie niet hoeven te wachten tot een programma afsluit om een andere op te starten. Daarmee wil Fujitsu het mogelijk maken om dergelijke HPC-systemen inzetbaar te maken voor het draaien van programma’s met restrictieve latency-eisen.

Fujitsu legt uit dat de conventionele communicatiemethode in een HPC-systeem veel inherente oponthoud kent. Dit komt door timing-verschullen in switching tussen servers. Deze methode staat bekend onder de naam ‘unicast’, en informeert elke server achter elkaar over een nieuwe switch. Dit is erg betrouwbaar, maar Fujitsu hoopt in selecte situaties seconden winst te kunnen maken met een alternatief. ‘Broadcast’-communicatie laat elke servers tegelijkertijd weten dat er een switch plaatsvindt, oftewel ‘real-time batch switching’. Men zegt dat packet drops zeldzaam zijn, maar de betrouwbaarheid ten opzichte van unicast neemt dus iets af. Het is aan de gebruiker of de tijdswinst de moeite waard is.

Specifieke toepassingen voor de nieuwe broadcast-methode zijn volgens Fujitsu onder andere digital twins, generatieve AI en medicijnenonderzoek.

De twee communicatiemethoden. Bron: Fujitsu

Toekomstige toepassing

Fujitsu heeft zelf een platform om geavanceerde AI-technologieën te testen, onder de codenaam Kozuchi. Daarop wil het bedrijf de CPU/GPU-optimalisatietechniek toepassen. De nieuwe communicatiemethode voor HPC-systemen hoopt Fujitsu in te zetten voor de 40-qubit quantumcomputersimulatie die het in aanbouw heeft.

Andere toepassingen zijn nog onzeker, maar het is mogelijk dat er software beschikbaar zal komen die de nieuwe uitvindingen breder inzetbaar zal maken.

Lees ook: Fujitsu integreert public clouddiensten volledig in overkoepelend concern

Lees meer over Applications

Microsoft-CEO: AI-klanten geven hun kennis weg aan LLM-aanbieders

CEO van Microsoft Satya Nadella poneert de zogeheten 'Reverse Information Paradox'. In een post op X constate...

Erik van Klinken 22 uren geleden

Topartikel

Het probleem met AI model routing

Tokenmaxxing is grotendeels een stille dood gestorven. Het is tot bedrijven doorgedrongen dat ranglijsten die...

Erik van Klinken 6 juli 2026

Topartikel

Siemens-topman Patrick Fokke: “Industriële software moet een businesscase dienen”

Kloof tussen AI-hype en realiteit fabrieksvloer

Colin Baak 30 juni 2026

SAP versoepelt supportregels na EU-onderzoek

SAP voert wereldwijd ingrijpende wijzigingen door in de voorwaarden voor onderhoud en ondersteuning van zijn ...

Mels Dees 19 uren geleden

Expert aan het woord

Whitepapers

GPU-tekort drijft Fujitsu tot het optimaal benutten van bestaande hardware

Benutten van CPU en GPU

Minder wachten

Toekomstige toepassing

Blijf op de hoogte, abonneer!

GitHub Copilot, AI-assistent van het eerste uur, staat zwaar onder druk

GPT-5.6 nu breed beschikbaar: Sol, Terra en Luna gelanceerd

Grok 4.5 imponeert als coding agent op Opus-niveau

Dawnguard belooft echte shift-left: “enige oplossing is iets bouwen wat niet kwetsbaar is”

How HPE brought two networking giants together in under one year

Why hyperscalers run containers in VMs: VKS deep dive

Solo.io reveals how to manage AI agents across any platform

How Nutanix is tackling multi-cloud Kubernetes and AI workloads

Liquid cooling dwingt datacenters tot andere ontwerpkeuzes

Slimmer vergaderen begint met het juiste ecosysteem

Ondersteun kritieke workloads met all-NVMe active-active storage voor non-stop bedrijfsvoering

Datasoevereiniteit begint bij grip: niet alleen op databases, maar óók op data zelf

GOTO Copenhagen 2026

Klarrio: Architectuur is grootste knelpunt of grootste versneller

Hoe je stap voor stap een AI-gedreven kennisapplicatie bouwt

Waarom automatisering onmisbaar is in moderne cybersecurity