Red Hat OpenShift 4.21 brengt slimme GPU-toewijzing voor AI-workloads

Red Hat OpenShift 4.21 brengt slimme GPU-toewijzing voor AI-workloads

Red Hat heeft OpenShift 4.21 gelanceerd met Dynamic Resource Allocation voor GPU’s, waarmee high-end GPU’s geprioriteerd kunnen worden voor AI-training. Ook kunnen deze resources volledig afgeschaald worden om geld te besparen. De release voegt tevens autoscaling naar nul toe voor hosted control planes en cross-cluster VM-migratie zonder downtime.

OpenShift 4.21 pakt een fundamenteel probleem aan waar AI-teams dagelijks mee worstelen: GPU-toewijzing die niet matcht met daadwerkelijke behoeftes. Traditioneel vroegen teams simpelweg om een GPU en hoopten dat deze aan hun vereisten voldeed. Met de nieuwe Dynamic Resource Allocation specificeren gebruikers exact wat ze nodig hebben, bijvoorbeeld “een GPU met minimaal 40GB VRAM”. De scheduler bevraagt hardwareattributen rechtstreeks via common expression language, om de juiste resources te vinden.

Dit elimineert handmatig node-labeling. Het systeem leest hardwaremogelijkheden en matcht ze automatisch aan workload-vereisten. Voor deze functie is wel een vendor-geleverde operator of driver met DRA-ondersteuning nodig.

Kostenoptimalisatie door autoscaling

Hosted control planes krijgen native VerticalPodAutoscaler-integratie. Control plane-componenten schalen automatisch op basis van realtime geheugenverbruik, niet statische schattingen. Daarnaast kunnen control planes nu schalen naar nul tijdens inactiviteit. De configuratie en staat blijven bewaard en ze hervatten automatisch wanneer nodig.

NodePools volgen hetzelfde patroon en schalen naar nul nodes in ontwikkel- en testomgevingen. Dat maakt Hosted Control Planes de meest kostenefficiënte manier om OpenShift te draaien. De functie zorgt ervoor dat de hosted control plane operatief blijft in standby-modus.

Virtualisatie wordt volwassener

Cross-cluster live migratie laat beheerders draaiende VM’s verplaatsen tussen verschillende OpenShift-clusters zonder downtime. Beheerders kunnen nu clusteronderhoud uitvoeren, resources herbalanceren over regio’s of workloads migreren naar nieuwere hardware zonder service-onderbreking.

IPv6-only control plane en secondary network support is nu algemeen beschikbaar. Dit is een belangrijke stap voor organisaties die IPv4-adressen opraken. Het stelt je in staat OpenShift-clusters en gevirtualiseerde workloads uit te rollen in moderne, IPv6-native omgevingen. Complexe Network Address Translation-workarounds zijn niet langer nodig.

OpenShift Virtualization op Google Cloud bare metal stelt organisaties in staat VM’s rechtstreeks op dedicated hardware te draaien. Dit implementatiemodel is cruciaal voor prestatiegevoelige workloads die directe toegang tot fysieke CPU-features en hardware-acceleratie vereisen, zoals low-latency databases.

Verbeterde UI voor netwerkbeheer

De verbeterde virtualisatie-UI begeleidt beheerders naar de juiste netwerkconfiguraties terwijl geavanceerde controle behouden blijft. Beheerders kunnen nu secondary ClusterUserDefinedNetworks aanmaken met localnet-topologie. Ingebouwde guardrails voorkomen onbedoeld verwijderen van UDN-afgeleide NetworkAttachmentDefinitions.

Red Hat OpenShift Lightspeed, de virtuele AI-assistent, is geïntegreerd met de OpenShift Virtualization-gebruikersinterface. Virtualisatiebeheerders hoeven niet meer te schakelen tussen interfaces of handmatig bestanden te uploaden. Ze krijgen nu in-context, AI-aangedreven inzichten voor troubleshooting van virtuele machine-fouten.

OpenShift 4.20 introduceerde eerder al post-quantum encryptie en LeaderWorkerSet voor AI-workloads. Versie 4.21 bouwt hierop voort met praktische verbeteringen voor dagelijks gebruik.