Microsoft maakt geheim wapen tegen cloudonderbrekingen open source

Microsoft gebruikt een in eigen huis ontwikkelde tool om onderbrekingen van zijn Azure-cloudplatform zoveel mogelijk te voorkomen. Het maakt de tool nu open source beschikbaar voor iedereen.

Een vergissing is snel gebeurd, maar een klein foutje kan al snel een serieuze impact hebben op een netwerkinfrastructuur. Zeker wanneer de grootte en complexiteit van het netwerk toeneemt. Microsoft heeft daarom de Open Network Emulator (ONE) ontwikkeld, die het netwerk achter de Azure-cloud simuleert.

Open Network Emulator

ONE simuleert alle hardware- en software-elementen die deel uitmaken van een netwerk, alsook hoe ze met elkaar verbonden zijn. De tool doet daarvoor beroep op Docker-containers en VM’s, en helpt netwerktechnici om wijzigingen aan de infrastructuur – en de effecten ervan – te testen in een veilige omgeving voordat ze live worden uitgerold.


Lees dit: Datacenters krijgen steeds vaker te maken met onderbrekingen


“Ons netwerk is groot, heterogeen, complex en ondergaat constante churns. In een dergelijke omgeving kunnen zelfs kleine problemen – die worden veroorzaakt door apparaatstoringen, softwarefouten, configuratiefouten, onbewezen beheertools en onvermijdelijke menselijke fouten – snel grote storingen veroorzaken. Daarom is het cruciaal om de betrouwbaarheid van ons netwerk te behouden en te verbeteren om de impact van elke geplande verandering in een realistische omgeving te valideren, voordat ze in productie wordt geïmplementeerd”, schrijft Microsoft in een introductie van ONE.

De netwerkingenieurs van Microsoft gebruiken de emulator sinds meer dan een jaar en hebben zo volgens het bedrijf al honderden bugs in voorgestelde wijzigingen platgetrapt, waardoor potentiële pannes van de cloudinfrastructuur werden voorkomen. Omdat Microsoft denkt dat de tool ook voor anderen waardevol kan zijn, maakt het de code open source beschikbaar.

Uptime verhogen

De tool kan worden gebruikt door grote ondernemingen om de uptime van hun netwerk te verbeteren, of door netwerkleveranciers om nieuwe besturingssoftware op grote schaal te testen. Studenten en onderzoekers kunnen ONE gebruiken om hyperscale netwerken zoals die van Amazon, Google en Microsoft te simuleren en erop te innoveren, zonder toegang tot de feitelijke netwerken.

Het kunnen toetsen van netwerkaanpassingen aan de werkelijkheid is geen overbodige luxe, nu de impact van pannes steeds groter wordt. Uit een recent rapport van Uptime Institute blijkt dat het aantal onderbrekingen in datacenters toeneemt. Uptime Institute wijst daarvoor op de toegenomen onderlinge afhankelijkheid tussen infrastructuren. Een onderbreking van een cloudinfrastructuur gebeurt niet geïsoleerd, maar kan verstrekkende gevolgen hebben voor miljoenen gebruikers en problemen veroorzaken in hybride omgevingen.