2min Security

Snowflake toont veerkracht tijdens AWS-storing

Snowflake toont veerkracht tijdens AWS-storing

De storing bij Amazon Web Services (AWS) vorige week toonde hoe kwetsbaar cloud-infrastructuren zijn wanneer criminelen cruciale diensten treffen. 

Terwijl organisaties hinder ondervonden, meldde Snowflake dat ruim 300 klant-workloads zonder onderbreking bleven draaien. Dit, dankzij het gebruik van zijn Snowgrid-technologie.

Volgens Snowflake konden deze workloads automatisch overschakelen naar alternatieve regio’s of clouds, waardoor bedrijfsprocessen grotendeels ongestoord konden doorgaan. SiliconANGLE schrijft dat Snowflake de gelegenheid aangreep om klanten eraan te herinneren dat een storing niet per se tot een bedrijfscrisis hoeft te leiden, mits er is geïnvesteerd in een doordachte continuïteitsstrategie.

Snowgrid is sinds 2022 beschikbaar en biedt organisaties de mogelijkheid om data en workloads te repliceren over meerdere cloudregio’s bij AWS, Microsoft Azure en Google Cloud. Wanneer zich een storing voordoet, kan een vooraf ingesteld failover-scenario handmatig of automatisch worden geactiveerd. Het platform zorgt ervoor dat workloads zonder dataverlies of duplicatie hervatten op een secundaire locatie. Door middel van automatische DNS-updates worden applicaties en dashboards opnieuw verbonden. Doorgaans lukt dit zonder merkbare downtime voor eindgebruikers.

Volgens Chief Product Officer Christian Kleinerman is de automatische omleiding van verbindingen een essentieel onderdeel van Snowgrid. In de praktijk merken gebruikers volgens hem hooguit een korte onderbreking, waarna systemen normaal verder functioneren.

De AWS-storing werd veroorzaakt door een probleem in de DNS-infrastructuur van de regio U.S. East 1, stelt SiliconAngle. Daardoor waren ook de control plane-services onbereikbaar, zelfs voor klanten met workloads verdeeld over meerdere availability zones. SiliconANGLE merkt op dat het incident duidelijk maakt dat beschikbaarheidszones geen volledige bescherming bieden. Diensten als DNS of identity management worden binnen een regio gedeeld, waardoor een storing op dat niveau alle zones tegelijk kan raken.

Redundantie binnen regio voldoet niet

Snowflake onderschrijft die conclusie. Volgens Kleinerman denken veel organisaties ten onrechte dat redundantie binnen één regio voldoende is voor bedrijfscontinuïteit, terwijl in de praktijk juist een architectuur over meerdere regio’s of clouds nodig is om veerkracht te waarborgen.

Snowflake benadrukt dat Snowgrid geen oplossing is die zonder onderhoud kan worden ingezet. Klanten moeten hun replicatie- en failover-processen zorgvuldig inrichten en regelmatig testen om zeker te weten dat deze werken wanneer dat nodig is. Organisaties die dat volgens Snowflake deden, ondervonden tijdens de recente AWS-problemen slechts minimale hinder.

Kleinerman schreef in een blogpost dat storingen onvermijdelijk zijn, maar dat voorbereiding het verschil maakt tussen een normale werkdag en een hectische maandag.