RAID-problemen: HDD-bouwers vermommen trage drives als snellere schijven

Western Digital, Seagate en Toshiba verkopen stiekem tragere SMR-HDD’s als conventionele schijven. WD doet het zelfs bij NAS-schijven en brengt zo de betrouwbaarheid van RAID-configuraties in gevaar.

Alle HDD-fabrikanten verkopen stiekem SMR-schijven als CMR-drives. Dat ontdekte Block & Files en werd intussen bevestigd door de fabrikanten. Het verschil in onderliggende technologie zorgt voor lagere prestaties in pc’s en workstations, en kan nefaste gevolgen hebben in NAS-configuraties.

SMR en CMR

SMR staat voor shingled magnetic recording, CMR is conventional magnetic recording. CMR is standaardtechnologie waarbij data rechtstreeks wordt weggeschreven op een HDD. Het OS of de RAID-controller heeft de rechtstreekse controle over de sectoren van de harde schijf. SMR is een relatief nieuwe technologie waarbij schrijfzones op een HDD elkaar deels overlappen. Een dak gebouwd uit dakpannen is een populaire visualisatie van de technologie: iedere rij pannen kan je zien als een reeks geschreven data. De pannen overlappen elkaar, net zoals de data elkaar overlapt.

Illustratie via Seagate.

SMR maakt het mogelijk om meer data op een drive te passen, maar heeft enkele grote nadelen. SMR-drives zijn onderverdeeld in zones, een beetje zoals SSD’s. De drive kan onmogelijk een klein stukje van een zone aanpassen: bij iedere schrijfopdracht moet de hele SMR-zone opnieuw worden opgebouwd. Dat betekent logischerwijze dat een SMR-drive veel trager is dan een CMR-drive: de schijf moet immers niet alleen de nieuwe data wegschrijven, maar ook de oude data daaromheen opnieuw schrijven.

SMR-drives maken daarom gebruik van cache. De computer of de NAS schrijft niet rechtstreeks naar de SMR-schijf, maar naar een veel snellere CMR-cache van enkele tientallen gigabytes. De firmware op de drive archiveert de cache vervolgens in SMR-zones wanneer de drive even niet gebruikt wordt.

Het probleem

SMR-technologie is uitstekend voor archivering, waar prestaties niet van belang zijn. In andere toepassingen leidt de technologie tot problemen. Toshiba en Seagate verkopen enkele desktopdrives met SMR-technologie zonder dat ze klanten daarvan op de hoogte brengen. OEM’s zoals Dell en HP stoppen die drives in hun hardware, opnieuw zonder de consument in te lichten. Zolang workloads de CMR-buffer niet overschrijven, is er geen enkel probleem: de drive zal voor de eindgebruiker presteren zoals geadverteerd.

SMR-technologie is uitstekend voor archivering, waar prestaties niet van belang zijn.

Anders wordt het wanneer schrijfopdrachten de buffer verzadigen. De drive heeft nu geen plaats meer om nieuwe data te absorberen, aangezien rechtstreeks naar de SMR-zones schrijven geen optie is. Dat betekent dat de CMR-buffer eerst verwerkt moet worden. De prestaties van de drive zakken in dat geval drastisch aangezien de HDD zowel nieuwe data moet aanvaarden als de buffer moet wegschrijven. Tijdens tests van Blocks & Files zakte de gemiddelde schrijfsnelheid van een drive zo van 120 MBps naar een abominabele 40 MBps.

NAS-gebruik

Dat is oneerlijk van Seagate en Toshiba, maar zij zondigen niet zo hard als Western Digital. WD vermomt SMR-drives als CMR-HDD’s in zijn WD Red-gamma, speciaal gebouwd voor NAS-toepassingen. Ook hier is er sprake van een grote buffer en redeneert WD dat er daardoor in de praktijk geen problemen ontstaan. Gebruikers op verschillende fora zoals Reddit, Synology en Smartmontools betwisten die analyse.

Lees ook: Western Digital heeft roadmap naar 50 TB-harde schijven

Concreet zou de CMR/SMR-combinatie niet compatibel zijn met RAID-controllers. Aanvankelijk is er geen enkel probleem: een RAID-systeem met verschillende WD-SMR-drives zal tijdens normaal gebruik inderdaad voldoende hebben aan de buffer. De problemen beginnen wanneer je een bestaande RAID-configuratie wil uitbreiden met een WD Red, of een RAID-configuratie wil herstellen na een uitgevallen drive.

De RAID-controller zal nu de hele schijf herschrijven op basis van de pariteitsbits op de andere drives. De heropbouw van de RAID-configuratie is een extreem intensieve taak die al snel 24 uur in beslag kan nemen. In die tijd wordt de CMR-buffer van de drive met glans overschreden. De firmware zal nu, net als op de desktop, maatregelen nemen en de buffer ledigen naar de SMR-zones. Tijdens die actie neemt de HDD even geen nieuwe schrijfopdrachten meer aan, waardoor de RAID-controller de drive terecht als niet responsief ziet. Aangezien de controller de drive sector voor sector wil heropbouwen in de nieuwe RAID-configuratie, komt die hapering over als een slechte sector. De controller kan zo logischerwijs concluderen dat de splinternieuwe drive defect is, waarna die uit de RAID-array wordt gesmeten.

Wie een RAID-configuratie wil uitbreiden, aanpassen of herstellen en daarbij naar een drive met stiekeme SMR-technologie gaat schrijven, kan in de problemen komen.

Gebruikers lijken exact dat probleem te ervaren met een select aantal schijven van WD’s line-up. In het beste geval worden dergelijke drives niet uit het array gekickt, maar duurt de opbouw van de RAID-configuratie meerdere dagen in plaats van de gebruikelijke uren. Als consument of professionele gebruiker koop je WD Red-drives precies omdat die geadverteerd worden als perfect voor gebruik in een NAS. Het feit dat je daar een stevige kanttekening bij kan maken, is teleurstellend, vooral omdat WD de SMR-technologie stiekem integreert.

In een reactie geeft WD aan dat zijn drives wel degelijk alle vooropgestelde specificaties halen en interne tests geen problemen met RAID-configuraties aanwijzen. De klachten van klanten gecombineerd met de realiteit van de CMR-buffer wijst echter op het tegendeel.

Waarom?

Waarom nemen de drie fabrikanten nu risico’s door SMR-technologie in hun drives te verpakken zonder dat te vermelden? En waarom verzwijgen ze dat, als het toch niet uitmaakt? Op die laatste vraag is hat antwoord duidelijk: de combinatie van de tragere opslag, de werking met de buffer en de onrechtstreekse manier van schrijven naar een SMR-HDD maakt dat de technologie wel degelijk een impact heeft. De fabrikanten stippen aan dat die impact onmerkbaar is in de scenario’s waarvoor de HDD’s bedoeld zijn en dat is gedeeltelijk waar. Veel gebruikers zullen inderdaad niet tegen de limiet van de buffer aanlopen wanneer ze geen RAID-configuratie gebruiken.

De drijfveer achter de misleiding is zoals vaak geld. SMR verhoogt de capaciteit van een HDD-platter. Je krijgt simpelweg meer data op eenzelfde schijf wanneer je SMR-technologie gebruikt. De aanpak is dus een kostenbesparing van de fabrikant.

Getroffen hardware

Omwille van de onduidelijkheid van de fabrikanten blijft het een beetje zoekwerk naar welke drives stiekem SMR gebruiken. De Duitse prijsvergelijkingswebsite Geizhals lijkt over de juiste data te beschikken die overeenkomt met de bevindingen van gebruikers en de statements van de fabrikanten. Voor Seagate zouden zeven types HDD stiekem SMR gebruiken:

  • Barracuda 2 TB – ST2000DM008
  • Barracuda 4T B – ST4000DM004
  • Barracuda 8 TB – ST8000DM004
  • Desktop HDD 5 TB – ST5000DM000
  • Exos 8 TB – ST8000AS0003
  • Archive v2 6 TB – ST6000AS0002
  • Archive v2 8 TB – ST8000AS0002

Toshiba zondigt met volgende modellen:

  • P300 4 TB – HDWD240UZSVA
  • P300 6 5B – HDWD260UZSVA

Western Digital speelt tot slot vals met deze drives:

  • WD Red 2 TB- WD20EFAX
  • WD Red 4 TB – WD40EFAX
  • WD Red 6 TB – WD60EFAX
  • WD Red 10 TB – WD100EFAX
  • WD Red 10 TB – WD101EFAX
  • WD Red 12 TB – WD120EFAX

De Red-drives met een capaciteit van 8 TB en 14 TB zouden wel gewoon van CMR-technologie gebruik maken.

Oneerlijk

Uiteindelijk maken meerdere factoren deze hele saga schandalig. Het belangrijkste probleem is natuurlijk het gebrek aan transparantie. Toshiba en Seagate verdienen hier net als WD een tik op de vingers, al is het probleem voor de eerste twee HDD-bouwers iets minder groot, aangezien de getroffen schijven duidelijk niet in de markt worden gezet voor gebruik in NAS-omgevingen. Voor WD komt daarbij dat het valsspeelt met zijn Red-drives Van die schijven verwacht je net wel de grootst mogelijke betrouwbaarheid.

Hoewel WD zijn RED-drives speciaal voor NAS in de markt zet, bevatten ze stiekem SMR-technologie die in het beste geval sub-ptimaal en het slechtste geval catastrofaal is.

Ze worden in de markt gezet als NAS-drives met een maximale jaarlijkse schrijflast. Het is niet aan WD om vervolgens assumpties te maken over de dagelijkse schrijflast om zo stiekem een kostenbesparing door te voeren. Bovendien tonen de problemen die gebruikers met hun RAID-configuraties ervaren aan dat de besparing van WD voor minstens een deel van de gebruikers wel degelijk gevolgen heeft. Seagate benadrukt in het licht van het schandaal nog dat zijn Ironwolf-NAS-drives wel degelijk allemaal SMR-vrij zijn

Zoek je een eerlijke HDD-fabrikant om je geld aan te geven? Pech. Toshiba, WD en Seagate zijn de enige drie bouwers van harde schijven ter wereld, alle andere merken maken gebruik van hardware van de drie giganten.

Geen paniek

Heb jij een getroffen drive in een RAID-configuratie in gebruik? Dan is er nog geen reden tot paniek. De problemen treffen drives tijdens het schrijven. Enkel de nieuwe schijf wordt met andere woorden uit de RAID-array gekickt, terwijl de data op bestaande drives intact blijft. Ervaar je problemen, dan is het in theorie wel mogelijk om een andere drive met CMR-technologie te gebruiken om het array alsnog naar wens herop te bouwen.