Compressie en deduplicatie

NVMe-flashopslag kost veel geld vergeleken met klassieke harde schijven. Om de beschikbare capaciteit zo optimaal mogelijk te gebruiken, maakt PowerMax gebruik van inline deduplicatie (dedupe) en compressie. Atkinson legt ons uit hoe dat werkt. “Inline betekent hier dat dedupe en compressie wordt uitgevoerd nadat de data wordt ontvangen door het systeem, maar voor het wordt geplaatst op de schijven.” Hiermee claimt Atkinson dat een 3:1-verhouding voor dedupe en compressie realistisch is binnen een gemiddeld bedrijf. Stel dat je een systeem hebt met 2 PB aan opslag, dan heb je 6 PB beschikbaar omdat het systeem gemiddeld verwacht dat dedupe en compressie heel wat plaats kunnen winnen.  

Atkinson claimt dat een 3:1-verhouding voor dedupe en compressie realistisch is voor PowerMax binnen een gemiddeld bedrijf.

  PowerMax maakt gebruik van verschillende compressiepools die een vast formaat hebben, variërend tussen 8K en 128K. De meeste data kan worden gecomprimeerd, maar niet alle data behaalt maximale compressie. Om de compressie-efficiëntie te verhogen, werkt PowerMax met verschillende compressiepools. De 128K-pool is de plaats waar niet-gecomprimeerde data wordt bewaard. Hoe actiever data wordt gebruikt, hoe meer die richting de 128K-pool wordt geplaatst. Zo is de data instant beschikbaar zonder dat die opnieuw moet worden gedecomprimeerd.    

Extra opslagcapaciteit

Deduplicatie is een tweede belangrijke stap om extra opslagcapaciteit vrij te maken. Elk bestand dat op de PowerMax wordt gekopieerd, krijgt een specifieke hash ID inline nog voor die wordt gekopieerd. Met die ID wordt eerst gekeken of datareductie actief is. Zoja, dan wordt gekeken of er bestanden op de server-array staan met dezelfde ID. Als dat niet zo is, is het bestand uniek en wordt het weggeschreven naar PowerMax. Bestaat de ID al wel, dan wordt er een extra hash weggeschreven in de tabel, maar wordt het bestand niet bewaard. Atkinson gaat hierop verder: “Elke hash ID wordt gegenereerd dankzij SHA-2 en produceert een unieke 10 byte hash ID. Wanneer blijkt dat het bestand al op de server staat, maakt PowerMax een Dedupe Management Object (DMO) aan dat 64 byte groot is. Hierin staat genoteerd waar het originele bestand staat, en dat wordt doorgegeven aan het front-end device.” PowerMax ondersteunt diverse datareductiediensten zoals SnapVX, SRDF, D@re en vVols.