Hoe pas je een exabyte aan data in een schoendoos?

Tegen 2020 genereert elke persoon die online gaat naar schatting 1,7 MB nieuwe data per seconde. Het is een terugkerend thema tijdens het afgelopen Imec Technology Forum in Antwerpen. De tsunami van data die op ons afkomt, vraagt om nieuwe technologieën om al die informatie beheer(s)baar te houden. Eén piste die daarbij wordt onderzocht, is opslag in DNA.

We luisteren op het Technology Forum naar Jim Linton, CEO van Iridia. Dat bedrijf werd in 2016 opgericht met als doel om een commerciële oplossing voor gegevensopslag te ontwikkelen op basis van DNA. “De beste uitvinder ter wereld is moeder natuur”, vertelt Linton. “DNA is de perfecte tool voor gegevensopslag. We zijn allemaal wandelende harde schijven, elke cel in ons lichaam draagt 6 GB aan data in zich.”

DNA is bijzonder stabiel, wat het uitermate geschikt maakt voor archiefopslag op lange termijn. Bovendien ligt ook de opslagdichtheid enorm hoog, wat tegemoetkomt aan de data-explosie van de komende jaren. “Veel data gaat nu al verloren omdat we ze niet kunnen opslaan”, weet Linton. “Vaak zijn het gegevens die we niet nodig hebben, maar wat als we ze in de toekomst toch willen gebruiken? Het is beter om die data wel te kunnen opslaan en archiveren.”

Verloren zettabytes

Iridia spreekt zelf over een opslagtekort van 7,5 zettabytes (7,5 biljoen gigabytes) tegen 2020. Zolang data in steeds sneller tempo wordt gegenereerd dan dat ze kan worden opgeslagen, zal dat verschil alleen maar toenemen. Er is dus een nieuwe sprong voorwaarts in opslagtechnologie nodig.

 

Tegen 2020 gaat 7,5 zettabytes aan data verloren omdat we ze niet kunnen opslaan.

 

DNA-opslag kan die sprong voorwaarts betekenen, maar de technologie staat nog in zijn kinderschoenen. Dankzij ontwikkelingen in het domein van synthetisch DNA, is het mogelijk om DNA met nullen en enen te coderen. Op die manier kan digitale informatie naar het DNA worden weggeschreven. Aan de hand van een sequentiereactie kan het DNA achteraf weer worden ontleed en de weggeschreven data opnieuw opgebouwd.

Voorlopig werden alleen nog maar experimenten uitgevoerd met kleine hoeveelheden data. Zo slaagden onderzoekers van Microsoft en de universiteit van Washington er in 2016 in om 200 MB aan informatie (boeken, video en databases) in synthetisch DNA op te slaan en daarna weer te reconstrueren.

Automatiseren

Om DNA-opslag commercieel inzetbaar te maken, moet het proces voor het coderen en terugvinden van data worden geautomatiseerd. Ook daar worden vandaag grote sprongen vooruitgezet.

 

geautomatiseerd DNA-opslagsysteem Microsoft
Dit geautomatiseerd opslagsysteem van Microsoft kan data opslaan en terugvinden in synthetisch DNA.

Eerder dit jaar was het opnieuw Microsoft dat een volledig geautomatiseerd DNA-opslagsysteem aan de wereld presenteerde. “Ons uiteindelijke doel is om een systeem in productie te zetten dat voor de eindgebruiker op eender welke andere cloudopslagdienst lijkt. Bits worden naar een datacenter gestuurd en daar opgeslagen, en dan verschijnen ze gewoon weer wanneer de klant ze wil hebben. Om dat te doen, moesten we bewijzen dat dit praktisch is vanuit een automatiseringsperspectief”, zei hoofdonderzoeker Karin Strauss destijds over de doorbraak.

Van DNA naar binair

Ook Iridia werkt aan zijn eigen oplossing in de vorm van een speciale DNA-chip. Zonder te veel in de technische details te duiken, werkt die ongeveer als volgt. De chip bevat kleine stukjes DNA die in een gewenst patroon kunnen worden aan elkaar geregen tot synthetische DNA-strengen, die de vertaling zijn van een binaire code. De basen A en T kunnen zo bijvoorbeeld overeenkomen met waarde 0, terwijl G en C voor een 1 staan. Dezelfde chip kan daarna opnieuw worden gebruikt om het DNA weer uit te lezen.

“Het is een bijzonder schaalbare oplossing waarmee we tot een petabyte aan data kunnen opslaan in het formaat van een suikerklontje”, maakt Linton zich sterk. Hij schat dat DNA-opslag binnen vier tot vijf jaar een commerciële doorbraak zal kennen. De eerste chip van Iridia verschijnt naar verwachting tegen 2025 op de markt.

“DNA-opslag is klaar om een revolutie teweeg te brengen in langdurige archiefopslag. Het zal de kosten drukken en de opslagdichtheid sterk verhogen. Een exabyte aan data past dan in een formaat niet groter dan een schoendoos”, besluit Linton.