GitHub bewaart volledig opensource-archief in Arctische kluis

GitHub heeft een snapshot van al zijn publieke repositories verhuisd naar een Arctische kluis in Noorwegen, waar al de opensource code die op het platform leeft voor meer dan duizend jaar gearchiveerd wordt.

GitHub, onderdeel van Microsoft, beheert de grootste verzameling van opensource code ter wereld en kondigde vorig jaar in november aan dat het die data veilig ging archiveren in de GitHub Arctic Code Vault. Die bevindt zich in een oude koolmijn, zo’n 250 meter onder de permafrost in Svalbard, Noorwegen. Daar moet het code-archief de tand des tijds doorstaan voor toekomstige generaties.

Op 20 februari van dit jaar werd een snapshot gemaakt van het volledige publieke GitHub-archief, goed voor in totaal 21 terabytes die werden weggeschreven op 186 filmrollen. Door de uitbraak van het coronavirus kon de code evenwel pas op 8 juli in de Arctic Code Vault in Noorwegen worden afgeleverd.

“Ons oorspronkelijke plan was dat ons team naar Noorwegen zou vliegen en persoonlijk de opensource code van de wereld naar het Noordpoolgebied zou begeleiden, maar omdat de wereld een wereldwijde pandemie blijft doorstaan, moesten we onze plannen aanpassen”, vertelt Julia Metcalf, director of strategic programs bij GitHub in een blogpost.

Beeld: GitHub

Het transport werd overgelaten aan een lokale logistieke partner. “De code kwam terecht in Longyearbyen, een stad met een paar duizend inwoners op Svalbard, waar onze dozen werden opgewacht door een plaatselijk logistiek bedrijf en ’s nachts in tussentijdse veilige opslag werden gebracht. De volgende ochtend reisden ze naar de ontmantelde kolenmijn in de berg en vervolgens naar een kamer diep onder honderden meters permafrost, waar de code zich nu bevindt.”

Het archief bevat publieke code-repositories en belangrijke slapende repo’s. Het snapshot bestaat uit de HEAD (de laatste commit) van de default branch van elke repository, minus eventuele binaire bestanden die groter zijn dan 100 kB. Elke repository werd verpakt als een enkel TAR-bestand en de meeste gegevens zijn opgeslagen in de vorm van QR-codes om efficiënt te kunnen worden geraadpleegd.