Arctic World Archive
Archives souterraines
From Wikipedia, the free encyclopedia
Les Arctic World Archive (AWA) (en français : Archives mondiales de l'Arctique) sont un centre de conservation de données situé dans l'archipel du Svalbard, sur l'île de Spitzberg, en Norvège, non loin de la Réserve mondiale de semences du Svalbard. Elles renferment des données d'intérêt historique et culturel provenant de plusieurs pays, ainsi que l'intégralité du code open source de l'entreprise multinationale américaine GitHub, dans un coffre-fort en acier profondément enfoui. Le support de stockage des données est conçu pour une durée de vie estimée entre 500 et 1 000 ans. L'AWA est gérée en tant qu'entreprise à but lucratif par la société privée Piql et la compagnie minière d'État Store Norske Spitsbergen Kulkompani (SNSK).
Histoire
Piql est une entreprise norvégienne de stockage de données spécialisée dans l'archivage à long terme de supports numériques. Piql et SNSK ont créé la chambre forte en acier profondément enfouie à partir d'un puits de mine d'une ancienne mine de charbon abandonnée. Lors de son inauguration en tant qu'Archives mondiales de l'Arctique, le 27 mars 2017, les gouvernements brésilien, mexicain et norvégien y ont entreposé des copies de divers documents historiques[1],[2],[3].
Description
L'archipel du Svalbard, situé au nord de la Norvège continentale, situé à environ 970 km du pôle Nord[4], est déclaré démilitarisé par 42 pays, conformément au Traité du Svalbard signé après la Première Guerre mondiale[1]. Le territoire ne peut donc être utilisé à des fins militaires, et l'entreprise le décrit comme « l'un des endroits les plus sûrs au monde sur le plan géopolitique[5],[6]». Le centre d'archives se trouve sur le Spitzberg, la plus grande île du Svalbard[7].
L'installation est un grand coffre-fort en acier[7] situé entre 150[5] et 300 mètres sous le sol ou le pergélisol[7],[4] à l'intérieur d'une mine de charbon abandonnée (Store Norske Gruve 3) qui atteint plus de 300 mètres de profondeur d'un flanc de montagne[5],[8],[2]. L'installation est sécurisée par un mur en béton et une porte en acier. Les dépôts eux-mêmes sont stockés dans des conteneurs maritimes sécurisés derrière la porte[3].
En raison du climat arctique de l'île et du pergélisol qui en résulte, même en cas de panne de courant, la température à l'intérieur de la chambre forte resterait inférieure à zéro degrés, ce qui est suffisamment froid pour préserver son contenu pendant des décennies, voire plus[5]. La chambre forte se situe à 250 mètres de profondeur[7]. L'abri est situé suffisamment profondément pour éviter les dommages causés par des armes nucléaires ou des impulsions électromagnétiques[8].
Stockage et utilisation future
Les données sont stockées en hors ligne sur des bobines de film fabriquées à l'aide d'une version améliorée de la technologie photographique classique de chambre noire[1],[4]. Le film est composé de polyester recouvert de cristaux d'halogénure d'argent[7] et d'une couche de poudre d'oxyde de fer dont sa durée de vie est d'au moins 500 ans et peut atteindre 2 000 ans dans des conditions de stockage optimales[6].
En réalisant que des personnes vivant dans un futur lointain pourraient ne pas comprendre ce qu'elles verront dans la chambre forte, une sorte de « pierre de Rosette » a été conçue afin de les aider à décoder les données, sous la forme d'un guide d'interprétation des archives. Ces guides sont tous lisibles à l'œil nu, après grossissement, et rédigés en anglais, en arabe, en espagnol, en chinois et en hindi[7].
Processus
Les clients qui paient pour le stockage de données peuvent envoyer leurs données par voie numérique ou physique. Les données peuvent être récupérées à tout moment depuis le coffre-fort, mais le processus est long car les données ne sont pas connectées à Internet. Lorsqu'une donnée est demandée, la bobine de film correspondante doit être extraite manuellement[1], puis transférée par fibre optique vers le continent, au siège de Piql à Drammen[4]. Le délai de récupération le plus court est de 20 à 30 minutes, mais il peut atteindre 24 heures avec un abonnement et 72 heures sans abonnement[1],[2].
Contenu
Les archives conservent un large éventail de données historiques et culturelles[7]. Des gouvernements, des chercheurs, des institutions religieuses, des entreprises de médias et d'autres organismes y déposent certains de leurs documents les plus importants. Le Brésil et la Norvège y ont archivé leurs constitutions ainsi que d'autres documents historiques importants[4].
Les archives comprennent des informations sur la biodiversité australienne et des exemples d'œuvres australiennes d'importance culturelle. Elles incluent l'Atlas of Living Australia et des modèles d'apprentissage automatique créés par Geoscience Australia (en), qui contribuent à la compréhension de sujets tels que les feux de brousse et le changement climatique[7].
Les archives comprennent également une version numérisée du tableau Le Cri d'Edvard Munch pour le Musée national de Norvège, et une version numérisée du chef-d'œuvre de Dante de la littérature italienne, La Divine Comédie, pour la Bibliothèque vaticane[2].
En mars 2018, l'émission scientifique allemande Galileo a diffusé son premier épisode et a réalisé un documentaire à ce sujet pour ProSieben[2],[8].
En octobre 2020, le premier dépôt d'un lauréat du prix Nobel a été effectué auprès des Archives. 14 livres de la lauréate du Prix Nobel de littérature 2018, Olga Tokarczuk, ont été placés sur PiqlFilm, un projet mené par Piql Polska et financé par l'éditeur Wydawnictwo Literackie[9],[2].
Programme d'archivage GitHub
En novembre 2019, GitHub (qui a été acquis par Microsoft en 2018[6]) a annoncé que tout son code open source public serait archivé dans un coffre-fort de codes à l'Arctic World Archive[2],[3], dans le cadre de son programme d'archivage GitHub[7].
En juillet 2020, les archives du site datant de février de la même année, d'une taille de 21 téraoctets, ont été stockées à l'AWA[2],[3]. Les données sont stockées sur 186 bobines de film d'une longueur totale d'un kilomètre recouvertes de code et stockées sous forme de code-barres matriciel (2D) (Code-barre Boxing (en)), stockant des données à très haute densité, chacun des 200 plateaux de données contient 120 gigaoctets[6]. La quantité de code stockée a été décrite ainsi : « Si une personne tapant à environ 60 mots par minute tentait de remplir tout cet espace, cela lui prendrait 111 300 ans[7] ». La première bobine contient le code des systèmes d’exploitation Linux et Android, ainsi que celui de 6 000 autres applications open source majeures[6].
En plus du guide général du coffre-fort, l’« Arbre technologique » (en anglais : Tech Tree) détaille le développement logiciel, les langages de programmation et d’autres informations sur la programmation informatique[7]. Le guide et l’Arbre technologique sont rédigés de manière collaborative et disponibles dans un dépôt Git public[2].
L'Arctic Cold Vault (en français : Code de coffre-fort de l'Arctique) de GitHub est une couche d'archivage « froide ». Les couches « chaude » (dépôts en ligne accessibles) et « tiède » (comme l'Internet Archive) des archives de code de GitHub présentent toutes deux la faiblesse d'être basées sur l'électronique. Il s'agit d'une capture instantanée incomplète mais plus sécurisée des données, avec un archivage prévu à intervalles de cinq ans[7].
Voir aussi
- La Réserve mondiale de semences du Svalbard, qui stocke des semences du monde entier en cas de crise majeure
- Internet Archive