L’archivage des données: tendon d’achille des data?


Localiser un incident sur les réseaux de communication, surveiller la qualité de l’eau, trouver l’hôpital le plus proche d’un lieu d’accident de la route, sont quelques exemples actions nécessitant la création d’une base de données géolocalisées. La connaissance des territoires est de plus en plus virtuelle. Les données géographiques sont mobilisées dans de nombreux secteurs pour prendre des décisions. Au delà de la géomatique, la compilation des données est prégnante dans l’ensemble des activités humaines s’appuyant sur une interface numérique. Pour réaliser ces actes, des informations doivent être au préalable stockées à court ou à long terme sur des supports informatiques. Conserver les données semble procurer des possibilités infinies dans l’ensemble des secteur de la société.

Ces supports informatiques sont-ils fiables? Peut-on confier notre mémoire à des technologies non pérennes? Quelle alternative existe pour conserver notre organisation moderne des connaissances?

La faculté des hommes à faire face à toute sorte d’enjeux repose en grande partie sur l’accumulation des connaissances. Nous avons hérité de connaissances précieuses depuis l’antiquité sous diverses formes, qui a permis d’élaborer le socle de notre pensée scientifique. La pierre gravée reste lisible sur 10 000 ans, le parchemin sur 1000 ans et la pellicule sur 100 ans. Quand est-il des supports retranscrivant une information binaire, nouvelle forme d’écriture? Dans les années 90, le CD était sensé devenir le support d’archivage de référence. Cette conviction était mal fondée. Le CD est un support instable et fragile, qui offre une durée de vie de 20 ans dans le meilleur des cas. La clé USB et autres mémoires flash ne font guère mieux. En respectant le seuil des 100 000 réécritures, très vite atteint en informatique, la préservations des données n’excède pas 10 ans.

Source:https://www.zed.fr/fr/tv/distribution/catalogue/programme/nos-ordinateurs-ont-ils-la-memoire-courte

Source:https://www.zed.fr/fr/tv/distribution/catalogue/programme/nos-ordinateurs-ont-ils-la-memoire-courte

Plus les supports techniques évoluent et plus le temps disponible pour conserver l’information se réduit. Or l’humanité produit sans cesse toujours plus de connaissances sous forme de données immatérielles. Pour imaginer ce que représente la masse d’information crée par l’humanité à l’ère du numérique, il faut avoir les ordres de grandeur suivant:

Un page rédigée, c’est 3 Ko, 300 pages 1 Mo, une bibliothèque 1 Go. Un DVD peut contenir 6 bibliothèques soit 6 Go. Uniquement pour l’année 2011, les données générées par l’humanité, inscrite sur DVD, pourraient se matérialiser sous la forme d’une pile de DVD reliant la Terre à la Lune. Les Data représente une quantité d’information colossale, collectée pour servir nos intérêts.

L’incertitude révélée par la non pérennité des supports numériques, est devenu un réel sujet d’inquiétude. Des chercheurs se sont déjà mis à pied d’oeuvre pour trouver des alternatives d’archivage des données numériques. L’université de Kyoto au Japon, explore la piste de la gravure au laser sur quartz. Cette technique permet d’inscrire des données dans la masse du minéral, à l’abri de toute forme d’altération pour des millions d’années et lisibles au microscope par transparence. Les problèmes de détérioration et de format de lecture sont réglés mais cette technologie reste limitée par ces capacités de stockage.

L’ European Bioinformatics Institute en Angleterre, étudie une une autre piste encore plus révolutionnaire. L’ ADN possède une durée de vie de plus centaine de millier d’années entreposé dans un environnement optimum. En transcodant le système binaire en système A, C,G et T, éléments chimiques constituant le langage génétique, il est possible dés à présent de stocker des fichiers textes, audios et graphiques dans un brin d’ ADN. Ce procédé reste encore expérimental et onéreux mais s’avère très encourageant par ses capacités de stockage gigantesques.

source:https://lejournal.cnrs.fr/articles/des-molecules-pour-stocker-linformation

Source:https://lejournal.cnrs.fr/articles/des-molecules-pour-stocker-linformation

La solution actuelle mise en oeuvre à grande échelle pour parer à l’évanouissement des données quotidiennement générées est leur duplication à l’infini. Le Cloud est devenu le support de prédilection pour sauvegarder les informations de manière sure. Cependant il ne faut pas oublier que derrière cette technologie se trouve une interface matérielle avec ses failles. Les data-center dans lesquels prend vie le Cloud, ne sont ni plus ni moins que des disques durs en réseaux. Les données sont répliquées de disques durs à disques durs dans un flux continu. En effet ce support électronique n’est pas viable à long terme. Il n’est pas improbable qu’une erreur vienne se glisser au fur et à mesure des copies malgré la présence de codes correcteurs.

source:http://www.informatiquenews.fr/cisco-star-du-data-center-amazon-du-cloud-43567

source:http://www.informatiquenews.fr/cisco-star-du-data-center-amazon-du-cloud-43567

L’informatique a étendu le champs des possibles en matière de connaissance et de maîtrise de notre environnement. Il ne faut cependant pas oublier que derrière le monde virtuel se trouve une matérialité ayant ses faiblesses. On peut se demander si la conservation des données à long terme à un sens dans un environnement aussi mouvant. Ce qui est vrai aujourd’hui ne le sera pas forcément demain. A t-on besoin de garder en mémoire les informations concernant un territoire changeant pour faire de la géomatique appliquée?

Source:

http://future.arte.tv/fr/memoire-numerique

http://binaire.blog.lemonde.fr/2015/05/18/nos-ordinateurs-ont-ils-la-memoire-courte/

http://www.01net.com/actualites/des-chercheurs-creent-un-support-de-stockage-eternel-952089.html

 

 

Laissez un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *