Stockage de données dans l’ADN : une avancée majeure accélère le processus de récupération

Le stockage de contenu numérique dans l’ADN est une technologie émergente qui exploite la densité, la durabilité et les faibles besoins en énergie de la molécule. L’ADN peut durer des générations, contrairement aux flash NAND et aux disques durs qui se dégradent en quelques années ou décennies, au mieux. Il offre également une capacité de stockage de données environ 100 millions de fois supérieure à celle des systèmes de stockage de données classiques. Cependant, la récupération des données à partir du stockage d’ADN est un processus complexe et plutôt lent. Une bonne nouvelle, une percée réalisée par des chercheurs israéliens accélère l’activité de 3 200 fois, rapporte TechXplore.
Technologie de pointe
Une équipe de Technion – l’Institut israélien de technologie – a créé un outil d’IA qui rend la récupération d’informations numériques stockées dans l’ADN nettement plus rapide et précise. Le système, nommé DNAformer, est 3 200 fois plus rapide que les méthodes précédentes les plus précises et est censé offrir d’excellents résultats, montrant ainsi des promesses pour le stockage de données à grande échelle et efficace à l’aide de matériaux biologiques. Il est encore trop lent pour le marché commercial, mais les chercheurs pensent qu’ils vont dans la bonne direction.
Amélioration significative des performances
Cette nouvelle approche permet le traitement de 100 Mo en seulement 10 minutes, par rapport à plusieurs jours en utilisant les meilleures méthodes actuelles. Lors d’un test impliquant 3,1 Mo, l’outil a géré plusieurs types de contenus : une image fixe en couleur, un court enregistrement sonore de Neil Armstrong sur la Lune, un texte sur les avantages du stockage de l’ADN, et des données générées de manière aléatoire imitant des fichiers cryptés ou compressés.
Pour stocker des données, des molécules d’ADN personnalisées sont synthétisées. La lecture de l’information nécessite du séquençage, mais cela introduit diverses erreurs comme des suppressions ou des substitutions, et renvoie des copies de données désordonnées et parfois corrompues. DNAformer gère ces problèmes à l’aide d’algorithmes qui identifient les schémas corrects à partir des entrées défectueuses.
Une fiabilité améliorée
Le modèle comprend des codes de correction personnalisés et une couche de sécurité pour détecter des séquences très bruyantes. Il utilise des outils spécialisés pour corriger ces erreurs avant de traduire les séquences en forme numérique. DNAformer est basé sur un modèle transformateur entraîné à l’aide d’ensembles de données synthétiques produits par un simulateur également construit à Technion. En plus de l’amélioration de la vitesse, DNAformer a également montré jusqu’à 40% de précision supérieure par rapport aux méthodes rapides de récupération précédentes.
Cette performance marque une percée dans le traitement des données de stockage d’ADN du monde réel, en particulier lorsqu’il s’agit de traiter des séquences incomplètes ou bruyantes qui défient les méthodes de correction traditionnelles.
Source : www.tomshardware.com