Microsoft bate el récord de almacenamiento de datos en un fragmento de ADN

Su aspecto recuerda al de un tubo de ensayo con sal deshidratada en el fondo, pero Microsoft afirma este podría ser el futuro del almacenaje de datos. La empresa informó la semana pasada de que había codificado aproximadamente 200 megabits de datos, incluido Guerra y Paz y 99 clásicos literarios más, en ADN.

Los investigadores ya habían demostrado que los datos digitales pueden ser almacenados en ADN, pero Microsoft dice que nadie había codificado tanta cantidad en ADN de golpe.

El ADN representa un buen medio de almacenaje porque los datos pueden ser escritos en moléculas con una concentración mayor que los elementos básicos de las tecnologías convencionales de almacenaje, según la investigadora de Microsoft Karin Strauss. Ella es que también es la máxima responsable del proyecto, que cuenta también con la participación de investigadores de la Universidad de Washington (EEUU). Ahora mismo la técnica es cara y compleja pero la empresa espera aprovecharse de la caída del coste de herramientas para crear y leer ADN impulsada por la industria biotecnológica. El ADN se considera como un sustituto en potencia para la cinta magnética, el mecanismo estándar actual para el almacenaje de datos a largo plazo.

"Nos interesa averiguar si podremos crear un sistema extremo a extremo basado en ADN que pueda almacenar datos, sea automático y pueda ser utilizado por empresas", explica Strauss.

Foto: La sustancia rosa de este tubo de ensayo es ADN que ha sido sintetizado para almacenar datos digitales a largo plazo. Microsoft empleó la misma técnica para almacenar aproximadamente 200 megabits de datos. Crédito: Tara Brown, Universidad de Washington.

Para Strauss el proyecto surge por el hecho de que los dispositivos de almacenaje electrónico no están mejorando al mismo ritmo al que aumenta el volumen de datos con los que se trabaja. La experta detalla: "Si miramos las proyecciones actuales, no podemos almacenar toda la información que queremos al precio de los dispositivos dispositivos actuales".

IDC prevé que el total de datos almacenados alcanzará los 16 billones de gigabits el próximo año, la mayoría de los cuales estarán alojados en enormes centros de datos. Strauss calcula que una cantidad de ADN suficiente para llenar una caja de zapatos podría almacenar el equivalente a aproximadamente 100 gigantes centros de datos.

El ADN también puede resultar increíblemente resistente, especialmente si es conservado en condiciones secas y frescas. En marzo unos investigadores anunciaron que habían reconstruido parcialmente los genomas de unos humanos antiguos cuyos huesos permanecieron dentro de una cueva española durante más de 400.000 años. En cambio, la cinta magnética que representa la mejor opción de almacenaje de datos a largo plazo hoy sólo dura unas décadas antes de empezar a degradarse.

Para almacenar datos en ADN hay que traducir los 1 y 0 de los archivos digitales binarios en largas cadenas de los cuatro nucleótidos distintos que forman las cadenas de ADN y codifican la información genética. En 2012, el biólogo molecular de la Universidad de Harvard (EEUU) George Church escribió un libro de 50.000 palabras que sumaba menos de un megabit de datos en ADN y lo imprimió en un chip de vidrio más pequeño que un grano de polen. Este año informó de haber logrado codificar 22 megabits de datos digitales.

Microsoft afirma haber escrito ahora casi 10 veces esa cantidad de datos digitales en una colección de millones de cadenas de ADN, cada una de 150 bases.

El investigador posdoctoral de la Universidad de Califo ia en Berkeley (EEUU) Reinhard Heckel, que estudia formas de almacenar datos en ADN, lo considera "impresionante". Pero dice que el mayor obstáculo para poder sacar provecho del almacenaje de datos en ADN es el coste, porque fabricar moléculas personalizadas de ADN es caro. "Para que la gente realmente lo adopte, tienes que almacenar [los datos] en algo más barato que la cinta, y eso será difícil", apunta Heckel.

Microsoft no divulgará los detalles de lo costó su esfuerzo de construir su almacenamiento de ADN de 200 megabits, que necesitó de alrededor de 1.500 millones de bases. Pero Twist Bioscience, que sintetizó el ADN, típicamente cobra casi 10 céntimos de euro por cada base. La síntesis comercialmente disponible puede llegar a costar 0,04 céntimos de euro por base. Leer un millón de bases cuesta aproximadamente menos de un céntimo de euro. Strauss confía en que los costes de leer y escribir ADN caerán drásticamente durante los próximos años. Afirma que ya hay pruebas de que están cayendo a un ritmo más rápido que la caída del coste de fabricar transistores durante los últimos 50 años, una tendencia que ha impulsado gran parte de las innovaciones en la computación.

Habría costado unos unos nueve millones de euros secuenciar un genoma humano en 2007, pero menos de 1.000 euros en 2015.

Los investigadores ya habían demostrado que los datos digitales pueden ser almacenados en ADN, pero Microsoft dice que nadie había codificado tanta cantidad en ADN de golpe.

"Nos interesa averiguar si podremos crear un sistema extremo a extremo basado en ADN que pueda almacenar datos, sea automático y pueda ser utilizado por empresas", explica Strauss.

Microsoft afirma haber escrito ahora casi 10 veces esa cantidad de datos digitales en una colección de millones de cadenas de ADN, cada una de 150 bases.

Habría costado unos unos nueve millones de euros secuenciar un genoma humano en 2007, pero menos de 1.000 euros en 2015.

Buscar en MIT Technology Review

Explorar Temas

Secciones

Microsoft bate el récord de almacenamiento de datos en un fragmento de ADN