Biotecnología

Grandes preguntas: ¿cómo empezó la vida?

La IA está ayudando a los químicos a desentrañar los misterios sobre los orígenes de la vida, y a detectar indicios de ella en otros mundos

por Michael Marshall | traducido por
07 Diciembre, 2023

Cómo comienza la vida es una de las preguntas más grandes y complejas de la ciencia. Sabemos que algo ocurrió en la Tierra hace más de 3.500 millones de años, y es muy posible que también haya ocurrido en otros mundos del universo.

Sin embargo, no sabemos cómo se hace la magia. De algún modo, un caldo de sustancias químicas no vivas, como el agua y el metano, debe combinarse y autoorganizarse. Cada vez aumenta su complejidad y coordinación, hasta que finalmente da lugar a una célula viva.

Una de las mayores dificultades es la gran complejidad del problema: incluso las bacterias más simples ya conocidas tienen más de 100 genes y contienen cientos de tipos de moléculas. Y todas interactuan con vehemencia en una danza microscópica. El entorno de la Tierra primigenia también debió de ser complicado: gran cantidad de sustancias químicas diferentes, desde metales y minerales hasta agua y gases, todo ello fue arrastrado por los vientos y las erupciones volcánicas.

"El espacio de parámetros experimentales es casi infinito", afirma Wilhelm Huck, químico de la Universidad Radboud de Nimega (Países Bajos).

Ahora, algunos investigadores están probando un nuevo enfoque: aprovechar la IA para identificar las condiciones de éxito. En concreto, varios grupos han empezado a utilizar herramientas de aprendizaje automático que pueden identificar patrones en conjuntos de datos demasiado grandes y desordenados para que el cerebro humano los comprenda.

La esperanza es que estas herramientas ayuden a los investigadores a lograr en años lo que de otro modo llevaría décadas. Al indicar el camino hacia los procesos más rápidos y robustos para generar complejidad, podrían ayudarnos a concebir una teoría universal de los orígenes de la vida, aplicable no solo a la Tierra sino a cualquier otro mundo.

Aún es pronto, pero ya se han producido algunos avances significativos.

Crear vida desde cero

El problema sobre el origen de la vida tiene que ver, al menos en parte, con la química. ¿Qué mezcla de sustancias químicas, y en qué condiciones, es necesaria para que se forme la vida? "La química responderá a esta pregunta, una de las más profundas de la humanidad", asegura Leroy ‘Lee’ Cronin, químico de la Universidad de Glasgow (Reino Unido).

El estudio de los orígenes de la vida se inició con un experimento publicado en 1953. Stanley Miller, un estudiante de posgrado supervisado por el químico Harold Urey, mezcló agua y tres gases en frascos de vidrio, los calentó y sometió a descargas eléctricas que imitaban los relámpagos que supuso que caían sobre la joven Tierra con regularidad. Al cabo de unos días se había obtenido glicina, el aminoácido más simple y uno de los componentes básicos de las proteínas.

Aunque el experimento de Miller no produjo vida ni nada que parecido, se convirtió en un icono pues se realizó sin supervisión: Miller solo lo preparó y lo dejó funcionar. Con ello, se pretendía imitar las condiciones de la Tierra primigenia, donde no había químicos sintéticos que guiaran las reacciones hasta el final "adecuado". Sin embargo, el supuesto realismo del experimento también era un problema, ya que producía tantas sustancias químicas que era casi imposible identificarlas todas y comprender cómo se formaban.

Muchos experimentos posteriores de química "prebiótica" han sido controlados con más cuidado, y consiguieron producir más aminoácidos, azúcares y otras sustancias químicas de la vida. Sin embargo, no está claro que estas reacciones tan meticulosamente controladas se produjeran sin intervención humana, por lo que es posible que no nos digan nada sobre la Tierra primigenia. Los investigadores quieren volver al experimento de Miller, y encontrar mejores formas de explorar lo que ocurre en mezclas complejas no controladas.

Ahí puede entrar en juego el aprendizaje automático, es más, la tecnología ya se ha aplicado a problemas existentes en biología. En particular, AlphaFold, el sistema de Google DeepMind ha logrado predecir las formas tridimensionales plegadas de miles de proteínas. Para ello, sus creadores entrenaron primero a AlphaFold con las estructuras conocidas de muchas proteínas. Una vez aprendidos los patrones, fue capaz de predecir, con gran precisión, las estructuras de otras proteínas que aún no habían sido caracterizadas.

Betül Kaçar, de la Universidad de Wisconsin-Madison (EE UU), y sus colegas hicieron algo parecido en un estudio publicado en 2022. Intentaron reconstruir la historia evolutiva de unas proteínas llamadas rodopsinas, que las bacterias utilizan para absorber la energía de la luz. En concreto, querían saber qué tipo de luz absorbían las primeras rodopsinas, ya que esto indicaría en qué tipo de entorno evolucionaron.

Al comparar los genes que codifican la rodopsina en microbios emparentados a distancia, pudieron estimar las secuencias de los genes de rodopsina más antiguos, genes que ya no existen. Además, llegaron a la conclusión de que estas primeras proteínas rodopsinas estaban sintonizadas con frecuencias específicas de luz. Por tanto, utilizaron una técnica de aprendizaje automático desarrollada por otro grupo, que podía predecir la fotosensibilidad de las rodopsinas actuales. El equipo de Kaçar utilizó el aprendizaje automático para demostrar que las rodopsinas primigenias eran más sensibles a la luz verde. Esto sugería que los microbios de los que formaban parte vivían algo por debajo de la superficie de una masa de agua, donde el agua bloqueaba otras frecuencias de luz. Esto encaja con otras líneas de evidencias sobre dónde se originó la vida inicialmente.

Explorando el desorden

¿Qué ocurre con esas complejas mezclas de sustancias químicas? Bartosz Grzybowski, químico sintético del Instituto de Ciencias Básicas de Ulsan (Corea del Sur), fue pionero en la materia gracias a un estudio publicado en 2020.

El equipo recopiló datos sobre química prebiótica de docenas de artículos publicados desde el experimento de Miller en 1953, cada uno de ellos demostraba un pequeño número de reacciones. Los combinaron en una única base de datos, y crearon una red de reacciones. A continuación, escribieron un programa informático para predecir nuevas reacciones, basándose en qué tipos de interacciones tendrían lugar entre distintos tipos de sustancias químicas.

Al partir de seis materiales sencillos, como agua y amoníaco, demostraron que era posible crear decenas de miles de sustancias químicas en condiciones óptimas, incluidas muchas de las que se encuentran en los organismos vivos. Lo más importante es que el programa predijo reacciones que nunca se habían observado, varias de ellas fueron llevadas a cabo por los investigadores. De un plumazo, habían identificado una serie de reacciones químicas nuevas que podrían haber sido importantes en la formación de la vida primigenia.

El estudio habría sido imposible sin el software. "Un ser humano no va a trazar el mapa de una red de decenas, miles o millones de conexiones", afirma Grzybowski. Sin embargo, subraya que el software fue codificado por químicos y obedece reglas explícitas. "Ni siquiera llamaría IA a lo nuestro", reconoce, sino "un sistema híbrido".

A pesar de sus predicciones correctas, la red de reacciones de Grzybowski sigue siendo algo teórica. También necesitamos saber a qué velocidad transcurre cada una de las reacciones y si los subproductos de reacciones anteriores interferirán con las posteriores. Huck, químico de la Universidad de Radboud (Países Bajos), y sus colegas han empezado a abordar esta cuestión con ayuda del aprendizaje automático.

En un estudio publicado en 2022, el equipo de Huck llevó a cabo la reacción de la formosa, que crea azúcares a partir de moléculas simples basadas en el carbono. Dado que un azúcar llamado desoxirribosa se utiliza para fabricar ADN, la creación de azúcares es un primer paso crucial en los orígenes de la vida. No obstante, hay un problema en la reacción de la formosa, ya que tiende a sufrir una "explosión combinatoria", explica Huck, y produce docenas o cientos de productos que varían en su mayoría al depender de las condiciones exactas.

El equipo de Huck llevó a cabo la reacción en pequeñas cámaras de flujo para mantenerla bajo control. Además, variaron una serie de condiciones, como la temperatura y la disponibilidad de distintas sustancias químicas. Después, la detuvieron una vez que había fabricado unas cuantas docenas de sustancias químicas, y analizaron la mezcla más tarde.

Las condiciones ambientales, como la temperatura, determinan qué productos se forman en la reacción, describe Huck. Sin embargo, no es obvio cómo ni por qué. A veces, los pequeños cambios en las condiciones tienen poco efecto, pero otras veces conducen a resultados diferentes. Ahí entra en juego el aprendizaje automático, tras un cierto entrenamiento, el software fue capaz de predecir lo que reproduciría la reacción. Esto nos acerca un poco más a la comprensión de las condiciones en las que se fabricaban azúcares en la Tierra primigenia.

Determinar las condiciones ambientales y otros parámetros que prevalecían en aquella época es uno de los mayores problemas para la investigación de los orígenes de la vida, afirma Wentao Ma, de la Universidad de Wuhan (China). Y técnicas como el aprendizaje automático ayudarán a reducirlo. En un estudio de 2021, Ma y sus colegas simularon una mezcla de ácidos nucleicos. Gracias al aprendizaje automático, pudieron hallar las condiciones óptimas para crear ácidos nucleicos capaces de acelerar la formación de sus propios componentes básicos, el tipo de círculo virtuoso del que depende la vida.

Por último, el aprendizaje automático también ayudaría a crear simulaciones fiables de los mecanismos precisos por los que se producen las reacciones químicas, esto es crucial para predecir cuándo funcionarán y cuándo no. Las herramientas clave para ello son los modelos informáticos que simulan todos los átomos de una mezcla mientras rebotan e interactúan entre sí. "Al realizar la simulación, podemos acceder al comportamiento microscópico del sistema", explica Timothée Devergne, modelizador de la Universidad de la Sorbona de París (Francia).

Sin embargo, estas simulaciones "atomísticas" consumen mucho tiempo. Cada interacción entre átomos requiere la resolución de ecuaciones complejas, por lo que ha sido muy difícil simular las complejas mezclas que existían en la Tierra primigenia. En consecuencia, los experimentos de química prebiótica han sido una especie de caja negra, pues podemos ver lo que se escupe, pero lo que ocurrió de manera exacta es un misterio.

Devergne utiliza el aprendizaje automático para resolver este problema. En 2007, varios investigadores de la ETH de Zúrich (Suiza) desarrollaron una red neuronal capaz de aprender las soluciones más probables de las ecuaciones que eran necesarias. Esto aceleró los cálculos en varios órdenes de magnitud. Ahora, Devergne y sus colegas aplican este método a la química prebiótica. Como prueba inicial, en un estudio publicado en 2022, utilizaron el aprendizaje automático para simular las reacciones que dieron lugar a la glicina en el experimento de Miller, algo simulado previamente y sin aprendizaje automático por el supervisor de Devergne. La red neuronal redujo el tiempo de cálculo entre 10 y 50 veces. Los resultados similares de otro grupo también se publicaron en 2022.

¿Para qué sirve?

Todas las personas contactadas para este artículo coinciden en que el uso del aprendizaje automático y otras herramientas de IA en la investigación sobre los orígenes de la vida se encuentra en una fase muy temprana. Algunos se muestran cautelosos a la hora de exagerar el enfoque.

"No puede decirnos nada nuevo, porque sabe lo que sabe", afirma Valentina Erastova, científica computacional de la Universidad de Edimburgo (Escocia). Las herramientas de aprendizaje automático solo pueden hacer predicciones precisas después de alimentarlas con grandes cantidades de datos de alta calidad. "Pueden mostrar tendencias y vínculos, pero están completamente sesgados por la forma en que se las entrene".

Sin duda, las herramientas de IA pueden acelerar lo que de otro modo sería monótono. Por ejemplo, en 2018, el equipo de Cronin describió un robot capaz de realizar experimentos y análisis químicos más rápido que los humanos. Utilizaba el aprendizaje automático para evaluar el progreso de las reacciones en tiempo real, y predecir qué mezclas reaccionarían y cuáles no. Cronin lleva años digitalizando la química, planea utilizar estos sistemas para realizar experimentos de química prebiótica y descubrir las vías para la formación de la vida. Por analogía con AlphaFold, asegura que quiere hacer "AlphaSoup".

El poder del aprendizaje automático es que puede ver patrones en grandes conjuntos de datos cuando los humanos no pueden. "Detecta patrones en mezclas complejas e identifica procesos que tienen lugar, y que tú mismo no puedes detectar", explica Huck. "Es un espacio de dimensiones tan altas que los patrones se te escapan".

La esperanza es que estos métodos permitan a los investigadores comprender, por fin, lo que ocurre en mezclas complejas que interactúan, como las que se encuentran en la Tierra primigenia. "Esta tecnología nos permite estudiar sistemas mucho más grandes que antes", afirma Devergne.

Hay una última cuestión. Si uno de los experimentos tiene éxito y un bioquímico consigue crear una forma sencilla de vida en el laboratorio; o si Perseverance, el vehículo explorador, descubre un microbio extraterrestre en Marte. Entonces, ¿cómo sabremos si lo que estamos viendo está realmente vivo?

"Se trata de un viejo problema de la geoquímica", explica Jim Cleaves, geoquímico de la Universidad Howard de Washington D.C. (EE UU). "¿Cómo se decide si algo está vivo o no?".

Para Cronin, la respuesta es la teoría del ensamblaje. Cronin y sus colegas sostienen que la característica distintiva de la vida es producir un gran número de objetos muy complejos, y definen la complejidad de un objeto por el número de pasos necesarios para fabricarlo. En un estudio de 2021, presentaron pruebas de que podían distinguir entre muestras producidas por la vida y muestras producidas sin ella, al basarse en la compleja medida de las moléculas. Y se utilizó el aprendizaje automático para acelerar los análisis.

En un estudio publicado en septiembre de 2023, Cleaves y sus colegas utilizaron el aprendizaje automático de forma más directa. Entrenaron una red neuronal con una amplia gama de sustancias, como arroz basmati, carbón y esquisto. Después, pudo identificar muestras biológicas y no biológicas con una precisión del 90%. La IA utilizó una métrica algo distinta de la de Cronin, pues se centra en la mezcla global de componentes químicos dentro de una muestra, y no en la complejidad de los componentes individuales, explica Cleaves, "son ideas complementarias".

Cleaves afirma que este tipo de métodos podrían aplicarse a los datos procedentes de sondas, como los vehículos exploradores de la NASA. Por ejemplo, el rover Curiosity tiene un instrumento llamado SAM (Sample Analysis at Mars) que realiza análisis químicos similares a los que utilizó su equipo. Con modificaciones menores, aventura Cleaves, "podría hacerse ahora".

Mientras tanto, investigadores como Cronin y Huck siguen adelante con sus estudios sobre la bioquímica primigenia. "Creo que podremos utilizar técnicas de aprendizaje automático como AlphaFold, pero tendremos que reentrenarlas en el caldo química", concluye Cronin. "Debemos hacer AlphaSoup. Si somos capaces de hacerlo, saldremos a la carrera".

Michael Marshall es un escritor independiente residente en Reino Unido. Se dedica a las ciencias de la vida, la salud y el medio ambiente. The Genesis Quest, su primer libro, trata sobre los orígenes de la vida

Biotecnología

Grandes preguntas: ¿cómo empezó la vida?

Crear vida desde cero

Explorando el desorden

¿Para qué sirve?

Un nuevo tratamiento a partir de células madre busca curar la epilepsia

Un fármaco diseñado por IA alcanza un hito al avanzar en la fase de pruebas

Falta de protocolos y tratamientos dudosos: los retos de la medicina de la longevidad