La humanidad se ha enfrentado a un enorme desafío durante medio siglo: comprender la forma de los componentes básicos de la vida, un conocimiento esencial para curar enfermedades que ahora son mortales. El agua es muy fácil de imaginar. Son solo dos átomos de hidrógeno unidos a otro oxígeno: H₂O. Pero la proteína que hace que la sangre sea roja, la hemoglobina, responde a la fórmula diabólica C₂₉₅₂H₄₆₆₄N₈₁₂O₈₃₂S₈Fe₄. El biólogo estadounidense Cyrus Levinthal calculó en 1969 que se necesitaría más tiempo que el transcurrido desde el origen del universo, unos 14 mil millones de años, para desentrañar todas las configuraciones posibles de una sola proteína. Sin embargo, un sistema de inteligencia artificial del conglomerado de Google logró hacer esto en minutos. Sus predicciones para casi todas las proteínas humanas se hacen públicas este jueves. Es un gran salto para la biología. La humanidad se quita la venda de los ojos.
A la cabeza de esta revolución está el neurocientífico británico Demis Hassabis, 44 años. El investigador era un niño prodigio del ajedrez y en 1997 estuvo marcado por la lucha entre el maestro ruso Gari Kasparov y el superordenador Deep Blue. El ordenador ganó esa batalla, pero Hassabis se quedó con la sensación de que era tosco, inútil si había que jugar tres seguidos. Cuando terminó el último juego, el entonces estudiante de la Universidad de Cambridge decidió diseñar una máquina capaz de aprender cualquier juego. En 2010, Hassabis fundó la empresa DeepMind para impulsar la inteligencia artificial. En 2013, su primera criatura había aprendido por su cuenta a jugar y ganar en varios videojuegos de la legendaria consola de videojuegos Atari. En 2014, Google compró la empresa por unos 650 millones de dólares.

Tras su formación en videojuegos, los científicos de DeepMind decidieron intentar solucionar uno de los mayores retos de la biología. Las proteínas, como las hormonas, las enzimas y los anticuerpos, son máquinas diminutas que realizan las funciones básicas de la vida. Están formados por cadenas de otras moléculas más pequeñas, aminoácidos, como un collar de perlas. Estos collares se pliegan en configuraciones intrincadas que determinan su función. Los anticuerpos, las defensas del cuerpo humano contra invasores como el coronavirus, tienen forma de Y.
Las recetas de todas las proteínas que necesita para funcionar están escritas en el ADN de cada célula. El sistema de DeepMind, apodado AlphaFold, lee esta información, una secuencia de aminoácidos, y predice la estructura de cada proteína. Su precisión es similar a la obtenida con los experimentos de laboratorio, que requieren mucho más tiempo y dinero. Es como adivinar la forma de una tortilla cuando ves por primera vez una receta con huevos, patatas, cebolla, aceite y sal.
DeepMind y el Laboratorio Europeo de Biología Molecular publicaron el jueves más de 350.000 estructuras, incluidas las de unas 20.000 proteínas humanas y las de otros 20 organismos, como el ratón de laboratorio y la bacteria de la tuberculosis. El científico Venki Ramakrishnan, ganador del Premio Nobel de Química en 2009, dice que este es «un avance increíble» con consecuencias impredecibles. “Ocurrió mucho antes de lo que muchos expertos hubieran predicho. Será emocionante ver las muchas formas en que la investigación biológica cambiará radicalmente ”, dijo Ramakrishnan, del Laboratorio de Biología Molecular de Cambridge, Reino Unido, en un comunicado.
El sistema es «una verdadera revolución para las ciencias de la vida», en palabras de la científica Edith Heard.
Algunas organizaciones ya están trabajando con la nueva base de datos. La Iniciativa de Medicamentos para Enfermedades Desatendidas, una organización sin fines de lucro patrocinada por Médicos sin Fronteras, utiliza la estructura de las proteínas para buscar nuevos tratamientos. Prácticamente todas las enfermedades, desde el cáncer hasta el Alzheimer y la covid, están relacionadas con la forma de ciertas proteínas. Otras instituciones, como la Universidad de Portsmouth (Reino Unido), están utilizando el programa para intentar diseñar proteínas que puedan reciclar plásticos.
Demis Hassabis, CEO de DeepMind, anunció que su plan es publicar 100 millones de propiedades en los próximos meses. Esto significaría ofrecer una predicción de forma libre para prácticamente cualquier proteína con una secuencia de aminoácidos conocida. «Creemos que esta es la contribución más importante de la inteligencia artificial al conocimiento científico hasta ahora», proclamó Hassabis. En su estudio, publicado este jueves en la revista NaturalezaParticipó el español Bernardino Romera Paredes, ingeniero informático de DeepMind nacido en Murcia hace 35 años.
El sistema AlphaFold no surge de la nada, como dice Edith Heard, directora general del Laboratorio Europeo de Biología Molecular, una organización con 1.800 empleados y oficinas en Alemania, Francia, Italia, Reino Unido y, desde 2017, en España, Barcelona. «AlphaFold fue capacitado usando datos de recursos públicos creados por la comunidad científica, por lo que tiene sentido que sus predicciones sean públicas», dijo Heard. El investigador habla de «una verdadera revolución para las ciencias de la vida, como lo fue hace décadas la genómica».

Para determinar la estructura real de una proteína se necesitan infraestructuras muy caras, como el Laboratorio Europeo de Radiación Sincrotrón, una estructura circular de casi un kilómetro de circunferencia en Grenoble (Francia). La radiación emitida por los electrones que circulan en el anillo, esencialmente compuestos por rayos X, nos permite observar los secretos de la materia. El biólogo español José Antonio Márquez explica que aclarar la forma de una proteína con un sincrotrón, o con el método alternativo de criomicroscopía electrónica, puede llevar “meses o incluso años”. AlphaFold lo hace en minutos, pero con errores.
“Estas son predicciones por computadora, no la determinación experimental de la estructura. Y la precisión es del 58% ”, subraya Márquez, investigador valenciano de 52 años que dirige la plataforma de cristalografía del Laboratorio Europeo de Biología Molecular en Grenoble. Hoy, si un científico quiere estudiar una proteína implicada en el cáncer, tiene que esperar meses o años para analizar su forma. Solo hay alrededor de 180.000 estructuras en las bases de datos. La información divulgada este jueves duplica esa cifra. Y en unos meses habrá millones. “Lo normal hoy en día es no encontrar una proteína en las bases de datos. Con AlphaFold puede tener una predicción con una confiabilidad del 58%. Te ahorra una enorme cantidad de tiempo «, dice Márquez, quien no participó en el proyecto. Las imprecisiones del sistema se concentran en ciertas regiones de las proteínas, no estructuradas para adaptarse al medio.
El biólogo español señala otras limitaciones. El sistema DeepMind puede predecir la estructura de una molécula aislada, pero las proteínas a menudo interactúan entre sí. AlphaFold aún no puede predecir la forma de estos complejos, pero es un programa diseñado para permitirle aprender por su cuenta. Márquez es optimista: «Acelerará los descubrimientos en prácticamente todas las áreas de la biología».
Puedes escribirnos manuel@esmateria.com o seguir IMPORTA en Facebook, Gorjeo, Instagram o suscríbete aquí al nuestro Boletin informativo.