El programa ha encontrado las 200 millones de proteínas conocidas por la ciencia: ¿cómo es esto posible?

Los investigadores compilaron una base de datos de 200 millones de estructuras de proteínas. Lo lograron con la ayuda del programa AlphaFold,

que DeepMind desarrolló en 2018y publicado en julio de 2021. El programa de código abierto predice la estructura tridimensional de una proteína basándose en su secuencia de aminoácidos: los componentes básicos que forman las proteínas. La estructura de una proteína dicta su función, por lo que la base de datos de las identificadas por AlphaFold ayudará a identificar nuevas funcionalidades proteicas que los humanos pueden explotar.

Proteínas paradójicas

Las proteínas son los componentes básicos de la vida.Son producidos por una variedad de organismos, desde bacterias hasta plantas y animales, y cuando se producen, se pliegan en milisegundos. Formadas a partir de cadenas de aminoácidos plegadas en formas complejas, su estructura tridimensional determina en gran medida su función. Una vez que se descubre cómo se pliega una proteína, se puede comprender cómo funciona y cambiar su comportamiento.

Aunque el ADN proporciona instrucciones para crearcadenas de aminoácidos, predecir cómo interactúan para formar una forma tridimensional ha sido muy difícil. Hasta hace poco, los científicos habían descifrado sólo una fracción de los 200 millones de proteínas conocidas por la ciencia. El problema es que su estructura es tan compleja que intentar adivinar qué forma adoptarán es casi imposible.

AlphaFold de DeepMind ha creado imágenes en 3D de estructuras de proteínas. Imagen cortesía de DeepMind

Cyrus Levinthal, molecular estadounidensebiólogo, escribió en un artículo de 1969 sobre la paradoja: a pesar del enorme número de configuraciones posibles, las proteínas se pliegan con rapidez y precisión. Además, cada proteína puede adoptar entre 10^300 formas finales posibles.

Así, escribió Levinthal, si uno intentara encontrar la forma correcta de una proteína probando cada configuración una tras otra, llevaría más tiempo del que existiera el universo.

Los intentos de los científicos

Los científicos tienen formas de visualizar proteínas.y analizar su estructura, pero este es un trabajo demasiado lento y difícil. Según la revista Nature, la cristalografía de rayos X se utiliza con mayor frecuencia para obtener imágenes de proteínas. En este método, los rayos X se dirigen a cristales de proteínas sólidas y se mide cómo se refractan. El objetivo es determinar cómo está estructurada la proteína. Según DeepMind, este trabajo experimental ha determinado la forma de unas 190.000 proteínas.

Nuevo método

En noviembre de 2020, el grupo DeepMind participó eninteligencia artificial, anunció el desarrollo de un programa llamado AlphaFold que puede predecir rápidamente esta información mediante un algoritmo. Desde entonces, ha estado estudiando los códigos genéticos de cada organismo cuyo genoma ha sido secuenciado y prediciendo las estructuras de los cientos de millones de proteínas que contienen en conjunto.

AlphaFold funciona acumulando conocimientosobre secuencias e interacciones de aminoácidos, intentando interpretar estructuras de proteínas. Como resultado, el algoritmo aprendió a predecir las formas de las proteínas en cuestión de minutos con precisión hasta el nivel atómico.

El año pasado DeepMind publicóla base de datos abierta de estructuras de proteínas contiene 20 especies, incluidas casi todas las 20.000 proteínas expresadas por humanos. Ahora ha completado el trabajo y ha publicado las estructuras previstas para más de 200 millones de proteínas.

¿Cómo se aplica la tecnología?

Los investigadores ya están aprovechando los frutos de su trabajo.AlfaFold. Según The Guardian, el programa permitió a los científicos caracterizar definitivamente una proteína clave en el parásito de la malaria que no había sido susceptible de cristalografía de rayos X. En última instancia, esto mejorará la vacuna contra la enfermedad.

Imagen 3D de la proteína de la malaria. Imagen cortesía de Deepmind

El investigador de abejas Wilde Leipartde la Universidad Noruega de Ciencias de la Vida utilizaron AlphaFold para revelar la estructura de la vitelogenina. Es una proteína reproductiva e inmune producida por todos los animales que ponen huevos. El descubrimiento ayudará a desarrollar nuevas formas de proteger, por ejemplo, a las abejas y a los peces de las enfermedades. Esto es importante porque estos animales son importantes para alimentar a la humanidad.

El programa también informa sobre la búsqueda de nuevosproductos farmacéuticos, dijo Rosana Kapeller, directora ejecutiva de ROME Therapeutics, en un comunicado de DeepMind. “La velocidad y precisión de AlphaFold aceleran el proceso de desarrollo de fármacos. Recién estamos empezando a comprender su impacto en el desarrollo de productos farmacéuticos”, concluyó.

Los científicos también utilizan los modelos AlphaFold.del Centro de Innovación Enzimática de la Universidad de Portsmouth para identificar enzimas del mundo natural que pueden adaptarse para procesar plásticos.

Lee mas:

Próximamente una tormenta solar golpeará la Tierra: el material vuela a una velocidad de 800 km/s

Científicos filmaron a una extraña criatura con tentáculos, que confundieron con una flor

Rusia abandona la ISS: qué pasará ahora y por qué el mantenimiento de la estación está amenazado