Diario de León

La IA aporta la mayor base de datos sobre las proteínas

Mejora las predicciones sobre cómo se pliegan estas moléculas

Publicado por
EFE

Creado:

Actualizado:

Las proteínas tienen una forma tridimensional única que las lleva a encajar unas en otras, pero determinarla supone un gran reto. El uso de la inteligencia artificial ha permitido crear la base de datos más completa de predicciones sobre cómo se pliegan estas moléculas.

Piezas fundamentales de la vida, la estructura de cada proteína, que depende de los aminoácidos que la componen, define lo que hace y cómo lo hace, por lo que determinarla aportar información valiosa para entender los procesos biológicos, hacer avanzar diversos campos de investigar y podría servir para el desarrollo de fármacos.

Alpha Fold
La inteligencia artificial que ha desarrollado este estudio para publicar la base de datos es europea

La empresa DeepMind y el Laboratorio Europeo de Biología Molecular (EMBL) han empleado el sistema de inteligencia artificial AlphaFold para publicar la base de datos más completa y precisa de las predicciones de las estructuras de las proteínas humanas. La base de datos, abierta para la comunidad científica y que estará alojada en el Instituto Europeo de Bioinformática, incluirá alrededor de 20.000 proteínas expresadas por el genoma humano. Entre las primeras 350.000 estructuras publicadas en la base de datos, además del proteoma humano, están las proteínas de 20 organismos biológicamente significativos como E. coli, la mosca de la fruta, el ratón, el pez cebra, el parásito de la malaria y las bacterias de la tuberculosis. Con ello, se amplía drásticamente el conocimiento acumulado sobre las estructuras de proteínas, más que duplicando el número de estructuras de proteínas humanas con predicciones de alta precisión disponibles para los investigadores, lo que permitirá acelerar el trabajo en gran variedad de campos, señaló el EMBL en una nota.

350.000 estructuras
El proteoma humano, la mosca de la fruta, el ratón, el pez y la cebra están entre ellas

La revista Nature publica ayer un estudio en el que se describe cómo se realizan estas predicciones y proporciona la imagen más completa de las proteínas que componen el proteoma humano (el conjunto de proteínas codificadas por el genoma humano), cuya comprensión es de gran importancia para la salud y la medicina.

El conjunto de datos resultante proporciona una predicción fiable de la posición estructural de casi el 60 % de los aminoácidos del proteoma humano.

Los autores del estudio vieron que el algoritmo AlphaFold era capaz de predecir «con confianza» la posición estructural del 58 % de los aminoácidos del proteoma humano. De ellos, la posición de un subconjunto del 35,7 % se predijo con un grado de confianza «muy alto», lo que supone el doble del número cubierto por las estructuras experimentales, explicó la revista.

tracking