Menú Cerrar

«Diseño computacional y predicción estructural de proteínas por inteligencia artificial»

El Premio Nobel de Química 2024 ha sido otorgado conjuntamente a David Baker por el diseño computacional de proteínas y a Demis Hassabis y John M. Jumper por la predicción de la estructura de las proteínas.

Las proteínas son macromoléculas formadas por cadenas lineales de aminoácidos. La secuencia de aminoácidos está determinada por la secuencia de nucleótidos del gen que codifica dicha proteína (llamados genes estructurales). Por tanto, la información genética determina de este modo qué proteínas tiene una célula, un tejido y un organismo. Las proteínas realizan funciones esenciales para la vida celular: catálisis (enzimas), reguladoras (hormonas), defensivas (inmunoglobulinas), transporte (hemoglobina), entre otras.

Para describir estructuralmente una proteína se definen cuatro niveles de organización:

  • Estructura primaria, es la secuencia de aminoácidos H2NC(R1,R2)COOH de la cadena.
  • Estructura secundaria, son patrones locales de plegamiento que presentan ciertas secuencias de la proteína.
  • Estructura terciaria, es la conformación plegada tridimensional de la cadena polipeptídica.
  • Estructura cuaternaria, es la organización de una proteína oligomérica o ensamblaje de proteínas.

El galardonado David Baker es un bioquímico y biólogo computacional estadounidense, conocido por ser pionero en métodos para diseñar proteínas y predecir sus estructuras tridimensionales. Su grupo de investigación desarrolló un algoritmo llamado Rosetta para la predicción de la estructura de proteínas mediante cálculo ab initio (resolución aproximada de la ecuación de Schrödinger del sistema molecular sin añadir ningún parámetro experimental) que se ha convertido en una herramienta para el diseño de proteínas, un proyecto de computación llamado Rosetta@Home (visitar web).

Su grupo publicó también el diseño y validación cristalográfica de la primera proteína artificial de 93 aminoácidos conocida como Top7 (ver Figura 1) que contiene un pliegue que nunca antes se había visto. La proteína fue diseñada ab initio en un computador con la ayuda de algoritmos de predicción estructural proteica. La determinación de la estructura de rayos X de la proteína sintetizada en el laboratorio reveló que la estructura era muy similar al modelo diseñado informáticamente. Top7 fue presentada como la ‘Molécula del Mes’ por el Protein Data Bank (Banco de Datos de Proteínas) en octubre de 2005, y actualmente está representada en el logo de Rosetta@home.

Figura 1. En azul la estructura predicha por modelo computacional y en rojo la determinada por difracción de rayos X (técnica que permite obtener una “fotografía” de todas las posiciones atómicas de la macromolécula a partir de una estructura cristalina).

Desde entonces, su grupo de investigación ha creado nuevas proteínas que se pueden utilizar como fármacos, vacunas, nanomateriales y sensores diminutos. (ver Figura 2).

Figura 2. Estructuras proteicas diseñadas por computación mediante el programa Rosetta.

El segundo descubrimiento se refiere a la predicción de las estructuras de las proteínas. En 2020, Demis Hassabis y John Jumper presentaron un programa de inteligencia artificial llamado AlphaFold2 (herramienta de investigación y fácil de usar; acceso al programa web) por DeepMind (propiedad de Google; acceso a DeepMind) que realiza predicciones con una rapidez y eficacia nunca vistas de la estructura de las proteínas mediante unos sistemas informáticos de aprendizaje profundo, los mismos que se emplean en el conocido CHATGPT. Con su ayuda, han podido predecir la estructura de prácticamente unos 200 millones de proteínas que los investigadores han identificado hasta entonces (algo que a un humano le habría llevado millones de años). Desde su descubrimiento, AlphaFold2 ha sido utilizado por más de dos millones de personas de 190 países.

¿Cómo funciona AlphaFold?

El sistema informático ha sido entrenado con una gigantesca base de datos de estructuras de proteínas aisladas y caracterizadas por rayos X que analiza y separa las partes importantes que están implicadas en el plegamiento y conformación tridimensional de la proteína. De esta forma relaciona la secuencia de aminoácidos que está asociada con la reorganización espacial de la proteína, es decir, analiza las distintas interacciones entre los aminoácidos.

Así pues, cuando se introduce en el programa una determinada secuencia de aminoácidos, este predice con una alta probabilidad la estructura tridimensional que adoptaría la proteína en base a los datos analizados de estructuras reales aisladas en la naturaleza. Para ello el sistema informático hace uso de las llamadas redes neuronales artificiales, una tecnología que se usa para el aprendizaje profundo, es decir, el campo de la inteligencia artificial que enseña a una computadora a procesar datos de una manera similar a como lo haría el cerebro humano a fin de generar información y predicciones precisas y que justo (y en mi opinión acertadamente) ha sido galardona este mismo año con el Premio Nobel de Física 2024.

Enlaces de interés:

Rosetta (programa de diseño de proteínas)

Visualizador de macromoléculas (PDB)

AlphaFold2 (proyecto-web)

AlphaFold Servidor (introduce una secuencia de aminoácidos para obtener el 3D).

Nobel Prize web

Descarga el archivo completo.

Deja una respuesta

Publicado en SABÍAS QUE..., SOBRE QUÍMICA

Artículos relacionados

Descripción general de privacidad

Este sitio web utiliza cookies para que podamos brindarle la mejor experiencia de usuario posible. La información de las cookies se almacena en su navegador y realiza funciones como reconocerlo cuando regresa a nuestro sitio web y ayudar a nuestro equipo a comprender qué secciones del sitio web le resultan más interesantes y útiles.