Información

Predicción de la estructura de proteínas a partir de la secuencia de aminoácidos.

Predicción de la estructura de proteínas a partir de la secuencia de aminoácidos.


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

La información proporcionada en este recurso https://predictioncenter.org/ es casi imposible de digerir (como con todo en este campo), por lo que si alguien pudiera decirme cuál es la precisión con la que podemos predecir la estructura de la proteína terciaria ahora, le agradecería .

También me encantaría escuchar sus pensamientos sobre '¿por qué una célula puede producir exactamente la misma estructura de proteína miles de veces usando leyes físicas conocidas, pero tenemos que adivinarlo usando el aprendizaje automático'? ¿Por qué es difícil?


¿Cuál es la precisión con la que podemos predecir la estructura de la proteína terciaria?

Eso depende de la proteína. Si la secuencia primaria se asemeja mucho a la secuencia de una proteína para la que la estructura ya está resuelta, entonces métodos basados ​​en plantillas para modelar la estructura 3D (también conocido como modelado de homología). Estos métodos tienden a ser precisos, según la evaluación de la puntuación de modelado de plantillas, aunque la confirmación de la estructura cristalina solo está disponible para una minoría de modelos (1%, según este documento de 2010).

Para proteínas sin homólogos resueltos estructuralmente, ab initio plegable se utiliza a menudo, que se basa en la evaluación de la mecánica molecular del plegamiento iterativo de la cadena de péptidos para encontrar estructuras que minimicen la energía libre de Gibbs. El software popular para el modelado mecánico molecular de proteínas incluye CHARMM y AMBER. Ab initio Los métodos son computacionalmente intensivos y son más difíciles de validar.

'¿Por qué una célula puede producir exactamente la misma estructura de proteínas miles de veces utilizando leyes físicas que conocemos, pero tenemos que adivinarlo mediante el aprendizaje automático? ¿Por qué es difícil?

Es difícil conocer todos los factores celulares presentes cuando se sintetiza una proteína en particular y cómo esos factores afectan el plegamiento de la proteína. ¿Cuál es la temperatura y el pH proximales al ribosoma? ¿Están involucradas las proteínas chaperonas? ¿Es la estructura de energía más baja la verdadera estructura, o la estructura nativa cae en un mínimo local estable con un potencial funcional seleccionado por la evolución? Se puede encontrar una buena discusión sobre ese último punto en Quora.


El predictioncenter.org ejecuta un concurso abierto cada dos años: Evaluación crítica de la predicción de estructuras (CASP). CASP 14 ya está en marcha.

Los mejores programas para ab initio El plegamiento son dinámicas moleculares altamente aumentadas con aprendizaje automático y un montón de algoritmos predictivos agregados para crear una estructura. Mire el software Rosetta de David Baker. Más recientemente, DeepMind de Google venció a Rosetta y a un grupo de otros.

predictioncenter.org/casp13/zscores_final.cgi

Deepmind es una red impulsada por Deep Belief https://deepmind.com/blog/article/AlphaFold-Using-AI-for-scientific-discovery

Entrenamos una red neuronal para predecir una distribución de distancias entre cada par de residuos en una proteína (visualizada en la Figura 2). Estas probabilidades se combinaron luego en una puntuación que estima la precisión de la estructura de una proteína propuesta. También entrenamos una red neuronal separada que usa todas las distancias en conjunto para estimar qué tan cerca está la estructura propuesta de la respuesta correcta.


Análisis de la función de las proteínas y su predicción a partir de la secuencia de aminoácidos.

Comprender la función de las proteínas es una de las claves para comprender la vida a nivel molecular. También es importante en el contexto de la enfermedad humana porque muchas afecciones surgen como consecuencia de alteraciones de la función de las proteínas. La reciente disponibilidad de tecnología de secuenciación relativamente económica ha dado como resultado miles de genomas completos o parcialmente secuenciados con millones de proteínas funcionalmente no caracterizadas. Un volumen tan grande de datos, combinado con la falta de ensayos experimentales de alto rendimiento para anotar proteínas funcionalmente, se atribuye a la creciente importancia de la predicción automática de funciones. Aquí, estudiamos las proteínas anotadas por términos de Gene Ontology (GO) y estimamos la precisión de la transferencia funcional de la secuencia de proteínas solamente. Encontramos que la transferencia de términos de GO por alineamientos de secuencia por pares es sólo moderadamente precisa, mostrando una influencia sorprendentemente pequeña de la identidad de secuencia (SID) en un amplio rango (30-100%). Desarrollamos y evaluamos un nuevo predictor de la función de las proteínas, el anotador funcional (FANN), a partir de la secuencia de aminoácidos. El predictor explota un marco de red neuronal de múltiples salidas que es muy adecuado para modelar simultáneamente las dependencias entre términos funcionales. Los experimentos proporcionan evidencia de que FANN-GO (predictor de términos de GO disponible en http://www.informatics.indiana.edu/predrag) supera a los métodos estándar como la transferencia por SID global o local, así como a GOtcha, un método que incorpora la estructura ofGO. Proteínas 2011 © 2011 Wiley-Liss, Inc.

Se puede encontrar información adicional de respaldo en la versión en línea de este artículo.

Nombre del archivo Descripción
PROT_23029_sm_suppinfo.pdf173.6 KB información de soporte

Tenga en cuenta: El editor no es responsable del contenido o la funcionalidad de la información de apoyo proporcionada por los autores. Cualquier consulta (que no sea el contenido faltante) debe dirigirse al autor correspondiente del artículo.


Muestreo poblacional y predicción de estructura proteica de novo basada en fragmentos

Conclusión

La predicción de la estructura de proteínas sigue siendo un problema abierto de gran importancia en biología estructural. El enorme tamaño del espacio de búsqueda y la dureza del panorama de la aptitud lo convierten en un problema NP-difícil desafiante, incluso para el hardware de computadora moderno y los algoritmos de optimización de última generación. Los métodos populares, como Rosetta, necesitan generar una cantidad sustancial de modelos de proteínas debido a la gran cantidad de mínimos locales típicamente. En este contexto, y con la democratización de las arquitecturas informáticas paralelas, las metaheurísticas basadas en la población, como los algoritmos evolutivos, representan una alternativa interesante. Los métodos basados ​​en la población tienen la capacidad de compartir información entre las soluciones. Esta capacidad brinda múltiples posibilidades: principalmente, permite dirigir la búsqueda extrayendo y explotando información de buenas soluciones, y potencia la exploración del espacio de búsqueda al promover la diversidad en la población. Por supuesto, la explotación de buenas soluciones y la exploración del espacio de búsqueda están en competencia durante una trayectoria de búsqueda. Los métodos basados ​​en la población se pueden ajustar y personalizar para ajustar el equilibrio entre la explotación y la exploración. El equilibrio ideal depende del problema y, a menudo, se necesita un conocimiento experto para mejorar la eficiencia de los algoritmos. Los algoritmos evolutivos son altamente personalizables en muchos niveles diferentes, desde la selección de soluciones hasta los operadores estocásticos e incluso la estrategia de reemplazo de población. Se pueden extraer muchas características e información útil de las proteínas y utilizarlas para hacer que el problema de predicción de la estructura de las proteínas sea altamente compatible con los métodos basados ​​en poblaciones. EdaRose es una estimación del algoritmo de distribución construido sobre Rosetta. Se ha personalizado para aprovechar cierta información sobre la estructura de los modelos de proteínas. Muchos estudios de investigación ponen de manifiesto los beneficios de los métodos basados ​​en la población en términos de muestreo y rendimiento en comparación con los métodos de solución única. La introducción de conocimientos de expertos adicionales, o el diseño de nuevas estrategias de búsqueda concertadas, probablemente mejoraría aún más la ganancia en el rendimiento, aprovechando la flexibilidad de los métodos de muestreo basados ​​en la población.


Descripción general de la predicción de la estructura de las proteínas de la zona crepuscular

La predicción de la estructura de la proteína a partir de la secuencia de aminoácidos ha sido uno de los aspectos más desafiantes en la biología estructural computacional a pesar del progreso significativo en los últimos años mostrado por la evaluación crítica de los experimentos de predicción de la estructura de la proteína (CASP). Cuando las estructuras determinadas experimentalmente no están disponibles, las estructuras predictivas pueden servir como puntos de partida para estudiar una proteína. Si la proteína diana consiste en una región homóloga, se puede construir un modelo de alta resolución (típicamente & lt1.5 Å) mediante un modelo comparativo. Sin embargo, cuando se enfrenta a una baja similitud de secuencia de la proteína objetivo (también conocida como proteína de la zona crepuscular, la identidad de secuencia con las plantillas disponibles es inferior al 30%), la predicción de la estructura de la proteína debe iniciarse desde cero. Tradicionalmente, las proteínas de la zona crepuscular se pueden predecir mediante el método de enhebrado o ab initio. Basado en la tendencia actual, la combinación de diferentes métodos trae un mayor éxito en la predicción de proteínas de la zona crepuscular. En esta mini revisión, se discutieron los métodos, avances y desafíos para la predicción de proteínas de la zona crepuscular.


Predecir la localización subcelular

La anotación de secuencia automatizada de localización subcelular es un paso importante en la anotación funcional de proteínas. Esto es particularmente importante en las células eucariotas, que contienen varios compartimentos subcelulares. La predicción de péptidos señal tiene una historia bastante larga que no se revisará aquí. De hecho, esa área representa uno de los grandes éxitos en todo el campo de la bioinformática predictiva: los algoritmos se están acercando a un nivel de rendimiento comparable a la calidad de los datos experimentales subyacentes, quizás en algunos casos incluso mejor [6, 29].

El esquema SignalP [30, 31] fue el primer enfoque basado en redes neuronales que predice tanto la presencia del péptido señal secretor como su sitio de escisión. Dio un orden de magnitud de mejora en el rendimiento. Como se mencionó anteriormente, esta mejora también se basó en nuevos principios de preparación de conjuntos de datos inspirados en los desarrollos en la predicción de la estructura de proteínas [4]. Otros métodos publicados basados ​​en aprendizaje automático que funcionan bien en esta área incluyen LOCTree [32], basado en varias SVM binarias, organizadas en tres árboles de decisión diferentes y específicos para plantas, no plantas y procariotas BaCelLo [29, 33], que se basa en un árbol de decisión de SVM binarias, y es específico para animales, hongos y plantas TargetP [6], basado en redes neuronales y específico para no plantas, plantas y procariotas WoLF PSORT [34], un clasificador que calcula una gran número de características de secuencia y es específico para animales, hongos y plantas. Una tendencia general en la evaluación comparativa de estos algoritmos es quizás que el rendimiento de los predictores multicompartimentales tiende a sobreestimarse.

Una ubicación subcelular para la que se ha desarrollado una amplia gama de métodos de predicción basados ​​en secuencias es la inserción en membranas. Estructuralmente, las proteínas integrales de la membrana tienen dos formas básicas, ya sea en haces de hélices α o en barriles β que a menudo forman poros permeables a través de la membrana. Por diversas razones, la mayor parte del trabajo computacional sobre proteínas de membrana se ha centrado en las primeras. En términos generales, los predictores de topología suelen buscar tres características de secuencia importantes de hélices alfa transmembrana: primero, tramos hidrófobos de aproximadamente 20 aminoácidos que abarcan el núcleo de la bicapa lipídica, segundo, un `` cinturón aromático '' flanqueante de residuos de triptófano y tirosina situado en el interfase lípido-agua y, en tercer lugar, una sobrerrepresentación de los aminoácidos lisina y arginina cargados positivamente en bucles citoplasmáticos cortos, conocida como la regla del interior positivo [35].

Los primeros intentos de predecir la topología transmembrana a partir de la secuencia se basaron en la identificación de picos en los gráficos de hidrofobicidad, utilizando la regla del interior positivo para casos inciertos y para predecir la orientación general de la proteína [35]. Enfoques más recientes utilizan algoritmos de aprendizaje automático para extraer preferencias de secuencia estadística de proteínas de membrana con estructuras conocidas [36-40]. Se ha demostrado que la inclusión de información evolutiva al basar la predicción en perfiles de secuencia aumenta los niveles de rendimiento en aproximadamente un 5-10% [37, 39, 41]. Los predictores actuales alcanzan una precisión de alrededor del 80% en estructuras proteicas de membrana conocidas, aunque su rendimiento podría sobrestimarse cuando se aplican a datos del genoma completo [42].

En los últimos años, la elucidación de la complejidad de algunas estructuras de proteínas de membrana ha llevado al desarrollo de métodos que predicen no solo hélices transmembrana, sino también otras características estructurales, como bucles reentrantes y hélices interfaciales [43, 44]. Otros métodos, como Phobius, combinan la predicción de hélices transmembrana con la predicción simultánea de péptidos señal, lo que conduce a niveles de rendimiento mejorados para proteínas que contienen ambos [41].

Se ha demostrado que una amplia variedad de proteínas contienen grupos lipídicos unidos covalentemente [45]. El anclaje de lípidos también es una forma común de unir proteínas solubles a membranas en eucariotas. Esta modificación dirige la proteína anclada a su ubicación celular muy específica con un impacto importante en la función final. Los predictores están actualmente disponibles para modificaciones tales como miristoilación, palmitoilación y prenilación [46, 47]. La modificación del ancla de lípidos más común y mejor estudiada es el enlace glicosilfosfatidilinositol (GPI) a la porción de la secuencia carboxi-terminal que dirige la proteína hacia la valva extracelular de la membrana plasmática. En los últimos años, también se han realizado avances en la predicción de proteínas ancladas a GPI [48, 49].


ESTRUCTURA TERCIARIA DE PROTEÍNA

Se ofrecen sitios para calcular y mostrar la estructura tridimensional de oligosacáridos y proteínas. Con los dos sitios de análisis de proteínas, la proteína de consulta se compara con las estructuras de proteínas existentes, como se revela a través del análisis de homología.

Antecedentes: "Principios de estructura de proteínas, modelado y visualización comparativos de proteínas" por N. Guex y M.C. Peitsch (GlaxoWellcome, Suiza) está aquí. Para obtener las coordenadas PDB de una proteína de su interés, vaya al Protein Data Bank o Molecules to Go o NCBI.

PHYRE2 - PAG rotein Homología / analógicoY Rreconocimiento mingine: este es mi sitio favorito para la predicción de la estructura 3D de las proteínas. En cada caso que he utilizado este sitio, me ha proporcionado un modelo. Phyre2 utiliza la alineación de modelos de Markov ocultos a través de HHsearch para mejorar significativamente la precisión de la alineación y la tasa de detección. También incorpora una nueva simulación de plegado ab initio llamada Poing para modelar regiones de sus proteínas sin homología detectable. (Referencia: Kelley LA et al. Protocolos de la naturaleza 10: 845-858 (2015) .

CPHModels (Centro de Análisis de Secuencias Biológicas, Universidad Técnica de Dinamarca) - actualmente consta de las siguientes herramientas: Sowhat: Un método basado en redes neuronales para predecir contactos entre átomos C-alfa de la secuencia de aminoácidos. RedHom: una herramienta para encontrar un subconjunto con baja similitud de secuencia en una base de datos. Bases de datos: subconjuntos de la base de datos del Brookhaven Protein Data Bank (PDB) con baja similitud de secuencia producida con la herramienta RedHom.

MODELO SUIZO - (Investigación experimental Glaxo-Wellcome, Suiza) Un servidor de modelado de proteínas comparativo automatizado. Elija & quot Modo de primer acercamiento & quot. nótese bien los resultados se envían por correo electrónico y requieren un visor como DeepView - Swiss-PdbViewer, Rasmol o Cn3D.

ORION: es un servidor web para el reconocimiento de pliegues de proteínas y la predicción de estructuras utilizando perfiles híbridos evolutivos. Se pueden extraer varias bases de datos como PDB, SCOP y HOMSTRAD para encontrar una plantilla estructural adecuada. Para el paso de modelado, MODELLER puede obtener directamente una estructura 3D de proteína a partir de la plantilla seleccionada y mostrarla con medidas de estimación del modelo de calidad global y local. (Referencia: Ghouzam Y et al. (2016) Scientific Reports 6: 28268).

I-TASSER EN LÍNEA: los modelos 3D se construyen en base a alineaciones de múltiples subprocesos mediante LOMETS y luego se derivan las luces iterativas de la función de simulación de TASSER al hacer coincidir los modelos predichos con las bases de datos de funciones de proteínas. I-TASSER se clasificó como el servidor número uno para la predicción de la estructura de proteínas en experimentos recientes de CASP7 y CASP8. (Referencia: A. Roy et al. 2010. Nature Protocols 5: 725-738)

ESyPred3D: este programa de modelado de homología automatizado se beneficia de una nueva estrategia de alineación que utiliza redes neuronales. Las alineaciones se obtienen mediante la combinación, ponderación y selección de los resultados de varios programas de alineación múltiple. La estructura tridimensional final se construye utilizando el paquete de modelado MODELLER. (Referencia: C. Lambert et al. 2002. Bioinformática 18: 1250-1256).

Robetta: es un servicio de predicción de la estructura de proteínas que se evalúa continuamente a través de CAMEO. Sus características incluyen una interfaz de envío interactiva que permite alineaciones de secuencia personalizadas para modelado de homología, restricciones, fragmentos locales y más. Puede modelar complejos de cadenas múltiples y ofrece la opción de muestreo a gran escala. Utiliza la base de datos de plantilla PDB100, que se actualiza semanalmente, una base de datos de modelo basada en coevolución (MDB), y también ofrece la opción de plantillas personalizadas. (Referencia: Kim DE et al. (2004) Nucleic Acids Res 32 (problema del servidor web): W526-531).

PEP-FOLD 3 es un de novo enfoque dirigido a predecir estructuras peptídicas a partir de secuencias de aminoácidos. Este método, basado en letras SA del alfabeto estructural para describir las conformaciones de cuatro residuos consecutivos, acopla la serie predicha de letras SA a un algoritmo codicioso y un campo de fuerza de grano grueso. (Referencia: Lamiable A, et al. Nucleic Acids Res.2016 44 (W1): W449-54).

(PS) 2: el servidor de predicción de la estructura de la proteína predice las estructuras tridimensionales de los complejos de proteínas basándose en modelos comparativos, además, este servidor examina el acoplamiento entre las subunidades del complejo predicho mediante la combinación de consideraciones estructurales y evolutivas. La estructura compleja predicha podría ser indicada y visualizada por visores de gráficos 3D basados ​​en Java y los perfiles estructurales y evolutivos se muestran y comparan cadena por cadena (Referencia: T-T. Huang et al. 2015. Nucl. Acids Res. 43 (W1): W338-W342).

BetaCavityWeb: computación de canales y vacíos moleculares con sus propiedades de masa. La salida consta de tres componentes: 1) el número de cavidades, 2) los átomos que contribuyen al límite de cada cavidad y 3) la propiedad geométrica de cada cavidad. También se informan estadísticas computacionales. El radio de sonda de cero corresponde a las cavidades existentes en las moléculas de van der Waals. Si el radio de la sonda es distinto de cero, las cavidades son las que existen en el modelo Lee-Richards (accesible al solvente). (Referencia: J-K. Kim et al. 2015. Nucl. Acids Res. 43 (W1): W413-W418).

Sistema AS2TS: ofrece una variedad de recursos para el análisis estructural de proteínas utilizando el programa LGA (alineación local-global) para buscar regiones de similitud local y evaluar el nivel de similitud estructural entre las estructuras de proteínas comparadas.Para facilitar el proceso de modelado de la estructura de la proteína basado en homología, el servicio AL2TS traduce los datos de alineación de secuencia y estructura dados en las coordenadas estándar de PDB (Referencia: A. Zemla et al. 2005. Nucl. Acids Res. 33: W111-W115).

3D-JIGSAW (Laboratorio de modelado biomolecular, Cancer Research UK, Inglaterra) - modelado de homología. Guarde los resultados del correo electrónico como * .pdb y véalos con Rasmol, etc.

RaptorX: consta de cuatro módulos principales: subprocesos de una sola plantilla, evaluación de la calidad de la alineación y subprocesos de varias plantillas. (Referencia: K & aumlllberg, M. et al. 2012. Nat Protoc. 7(8):1511-1522).

¿Y SI Interfaz Web? (Centro de Informática Molecular y Biomolecular, Universidad de Nijmegen, Holanda) ofrece una gran cantidad de herramientas para examinar archivos PDB.

Peeling de proteínas: un enfoque para dividir una estructura de proteína 3D en fragmentos compactos, un método para identificar pequeñas unidades compactas (unidades de proteína (PU)) que componen estructuras de proteínas tridimensionales. (Referencia: J.-C. Gelly et al. 2006. Bioinformatics 22: 129-133)

InterProSurf: predice la interacción de residuos de aminoácidos en proteínas que tienen más probabilidades de interactuar con otras proteínas, dadas las estructuras tridimensionales de las subunidades de un complejo proteico. El método de predicción se basa en el área de superficie accesible al solvente de residuos en las subunidades aisladas, una escala de propensión para los residuos de interfaz y un algoritmo de agrupamiento para identificar regiones de superficie con residuos de alta propensión de interfaz. (Referencia: S.S. Negi et al. 2007. Bioinformatics. 23: 3397-3399)

ProtSkin convierte una alineación de secuencias de proteínas en formato BLAST, CLUSTAL o MSF en un archivo de propiedades utilizado para mapear la conservación de la secuencia en la estructura de una proteína utilizando GRASP, MOLMOL o PyMOL. También se proporciona un archivo pseudo-PDB con la puntuación de conservación de la secuencia en lugar del factor de temperatura, para usar con programas como InsightII (accelrys). (Referencia: Deprez, C. et al. 2005. J. Mol. Biol. 346: 1047-1057).

PSIPRED Protein Sequence Analysis Workbench: incluye PSIPRED v3.3 (Predicción de estructura secundaria) DISOPRED3 y amp DISOPRED2 (Predicción de trastornos) pGenTHREADER (Reconocimiento de pliegues basado en perfiles) MEMSAT3 y amp MEMSAT-SVM (Predicción de hélice de membrana) Modelado de BioSerf DomP v2.0 (Automated Homredology) (Predicción de dominio de proteínas) FFPred 3 (Predicción de función eucariota) GenTHREADER (Reconocimiento de plegado rápido) MEMPACK (Predicción de SVM de topología de TM y empaque de hélice) pDomTHREADER (Reconocimiento de dominio de plegado) y DomSerf v2.0 (Modelado de dominio automatizado por homología). (Referencia: Buchan DWA et al. 2013. Nucl. Acids Res. 41 (W1): W340-W348).

MODELLER - modelado comparativo de la estructura de proteínas por satisfacción de restricciones espaciales

Estructuras derivadas de coordenadas de RMN:

GeNMR (GEnerate RMN estructura): genera estructuras de proteínas en 3D utilizando restricciones de distancia derivadas de NOE y cambios químicos de RMN. (Referencia: M. Berjanskii et al. 2009. Nucl. Acids Res. 37(Problema del servidor web): W670-W677)

Una vez que tenga una estructura, es posible que desee superponerla a otras moléculas. Para obtener códigos de acceso a la AP para un
proteína de su interés, vaya al Protein Data Bank

GATO GORDO (Festructura flexible AlignmenT por Chaining Apares de fragmentos alineados que permiten Twists) es un enfoque para proteínas flexibles
comparación de estructuras. Aborda simultáneamente los dos objetivos principales de la alineación flexible de la estructura optimizando la
alineación y minimización del número de movimientos del cuerpo rígido (giros) alrededor de los puntos de pivote (bisagras) introducidos en la referencia
estructura. (Referencia: Y.Ye & amp A. Godzik. (2003) Bioinformática 19: supl. 2. ii246-ii255). Este sitio web proporciona acceso a una amplia
gama de herramientas proteicas.

Busque estructuras de proteínas similares mediante FATCAT: cargue archivos PDB locales o simplemente proporcione códigos PDB. Para homólogos cercanos, vaya aquí (Referencia: Y. Ye & amp A. Godzik. 2003. Bioinformatics 19(Supl. 2): II246-II255)

SuperPose: es un servidor de superposición de proteínas. Calcula las superposiciones de proteínas utilizando un enfoque de cuaternión modificado. A partir de una superposición de dos o más estructuras, SuperPose genera alineaciones de secuencia, alineaciones de estructura, coordenadas PDB, estadísticas de RMSD, gráficos de distancia de diferencia e imágenes interactivas de las estructuras superpuestas. El servidor web SuperPose admite el envío de archivos con formato PDB o números de acceso a PDB. (Referencia: Maiti, R. et al. 2004. Nucleic Acids Res. 32 (Problema del servidor web: W590-594).

MulPBA (multiple PAGrotein Bcerrar con llave Aalineación): es una herramienta para la comparación de estructuras de proteínas basada en la similitud en la conformación de la columna vertebral local. La conformación de la columna vertebral local se define como diedros pentapéptidos (Referencia: L & eacuteonard S et al. (2014) J Biomol Struct Dyn. 32(4): 661-668).

3D-Match: comparación de estructuras 3D de dos proteínas (Arándano)

iPBA: es una herramienta para la comparación de estructuras de proteínas basada en la similitud en la conformación de la columna vertebral local. Presenta un enfoque de alineación mejorado utilizando (i) matrices de sustitución de PB (SM) especializadas y (ii) metodología de alineación basada en anclajes. (Referencia: Gelly, J.C. et al. 2011. Nucleic Acids Res. 39(Problema del servidor web): W18-23).

MAPSCI Alineamiento múltiple de estructuras proteicas e identificación de consenso. El algoritmo representa cada proteína como una secuencia de triples de coordenadas de los átomos de carbono alfa a lo largo de la columna vertebral. Luego calcula iterativamente una secuencia de matrices de transformación (es decir, traslaciones y rotaciones) para alinear las proteínas en el espacio y generar el consenso. El algoritmo es heurístico en el sentido de que calcula una aproximación a la alineación óptima que minimiza la suma de las distancias por pares entre el consenso y la proteína transformada. (Referencia: Ilinkin, I. et al. 2010. BMC Bioinformatics. 11:71).

Rclick: este servidor web que es capaz de superponer estructuras 3D de ARN mediante el emparejamiento de clique y el ajuste de mínimos cuadrados 3D. Rclick ha sido evaluado y comparado con otros servidores y métodos populares para alineaciones estructurales de ARN. En la mayoría de los casos, las alineaciones de Rclick fueron mejores en términos de superposición de estructuras. También reconoce cambios conformacionales entre estructuras. (Referencias: Nguyen MN, & amp Verma C. 2015. Bioinformatics 31:966-968).

NGL Viewer es una aplicación web para la visualización de estructuras macromoleculares. Al adoptar completamente las capacidades de los navegadores web modernos, como WebGL, para gráficos moleculares, el espectador puede mostrar de forma interactiva grandes complejos moleculares y tampoco se ve afectado por el retiro de complementos de terceros como Flash y Java Applets. Hermosa salida. (Referencia: A.S. Rose & amp P.W. Hildebrand. 2015. Nucl. Acids Res. 43 (W1): W576-W579).

CEP: un servidor de predicción de epítopos conformacionales: proporciona una interfaz web para la predicción de epítopos conformacionales. El algoritmo, además de predecir epítopos conformacionales, también predice determinantes antigénicos y epítopos secuenciales. Los epítopos se predicen utilizando datos de estructura 3D de antígenos proteicos, que se pueden visualizar gráficamente. (Referencia: U. Kulkarni-Kale et al. 2005. Nucl. Acids Res. 33: W168-W171). El siguiente es un ejemplo de un epítopo (lleno de espacio) mapeado en la superficie parcial (barra) de la lisozima:

PDB2MultiGIF (Departamento Central de Espectroscopia - Modelado Molecular, Deutsches Krebsforschungszentrum, Alemania) - si desea presentar su modelo en una página web de manera similar a las tres imágenes en la página de entrada, use este programa. Toma la estructura 3D (archivo PDB) y genera una imagen animada que se puede mostrar con cualquier navegador. Existe una elección considerable en cuanto al tamaño de la imagen, el número de fotogramas y la dirección de rotación.

MovieMaker: un servidor web que permite (

10 seg), películas descargables que se generarán de la dinámica de las proteínas. Acepta archivos PDB o números de acceso PDB como entrada y genera automáticamente animaciones coloridas que cubren una amplia gama de movimientos de proteínas y otros procesos dinámicos. Los usuarios tienen la opción de animar 1) rotación simple 2) transformación entre dos conformadores finales 3) vibraciones de picosegundos de escala corta 4) acoplamiento de ligandos 5) oligomerización de proteínas 6) movimientos de nanosegundos (conjuntos) de escala media y 7) plegamiento / despliegue de proteínas . MovieMaker no es un servidor de dinámica molecular y no realiza cálculos de MD. (Referencia: R. Maiti et al. 2005. Nucl. Acids Res. 33: W358-W362)

COMBOSA3D - Coloración de moléculas según la alineación de secuencias (Paul Stoddard) - acepta un grupo de secuencias prealineadas en formato FASTA (una de las secuencias debe tener una estructura tridimensional resuelta) y utiliza la información de alineación para resaltar los residuos conservados en la molécula. Las estructuras tridimensionales se muestran usando un complemento Chime o se puede usar RasMol para ver y colorear una molécula.

ProFunc: un servidor para predecir la función de las proteínas a partir de la estructura 3D - este programa toma archivos PDB y lleva a cabo una impresionante variedad de análisis que incluyen escaneos contra bases de datos de PDB y motivos, determinación de la morfología de la superficie y residuos conservados, y sitios potenciales de unión a ligandos. (Referencia: R. A. Laskowski y col. 2005. Nucl. Acids Res. 33: W89-W93).

Predecir la función de la estructura:

ProFunc: se ha desarrollado para ayudar a identificar la función bioquímica probable de una proteína a partir de su estructura tridimensional utilizando una variedad de métodos basados ​​en secuencia y estructura (Referencia: Laskowski R.A. et al.2005. Ácidos nucleicos Res.33, W89-W93).

PROVEAN (Protein Variacion miefecto Analyzer) es una herramienta de software que predice si una sustitución de aminoácidos o indel tiene un impacto en la función biológica de una proteína. (Referencia: Choi Y et al. 2012. PLoS One 7:e46688).

CUPSAT - CColonia Uuniversidad PAGrotein Sestabilidad Aanálisis Tool: predice cambios en la estabilidad de las proteínas tras mutaciones puntuales. El modelo de predicción utiliza potenciales de átomos de aminoácidos y distribución de ángulos de torsión para evaluar el entorno de aminoácidos del sitio de mutación. Además, el modelo de predicción puede distinguir el entorno de aminoácidos utilizando su accesibilidad al disolvente y la especificidad de la estructura secundaria. (Referencia: Parthiban V, et al. (2006) Nucleic Acids Research, 34: W239-42.

Eris: es un servidor de predicción de estabilidad de proteínas. Este servidor calcula el cambio de la estabilidad de la proteína inducida por mutaciones (& Delta & DeltaG) utilizando la suite de modelado Medusa recientemente desarrollada. En nuestro estudio de prueba, se calcularon los valores & Delta y DeltaG de un gran conjunto de datos (& gt500) y se compararon con los datos experimentales y se encontraron correlaciones significativas. Los coeficientes de correlación varían de 0,5 a 0,8. Eris también permite el refinamiento de la estructura de la proteína cuando las estructuras de alta resolución no están disponibles. (Referencia: Yin, F. et al. Nature Methods 4: 466-467 2007). Requiere registro.

AUTO-MUTE - AUTOservidor acoplado para predecir. consecuencias funcionales del aminoácido MUTaciones en protmiins - es un conjunto de programas que miden cambios de estabilidad (& Delta & DeltaG, & Delta & DeltaGH2O, y & DeltaTm). (Referencia: Masso M. & amp Vaisman I.I. (2010) Protein Eng. Des. Sel. 23: 683-687).

DUET - Protein Stability Change Upon Mutation - un servidor web para un enfoque computacional integrado para estudiar mutaciones sin sentido en proteínas. DUET consolida dos enfoques complementarios (mCSM y SDM) en una predicción de consenso, obtenida al combinar los resultados de los métodos separados en un predictor optimizado utilizando Support Vector Machines (SVM). (Referencia: D.E.V. Pires et al. 2015. Nucl. Acids Res. 42(1): W314-W319)

Bolsillos (sitios activos) en estructuras 3D de proteínas:

metaPocket - Identificación de cavidades en la superficie de la proteína utilizando múltiples enfoques computacionales para la predicción del sitio de unión del fármaco (Referencia: Zhang, Z. et al. 2011. Bioinformatics, 27: 2083-2088).

POCASA (correoscket-Californiavidad Sbuscar Application) es un programa automático que implementa el algoritmo llamado Roll que puede predecir los sitios de unión mediante la detección de bolsas y cavidades de proteínas de estructura 3D conocida. (Referencia: Yu, J. et al.2010. Bioinformática 26: 46-52.)

Suite Fpocket: hay tres servidores disponibles: (a) Fpocket: realiza una detección simple de bolsas (b) MDpocket: rastrea las bolsas en la dinámica molecular y, (c) Hpocket: visualiza las bolsas conservadas dentro de las proteínas homólogas (Referencia: Schmidtke P et al.2009. Ácidos nucleicos Res.10:168).

Mutación y cristalización:

Servidor SERp - STu cara mintropía Reducción pagrediction (SERp) es una herramienta exploratoria para ayudar a identificar los sitios que son más adecuados para la mutación diseñada para mejorar la cristalización mediante un enfoque de reducción de la entropía superficial. (Referencia: Goldschmidt L et al. 2007. Protein Sci. 16:1569-76).

Predictor de proteína de raspado - (Instituto de Genómica y Bioinformática, Universidad de California, Irvine) - los programas incluyen: ACCpro: la accesibilidad relativa de los residuos de proteínas a los disolventes CMAPpro: predicción de mapas de contacto de aminoácidos COBEpro: predicción de epítopos continuos de células B CONpro: predice si el número de contactos de cada residuo en una proteína está por encima o por debajo del promedio para ese residuo. Initio).


MODELADO FÍSICO DE PLEGADO Y PREDICCIÓN DE ESTRUCTURAS

Las simulaciones por computadora de modelos puramente basados ​​en la física se están volviendo útiles para la predicción de estructuras y para el estudio de rutas de plegado. En este caso, la métrica del éxito no es únicamente el rendimiento en la predicción de estructuras nativas, sino obtener una comprensión más profunda de las fuerzas y dinámicas que gobiernan las propiedades de las proteínas. Cuando los métodos puramente físicos tienen éxito, nos permitirá ir más allá de la bioinformática para (a) predicen cambios conformacionales, como el ajuste inducido, importante para el descubrimiento computacional de fármacos (B) comprender los mecanismos de acción de las proteínas, los movimientos, los procesos de plegamiento, la catálisis enzimática y otras situaciones que requieren algo más que la estructura nativa estática (C) comprender cómo las proteínas responden a los disolventes, el pH, las sales, los desnaturalizantes y otros factores y (D) diseñan proteínas sintéticas que tienen aminoácidos no canónicos o polímeros foldaméricos con cadenas principales no biológicas.

Una cuestión clave ha sido si los campos de fuerza física atómica semiempíricos son lo suficientemente buenos para plegar una proteína en una computadora. Los métodos basados ​​en la física están actualmente limitados por grandes requisitos computacionales debido al formidable problema de búsqueda conformacional y, en menor medida, por debilidades en los campos de fuerza. Sin embargo, ha habido éxitos notables en la última década gracias al desarrollo de grandes recursos de supercomputadoras y sistemas informáticos distribuidos. El primer hito fue una simulación en supercomputadora realizada por Duan y Kollman en 1998 del plegado del casco de villina de 36 residuos en solvente explícito, durante casi un microsegundo de tiempo calculado, alcanzando un estado colapsado 4.5 & # x000c5 de la estructura de RMN (57) . Otro hito fue el desarrollo por parte de Pande y sus colegas de Folding @ home, un sistema de computación en red distribuida que se ejecuta en los protectores de pantalla de las computadoras voluntarias en todo el mundo. Pande et al. (241) han estudiado la cinética de plegamiento de la villina. Pande et al. (110) y Duan et al. (136, 137) han alcanzado recientemente estructuras de villina de alta resolución. Además, tres grupos han plegado el péptido Trp-cage de 20 residuos para

1 & # x000c5: Simmerling et al. (200), el grupo IBM Blue Gene de Pitera y Swope (183) y Duan y colaboradores (35). Recientemente, Lei & # x00026 Duan (135) plegó el dominio de unión a la albúmina, un paquete de tres hélices de 47 residuos, a 2,0 & # x000c5. Los enfoques basados ​​en la física también están plegando pequeñas hélices y péptidos en horquilla de hasta

20 residuos que tienen estructuras secundarias estables (63, 81, 108, 240, 246 M.S. Shell, R. Ritterson & # x00026 K.A. Dill, datos no publicados). También se han muestreado modelos de potencial físico utilizando estrategias de optimización deterministas y estocásticas que no son de Boltzmann (121, 174, 207, 220).

Estas son algunas de las conclusiones clave. Primero, una forma poderosa de muestrear conformaciones y obtener promedios de Boltzmann adecuados es la dinámica molecular de intercambio de réplicas (REMD) (210). En segundo lugar, aunque los campos de fuerza son buenos, necesitan mejoras en las energías de torsión de la columna vertebral para abordar el equilibrio entre las conformaciones helicoidales y extendidas (81, 108, 240), y en la solvatación implícita, lo que reduce drásticamente el gasto en relación con las simulaciones explícitas de agua pero que con frecuencia sobreestabiliza las interacciones de emparejamiento de iones, desestabilizando a su vez las estructuras nativas (63, 246).

¿Pueden los campos de fuerza modernos con muestreo de Boltzmann predecir estructuras nativas más grandes? Un trabajo reciente indica que, cuando se combina con una técnica de búsqueda conformacional basada en el mecanismo de plegado ZA, los métodos puramente basados ​​en la física pueden llegar a estructuras cercanas al estado nativo para cadenas de hasta

100 monómeros (177 M.S. Shell, S.B. Ozkan, V.A. Voelz, G.H.A. Wu & # x00026 K.A. Dill, datos no publicados). El enfoque, llamado ZAM (método de cierre y ensamblaje), utiliza el intercambio de réplicas y el campo de fuerza AMBER96 y funciona mediante (a) rompiendo la cadena proteica completa en pequeños fragmentos (inicialmente 8-meros), que se simulan por separado utilizando REMD (B) luego creciendo o comprimiendo los fragmentos que tienen estructuras metaestables agregando algunos residuos nuevos o ensamblando dos de esos fragmentos juntos, con más REMD e iteraciones y (C) bloqueando en su lugar cualquier contacto residuo-residuo estable con un resorte armónico, imponiendo rutas de plegado físico putativas emergentes, sin la necesidad de muestrear un gran número de grados de libertad a la vez.

ZAM se probó mediante el plegamiento de ocho de nueve proteínas pequeñas del PDB dentro de 2.5 & # x000c5, utilizando un clúster de 70 procesadores durante 6 meses (177), dando una buena concordancia con los valores & # x003c6 conocidos para cuatro de ellos . La Figura 9 muestra el proceso de plegado ZAM para una de estas proteínas, y la Figura 10 muestra las estructuras predichas versus experimentales para las nueve. En una prueba más rigurosa, se aplicó ZAM en CASP7 al plegamiento de seis proteínas pequeñas de 76 a 112 residuos (M.S. Shell, S.B. Ozkan, V.A. Voelz, G.H.A. Wu & # x00026 K.A. Dill, datos no publicados). De las cuatro proteínas intentadas en CASP7 que no se intercambiaron de dominio, ZAM predijo estructuras terciarias aproximadamente correctas, segmentos de más de 40 residuos con un RMSD promedio de 5,9 angstroms y estructuras secundarias con una precisión del 73%. A partir de estos estudios se ha concluido que las rutas ZA pueden identificar rutas de muestreo limitado al estado nativo a partir de estados desplegados, dirigidos por campos de fuerza de todos los átomos, y que el modelo AMBER96 más un modelo de solvente implícito de Born generalizado es una función de puntuación razonable.Los fragmentos que adoptan estructuras secundarias incorrectas al principio de las simulaciones se corrigen con frecuencia en el plegamiento de la etapa posterior porque la estructura terciaria emergente de la proteína a menudo no los tolera.

Las rutas de plegamiento encontradas en el proceso de búsqueda conformacional de ZAM para la proteína G, del trabajo descrito en la Referencia 177. La cadena se analiza primero en muchos fragmentos cortos superpuestos. Después de muestrear por dinámica molecular de intercambio de réplicas, se identifican y restringen los contactos hidrófobos estables. Los fragmentos son entonces (a) crecido o comprimido a través de iteraciones de agregar nuevos residuos, muestreo y detección de contacto, o (B) ensamblados por pares utilizando una alineación de cuerpo rígido seguido de un muestreo adicional hasta que se alcanza una estructura completa.

Diagramas de cinta de las estructuras de proteínas predichas utilizando el algoritmo de búsqueda ZAM (púrpura) versus estructuras PDB experimentales (naranja). Las C-RMSD de la columna vertebral con respecto a las estructuras PDB son la proteína A (1.9 & # x000c5), la proteína de unión al dominio de albúmina (2.4 & # x000c5), alfa-3D [2.85 & # x000c5 (excluyendo los residuos de bucle) o 4.6 & # x000c5] , Dominio WW FBP26 (2.2 & # x000c5), dominio WW YJQ8 (2.0 & # x000c5), fragmento de residuo 1 & # x0201335 de ubiquitina (2.0 & # x000c5), proteína G (1.6 & # x000c5) y -espectrina SH3 (2.2 & # x000c5). ZAM no encuentra la estructura src-SH3: se muestra una conformación que es 6 & # x000c5 de la estructura experimental. El problema en este caso parece ser la sobreestabilización de pares de iones no nativos en el modelo de solvatación implícita GB / SA.


Para un metasitio vinculado a una amplia gama de programas en línea de predicciones de estructura y análisis de secuencias de proteínas, recomiendo PredictProtein (ROSTLAB, Technische Universit y aumlt M & uumlnchen). Ver también: Predictor de proteínas SCRATCH (Instituto de Genómica y Bioinformática, Universidad de California, Irvine, EE. UU.)

Varios sitios excelentes para el análisis en línea de posibles proteínas que atraviesan la membrana son: (Secuencia de prueba ver Orientación de proteínas en membranas para 268 estructuras proteicas de membrana a-helicoidal únicas)

TMpred - Predicción de regiones transmembrana y orientación - ISREC (Instituto Suizo de Investigación Experimental del Cáncer)
TMHMM: predicción de hélices transmembrana en proteínas (Centro de Análisis de Secuencias Biológicas, Universidad Técnica de Dinamarca)
DAS - Servidor de predicción transmembrana (Universidad de Estocolmo, Suecia)
SEPARAR (D. Juretic, Univ. Split, Croacia) - el servidor de predicción de topología de proteínas transmembrana proporciona una salida clara y colorida que incluye preferencia beta e índice de momento hidrofóbico modificado.
OCTOPUS: utilizando una combinación novedosa de modelos ocultos de Markov y redes neuronales artificiales, OCTOPUS predice la topología correcta para el 94% de un conjunto de datos de 124 secuencias con estructuras conocidas. (Referencia: Viklund, H. & amp

Phobius: es una topología transmembrana combinada y un predictor de péptidos señal (Referencia: L. K & aumlll y col. 2004. J. Mol. Biol. 338: 1027-1036) También se puede acceder a esta herramienta aquí (EBI).

CCTOP (Consenso Csobrecargado CIMAology prediction): utiliza 10 métodos diferentes de predicción de topología de vanguardia, el servidor CCTOP incorpora información de topología de fuentes experimentales y computacionales existentes disponibles en las bases de datos PDBTM, TOPDB y TOPDOM utilizando el marco probabilístico del modelo de Markov oculto. El servidor ofrece la opción de preceder la predicción de topología con predicción de péptidos señal y discriminación de proteína transmembrana-globular. (Referencia: Dobson L et al. (2015) Nucleic Acids Res 43 (W1): W408 y ndashW412).

TMFoldWeb: es la implementación del servidor web de TMFoldRec, un algoritmo de reconocimiento de pliegues de proteínas transmembrana. TMFoldRec utiliza potenciales estadísticos y utiliza filtrado de topología y un algoritmo de subprocesamiento sin espacios. Clasifica las estructuras de la plantilla y selecciona los candidatos más probables y estima la fiabilidad del modelo de energía más baja obtenido. El potencial estadístico se desarrolló en un marco de máxima verosimilitud en un conjunto representativo de la base de datos PDBTM. Según la prueba de referencia, el rendimiento de TMFoldRec es de aproximadamente el 77% en la clase de pliegue de predicción correcta para una secuencia de proteína transmembrana determinada. (Referencia: Kozma D & amp Tusn & aacutedy GE (2015) Biol Direct. 10: 54).

MEMSATSVM: es una predicción mejorada de la topología de proteínas transmembrana que utiliza SVM. Este método es capaz de diferenciar péptidos señal de hélices transmembrana. (Referencia: Reeb J et al. (2015) Proteínas 83(3): 473-84).

MEMEMBED: predicción de la orientación de las proteínas de membrana. es capaz de orientar de forma rápida y precisa las proteínas de la membrana de la hélice alfa y del barril beta dentro de la bicapa lipídica, mostrando una concordancia más estrecha con los valores determinados experimentalmente que los enfoques existentes. También demostramos un refinamiento consistente y significativo de los modelos de proteínas de membrana y la discriminación efectiva entre las estructuras nativas y señuelo (Referencia: Nugent T & amp DT Jones (2013) BMC Bioinformatics 14: 276)

RHYTHM: predice la orientación de las hélices transmembrana en canales y bobinas de membrana, específicamente residuos enterrados frente a expuestos. (Referencia: A. Rose et al. 2009. Nucl. Acids Res. 37(Problema del servidor web): W575-W580)

TMMOD - Modelo de Markov oculto para la predicción de la topología de proteínas transmembrana (Departamento de Ciencias de la Información y Computación, Universidad de Delaware, EE. UU.) - en la página de resultados, haga clic en & quot mostrar probabilidades posteriores & quot para ver un diagrama tipo TMHMM

PRED-TMR2 (C. Pasquier & amp S.J. Hamodrakas, Departamento de Biología Celular y Biofísica, Univ. Atenas, Grecia) - cuando se aplica a varios conjuntos de pruebas de proteínas transmembrana, el sistema da una calificación de predicción perfecta del 100% al clasificar todas las secuencias en la clase transmembrana. Solo un 2,5% de tasa de error con proteínas no transmembrana.

TOPCONS: calcula las predicciones de consenso de la topología de proteínas de membrana utilizando un modelo de Markov oculto (HMM) y la entrada de cinco métodos de predicción de topología de última generación. (Referencia: A. Bernsel et al. 2009. Nucleic Acids Res. 37(Problema del servidor web), W465-8). Para un servidor por lotes sin ejecuciones BLAST, use TOPCONS single.

MINNOU ( METROproteína embrane IDelawarenortetificationorte conUNEDt uso explícito de perfiles y alineaciones de hidropatía) - predice dominios de transmembrana (TM) de hélice alfa y de hoja beta basándose en una representación compacta de un residuo de aminoácido y su entorno, que consiste en la accesibilidad prevista al disolvente y la estructura secundaria de cada aminoácido. (Referencia: Cao et al. 2006. Bioinformática 22: 303-309). Una leyenda para ayudar a interpretar los resultados aquí.

SuperLooper: proporciona la primera interfaz en línea para la búsqueda y colocación automática, rápida e interactiva de bucles en proteínas. (Referencia: P.W. Hildebrand et al. 2009. Nucl. Acids Res. 37(Problema del servidor web): W571-W574))

Transmembrane Kink Predictor (TMKink): un sello distintivo de la estructura de la proteína de membrana es la gran cantidad de hélices transmembrana distorsionadas. Debido a la prevalencia de las curvas, es importante no solo comprender cómo se generan, sino también aprender a predecir su aparición. Aquí, encontramos que hay preferencias de secuencia local en hélices retorcidas, más notablemente una mayor abundancia de prolina, que puede explotarse para identificar curvas a partir de información de secuencia local. Un predictor de red neuronal identifica más de dos tercios de todas las curvas (sensibilidad 0,70) con alta fiabilidad (especificidad 0,89). (Referencia: Meruelo AD et al. 2011. Protein Sci. 20:1256-64)

Método de tarjeta de puntuación SCMMTP Proteínas de transporte de membrana: identificación y caracterización de proteínas de transporte de membrana utilizando puntuaciones de propensión de dipéptidos. Las precisiones de entrenamiento y prueba de SCMMTP son 83,81% y 76,11%, respectivamente. (Referencia: Vasylenko, T. et al. 2015. BMC Bioinformatics, 16 (Supl. 1): S8, 2015)

Para dibujar la estructura de las proteínas transmembrana se encuentran disponibles dos sitios:

Protter: una herramienta de código abierto para la integración interactiva y la visualización de características de secuencias de proteínas anotadas y predichas junto con evidencia proteómica experimental. Protter admite numerosos formatos de archivo proteómicos e integra automáticamente una variedad de fuentes de anotación de proteínas de referencia, que se pueden ampliar fácilmente mediante complementos modulares. Una función de exportación incorporada produce ilustraciones de proteínas personalizadas con calidad de publicación, también para grandes conjuntos de datos. (Referencia: U. Omasits et al. 2014. Bioinformática. 30:884-886). Diagrama de la holina del bacteriófago lambda generado con Protter:

TOPO2 (S. Johns, Servicio de consultoría de análisis de secuencias de UCSF, EE. UU.) - este sitio proporciona un control considerable sobre la presentación. Aquí se proporciona una amplia documentación.

TMRPres2D (herramienta T rans M embrane de reproducción de proteínas en 2 dimensiones): esta herramienta Java toma datos de una variedad de servidores de plegamiento de proteínas y crea imágenes / modelos gráficos uniformes, bidimensionales y de alto análisis de hélice alfa o proteínas transmembrana de barril beta. (Referencia: I.C. Spyropoulos et al. 2004. Bioinformática 20: 3258-3260).

Reconocimiento de péptidos de señal y localización subcelular amp:

A. Proteínas bacterianas

PSORTb (Laboratorio Brinkman, Universidad Simon Fraser, Canadá) - proporciona probablemente el predictor de localización subcelular de proteínas bacterianas más preciso. Alternativamente use PSORT (Univ. Tokio, Japón) - una serie de programas para la predicción de sitios de localización de proteínas en las células. Elija programas específicos para proteínas animales, de levadura, vegetales o bacterianas (Gram-negativas o Gram-positivas).
PSLpred - es un método basado en SVM, predice 5 localización subcelular principal (citoplasma, membrana interna, membrana externa, extracelular, periplasma) de bacterias Gram-negativas. Este método incluye varios módulos SVM basados ​​en diferentes características de las proteínas. El enfoque híbrido logró una precisión general del 91%, que es el mejor entre todos los métodos existentes para la localización subcelular de proteínas procariotas. (Referencia: 21: 2522-2524.)

CELLO subCELlular LOsistema predictivo de calización: asigna proteínas Gram negativas al citoplasma, la membrana interna, el periplasma, la membrana externa o el espacio extracelular con una precisión de predicción general de aprox. 89%. También analiza proteínas eucariotas y grampositivas. (Referencia: C.S. Yu et al. 2004. Protein Sci. 13:1402-1406). El CELLO2GO actualizado (proteína subCELlular LOpredicción de calización con funcional GRAMOene Oanotación de ntología) - CELLO2GO debería ser una herramienta útil para la investigación que involucre sistemas subcelulares complejos porque combina CELLO y BLAST en una plataforma y su salida se manipula fácilmente para que las preguntas específicas del usuario se puedan abordar fácilmente (Referencia: Yu CS et al. 2014. PLoS ONE 9: e99368).

SignalP: predice la presencia y ubicación de los sitios de escisión del péptido señal en proteínas Gram-positivas, Gram-negativas y eucariotas (Centro de Análisis de Secuencias Biológicas, Universidad Técnica de Dinamarca). Para un ejemplo de una secuencia de prueba de uso de proteína periplásmica Masculino.
Phobius: es una topología transmembrana combinada y un predictor de péptidos señal (Referencia: L. K & aumlll y col. 2004. J. Mol. Biol. 338: 1027-1036).
LipoP 1.0 (Centro de Análisis de Secuencias Biológicas de la Universidad Técnica de Dinamarca) - permite la predicción de dónde los sitios de escisión de las peptidasas señal I y II de las bacterias Gram negativas escindirán una proteína.

SecretomeP - produce ab initio predicciones de no clásicas es decir. péptido señal no desencadena la secreción de proteínas. El método consulta una gran cantidad de otros servidores de predicción de características para obtener información sobre varios aspectos postraduccionales y de localización de la proteína, que se integran en la predicción de secreción final (Referencia: J.D. Bendtsen et al. 2005. BMC Microbiology 5: 58).

SSPRED: identificación y clasificación de proteínas involucradas en los sistemas de secreción bacteriana. No envíe más de cuatro proteínas a la vez. (Referencia: Pundhir, S., & amp Kumar, A. 2011. Bioinformación 6: 380-382).

Signal Find Server: incluye (a) FlaFind que predice péptidos señal de clase III (tipo pilina tipo IV) de arqueas (péptidos señal de clase III) y sus sitios de escisión de prepilina peptidasa (b) EppA-pilinFind que predice péptidos señal de clase III procesados ​​por un Peptidasa de prepilina de arquea única, EppA (c) TatFind que predice péptidos señal de translocación de arginina gemela (Tat) de arqueas y bacterias (d) PilFind que predice péptidos de señal bacterianos de tipo IV similares a pilina y sus sitios de escisión de prepilina peptidasa y, (e) TatLipo que predice péptidos señal de Tat haloarqueales que contienen un sitio de escisión de SPasa II (lipobox).

Signal-3L 2.0: es un servidor en línea para predecir el péptido señal de la proteína N-terminal, y la entrada es solo la secuencia de aminoácidos. Está construido con un modelo de mezcla jerárquico, que contiene las siguientes tres capas: (1) Discriminación de proteínas SP (péptido señal) y proteínas TMH (transmembrana helicoidal) de las otras proteínas globulares (2) Reconocimiento de proteínas SP de proteínas TMH y, (3) Identificación de los sitios de escisión de las proteínas SP. (Referencia: Y-Z. Zhang & amp H-B. Shen. Journal of Chemical Information and Modeling, 2017, 57: 988-999)

PrediSi - PREDIcción de SIpéptidos gnal (Karsten Hiller, Universidad Técnica de Braunschweig)

Signal Find Server: proporciona varios programas distintos: (a) FlaFind predice péptidos señal (péptidos señal clase III) de arqueas de clase III (tipo pilina de tipo IV) y sus sitios de escisión de prepilina peptidasa. (b) EppA-pilinFind predice péptidos señal de clase III procesados ​​por una prepilina peptidasa de arquea única, EppA. (c) TatFind predice péptidos señal de la translocación de arginina gemela (Tat) arqueales Y bacterianos. (d) PilFind predice péptidos señal bacterianos de tipo IV similares a pilina y sus sitios de escisión de prepilina peptidasa. (e) TatLipo predice péptidos señal de Tat haloarqueales que contienen un sitio de escisión de SPasa II (lipobox).

B. Proteínas eucariotas

DeepLoc-1.0 predice la localización subcelular de proteínas eucariotas. Puede diferenciar entre 10 localizaciones diferentes: núcleo, citoplasma, extracelular, mitocondria, membrana celular, retículo endoplásmico, cloroplasto, aparato de Golgi, lisosoma / vacuola y peroxisoma. Su modelo logra una buena precisión (78% para 10 categorías 92% para membranas o solubles), superando los algoritmos actuales de última generación, incluidos los que se basan en información de homología. (Referencia: Almagro Armenteros JJ et al. 2017. Bioinnformatics 33(21): 3387-3395).

Protein Prowler Subcellular Localization Predictor versión 1.2 acepta secuencias de aminoácidos, presentadas en el formato FASTA, y determina la localización de la proteína entre las siguientes categorías: Vía secretora (presencia de un péptido señal SP) Mitocondria (presencia de un péptido direccional mitocondrial mTP) Cloroplasto (presencia de un péptido de tránsito de cloroplasto cTP solo aplicable a proteínas vegetales) y Otros (núcleo, citoplasmático o de otro tipo). (Referencia: Bod & eacuten, M. y Hawkins (2005) Bioinformática. 21(10): 2279-2286).
WoLF PSORT - (Instituto Nacional de Ciencia y Tecnología Avanzadas, Japón) (Referencia: Horton P et al. (2007) Nucleic Acids Res. 35 (problema del servidor web): W585 y ndashW587).

ngLOC: es un clasificador bayesiano basado en n-gramas que predice la localización subcelular de proteínas tanto en procariotas como en eucariotas. La precisión general de la predicción varía del 85,3% al 91,4% entre especies. Este programa puede predecir 11 ubicaciones distintas, cada una en especies de plantas y animales. ngLOC también predice 4 y 5 ubicaciones distintas en conjuntos de datos de bacterias grampositivas y gramnegativas, respectivamente. (Referencia: King BR et al BMC Res Notes. 5: 351 ).

ProtComp (Softberry, EE. UU.) se puede utilizar para predecir la localización subcelular de proteínas animales / fúngicas y vegetales.

SecretomeP - produce ab initio predicciones de no clásicas es decir. péptido señal no desencadena la secreción de proteínas. El método consulta una gran cantidad de otros servidores de predicción de características para obtener información sobre varios aspectos postraduccionales y de localización de la proteína, que se integran en la predicción de secreción final (Referencia: J.D. Bendtsen et al. 2005. BMC Microbiology 5: 58).

Otros sitios para predicciones de estructuras secundarias incluyen:

JPred4: es la última versión del popular servidor de predicción de estructuras secundarias de proteínas JPred que proporciona predicciones mediante el algoritmo JNet, uno de los métodos más precisos para la predicción de estructuras secundarias. Además de la estructura secundaria de la proteína, JPred también hace predicciones de la accesibilidad a los disolventes y las regiones en espiral. JPred4 presenta una mayor precisión, con una precisión de predicción de la estructura secundaria ciega de tres estados (a-helix, & szlig-strand y coil) del 82.0%, mientras que la precisión de la predicción de la accesibilidad del solvente se ha elevado al 90% para residuos y lt5% accesible. (Referencia: A. Drozdetskiy et al. 2015. Nucl. Acids Res. 43 (W1): W389-W394).

Secuencia de proteínas de red @ análisis en IBCP - (Institut de Biologie et Chemie des Proteines, Lyon, Francia) - tiene DSC, GORIV, Predator, SOPMA y el método de red neuronal jerárquica, además de programas más antiguos.

PSIPRED Protein Sequence Analysis Workbench: incluye PSIPRED v3.3 (Predicción de estructura secundaria) DISOPRED3 y amp DISOPRED2 (Predicción de trastornos) pGenTHREADER (Reconocimiento de pliegues basado en perfiles) MEMSAT3 y amp MEMSAT-SVM (Predicción de hélice de membrana) Modelado de BioSerf DomP v2.0 (Automated Homredology) (Predicción de dominio de proteínas) FFPred 3 (Predicción de función eucariota) GenTHREADER (Reconocimiento de plegado rápido) MEMPACK (Predicción de SVM de topología de TM y empaque de hélice) pDomTHREADER (Reconocimiento de dominio de plegado) y DomSerf v2.0 (Modelado de dominio automatizado por homología). (Referencia: Buchan DWA et al. 2013. Nucl. Acids Res. 41 (W1): W340-W348).

Para conocer una gama completa de propiedades de su proteína, incluida la hidrofobicidad, la hélice alfa y los gráficos de hoja beta, consulte ProScale (ExPASy, Suiza).

Estados desordenados:

Muchas proteínas que contienen regiones que no forman estructuras bien definidas y los siguientes programas nuevos ayudan a definir estas regiones:

D2P2 (Base de datos de predicciones de proteínas desordenadas): una batería de predictores de trastornos y sus variantes, VL-XT, VSL2b, PrDOS, PV2, Espritz e IUPred, se ejecutaron en un gran número de secuencias de proteínas. Se proporcionan búsquedas en la base de datos y se proporcionan enlaces a cada uno de los servidores desordenados. (Referencia: Oates ME et al. (2013). Nucleic Acids Res 41 (D1): D508-D516).

RONN (Red neuronal de orden regional) - (Referencia: Z.R. Yang et al. 2005. Bioinformática 21: 3369-3376). Para obtener una explicación del trastorno nativo, consulte aquí.
IUPred: la suposición subyacente es que las proteínas globulares están compuestas de aminoácidos que tienen el potencial de formar una gran cantidad de interacciones favorables, mientras que las proteínas intrínsecamente no estructuradas (IUP) no adoptan una estructura estable porque su composición de aminoácidos no permite interacciones favorables suficientes para formulario. (Referencia: Z.3433-3434).
DISOPRED3 (Referencia: J.J. Ward y col. 2004. J. Molec. Biol. 337: 635-645).

PrDOS es un servidor para predecir regiones desordenadas de forma nativa de una cadena de proteínas a partir de su secuencia de aminoácidos. PrDOS devuelve la probabilidad de desorden de cada residuo como resultados de predicción (Referencia: Ishida T y Kinoshita K (2007) Nucleic Acids Res. 35 (problema del servidor web): W460-4.).

MFDp (METROultimado Fbasado en usion Disorder pagredictor): tiene como objetivo mejorar los predictores de trastornos actuales (Referencia: M.J. Mizianty et al. 2010. Bioinformatics 26: i489-i496)

MoRFpred - Meslecular rreconocimiento Features (MoRF) son regiones de unión cortas ubicadas dentro de regiones intrínsecamente desordenadas más largas que se unen a proteínas asociadas a través de transiciones de desorden a orden. Los MoRF están implicados en procesos importantes que incluyen la señalización y la regulación. MoRFpred es una herramienta computacional para la predicción basada en secuencias y la caracterización de regiones de unión de transición de orden corto de desorden a orden en proteínas que identifica todos los tipos de MoRF (a, & szlig, espiral y complejo). (Referencia: F.M. Disfani et al. 2012. Bioinformática 28: i75-i83).

Dominio de Scooby (SequenCe hidrophtransmisión exterioricity predice dominios) es un método para identificar regiones globulares en la secuencia de proteínas que son adecuadas para estudios estructurales. El subprograma JAVA de dominio de Scooby se puede utilizar como una herramienta para identificar visualmente las regiones "plegables" en la secuencia de proteínas. Gráficos interesantes. (Referencia: R.A. George et al. 2005. Nucl. Acids Res. 33: W160-W163).

Para estimaciones sobre la antigenicidad de regiones de proteínas, consulte:

Gráfico de antigenicidad (Módulo JaMBW) - Dada una secuencia de aminoácidos, este programa calcula y traza la antigenicidad a lo largo de la cadena polipeptídica, como predice el algoritmo de Hopp & amp Woods (1981).
SAbPred: es un servidor de predicción de anticuerpos basado en la estructura (Referencia: J. Dunbar et al. Nucleic Acids Res.2016 44 (problema del servidor web): W474 y ndashW478.

EMBOSS antigénico (Paquete EMBOSS) - este programa predice regiones potencialmente antigénicas de una secuencia de proteína, utilizando el método de Kolaskar & amp Tongaonkar (1990). También accesible aquí.

OptimumAntigen y herramienta de diseño comercial (GenScript) - Los péptidos se optimizan utilizando el algoritmo de diseño de antígenos más avanzado de la industria. Cada péptido se mide frente a varias bases de datos de proteínas para confirmar la especificidad del epítopo deseada. Los beneficios de utilizar la herramienta de diseño OptimumAntigen & trade incluyen la evitación de epítopos no expuestos, la capacidad de especificar la reactividad cruzada deseada, la fuerte antigenicidad del péptido elegido, la identificación de las mejores opciones de conjugación y presentación para sus ensayos deseados, el uso del tutorial de péptidos integrado para síntesis y solubilidad, y respuesta inmune garantizada.

EpiC (The ProteomeBinders Epitope Choice Resource) recopila y presenta un resumen de estructura-función y una predicción de antigenicidad de su proteína para ayudarlo a diseñar anticuerpos que sean apropiados para sus experimentos planificados. (Referencia: Haslam, N. & amp Gibson. T. Proteome Res., 2010, 9 (7): 3759 y ndash3763).

SVMTriP: es un método para predecir epítopos antigénicos utilizando una máquina de vectores de soporte para integrar la similitud y la propensión de los tripéptidos. (Referencia: B. Yao et al. PLoS ONE (2012) 7(9):e45152).

Para detectar regiones de espirales en espiral en proteínas, use:

Bobinas: predicción de regiones de bobinas enrolladas en troteínas (Nodo suizo de EMBnet, Suiza) - (Referencia: A. Lupas et al.1991 Science 252: 1162-1164). Ver también PCOILS y MARCOILS.
Bobinas de par (Laboratorio de Ciencias de la Computación del MIT, EE. UU.) - (Referencia: B. Berger et al. 1995. Proc. Natl. Acad. Sci. USA, 92: 8259-8263) o MultiCoil: se basa en el algoritmo PairCoil y se utiliza para localizar bobinas en espiral diméricas y triméricas. (Referencia: E. Wolf et al. 1997. Protein Sci. 6: 1179-1189). CoilP

REPPER (REPScome y su PORiodicities): detecta y analiza regiones con repeticiones cortas sin espacios en proteínas. Encuentra periodicidades por Transformada de Fourier (FTwin) y análisis de similitud interna (REPwin). FTwin asigna valores numéricos a los aminoácidos que reflejan ciertas propiedades, por ejemplo, la hidrofobicidad, y proporciona información sobre las periodicidades correspondientes. REPwin utiliza autoalineaciones y muestra repeticiones que revelan similitudes internas significativas. Se complementan con PSIPRED y predicción de bobinas en espiral (COILS), lo que convierte al servidor en una herramienta analítica útil para proteínas fibrosas. (Referencia: M. Gruber y col. 2005. Nucl. Acids Res. 33: W239-W243).

Proteínas de la membrana externa de barril beta: (Secuencia de prueba)

PRED-TM y szlig y szlig (Bagos, P. G., et al. Departamento de Biología Celular y Biofísica, Universidad de Atenas, Grecia) - emplea un método de modelo de Markov oculto, capaz de predecir y discriminar proteínas de la membrana externa de barril beta. Le da a uno la oportunidad de descargar un gráfico de imagen personalizado o una representación 2D (ver a continuación):

BetaTPred2 (Centro de Bioinformática, Instituto de Tecnología Microbiana, India) - predecir los giros de & szlig en proteínas a partir de una alineación múltiple mediante el uso de una red neuronal de la secuencia de aminoácidos dada. Para la predicción de giro & szlig, utiliza las matrices de puntuación específicas de posición generadas por PSI-BLAST y la estructura secundaria predicha por PSIPRED. Para una clasificación del tipo de giro & szlig, utilice BetaTurns.

BOMP - El predictor de proteínas de la membrana externa de barril de & szlig (Referencia: Berven, F.S. et al. 2004. Nucl. Acids Res. 32 (Problema del servidor web): W394-9).

HHomp: detección de proteínas de la membrana externa mediante comparaciones HMM-HMM

ConBBPred - Predicción de consenso de proteínas de barril beta transmembrana - le da una opción de ocho programas de predicción.


Importante avance científico: DeepMind AI AlphaFold resuelve el gran desafío de la predicción de la estructura de proteínas de hace 50 años

En un importante avance científico, la última versión del sistema de inteligencia artificial AlphaFold de DeepMind & # 8217 ha sido reconocida como una solución al gran desafío de 50 años de la predicción de la estructura de proteínas, a menudo denominado & # 8216protein plegamiento problema & # 8217, según a una rigurosa evaluación independiente. Este avance podría acelerar significativamente la investigación biológica a largo plazo, abriendo nuevas posibilidades en la comprensión de enfermedades y el descubrimiento de fármacos, entre otros campos.

Hoy, los resultados de CASP14 muestran que el último sistema AlphaFold de DeepMind & # 8217 logra niveles incomparables de precisión en la predicción de estructuras. El sistema puede determinar estructuras de alta precisión en cuestión de días. CASP, la Evaluación Crítica de la Predicción de la Estructura de las proteínas, es una evaluación bienal administrada por la comunidad que comenzó en 1994 y el estándar de oro para evaluar las técnicas predictivas. Los participantes deben predecir ciegamente la estructura de las proteínas que solo recientemente, o en algunos casos aún no se han determinado experimentalmente, y esperar a que sus predicciones se comparen con los datos experimentales.

CASP utiliza la métrica & # 8220Global Distance Test (GDT) & # 8221 para evaluar la precisión, que van de 0 a 100. El nuevo sistema AlphaFold alcanza una puntuación media de 92,4 GDT en general en todos los objetivos. El error promedio del sistema # 8217 es de aproximadamente 1,6 Angstroms, aproximadamente el ancho de un átomo. Según el profesor John Moult, cofundador y presidente de CASP, una puntuación de alrededor de 90 GDT se considera informalmente competitiva con los resultados obtenidos con métodos experimentales.

El profesor John Moult, cofundador y presidente de CASP, Universidad de Maryland, dijo:

& # 8220 Hemos estado estancados en este único problema, cómo se pliegan las proteínas, durante casi 50 años. Ver a DeepMind producir una solución para esto, después de haber trabajado personalmente en este problema durante tanto tiempo y después de tantas paradas y comenzar a preguntarse si & # 8217d alguna vez llegaremos allí, es un momento muy especial & # 8221.

Por qué es importante la predicción de la estructura de las proteínas

Las proteínas son esenciales para la vida y sus formas están íntimamente ligadas a sus funciones. La capacidad de predecir las estructuras de las proteínas con precisión permite una mejor comprensión de lo que hacen y cómo funcionan. Actualmente hay más de 200 millones de proteínas en la base de datos principal y solo se ha cartografiado una fracción de sus estructuras 3D.

Un desafío importante es la cantidad astronómica de formas en que una proteína podría, teóricamente, plegarse antes de asentarse en su estructura 3D final. Muchos de los mayores desafíos a los que se enfrenta la sociedad, como el desarrollo de tratamientos para enfermedades o la búsqueda de enzimas que descompongan los desechos industriales, están fundamentalmente vinculados a las proteínas y al papel que desempeñan. La determinación de las formas y funciones de las proteínas es un campo importante de la investigación científica, que utiliza principalmente técnicas experimentales que pueden llevar años de trabajo minucioso y laborioso por estructura, y requieren el uso de equipos especializados multimillonarios.

El enfoque de DeepMind & # 8217 al problema del plegamiento de proteínas

Este avance se basa en la primera entrada de DeepMind & # 8217 en CASP13 en 2018, donde la versión inicial de AlphaFold logró el nivel más alto de precisión entre todos los participantes. Ahora, DeepMind ha desarrollado nuevas arquitecturas de aprendizaje profundo para CASP14, inspirándose en los campos de la biología, la física y el aprendizaje automático, así como en el trabajo de muchos científicos en el campo del plegamiento de proteínas durante el último medio siglo.

Una proteína plegada se puede considerar como un & # 8220spacial graph & # 8221, donde los residuos son los nodos y los bordes conectan los residuos en estrecha proximidad. Este gráfico es importante para comprender las interacciones físicas dentro de las proteínas, así como su historia evolutiva. Para la última versión de AlphaFold utilizada en CASP14, DeepMind creó un sistema de red neuronal basado en la atención, entrenado de extremo a extremo, que intenta interpretar la estructura de este gráfico, mientras razona sobre el gráfico implícito que está construyendo. Utiliza secuencias relacionadas evolutivamente, alineación de secuencia múltiple (MSA) y una representación de pares de residuos de aminoácidos para refinar este gráfico.

Al iterar este proceso, el sistema desarrolla fuertes predicciones de la estructura física subyacente de la proteína. Además, AlphaFold puede predecir qué partes de cada estructura de proteína predicha son confiables utilizando una medida de confianza interna.

El sistema fue capacitado con datos disponibles públicamente que consisten en

170.000 estructuras de proteínas del banco de datos de proteínas, utilizando una cantidad relativamente modesta de procesamiento según los estándares modernos de aprendizaje automático: aproximadamente 128 núcleos TPUv3 (aproximadamente equivalente a

100-200 GPU) se ejecutan durante unas pocas semanas.

Potencial de impacto en el mundo real

DeepMind se complace en colaborar con otros para aprender más sobre el potencial de AlphaFold & # 8217, y el equipo de AlphaFold está investigando cómo las predicciones de la estructura de las proteínas podrían contribuir a la comprensión de ciertas enfermedades con algunos grupos de especialistas.

También hay indicios de que la predicción de la estructura de las proteínas podría ser útil en futuros esfuerzos de respuesta a una pandemia, como una de las muchas herramientas desarrolladas por la comunidad científica. A principios de este año, DeepMind predijo varias estructuras de proteínas del virus SARS-CoV-2, y el trabajo sorprendentemente rápido de los experimentadores ahora ha confirmado que AlphaFold logró un alto grado de precisión en sus predicciones.

AlphaFold es uno de los avances más importantes de DeepMind hasta la fecha. Pero al igual que con toda la investigación científica, todavía queda mucho por hacer, incluido averiguar cómo las proteínas múltiples forman complejos, cómo interactúan con el ADN, el ARN o moléculas pequeñas, y cómo determinar la ubicación precisa de todas las cadenas laterales de aminoácidos. .

Al igual que con su sistema CASP13 AlphaFold anterior, DeepMind planea enviar un documento detallando el funcionamiento de este sistema a una revista revisada por pares a su debido tiempo, y simultáneamente está explorando la mejor manera de brindar un acceso más amplio al sistema de una manera escalable.

AlphaFold abre nuevos caminos al demostrar el sorprendente potencial de la IA como herramienta para ayudar al descubrimiento científico fundamental. DeepMind espera colaborar con otros para desbloquear ese potencial.

Declaraciones de científicos independientes:

Profesor Venki Ramakrishnan, Premio Nobel y Presidente de la Royal Society
& # 8220 Este trabajo computacional representa un avance asombroso en el problema del plegamiento de proteínas, un gran desafío de 50 años en biología. Ha ocurrido décadas antes de que muchas personas en el campo lo hubieran predicho. Será emocionante ver las muchas formas en que cambiará fundamentalmente la investigación biológica. & # 8221

Profesora Dame Janet Thornton, directora emérita y científica sénior de amp, EMBL-EBI
& # 8220 Lo que el equipo de DeepMind ha logrado es fantástico y cambiará el futuro de la biología estructural y la investigación de proteínas. Después de décadas de estudiar las proteínas, las moléculas que proporcionan la estructura y las funciones de todos los seres vivos, me desperté esta mañana con la sensación de que se han hecho progresos. & # 8221

Arthur D. Levinson, PhD, fundador y director ejecutivo de amp Calico, ex presidente y director ejecutivo de amp, Genentech
& # 8220AlphaFold es un avance único en una generación, que predice estructuras de proteínas con una velocidad y precisión increíbles. Este salto adelante demuestra cómo los métodos computacionales están preparados para transformar la investigación en biología y son muy prometedores para acelerar el proceso de descubrimiento de fármacos. & # 8221

Profesor Andrei Lupas, Director, Instituto Max Planck de Biología del Desarrollo
Los modelos asombrosamente precisos de & # 8220AlphaFold & # 8217 nos han permitido resolver una estructura de proteína en la que estuvimos atrapados durante casi una década, relanzando nuestro esfuerzo por comprender cómo se transmiten las señales a través de las membranas celulares. & # 8221

Profesor Ewan Birney, Director General Adjunto EMBL, Director EMBL-EBI
& # 8220 Casi me caigo de la silla cuando vi estos resultados. Sé lo riguroso que es CASP: básicamente garantiza que el modelado computacional debe funcionar en la desafiante tarea del plegamiento de proteínas ab-initio. Fue una lección de humildad ver que estos modelos podían hacer eso con tanta precisión. Habrá muchos aspectos que comprender, pero este es un gran avance para la ciencia. & # 8221

Declaraciones de DeepMind / Alphabet:

Demis Hassabis, PhD, Fundador y CEO de DeepMind
& # 8220 La última visión detrás de DeepMind siempre ha sido construir IA y luego usarla para ayudar a ampliar nuestro conocimiento sobre el mundo que nos rodea acelerando el ritmo de los descubrimientos científicos. Para nosotros, AlphaFold representa un primer punto de prueba para esa tesis. Este avance es nuestro primer gran avance en un gran desafío científico de larga data, que esperamos tenga un gran impacto en el mundo real en la comprensión de las enfermedades y el descubrimiento de fármacos. & # 8221

Pushmeet Kohli, PhD, Jefe de IA para la ciencia, DeepMind
& # 8220 Estos increíbles resultados son testimonio de la filosofía de investigación única de DeepMind & # 8217, que reúne a equipos multidisciplinarios y centrados en la misión para alcanzar objetivos científicos ambiciosos. Las evaluaciones críticas como CASP son importantes para impulsar el progreso de la investigación, y esperamos seguir construyendo sobre este trabajo, profundizando nuestra comprensión de las proteínas y los mecanismos biológicos, y abriendo nuevas vías de exploración. & # 8221

John Jumper, PhD, AlphaFold Lead, DeepMind
& # 8220 La biología de las proteínas es fantásticamente compleja y desafía la caracterización simple. El trabajo de nuestro equipo demuestra que las técnicas de aprendizaje automático finalmente pueden satisfacer la complejidad de describir estas increíbles máquinas de proteínas, y estamos realmente emocionados de ver qué nuevos avances tanto en la salud humana como en la biología fundamental traerá. & # 8221

Kathryn Tunyasuvunakool, PhD, Ingeniera científica, DeepMind
& # 8220 La capacidad de predecir estructuras de proteínas de alta precisión con IA podría cambiar la forma en que abordamos la biología, con aplicaciones potenciales en el diseño de fármacos y la biorremediación. Particularmente para proteínas que desafían experimentalmente, las buenas técnicas de predicción podrían marcar una gran diferencia. & # 8221

Sundar Pichai, director ejecutivo de Google y Alphabet
& # 8220 Este es un increíble avance impulsado por la IA en el plegamiento de proteínas, que nos ayudará a comprender mejor uno de los bloques de construcción más fundamentales de la vida. Este gran avance desde DeepMind tiene implicaciones prácticas inmediatas, lo que permite a los investigadores abordar problemas nuevos y difíciles, desde la respuesta a una pandemia futura hasta la sostenibilidad ambiental. & # 8221

Sobre DeepMind

DeepMind es un equipo multidisciplinario de científicos, ingenieros, expertos en aprendizaje automático y más, que trabajan juntos para investigar y construir sistemas de inteligencia artificial seguros que aprenden cómo resolver problemas y promover el descubrimiento científico para todos.

Mejor conocido por desarrollar AlphaGo, el primer programa en vencer a un campeón mundial en el complejo juego de Go, DeepMind ha publicado más de 1000 artículos de investigación, incluidos más de una docena en Nature and Science, y ha logrado resultados revolucionarios en muchos dominios de IA desafiantes de StarCraft II al plegamiento de proteínas.

DeepMind se fundó en Londres en 2010 y unió fuerzas con Google en 2014 para acelerar su trabajo. Desde entonces, su comunidad se ha expandido para incluir equipos en Alberta, Montreal, París y Mountain View en California.


Predicción del trastorno proteico a partir de la secuencia de aminoácidos.

Investigadores de la Universidad de Aarhus han desarrollado una herramienta, ODiNPred, para predecir el grado de orden estructural y desorden en proteínas, utilizando el aprendizaje automático junto con datos experimentales de RMN para cientos de proteínas.

IMAGEN: El profesor asociado Frans Mulder y sus compañeros de trabajo en la Universidad de Aarhus han desarrollado ODiNPred (Predicción del orden y el trastorno mediante la evaluación de datos de RMN), una herramienta de software desarrollada para la predicción de proteínas. ver más

En el siglo pasado, Anfinsen demostró sin lugar a dudas que una proteína puede encontrar su camino de regreso a su estructura tridimensional "nativa" después de haber sido colocada en "condiciones desnaturalizantes" en las que se desarrolla la estructura de la proteína. La profunda conclusión de sus experimentos fue que aparentemente la información que gobierna la búsqueda de regreso al estado nativo está oculta en la secuencia de aminoácidos. Luego, las consideraciones termodinámicas establecen una visión en la que el proceso de plegado es como rodar enérgicamente cuesta abajo hasta el punto más bajo: la estructura nativa única. Estos hallazgos a menudo se han entrelazado con el dogma central de la biología molecular. Por tanto, un gen codifica una secuencia de aminoácidos y la secuencia codifica una estructura específica.

Introduzca proteínas intrínsecamente desordenadas.

El siguiente avance se produjo con el advenimiento de la secuenciación rápida y barata del genoma a raíz del proyecto del genoma humano, una vez que se secuenciaron miles de genomas de varios organismos, los científicos hicieron un descubrimiento asombroso: había muchos, muchos genes que codificaban proteínas con baja -complejidad. En otras palabras, estas proteínas no contenían los aminoácidos adecuados para plegarse y los experimentos confirmaron que permanecían "intrínsecamente desordenados". Además, el genoma humano resultó tener más de un tercio de sus genes que codifican proteínas. dis¡pedido!

¿Cómo detectar el trastorno proteico?

Dado que las proteínas desordenadas son muy flexibles, no son susceptibles de cristalización y, por lo tanto, no se puede obtener información de la difracción de rayos X en cristales de proteínas, el enfoque que ha sido tan fundamental para las proteínas plegadas. En cambio, estas proteínas deben estudiarse en solución y, para este propósito, la espectroscopia de RMN (resonancia magnética nuclear) es la herramienta más adecuada. En este método, una propiedad física cuántica llamada "espín" se mide en un campo magnético fuerte para cada átomo de la molécula. Las frecuencias exactas de precesión de los espines son una función de su entorno, y es exactamente esta frecuencia la que permite a los investigadores medir cuantitativamente hasta qué punto cada aminoácido está ordenado o desordenado en la proteína.

En su nuevo artículo, publicado el 8 de septiembre de 2020, el Dr. Rupashree Dass junto con el profesor asociado Frans Mulder y el profesor asistente Jakob Toudahl Nielsen han utilizado el aprendizaje automático junto con datos experimentales de RMN para cientos de proteínas para construir una nueva herramienta bioinformática que han llamado ODiNPred. Este programa de bioinformática puede ayudar a otros investigadores a realizar las mejores predicciones posibles sobre qué regiones de sus proteínas son rígidas y cuáles probablemente sean flexibles. Esta información es útil para estudios estructurales, así como para comprender el papel biológico y la regulación de proteínas intrínsecamente desordenadas.

La investigación fue realizada por investigadores del Centro Interdisciplinario de Nanociencia (iNANO) y el Departamento de Química de la Universidad de Aarhus. El trabajo fue apoyado financieramente por VILLUM Fonden.

Para más información póngase en contacto

Profesor asociado Frans A. A. Mulder
Centro Interdisciplinario de Nanociencia y Departamento de Química
Universidad de Aarhus
Correo electrónico: fmulder & # 64chem.au.dk

Descargo de responsabilidad: AAAS y EurekAlert! no son responsables de la precisión de los comunicados de prensa publicados en EurekAlert. por las instituciones contribuyentes o para el uso de cualquier información a través del sistema EurekAlert.


3 Discusión

Para proporcionar predicciones binarias, el límite de las puntuaciones de PROVEAN se estableció en -2,5 para una alta precisión equilibrada. Sin embargo, los usuarios pueden volver a aplicar sus propios valores de corte para su análisis para lograr una mayor sensibilidad o una mayor especificidad. La sensibilidad y la especificidad obtenidas utilizando diferentes puntos de corte se muestran en el Material complementario (Fig. Complementaria S2).

Se demostró que el desempeño de PROVEAN para sustituciones de un solo aminoácido es comparable con otras herramientas (Choi et al., 2012). Aquí también examinamos la coherencia de la predicción con otras herramientas, SIFT y PolyPhen-2, utilizando el conjunto de datos UniProt de polimorfismos humanos y mutaciones de enfermedades. Las tres herramientas coinciden en una gran parte de las variantes, pero todavía hay muchas variantes para las que tres herramientas hacen predicciones diferentes. Los resultados se resumen utilizando los diagramas de Venn en el Material complementario (Fig. Complementaria S3).


Ver el vídeo: Δομή του Nεφρού,. Λάζαρης (Mayo 2022).