Información

D5. Múltiples conformaciones de la misma secuencia: biología

D5. Múltiples conformaciones de la misma secuencia: biología



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

1. Esto sería especialmente cierto si dos estructuras posibles estuvieran lo suficientemente cerca en energía libre pero separadas por una barrera de energía de activación significativa, lo que excluiría la reordenación conformacional simple de una conformación a otra.

2. Proteínas metamórficas: además de las proteínas priónicas, parece que muchas proteínas pueden adoptar más de una conformación bajo el mismo conjunto de condiciones. Sin embargo, a diferencia de las proteínas priónicas, en las que la formación de la variante de estructura beta es irreversible ya que el cambio conformacional está asociado con la agregación, muchas proteínas pueden cambiar las conformaciones de manera reversible. A menudo, estos cambios no parecen estar asociados solo con interacciones vinculantes que desencadenan el cambio. Murzin ha descrito proteínas que cambian de conformación con el cambio de pH (glicoproteínas virales), estado redox (canal de cloruro), isomerización de disulfuro (lisozima) y ligando unido (ARN polimerasa a medida que inicia y luego alarga el polímero de ARN en crecimiento). Cita dos proteínas que parecen cambiar de estado sin señales externas. Estos incluyen Mad2, en el que los dos confórmeros comparten una gran similitud, y Ltn10 (linfotactina), en el que no lo hacen. Una forma de linfotactina (Ltn 10) se une a receptores de linfocinas similares, mientras que la otra (Ltn 40) se une a la heparina. La cinética de plegamiento también puede desempeñar un papel en estos ejemplos, ya que las proteínas capaces de plegarse en dos confórmeros de forma independiente y rápida podrían prevenir el plegamiento incorrecto y la agregación que podrían ocurrir si tuvieran que desplegarse por completo primero antes de una transición conformacional. Tanto Mad2 como Ltn10 alteran la conformación a través de formaciones transitorias de dímeros, que facilitan los cambios conformacionales sin un despliegue generalizado. Las mutaciones en Ltn10 pueden hacer que la proteína adopte la conformación Ltn40. Por lo tanto, las proteínas "metamórficas" primordiales podrían, mediante una simple mutación, producir nuevas funcionalidades proteicas.

3. Proteínas intrínsecamente desordenadas (IDP): se han encontrado muchos ejemplos de proteínas que están parcial o completamente desordenadas pero que aún conservan la función biológica. A primera vista, esto podría parecer inesperado, ya que ¿cómo podría una proteína unirse a su ligando natural con especificidad y selectividad para expresar su función? Por supuesto, se podría postular que la unión del ligando induciría cambios conformacionales necesarios para la función (como la catálisis) en un ejemplo extremo de un ajuste inducido de un ligando en comparación con un ajuste de "cerradura y llave". Hace décadas, Linus Pauling predijo que los anticuerpos, proteínas que reconocen moléculas extrañas (antígenos), se unirían libremente al antígeno, seguido de un cambio conformacional para formar un ajuste más complementario y más estrecho. Esta era la forma más sencilla de permitir que un número finito de posibles anticuerpos proteicos se uniera a un número aparentemente interminable de posibles moléculas extrañas. De hecho, este es un método en el que los anticuerpos pueden reconocer antígenos extraños. Es más probable que los anticuerpos que se unen al antígeno con alta afinidad y, por lo tanto, alta especificidad se unan a través de un ajuste de cerradura y llave. (Pauling, sin embargo, no sabía que los genes que codifican las cadenas de proteínas en los anticuerpos están empalmados diferencialmente y sujetos a tasas mutacionales mejoradas que permiten la generación de una increíble diversidad de anticuerpos a partir de un conjunto limitado de genes).

Se ha estimado que más de la mitad de todas las proteínas nativas tienen regiones (más de 30 aminoácidos) que están desordenadas y más del 20% de las proteínas están completamente desordenadas. Las regiones de desorden están enriquecidas en cadenas laterales polares y cargadas que siguen, ya que se podría esperar que asumieran muchas conformaciones disponibles en soluciones acuosas en comparación con secuencias enriquecidas en cadenas laterales hidrofóbicas, que probablemente colapsarían en un núcleo compacto estabilizado por el efecto hidrofóbico. Las mutaciones en las regiones desordenadas tienden a preservar la región desordenada, lo que sugiere que la región desordenada es ventajosa para la función "futura". Además, las mutaciones que hacen que una secuencia no codificante produzca una codificante invariablemente producen secuencias de proteínas desordenadas. Las proteínas desordenadas tienden a tener propiedades reguladoras y se unen a múltiples ligandos, en comparación con uno ordenado, que están involucrados en la unión de ligando altamente específica necesaria para la catálisis y el transporte. También se ha demostrado que la concentración intracelular de proteínas desordenadas es menor que las proteínas ordenadas, posiblemente para prevenir la aparición de interacciones de unión inapropiadas mediadas a través de interacciones hidrófobas, por ejemplo. Los procesos para lograr esto incluyen una degradación de proteínas y ARNm más rápida y una traducción más lenta de ARNm para proteínas desordenadas. Por una razón similar, las proteínas mal plegadas también están destinadas a la degradación. La Figura A a continuación muestra la carga neta media frente a la hidrofobicidad media para 275 proteínas plegadas y 91 desplegadas de forma nativa. La Figura B muestra la composición relativa de aminoácidos de las proteínas globulares (ordenadas) en comparación con las regiones de desorden de más de 10 aminoácidos en las proteínas desordenadas. Las dos barras grises diferentes se obtuvieron con dos versiones diferentes del software utilizado para analizar las proteínas. Nuevamente, el gráfico muestra un enriquecimiento de aminoácidos hidrófilos en proteínas desordenadas.

Figura: Características de las proteínas intrínsecamente desordenadas

de la revista de acceso abierto: Dunker, A. et al. BMC Genomics 2008, 9 (Suppl 2): ​​S1 doi: 10.1186 / 1471-2164-9-S2-S1

Se pueden usar muchos métodos experimentales para detectar regiones desordenadas en proteínas. Estas regiones no se resuelven bien en estructuras cristalinas de rayos X (tienen factores B altos). Las estructuras de la solución de RMN mostrarían conformaciones múltiples y diferentes. La espectroscopia de CD también mostraría una estructura secundaria mal definida. Además, las mediciones de tamaño de la solución (dispersión de luz, centrifugación) mostrarían distribuciones de tamaño más grandes para una proteína determinada.

¿Qué tipos de proteínas contienen desorden? Los métodos experimentales y computacionales nuevos anteriores se han desarrollado para clasificar las proteínas según su grado de desorden. Parece haber más desplazados internos en eucariotas que en archea y procariotas. Muchos IDPS están involucrados en procesos de señalización celular (cuando las moléculas externas señalan a las células que respondan proliferando, diferenciándose, muriendo, etc.). La mayoría parece residir en el núcleo. El mayor porcentaje de los desplazados internos conocidos se une a otras proteínas y también al ADN. Estos resultados sugieren que los IEP son esenciales para la función de las proteínas y probablemente confieren ventajas significativas a las células eucariotas, ya que se pueden obtener múltiples funciones de la interacción de un solo IEP (derivado de un solo gen) con diferentes compañeros de unión a proteínas. Esto ampliaría enormemente el tamaño efectivo del genoma en humanos, por ejemplo, de alrededor de 25.000 con función específica, a muchos más. Esto ni siquiera tiene en cuenta el aumento de las funcionalidades derivadas de las modificaciones químicas postraduccionales.

Analizaremos las proteínas intrínsecamente desordenadas en el capítulo 5. Lo que queda claro a partir de un hallazgo reciente es que la estructura de la proteína es fluida y compleja y nuestras nociones y palabras simples para denotar proteínas como nativas o desnaturalizadas están equivocadas y limitan nuestras ideas sobre cómo la estructura de la proteína provoca función biológica. Por ejemplo, ¿qué significa la palabra "nativa" si las proteínas existen en múltiples estados in vivo e in vitro simultáneamente? Dunker et al (2001) han acuñado el concepto "Protein Trinity" para superar la noción de que una sola proteína se pliega a un solo estado que provoca una sola función. Más bien, cada uno de los estados de la "trinidad", el glóbulo ordenado, colapsado (o fundido) y extendido (bobina aleatoria) coexisten en la celda. Por tanto, todos pueden considerarse "nativos" y todos contribuyen a la función de la célula. Un solo IDP podría unirse a muchas proteínas asociadas diferentes, cada una produciendo estructuras y funciones finales diferentes. Los desplazados internos también serían más accesibles y, por lo tanto, susceptibles a la proteólisis, lo que conduciría a un mecanismo simple para controlar sus concentraciones, una forma importante de regular su actividad biológica. Su propensión a la modificación química postraduccional conduciría igualmente a nuevos tipos de regulación biológica.

Figura: La Trinidad de las proteínas: estados ordenados, colapsados ​​y extendidos

Estas ideas tienen profundas ramificaciones para nuestra comprensión de la expresión del fenotipo celular. Además, se encuentra disponible un mundo completamente nuevo de objetivos farmacológicos al encontrar medicamentos que modulan las transiciones entre estados proteicos ordenados, colapsados ​​y extendidos. Del mismo modo, los efectos secundarios de las drogas podrían entenderse investigando los efectos de estas transiciones en los desplazados internos a los que no se dirigió inicialmente.

4. Catálisis por glóbulo fundido: Un ejemplo reciente (Bemporad) de que una acilfosfatasa bacteriana tiene actividad catalítica como glóbulo fundido cuestiona aún más nuestras nociones de estructura y actividad enzimática. En este ejemplo, la interacción del sustrato no indujo cambios conformacionales globales en la proteína. Las simulaciones de dinámica molecular mostraron que están presentes muchas conformaciones parcialmente desordenadas de la proteína y que el desorden involucró el sitio activo. Sin embargo, las partes de la proteína están más ordenadas y forman un "andamio" que mantiene los aminoácidos de unión catalíticos y del sustrato lo suficientemente cerca como para que la unión pueda generar reordenamientos conformacionales en el lado activo y la subsecuente actividad catalítica.


Alineación estructural

Alineación estructural intenta establecer homología entre dos o más estructuras poliméricas basándose en su forma y conformación tridimensional. Este proceso generalmente se aplica a estructuras terciarias de proteínas, pero también se puede usar para moléculas de ARN grandes. En contraste con la superposición estructural simple, donde se conocen al menos algunos residuos equivalentes de las dos estructuras, la alineación estructural no requiere a priori conocimiento de puestos equivalentes. La alineación estructural es una herramienta valiosa para la comparación de proteínas con baja similitud de secuencia, donde las relaciones evolutivas entre proteínas no pueden detectarse fácilmente mediante técnicas de alineación de secuencia estándar. Por tanto, la alineación estructural se puede utilizar para implicar relaciones evolutivas entre proteínas que comparten muy poca secuencia común. Sin embargo, se debe tener precaución al usar los resultados como evidencia de ascendencia evolutiva compartida debido a los posibles efectos de confusión de la evolución convergente por la cual múltiples secuencias de aminoácidos no relacionadas convergen en una estructura terciaria común.

Los alineamientos estructurales pueden comparar dos secuencias o múltiples secuencias. Debido a que estas alineaciones se basan en información sobre las conformaciones tridimensionales de todas las secuencias de consulta, el método solo se puede utilizar en secuencias en las que se conocen estas estructuras. Por lo general, se encuentran mediante cristalografía de rayos X o espectroscopía de RMN. Es posible realizar una alineación estructural en estructuras producidas por métodos de predicción de estructuras. De hecho, la evaluación de tales predicciones a menudo requiere una alineación estructural entre el modelo y la verdadera estructura conocida para evaluar la calidad del modelo. [1] Los alineamientos estructurales son especialmente útiles en el análisis de datos de los esfuerzos de genómica estructural y proteómica, y pueden usarse como puntos de comparación para evaluar alineamientos producidos por métodos bioinformáticos puramente basados ​​en secuencias. [2] [3] [4]

Los resultados de una alineación estructural son una superposición de los conjuntos de coordenadas atómicas y una desviación mínima cuadrática media (RMSD) entre las estructuras. El RMSD de dos estructuras alineadas indica su divergencia entre sí. El alineamiento estructural puede complicarse por la existencia de múltiples dominios proteicos dentro de una o más de las estructuras de entrada, porque los cambios en la orientación relativa de los dominios entre dos estructuras que se van a alinear pueden inflar artificialmente el RMSD.


Resultados y discusión

Figura & # x200B Figura 1 1 A (Cima y Medio) muestra micrografías electrónicas con sombra rotatoria del (I27-PEVK)3 poliproteína. Las micrografías muestran grupos de tres dominios globulares que parecen estar atados por una cuerda invisible. Interpretamos estos resultados como evidencia de tres módulos I27 claramente marcados separados por dos segmentos PEVK. La región PEVK tiene 186 aa de longitud (www.embl-heidelberg.de & # x0002fExternalInfo & # x0002fTitin & # x0002fannotation.html). Por tanto, esta región tiene una longitud de contorno prevista de & # x0224870 nm (0,38 nm & # x0002faa & # x000d7 186 aa). Un histograma de la separación entre los dominios I27 muestra una amplia distribución con valores de 9 a 24 nm, con una sugerencia de picos distintos a 11 y 17 nm. La longitud observada de extremo a extremo de PEVK es significativamente menor que su longitud de contorno, lo que sugiere que la región de PEVK en el estado relajado está enrollada. Además, la región de PEVK es invisible en las micrografías EM, lo que indica que PEVK forma una estructura mucho menos compacta que el dominio de Ig plegado. Bustamante y sus colegas (18, 19) investigaron la distancia de un extremo a otro de las moléculas de ADN adsorbidas y equilibradas en un plano bidimensional y determinaron que esta distancia, R, podría calcularse como & # x0003c R 2 & # x0003e = 4 pL, dónde pag es la duración de la persistencia y L es la longitud del contorno de un polímero WLC. Suponiendo que las mediciones de EM son una buena aproximación del valor esperado de la distribución de longitud de extremo a extremo, estimamos un amplio rango de longitudes de persistencia para los segmentos de PEVK (0.2 & # x020132.3 nm).

EM de individuo (I27-PEVK)3 poliproteínas. (A) Representante (I27-PEVK)3 (Cima y Medio) y I2712 (Fondo) moléculas como se ve por EM de sombreado rotatorio. La poliproteína es visible como tres pequeñas partículas globulares (módulos I27), aparentemente conectadas por un hilo invisible (PEVK). Por el contrario, las imágenes con sombra rotatoria de I2712 muestran barras sólidas con una longitud promedio de 58 nm, prediciendo una longitud plegada de & # x022484.8 nm & # x0002fmodule. La barra corresponde a 50 nm. (B) Un histograma de la distancia media entre módulos I27, correspondiente a la distancia de extremo a extremo de PEVK, muestra una amplia distribución de 9 a 24 nm, con picos aparentes a 11 y 17 nm.

En contraste con el (I27-PEVK)3 poliproteínas, micrografías electrónicas de sombra rotatoria de un I2712 poliproteína muestran proteínas continuas en forma de varilla (Fig. & # x200B (Fig.1A 1 Fondo) con una longitud media de 58 nm (no mostrada), lo que da una longitud media de 4,8 nm para el módulo I27 plegado, que es ligeramente mayor que la estimación de RMN de 4,4 nm (20). El contraste entre la apariencia de las poliproteínas I27 y la de la poliproteína I27-PEVK (Fig. & # X200B (Fig.1 1 A) apoya la opinión de que la región PEVK es en gran medida un polipéptido enrollado y desplegado. Sin embargo, Fig. & # X200B Fig.1 1 B muestra un amplio rango en la distancia de extremo a extremo del segmento de PEVK relajado, lo que implica que PEVK puede tener múltiples conformaciones con diferentes longitudes de persistencia.

La conformación desplegada de los segmentos de PEVK también se indicó por sedimentación. (I27-PEVK)3 y I2712 sedimentados a 2.9 S y 4.2 S, respectivamente, dando un Smax& # x0002fS de 2.6 y 2.1. Smax es el S para una esfera compacta y no hidratada que contiene la masa equivalente de proteína. Smax& # x0002fS es equivalente a F& # x0002fFmin, dónde F y Fmin son los coeficientes de fricción de la proteína y la esfera equivalente (21, 22). Un valor superior a 2 indica una molécula muy extendida. los Smax& # x0002fS = 2.1 es consistente con la estructura alargada (58 & # x000d7 2.5 nm) de I2712. los Smax& # x0002fS = 2,6 de (I27-PEVK)3 indica una extensión aún mayor. Sin embargo, la molécula de PEVK está enrollada y la longitud total del (I27-PEVK)3 visto en las imágenes EM de la Fig. & # x200B La Fig. 1 es más corta que la de I2712. Por tanto, es probable que el mayor Smax& # x0002fS La relación resulta de una mayor exposición de la proteína al disolvente. Los datos de sedimentación concuerdan con que los segmentos de PEVK son cadenas polipeptídicas en gran parte desplegadas, lo que crea un arrastre hidrodinámico sustancial.

Figura & # x200B Figura 2 2 A muestra las curvas de fuerza-extensión obtenidas del I2712 poliproteína. Debido a que la punta de AFM recoge la proteína en ubicaciones aleatorias, el número de picos observados sirve como un recuento del número de módulos contenidos en el segmento que se recogió. El número de módulos recogidos puede variar de uno a 12. La longitud plegada de una poliproteína se puede determinar ajustando el modelo WLC de elasticidad del polímero (5, 6) a la parte inicial de la curva fuerza-extensión, antes de que se desarrolle cualquier despliegue. observado (Fig. & # x200B (Fig.2 2 A, L0, línea sólida). La longitud plegada de la poliproteína depende del número de módulos recogidos por la punta AFM (norte) y la longitud plegada de un solo módulo I27 (4,4 nm) (20). Muy de acuerdo con esta predicción, un gráfico de L0 versus norte muestra una pendiente de 4.3 nm & # x0002fmodule (Fig. & # x200B (Fig.2 2 B, línea sólida). Por tanto, tanto las micrografías electrónicas como los espectrógrafos AFM dan valores que concuerdan estrechamente con los determinados a partir de la estructura de RMN del módulo I27.

Huella característica del dominio I27 que se despliega mediante una fuerza de estiramiento. (A) Estiramiento de un I2712 La poliproteína produce una curva de fuerza-extensión que muestra el patrón característico de diente de sierra de despliegue. Las curvas de fuerza-extensión muestran un número diferente de dientes de sierra, dependiendo del número de módulos recogidos por la punta del AFM. Los cuadrados rojos representan los módulos que se recogen en este experimento en particular. Las líneas continuas son ajustes de los datos al modelo WLC de elasticidad del polímero. L0 es la longitud del contorno de la poliproteína completamente plegada al desplegarse el módulo a aproximadamente & # x02248200 pN, se añadirán 28,1 nm adicionales a la longitud del contorno de la proteína. (B) Relación entre L0, determinado por el ajuste al primer diente de sierra, y el número de módulos recogidos por la punta del AFM, determinado por el número de dientes de sierra. La línea continua es una regresión lineal de los datos con una pendiente de 4,3 nm / módulo.

Luego usamos las mismas técnicas para investigar la naturaleza mecánica de la proteína PEVK. Figura & # x200B Figura 3 3 A muestra varias curvas de fuerza-extensión para el (I27-PEVK)3 poliproteína. La huella dactilar característica del módulo I27 es que se despliega en & # x02248200 pN, extendiendo la longitud del contorno de la proteína en 28,1 nm (12). En la Fig. & # X200B Fig.3 3 A mostramos tres tipos de registros con uno (dos trazos superiores), dos (tres trazos intermedios) y tres (dos trazos inferiores) eventos de despliegue I27, excluyendo el último pico que corresponde al desprendimiento de la molécula de la punta de AFM. A diferencia de las poliproteínas I27, las relaciones fuerza-extensión de las poliproteínas I27-PEVK se caracterizan por una longitud inicial larga L0, que van de 50 a 230 nm, que corresponde al estiramiento de uno, dos o tres segmentos de PEVK. Los tres trazos en el medio de la Fig. & # X200B Fig.3 3 A tienen dos picos desplegables, pero tienen valores muy diferentes de L0, p.ej. 68 nm para el primero, 133 nm para el segundo y 211 nm para el tercero. Debido a que la poliproteína está construida en un patrón alterno I27 & # x0002fPEVK, si se observan tres picos de despliegue I27, al menos dos segmentos PEVK deben haberse estirado (ver Recuadros en la Fig. & # x200B Fig.3 3 A). Si se observan dos picos desplegados de I27, se deben haber estirado uno, dos o tres segmentos de PEVK. Si solo se observa que se despliega un módulo I27, puede haber uno o dos segmentos PEVK que se estiran, pero nunca tres, de acuerdo con nuestras observaciones. Usando este enfoque, podemos estar seguros de que los segmentos de PEVK se estiran y que las propiedades mecánicas de PEVK están representadas por la parte inicial de las relaciones fuerza-extensión, antes de que se despliegue cualquiera de los módulos I27.

Identificación y medición de la elasticidad de un segmento PEVK. (A) Estirar un (I27-PEVK)3 La poliproteína produce un patrón de dientes de sierra solo después de un espaciador inicial largo, L0. Los picos de diente de sierra son típicos para el despliegue del dominio I27 porque ocurren a 200 pN y extienden la proteína en & # x0224828.1 nm. Los eventos con un solo evento de desarrollo I27 muestran dos valores discretos de L0: & # x0224882 nm o & # x02248135 nm (dos trazos superiores). Cuando se despliegan dos o tres dominios I27, podemos medir un valor aún mayor para L0 en & # x02248190 nm. Los valores discretos de L0 resultan de estirar uno, dos o tres segmentos PEVK antes de que se produzca el despliegue del módulo I27. Los diagramas de la poliproteína que acompañan a cada registro muestran las diversas combinaciones de módulos recogidos por la punta AFM, donde los cuadrados rojos y los círculos rojos representan módulos I27 y segmentos PEVK recogidos, respectivamente. (B) Histograma de frecuencia para la longitud inicial L0. La distribución muestra tres picos claramente separados (norte = 142 grabaciones). Los ajustes gaussianos dan distribuciones con un pico a 82, 135 y 190 nm.

Figura & # x200B Figura 3 3 B muestra un histograma de la longitud inicial L0. El histograma muestra tres picos distintos centrados en aproximadamente 82, 135 y 190 nm. La longitud del contorno de la PEVK cardíaca humana es & # x0224870 nm. Por tanto, esta distribución se puede explicar asumiendo que la longitud inicial L0 ocurre aproximadamente como múltiplos enteros de aproximadamente 70 nm. Estos resultados sugieren fuertemente que las propiedades elásticas de la región inicial de las curvas fuerza-extensión mostradas en la Fig. & # X200B Fig.3 3 A se deben a los segmentos PEVK del (I27-PEVK)3 poliproteína.

Habiendo determinado la longitud del contorno de los segmentos PEVK cardíacos, a continuación medimos su longitud de persistencia. El estiramiento de un segmento de PEVK da como resultado un aumento monótono no lineal en la fuerza que puede describirse mediante el modelo WLC de elasticidad del polímero. los Recuadro en la Fig. & # x200B Fig.4 4 A muestra dos ejemplos de trazas de extensión de fuerza donde las líneas punteadas representan ajustes no lineales de Leverberg & # x02013Marquardt a la ecuación WLC. Con una resolución de fuerza de & # x022485 pN, el modelo WLC se ajusta bien a los datos y no se puede detectar una estructura estable mecánicamente resistiva, lo que sugiere que el PEVK se comporta como un resorte puramente entrópico que tiene una estructura de espiral aleatoria. Sin embargo, los dos trazos de extensión de fuerza no se superponen, lo que significa que tienen diferentes longitudes de persistencia. El histograma de longitudes de persistencia medidas (Fig. & # X200B (Fig.4) 4) muestra una distribución amplia (pag = 0.3 & # x020132.3 nm), de acuerdo razonable con los datos EM (línea roja). Este resultado proporciona evidencia directa de que el PEVK cardíaco muestra múltiples conformaciones con diferente flexibilidad mecánica. La pequeña diferencia en las distribuciones obtenidas de los datos de EM y AFM podría deberse a las aproximaciones utilizadas para calcular la longitud de persistencia de PEVK a partir de su distancia de extremo a extremo (19). Sin embargo, es notable que estén tan de acuerdo, validando las técnicas de molécula única demostradas aquí.

El segmento PEVK de titina cardíaca muestra múltiples conformaciones mecánicas. (A) Histograma de frecuencia de la longitud de persistencia medida del segmento PEVK (barras grises). Las relaciones fuerza-extensión están descritas con precisión por el modelo WLC de elasticidad del polímero (como se muestra en la Recuadro). La estrecha concordancia entre el modelo WLC y los datos (dentro de & # x022485 pN) demuestra que la extensión del segmento PEVK no implica la ruptura de estructuras unidas por hidrógeno. El segmento PEVK muestra una amplia gama de valores de longitud de persistencia, de acuerdo con las longitudes de persistencia calculadas a partir de las distribuciones de extremo a extremo observadas con EM (línea roja). (Recuadro) Dos grabaciones PEVK representativas con diferentes longitudes de persistencia. En estos dos trazos solo la longitud inicial de un estirado (I27-PEVK)3 Se muestra la poliproteína (antes del despliegue del dominio I27) (las líneas continuas son grabaciones experimentales, los símbolos abiertos son el ajuste no lineal de Levenberg & # x02013Marquardt del modelo WLC a las grabaciones individuales). La grabación roja tiene una longitud de persistencia de 0,40 nm, la grabación negra tiene una longitud de persistencia de 1,08 nm. A modo de comparación, la grabación roja (con una longitud de contorno de 207 nm) se normalizó para tener la misma longitud de contorno que la traza negra (140 nm). (B) Histograma de frecuencia de la longitud de persistencia medida de los segmentos PEVK de un solo (I27-PEVK)3 molécula durante ciclos repetidos de estiramiento y relajación. La longitud de persistencia se distribuye estrechamente alrededor de 1,1 nm y es la misma para los trazos de estiramiento (barras grises) y relajación (barras rojas), lo que muestra que no hay ningún cambio detectable en la longitud de persistencia durante estos ciclos. La dispersión se debe al margen de error de los ajustes a los datos. (Recuadro) Dos grabaciones consecutivas de estiramiento (negro) y relajación (rojo). No se observó histéresis entre el estiramiento y la relajación, lo que indica que este proceso es completamente reversible.

También probamos las propiedades disipativas del (I27-PEVK)3 poliproteína. los Recuadro en la Fig. & # x200B Fig.4 4 B muestra un solo ciclo de estiramiento-relajación de los segmentos PEVK. En estas condiciones, la curva de fuerza-extensión era completamente reversible porque las trazas hacia adelante (en negro) y hacia atrás (en rojo) podían superponerse, en contraste con la histéresis observada durante el despliegue de los dominios de Ig (8 & # x0201310, 12). La longitud de persistencia medida a partir de la misma molécula durante muchos ciclos consecutivos de estiramiento-relajación muestra sorprendentemente una distribución mucho más estrecha (de 0,8 a 1,7 nm), en contraste con la amplia distribución de longitudes de persistencia medidas en diferentes moléculas (Fig. & # X200B (Fig. .4 4 A). Este resultado indica que las moléculas de PEVK individuales retienen sus conformaciones elásticas distintivas a través de muchos ciclos de estiramiento-relajación, y estas conformaciones distintivas no se pueden interconvertir por la fuerza.

Estudios previos de PEVK han proporcionado información sobre las propiedades mecánicas de este segmento (3, 7, 8, 23 & # x0201325). Sin embargo, la elasticidad promediada por conjuntos en las miofibrillas intactas (3, 7) y la incertidumbre del número de moléculas en los experimentos de una sola molécula (8) pueden haber impedido la detección de las conformaciones múltiples de PEVK. La amplia gama de conformaciones mecánicas de la PEVK cardíaca observada en nuestros estudios demuestra la utilidad de una & # x0201c huella digital & # x0201d en experimentos de molécula única y proporciona un enfoque general para estudiar las propiedades mecánicas y las conformaciones de otras proteínas.

Es bien conocido que la inclusión de residuos de 1 -prolilo en una cadena polipeptídica tiene efectos estructurales significativos. Las cadenas de poliprolina tienen dos conformaciones de estructura secundaria distintas denominadas hélices de poliprolina tipo I y poliprolina tipo II (PPII). Las transiciones cooperativas entre estas dos conformaciones son causadas por la isomerización de prolina, donde un cambio de trans a cis conduce a una transición de hélice de tipo II a tipo I (26). La isomerización de trans a cis da como resultado longitudes de extremo a extremo significativamente diferentes, lo que sugiere diferentes longitudes de persistencia (27, 28). Estudios recientes de CD y RMN bidimensional han revelado la existencia de conformaciones de hélice PPII cortas en un módulo PEVK de 28 aa de longitud de titina fetal humana (29, 30). Debido a que la diferencia de energía entre los residuos trans y cis-prolilo es de solo 1 & # x020132 kcal & # x0002fmol (31), si una fracción de la hélice PEVK PPII cambia la conformación causada por la transición trans-cis, esto podría explicar fácilmente nuestros datos. Debido a que la conformación cis es más corta que la trans, cabría esperar que el estiramiento de la molécula de PEVK forzaría a todos los residuos cis 1 -prolilo a la forma trans más larga. Sin embargo, la barrera de energía de activación de cis a trans es grande, 21 kcal & # x0002fmol (32), y la ganancia de longitud es pequeña (1,0 & # x0212b). Estimamos la fuerza más probable requerida para una transición impulsada mecánicamente de cis a trans de acuerdo con (33, 34),

dónde v es la tasa de carga (200 pN & # x0002fs), & # x00394Xtu es la distancia entre cis y el estado de transición, y & # x003b1o es la tasa de isomerización de cis a trans en ausencia de fuerza. Usando un valor para & # x003b1o de 2 & # x000d7 10 & # x022123 s & # x022121 (35), calculamos que la transición cis a trans ocurrirá en & # x02248600 pN y, por lo tanto, es poco probable que suceda en nuestras condiciones experimentales. Esto puede explicar por qué observamos una amplia gama de longitudes de persistencia en diferentes moléculas de PEVK (diferentes cantidades de residuos cis y transl -prolilo) que no se pueden interconvertir por la fuerza.

Además de las formas cis y trans del residuo l -prolilo, Schimmel y Flory (36) observaron que las dos conformaciones permitidas del residuo trans prolilo pueden alterar significativamente la compacidad de una cadena polipeptídica. Por ejemplo, se demostró que una cadena de polialanina que contenía 10 & # x00025 de residuos de 1 -prolilo aislados cambiaba su longitud de extremo a extremo en un factor de & # x022481,6 cuando todos los residuos de prolilo trans cambiaban entre estos rotámeros. Además, debido a que no hay cambio en la longitud del contorno del polipéptido entre estos dos confórmeros, no se pueden interconvertir mediante una fuerza aplicada. Por lo tanto, las cadenas de PEVK con diferentes proporciones de los dos confórmeros del residuo trans prolilo también podrían explicar nuestros resultados.

¿Qué fuerzas durante el ensamblaje de proteínas podrían causar tal variación en los isómeros de prolina de una molécula a otra que da como resultado moléculas de PEVK de flexibilidad muy diferente? Nuestras proteínas modificadas genéticamente se fabricaron a partir de bacterias y, por lo general, se utilizan varios días después de la purificación. Se podría esperar que la tendencia a la isomerización sea la misma para cada prolina y, por lo tanto, promedie aproximadamente la misma en cada molécula. Sin embargo, hay que considerar la proteína como un todo. Si comienza a formarse una hélice de PPII, es probable que favorezca un rotámero de trans-prolina, en una reacción de plegamiento cooperativa. Por tanto, diferentes moléculas de PEVK podrían adquirir combinaciones estables, pero complejas, de PPII y conformaciones en espiral.

Proponemos que el PEVK cardíaco se comporta como un resorte entrópico que tiene una estructura enrollada en general con una hélice PPII y una estructura desordenada coexistiendo dentro de la bobina. Debido a que las estructuras helicoidales de PPII están dictadas predominantemente por el efecto estérico, la elasticidad de PEVK permanece entrópica. The conformation and mechanical properties of PEVK depend on the available conformers of the l -prolyl residue in the PEVK sequence. Because these conformers can be switched enzymatically, it is possible that the elasticity of PEVK, en vivo, can be regulated by yet unknown signaling mechanisms.


The reference genome is not a baseline

The current reference genome is a type specimen

Although the reference genome is meant to be a standard, what that means in a practical sense is not clearly defined. For example, the allelic diversity within the reference genome is not an average of the global population (or any population), but rather contains long stretches that are highly specific to one individual. Of the 20 donors the reference was meant to sample from, 70% of the sequence was obtained from a single sample, ‘RPC-11’, from an individual who had a high risk for diabetes [27]. The remaining 30% is split 23% from 10 samples and 7% from over 50 sources [28]. After the sequencing of the first personal genomes in 2007 [29, 30], the emerging differences between genomes suggested that the reference could not easily serve as a universal or ‘gold-standard’ genome (see Box 1 for definitions). This observation is easily extended to other populations [31,32,33,34], where higher diversity can be observed. The HapMap project [35, 36] and the subsequent 1000 Genomes Project [37] were a partial consequence of the need to sample broader population variability [38]. Although the first major efforts to improve the reference focused on the need to fill in the gaps, work is now shifting towards incorporating diversity, through the addition of alternative loci scaffolds and haplotype sequences [39]. But just how similar to a personal genome is the current reference? We performed a short series of analyses to answer this question (Fig. 1), using the 1000 Genomes Project samples. Looking first at the allele frequencies (AF) of known variants, we found that around two million reference alleles have population frequencies of less than 0.5, indicating that they are the minor allele (dark blue line in Fig. 1a). This might seem high for a reference. In fact, the allelic distribution of the current reference is almost identical to the allelic distributions of personal genomes sampled from the 1000 Genomes Project (light blue lines in Fig. 1a). In practice, the current reference can be considered a well-defined (and well-assembled) haploid personal genome. As such, it is a good type specimen, exemplifying the properties of the individual genomes. This means, however, that the reference genome does not represent a default genome any more than any other arbitrarily chosen personal genome would.

The reference genome is a type specimen. a Cumulative distributions of variants in the reference genome and those in personal/individual genomes. If we collapse the diploid whole genomes genotyped in the 1000 Genomes Project into haploid genomes, we can observe just how similar the reference is to an individual genome. First, taking population allele frequencies from a random sample of 100 individual genomes, we generated new haploid ‘reference’ sequences. We replaced the alleles of the reference genome with the personal homozygous variant, and a randomly chosen heterozygous allele. For simplicity, all calculations were performed against the autosomal chromosomes of the GRCh37 assembly and include only single nucleotide bi-allelic variants (i.e., only two alleles per single nucleotide polymorphism (SNP)). B Cumulative distributions of allele frequencies for variants called in 100 randomly chosen personal genomes, computed against the reference genome. Here, the presence of a variant with respect to the reference is quite likely to mean that the reference itself has the ‘variant’ with respect to any default expectation, particularly if the variant is homozygous

Reference bias

Because the reference genome is close to being a type specimen, it can distort results where it’s sequence is not very typical. In alignment, reference bias refers to the tendency for some reads or sequences to map more readily to the reference alleles, whereas reads with non-reference alleles may not be mapped or mapped at lower rates. In RNA-seq-based alignment and quantification, reference bias has a major impact when differential mapping matters (such as in allele-specific expression), but can be overcome by the use of personal genomes or through the filtering of biased sites [40,41,42]. In variant calling, reference bias can be more important. Alignment to the reference to infer variation related to disease is still a step in most analyses, and is crucial in clinical assignments of variant significance and interpretation [43, 44]. In these cases, reference bias will induce a particular error. Variant callers might call more ‘variants’ when the reference alleles are rare or could fail to call variants that are rare but also shared by the reference [45,46,47,48]. Owing to the presence of rare alleles in the reference genome, some known pathogenic variants are easily ignored as benign [25]. A variant called with respect to the reference genome will be biased, reflecting the properties of the reference genome rather than properties that are broadly shared in the population. Indeed, continuing with our analysis (Fig. 1b), if we compare the variant calls within personal genomes against the reference, we find that close to two-thirds of the homozygous variants (blue lines) and one-third of the heterozygous variants (green lines) actually have allele frequencies above 0.5. Variation with respect to the reference is quite likely to indicate the presence of a ‘variant’ in the reference genome with respect to any default expectation, particularly if that ‘variant’ is homozygous.


Conclusiones

It is clear that there is much to learn about the nature of protein structure dynamics that is not addressed in the static information contained in PDB. The intermediate structures representing a protein as it moves from one conformation to another may yield much information about how a protein functions. Experimental techniques are inadequate for this task due to practical and technological limitations. For this reason, structural biology is in great need of algorithms which can accurately predict the intermediate structures as a protein undergoes a conformational change.

While other morphing algorithms require computationally expensive energy and elastic network modeling calculations, our morphing algorithm is based on a few simple observations of protein structure, and therefore produces multiple intermediate conformations very quickly. Our intermediate structures represent possible protein structures, and demonstrate the motion of a protein as it changes between conformations. In the case of morphing between homologs, the intermediate structures give us clues to how protein structures have evolved.

The morphed structures also show promise in the area of virtual screening. Most techniques limit protein flexibility to the side chain atoms, and may allow limited flexibility of the substrate. Our morph produces intermediate structures which are hypotheses for possible backbone movements. For this reason, some ligands bound more favorably to our intermediate structures than the solved structures. These are strong implications for the potential of morphs in guiding drug development.

Like all other approaches, our algorithm also has limitations. Linear interpolation, with only small corrections, prevents our method from correctly producing a morph for proteins with very large or complex movements. Many of these morphs could be solved by allowing a larger movement from the first approximation (a larger lattice), or allowing higher granularity of possible C α positions (more points in each lattice) but the time cost would be significant. Clearly, in protein morphing there is a trade-off between speed and accuracy.


Just released: Addgene's Plasmids 101 eBook

And now for some exciting news. You can now download Addgene's new eBook! Our goal was to create a one-stop reference guide for plasmids. We've combined our Plasmids 101 blog posts and additional resources into one downloadable PDF that you can save on your desktop. The Plasmids 101 eBook is designed to educate all levels of scientists and plasmid lovers and serves as an introduction to plasmids, allowing you to spend less time researching plasmid basic features and spend more time developing the clever experiments and innovative solutions necessary for advancing the field.

1. Internal initiation of translation of eukaryotic mRNA directed by a sequence derived from poliovirus RNA. Pelletier et al (Nature. 1988 Jul 28334(6180):320-5.) PubMed.

2. A segment of the 5' nontranslated region of encephalomyocarditis virus RNA directs internal entry of ribosomes during in vitro translation. Jang et al. (J Virol. 1988 Aug62(8):2636-43.) PubMed.

3. Highly Efficient Multicistronic Lentiviral Vectorswith Peptide 2A Sequences. Ibrahimi et al. ( Hum Gene Ther. 2009 Aug20(8):845-60. doi: 10.1089/hum.2008.188. ) PubMed .

4. High cleavage efficiency of a 2A peptide derived from porcine teschovirus-1 in human cell lines, zebrafish and mice. Kim et al ( PLoS One. 20116(4):e18556. doi: 10.1371/journal.pone.0018556. Epub 2011 Apr 29. ) PubMed .

5. Scalable signaling mediated by T cell antigen receptor-CD3 ITAMs ensures effective negative selection and prevents autoimmunity. Holst et al (Nat Immunol. 2008 Jun9(6):658-66. doi: 10.1038/ni.1611. Epub 2008 May 11.) PubMed .

Read more Plasmids 101 posts or browse Addgene's Plasmid Guide for more molecular biology and cloning information.


Ver el vídeo: ISÓMEROS CONFORMACIONALES PROYECCIONES DE NEWMAN Y EN CABALLETE (Agosto 2022).