Información

¿Cuáles son las diferentes formas en que se empalma un exón?

¿Cuáles son las diferentes formas en que se empalma un exón?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Los exones se producen mediante más de un mecanismo, p. Ej. empalmar intrones después de la transcripción, si mal no recuerdo. Enumere todos los mecanismos.


Hay varias formas en que puede ocurrir el empalme, lo que depende de la molécula de ARN que se empalme y del catalizador que realiza el empalme:

  1. El empalme de ARNm se lleva a cabo mediante el espliceosoma, que consta de pequeños ARN nucleares. Hay secuencias al final de los intrones y orzuelos de las ramas que indican los sitios de empalme. La denominada estructura de lazo se forma cuando el grupo 2'OH de un residuo de adenosina en el sitio de ramificación ataca el sitio de empalme 5 '.

  2. auto-empalme del precursor de ARN ribosómico: se realiza con ausencia de espliceosoma.

  3. Empalme de ARNt: requiere tres enzimas e hidrólisis de ATP.

Referencias:

Bioquímica, L. Stryer, 5.a edición

J. Abelson. Empalme de ARNt


Estrategias para corregir mutaciones sin sentido

Hana Benhabiles,. Fabrice Lejeune, en Corrección de mutaciones sin sentido en enfermedades humanas, 2016

1.2 Ejemplos

La estrategia de omisión de exón ya ha llegado a ensayos clínicos en el caso de la distrofia muscular de Duchenne (DMD). En esta patología, aproximadamente el 75% de los pacientes podrían tratarse mediante omisión de exón (Aartsma-Rus et al., 2003) y, en particular, aproximadamente el 16% de los pacientes podrían ser objeto de una terapia de omisión del exón 51. El exón 51 codifica una parte del dominio central de la proteína distrofina denominada dominio Rod, desde el exón 8 hasta el exón 62 (fig. 3.3). El dominio de barra está formado por 24 repeticiones similares a un motivo peptídico que se encuentra en la espectrina β. Curiosamente, alrededor del 60% del dominio de los bastones se puede eliminar sin consecuencias graves sobre la función de la distrofina (England et al., 1990).

Figura 3.3. Representación esquemática de la organización del dominio proteico de la distrofina.

Los exones que codifican los diferentes dominios se indican en la parte superior. La distrofina se puede dividir en cuatro dominios llamados dominio N-terminal (naranja), el dominio de barra que contiene 24 repeticiones (púrpura) y cuatro dominios de bisagra (verde), un dominio rico en cisteína (azul) y un dominio C-terminal (rosa) .

Se han desarrollado dos estrategias para inducir la omisión del exón 51 u otros exones en el dominio de los bastones. El primero es enmascarar el sitio de empalme 3 'de un intrón con el fin de inducir la omisión del siguiente exón o exones, utilizando oligonucleótidos antisentido. La segunda estrategia se centra en inhibir el corte y empalme de un exón particular mediante la unión de un inhibidor de corte y empalme en este exón. Para lograr esto, se diseñó snRNA U7 modificado unido por hnRNPA1 con el fin de hibridar con una secuencia específica del exón diana (Goyenvalle et al., 2009). Ambas estrategias promovieron resultados muy alentadores con la síntesis de proteína distrofina truncada internamente en cultivos celulares y modelos animales, como ratón o perro (Aartsma-Rus et al., 2003 Barbash et al., 2013 Goyenvalle et al., 2012 Hoogaars et al. ., 2012 Vulin et al., 2012).

Sobre la base de los resultados positivos ex vivo en cultivo celular, así como in vivo en modelos de ratón y perro, se intentaron ensayos clínicos (para la definición de las fases de ensayo clínico, ver Nota 3.1).

Las fases del ensayo clínico

Fase de ensayo clínico I: esta fase es el primer estudio en humanos y requiere un pequeño número de personas o pacientes sanos (entre 20 y 80). La toxicidad y la tolerancia del fármaco se evalúan durante esta fase.

Fase de ensayo clínico II: El objetivo de esta segunda fase es determinar la dosis mínima eficaz. El estudio se realiza en 100 a 300 pacientes voluntarios que ayudarán a demostrar algún beneficio terapéutico ya identificar efectos secundarios.

Fase de ensayo clínico III: este estudio mide la eficacia del fármaco frente a un placebo o un tratamiento de referencia. En esta etapa se reclutan varios cientos a miles de pacientes. Es el paso final antes de la autorización para comercializar el medicamento.

Fase IV del ensayo clínico: esta fase se inicia tras la introducción del fármaco en el mercado y permite identificar efectos secundarios o toxicidad tras un largo periodo de uso.

El número de pacientes que participan en ensayos clínicos puede ser mucho menor en el caso del desarrollo de tratamiento sobre enfermedades raras, debido al limitado número de pacientes.

Se programaron varios ensayos, como el respaldado por GlaxoSmithKline (GSK) y Prosensa Therapeutics con la molécula Drisapersen, un fármaco que utiliza oligonucleótido antisentido de 2′-O-metilfosforotioato antisentido para inducir la omisión del gen de la distrofina en el exón 51 (Ensayo clínico NCT01803412) . Al final de la fase II del ensayo clínico, después de 24 semanas de tratamiento, los pacientes que recibieron Drisapersen lograron caminar 35,8 m más que los pacientes que recibieron el placebo en la prueba de marcha de 6 min (6-MWT, ver Nota 3.2) (Butland et al., 1982). Desafortunadamente, este fármaco fracasó en la fase III del ensayo clínico, ya que el rescate de la función de la distrofina no fue significativo en el 6-MWT. Otro ensayo clínico, también utilizando un enfoque antisentido, se ha completado hasta la fase clínica II, de Sarepta Therapeutics, con un fármaco llamado Eteplirsen que también induce la omisión del exón del exón 51 del gen de la distrofina, utilizando un oligómero morfolino fosforodiamidato (PMO). (Ensayo clínico NCT 01396239). Los resultados de este ensayo clínico indican que los pacientes tratados con Eteplirsen fueron capaces de caminar unos 67 m más que el grupo de control tratado con un placebo (Mendell et al., 2013). Los pacientes en el origen de la prueba pudieron caminar de 200 a 400 m en el 6-MWT. Curiosamente, los pacientes tratados con Eteplirsen lograron mantener su distancia original cubierta durante 6 minutos después de 48 semanas de tratamiento, mientras que los pacientes tratados con placebo disminuyeron su rendimiento. Este resultado sugiere que el tratamiento no fue capaz de inducir un aumento de la masa muscular, pero evita que la masa existente disminuya, lo que ya es un resultado muy alentador.

La prueba de marcha de 6 minutos (6-MWT)

Esta prueba mide la distancia que puede recorrer un paciente en 6 min de caminata sin asistencia física. El paciente debe realizar el ejercicio lo más rápido posible pero se le permite ralentizar o incluso detenerse a descansar un rato durante el ejercicio. La prueba debe realizarse en un terreno plano sin obstáculos con una longitud de al menos 25 m sin giros.

Para una persona sana, la distancia esperada se puede medir con la siguiente fórmula:

D = 218 + (5,14 × tamaño en centímetros) - (5,32 × edad) - (1,8 × peso en kilogramos) + [51,31 × sexo (1 para hombres y 0 para mujeres)].

A modo de ejemplo, se espera que una mujer de 45 años, 157 cm de altura y 50 kg de peso cubra unos 696 m.

El exón 51 no es el único exón de la distrofina elegible para la estrategia de omisión de exón. De hecho, el exón 53 tiene características similares al exón 51. Se esperaba que en marzo de 2015 se completara un ensayo clínico de fase I patrocinado por Nippon Shinyaku Pharmaceuticals que comenzó en junio de 2013 con el medicamento NS-065 / NCNP-01 (NCT02081625). y tienen como objetivo la omisión del exón 53. La naturaleza de NS-065 / NCNP-01 es un oligonucleótido antisentido morfolino.


Revisión de la definición del intrón, la definición del exón y el empalme inverso

El corte y empalme de pre-ARNm se realiza mediante la función secuencial de diferentes complejos de espliceosomas. El ensamblaje de empalmesomas depende de la presencia, desde el extremo 5 ′ hasta el extremo 3 ′ de los intrones, del sitio de empalme 5 ′ conservado (5′SS), la secuencia de puntos de ramificación (BPS) y 3′SS. De todos los complejos de espliceosomas, el único que carece de una estructura resuelta es el primero en ensamblar en el pre-ARNm, conocido como complejo E. No está claro cómo el espliceosoma define inicialmente (reconoce y ensambla) intrones o exones, y cómo se favorece el empalme canónico sobre una reacción no canónica conocida como empalme inverso, que genera ARN circulares exónicos (circRNA). Li y col. ahora presente la estructura de microscopía crioelectrónica (crio-EM) del complejo E de Saccharomyces cerevisiae, lo que sugiere que la definición del intrón, la definición del exón y el empalme inverso pueden llevarse a cabo mediante los mismos complejos.

En la levadura, que normalmente contiene intrones cortos y exones largos, la definición de intrones parece dominar. Por el contrario, en los vertebrados, donde los intrones son más largos y los exones más cortos, se cree que prevalece la definición del exón. Para estudiar estos mecanismos en detalle, los autores ensamblaron complejos E de levadura en gemación funcionales in vitro en el ACTO 1 pre-ARNm o el UBC4 pre-ARNm, y determinaron sus estructuras crio-EM.

La clave para iniciar el empalme a través de la definición de intrones es unir el 5′SS y el BPS. Una característica sorprendente que se encuentra en la estructura del ACTO 1–E complejo era un

Doble hélice de 25 pb aguas abajo del 5′SS, que no se encontró en el UBC4–E complejo. La región 5′SS-a-BPS (265 nt) del ACTO 1 intrón, pero no la misma región en UBC4 (58 nt), se predice que formará estructuras similares a un tallo largo, y las mutaciones que abolieron estas estructuras dieron como resultado una acumulación sustancial de pre-ARNm (inhibición del corte y empalme). Por lo tanto, las estructuras secundarias pueden ayudar a reunir elementos intrónicos esenciales y facilitar el ensamblaje del espliceosoma.

La estructura del complejo E, especialmente las posiciones relativas del 5′SS y el BPS, sugirió que el mismo complejo E puede formarse a través de exones: en lugar de conectar un 5′SS con un BPS aguas abajo a través de un intrón, el 5′SS podría conectarse con un BPS aguas arriba a través de un exón. Para probar si la definición del exón ocurre in vivo en la levadura, los autores truncaron la DYN2 gen para contener solo su exón medio e intrones flanqueantes (construcción IEI) y mutó los elementos de empalme que bordean ambos lados del DYN2 exón - una mutación BPS en el intrón 1 y una mutación 5′SS en el intrón 2. Si el empalme de DYN2 se rige únicamente por la definición del intrón, se esperaría la retención del intrón en el que reside una mutación, con un efecto mínimo sobre el otro intrón; sin embargo, si el corte y empalme se rige por la definición del exón, cada una de las mutaciones conduciría a la retención de ambos intrones. La composición observada de los intermedios de corte y empalme producidos a partir de los diferentes mutantes de IEI sugirió que tanto la definición del intrón como la definición del exón ocurren in vivo y contribuyen al corte y empalme correcto de DYN2 y mostró, por primera vez, que la definición del exón se produce en la levadura.

Una predicción de este modelo es que la formación de complejos de definición de exón a través de exones largos conduce a un empalme inverso (empalme de la 5′SS corriente abajo con la 3′SS corriente arriba del exón) y la formación de circRNAs exónicos, debido a la falta de Obstáculo estérico. El acortamiento de los exones de las construcciones IEI que producen circRNA abolió la formación de circRNA a partir de las construcciones, lo que respalda la preferencia por el empalme inverso a través de exones largos (o múltiples) y la aparición de la definición del exón.

"Tanto la definición de intrón como la definición de exón ocurren in vivo y contribuyen a un correcto empalme"

En resumen, en la levadura (y probablemente en todos los eucariotas) los mismos complejos E son capaces de definir tanto intrones como exones, sin la necesidad de componentes adicionales o reordenamientos estructurales. Además, la definición del exón puede provocar un empalme inverso a través de exones largos, lo que sugiere que los circRNA son subproductos naturales del empalme mediado por espliceosomas en todos los eucariotas.


Resultados y discusión

Variación en los niveles de empalme alternativo en diferentes tejidos humanos

Los eventos de corte y empalme alternativos se distinguen comúnmente en términos de si las isoformas de ARNm difieren por la inclusión o exclusión de un exón, en cuyo caso el exón involucrado se denomina 'exón omitido' (SE) o 'exón de casete', o si las isoformas difieren en el uso de un sitio de empalme 5 'o un sitio de empalme 3', dando lugar a exones de sitio de empalme 5 'alternativos (A5E) o exones de sitio de empalme 3' alternativos (A3E), respectivamente (representado en la Figura 1). Estas descripciones no son necesariamente mutuamente excluyentes, por ejemplo, un exón puede tener un sitio de empalme 5 'alternativo y un sitio de empalme 3' alternativo, o tener un sitio de empalme 5 'alternativo o un sitio de empalme 3' pero omitirse en otras isoformas. Un cuarto tipo de empalme alternativo, la 'retención de intrones', en el que dos isoformas difieren por la presencia de un intrón sin empalmar en una transcripción que está ausente en la otra, no se consideró en este análisis debido a la dificultad de distinguir los verdaderos eventos de retención de intrones. de la contaminación de las bases de datos EST por pre-ARNm o secuencias genómicas. La presencia de estos y otros artefactos en las bases de datos EST son advertencias importantes para cualquier análisis de datos de secuencia EST. Por lo tanto, impusimos filtros estrictos sobre la calidad de EST a las alineaciones genómicas utilizadas en este análisis, aceptando solo alrededor de una quinta parte de todas las alineaciones de EST obtenidas (ver Materiales y métodos).

Niveles de empalme alternativo en 16 tejidos humanos con cobertura de secuencia EST moderada o alta. Las barras horizontales muestran la fracción promedio de genes empalmados alternativamente (AS) de cada tipo de empalme (y desviación estándar estimada) para muestreos aleatorios de 20 tecnologías ecológicamente racionales por gen de cada gen con ≥ 20 secuencias EST alineadas derivadas de un tejido humano determinado. Los diferentes tipos de empalmes se ilustran esquemáticamente en cada subparcela. (a) Fracción de genes AS que contienen exones omitidos, exones del sitio de empalme 3 'alternativos (A3E) o exones del sitio de empalme 5' (A5E), (B) fracción de genes AS que contienen exones omitidos, (C) fracción de genes AS que contienen A3E, (D) fracción de genes AS que contienen A5E.

Para determinar si se producen diferencias en las proporciones de estos tres tipos de eventos de AS en los tejidos humanos, evaluamos las frecuencias de genes que contienen exones omitidos, exones del sitio de empalme 3 'alternativo o exones del sitio de empalme 5' alternativo para 16 tejidos humanos (ver Figura 1). para la lista de tejidos) para los que se disponía de un número suficientemente grande de secuencias EST. Debido a que la disponibilidad de un mayor número de tecnologías ecológicamente racionales derivadas de un gen aumenta la posibilidad de observar isoformas alternativas de ese gen, la proporción de genes AS observados en un tejido tenderá a aumentar con el aumento de la cobertura de genes EST [10, 31]. Dado que el número de secuencias EST disponibles difiere considerablemente entre los tejidos humanos (por ejemplo, la base de datos dbEST contiene aproximadamente ocho veces más tecnologías ecológicamente racionales derivadas del cerebro que las tecnologías ecológicamente racionales derivadas del corazón), con el fin de comparar la proporción de AS en diferentes tejidos de forma imparcial Así, utilizamos una estrategia de muestreo que aseguró que todos los genes / tejidos estudiados estuvieran representados por igual número de tecnologías ecológicamente racionales.

Es importante señalar que nuestro análisis no hace uso del concepto de una transcripción canónica para cada gen porque no está claro que dicha transcripción pueda elegirse objetivamente o que este concepto sea biológicamente significativo. En cambio, los eventos de AS se definen solo mediante la comparación por pares de tecnologías ecológicamente racionales.

Nuestro objetivo era controlar las diferencias en la abundancia de EST en los tejidos, conservando al mismo tiempo el poder suficiente para detectar una fracción razonable de los eventos de AS. Para cada tejido, se consideraron genes que tenían al menos 20 secuencias EST alineadas derivadas de bibliotecas de ADNc humano específicas para ese tejido (EST "derivadas de tejido"). Para cada uno de estos genes, se eligió una muestra aleatoria de 20 de estas tecnologías ecológicamente racionales (sin reemplazo) para representar el empalme del gen dado en el tejido humano dado. Para las combinaciones de genes y tejidos incluidas en este análisis, la mediana del número de secuencias EST por gen no fue dramáticamente diferente entre los tejidos, oscilando entre 25 y 35 (consulte el archivo de datos adicionales 1). Las tecnologías ecológicamente racionales muestreadas para cada gen se compararon entre sí para identificar los eventos de AS que ocurren dentro del tejido dado (ver Materiales y métodos). El muestreo aleatorio se repitió 20 veces y la fracción media de genes AS observada en estos 20 ensayos se utilizó para evaluar la fracción de genes AS para cada tejido (Figura 1a). Diferentes subconjuntos aleatorios de un grupo relativamente grande tendrán menos superposición en las tecnologías ecológicamente racionales elegidas (y, por lo tanto, en los eventos AS específicos detectados) que para los subconjuntos aleatorios de un grupo más pequeño de tecnologías ecológicamente racionales, y un mayor número de tecnologías ecológicamente racionales proporciona una mayor cobertura de exones. Sin embargo, no hay ninguna razón por la que el número esperado de eventos AS detectados por subconjunto muestreado aleatoriamente deba depender del tamaño del grupo del que se eligió el subconjunto. Si bien el error (desviación estándar) de la frecuencia de AS medida por gen debería ser menor cuando se restringe a genes con grupos mínimos más grandes de tecnologías ecológicamente racionales, tal restricción no cambiaría el valor esperado. Desafortunadamente, la reducción del error de la frecuencia de AS estimada por gen se compensa con un aumento en el error esperado de la frecuencia de AS a nivel de tejido resultante del uso de menos genes. La inclusión de todos los genes con al menos 20 tecnologías ecológicamente racionales derivadas de tejidos representa una compensación razonable entre estos factores.

El cerebro humano tenía la fracción más alta de genes AS en este análisis (Figura 1a), con más del 40% de los genes exhibiendo uno o más eventos AS, seguidos por el hígado y los testículos. Análisis previos basados ​​en EST han identificado altas proporciones de empalme en el cerebro humano y los tejidos de los testículos [29, 30, 32]. Estos estudios no controlaron específicamente la representación muy desigual de tecnologías ecológicamente racionales de diferentes tejidos humanos. A medida que un mayor número de tecnologías ecológicamente racionales aumenta la posibilidad de observar una fracción mayor de las isoformas expresadas de un gen, la cantidad de tecnologías ecológicamente racionales disponibles tiene un impacto directo en las proporciones estimadas de EA, como se vio anteriormente en análisis que comparan los niveles de EA en diferentes organismos [ 31]. Por lo tanto, los resultados obtenidos en este estudio confirman que el cerebro y los testículos humanos poseen un nivel inusualmente alto de AS, incluso en ausencia de ventajas de abundancia de EST sobre otros tejidos. También observamos un alto nivel de AS en el hígado humano, un tejido con una cobertura de EST mucho menor, donde se han informado previamente niveles más altos de AS en células cancerosas [33, 34]. El músculo, el útero, la mama, el estómago y el páncreas humanos tenían los niveles más bajos de genes AS en este análisis (menos del 25% de los genes). La reducción del recuento mínimo de EST para su inclusión en este análisis de 20 a 10 EST, y el muestreo de 10 (de 10 o más) EST para representar cada gen en cada tejido, no alteró los resultados cualitativamente (datos no mostrados).

Diferencias en los niveles de omisión de exones en diferentes tejidos.

Los genes empalmados alternativamente en este análisis exhibieron en promedio entre uno y dos exones AS distintos. Al analizar los diferentes tipos de eventos de EA por separado, encontramos que el cerebro y los testículos humanos tenían los niveles más altos de exones omitidos, con más del 20% de genes que contienen SE (Figura 1b). El alto nivel de exones omitidos observado en el cerebro es consistente con análisis previos [29, 30, 32]. En el otro extremo, el ovario, el músculo, el útero y el hígado humanos tenían los niveles más bajos de exones omitidos (alrededor del 10% de los genes).

Un ejemplo de un evento de omisión de exón conservado observado en tejido cerebral humano y de ratón se muestra en la Figura 2a para el síndrome de retraso mental X frágil humano relacionado (FXR1) gen [35, 36]. En este caso, la omisión del exón altera el marco de lectura del exón aguas abajo, lo que presumiblemente conduce a la producción de una proteína con un extremo carboxi alterado y truncado. La secuencia del exón está perfectamente conservada entre los genomas humano y de ratón, al igual que las secuencias del sitio de empalme 5 'y del sitio de empalme 3' (Figura 2a), lo que sugiere que este evento de AS puede tener un papel regulador importante [37-39].

Ejemplos de eventos de AS específicos de tejido en genes humanos con evidencia de conservación de empalme en genes de ratón ortólogos. (a) Relacionado con el síndrome de retraso mental X frágil humano (FXR1) corte y empalme de genes detectado en secuencias EST derivadas del cerebro. FXR1 exhibieron dos isoformas de ARNm alternativas que se diferenciaban por omitir / incluir los exones E15 y E16. La exclusión de E16 crea un cambio en el marco de lectura, que se predice que resultará en un término carboxi alterado y más corto. El evento de omisión de exón se conserva en el ortólogo del ratón del ser humano. FXR1 gen, y ambas isoformas se detectaron en tecnologías ecológicamente racionales derivadas del cerebro de ratón. (B) Betaína-homocisteína humana S-metiltransferasa (BHMT) empalme de genes detectado en tecnologías ecológicamente racionales derivadas del hígado. BHMT exhibió dos isoformas alternativas que se diferenciaban por el uso del sitio de empalme 5 'alternativo en el exón E4. Las comparaciones de secuencias indican que las secuencias del exón y del sitio de corte y empalme implicadas en ambos eventos de exón del sitio de corte y empalme 5 'alternativo se conservan en el ortólogo de ratón del humano. BHMT gene. (C) Citocromo P450 2C8 humano (CYP2C8) empalme de genes. CYP2C8 exhibió dos isoformas de ARNm alternativas que difieren en el uso del sitio de empalme 3 'para el exón E4 (detectado en tecnologías ecológicamente racionales derivadas de varios tejidos), donde la exclusión de una secuencia de 71 bases crea un codón de terminación prematura en el exón E4b. Los exones y sitios de empalme involucrados en el evento AS se conservan en el ortólogo de ratón de CYP2C8.

Diferencias en los niveles de uso de sitios de empalme alternativos en diferentes tejidos

El análisis de las proporciones de eventos de AS que implican el uso de A5E y A3E reveló un patrón muy diferente (Figura 1c, d). En particular, la fracción de genes que contienen A3E fue más del doble en el hígado que en cualquier otro tejido humano estudiado (Figura 1d), y el nivel de A5E también fue aproximadamente un 40-50% más alto en el hígado que en cualquier otro tejido. (Figura 1c). El tejido con el segundo nivel más alto de uso alternativo tanto para los sitios de empalme 5 'como para los sitios de empalme 3' fue el cerebro. Otro grupo de tejidos humanos, incluidos el músculo, el útero, la mama, el páncreas y el estómago, similar al grupo de baja frecuencia de EE anterior, tuvo el nivel más bajo de A5E y A3E (menos del 5% de los genes en cada categoría). Así, surge una imagen en la que ciertos tejidos humanos como el músculo, el útero, la mama, el páncreas y el estómago, tienen niveles bajos de AS de todos los tipos, mientras que otros tejidos, como el cerebro y los testículos, tienen niveles relativamente altos de AS de todos los tipos. tipos y el hígado tiene niveles muy altos de A3E y A5E, pero exhibe solo un nivel modesto de omisión de exón. Hasta donde sabemos, este estudio representa el primer análisis sistemático de las proporciones de diferentes tipos de eventos de EA que ocurren en diferentes tejidos. La repetición de los análisis mediante la eliminación de tecnologías ecológicamente racionales de las bibliotecas de tejidos asociadas a enfermedades, utilizando las clasificaciones de bibliotecas disponibles [40], arrojó resultados cualitativamente similares (consulte los archivos de datos adicionales 2, 3 y 4). Estos datos muestran que las tecnologías ecológicamente racionales derivadas de tejidos enfermos muestran frecuencias modestamente más altas de omisión de exones, pero la clasificación relativa de los tejidos sigue siendo similar. Las fracciones de genes que contienen A5E y A3E no cambiaron sustancialmente cuando se excluyeron las tecnologías ecológicamente racionales de tejido enfermo.

A partir del conjunto de genes con al menos 20 tecnologías ecológicamente racionales derivadas de hígado humano, este análisis identificó un total de 114 genes con un sitio de empalme 5 'alternativo y / o un sitio de empalme 3' alternativo en el hígado. Los genes de este conjunto que fueron nombrados, anotados y para los cuales las secuencias de consenso de los sitios de empalme alternativos se conservaron en el gen del ratón ortólogo (ver Materiales y métodos) se enumeran en la Tabla 1. Por supuesto, la conservación de los sitios de empalme solo es necesaria , pero no suficiente por sí mismo, para implicar la conservación del evento AS en el ratón. En esta lista aparecen muchos genes esenciales que codifican enzimas desintoxicantes y metabólicas del hígado, incluidas las enzimas implicadas en el metabolismo del azúcar (por ejemplo, ALDOB, IDH1), el metabolismo de proteínas y aminoácidos (por ejemplo, BHMT, CBP2, TDO2, PAH, GATM), desintoxicación o descomposición de medicamentos y toxinas (por ejemplo, GSTA3, CYP3A4, CYP2C8).

Secuencias y patrones de empalme para dos de estos genes para los cuales se pudieron identificar exones / genes y transcripciones de ratones ortólogos: los genes BHMT y CYP2C8 - se muestran en detalle en la Figura 2b, c. En el evento representado para BHMT, los exones involucrados están altamente conservados entre los ortólogos humanos y de ratón (Figura 2b), de acuerdo con la posibilidad de que el evento de empalme pueda tener una función reguladora (conservada). Este evento de AS conserva el marco de lectura de los exones posteriores, por lo que es probable que las dos isoformas produzcan proteínas funcionales, que se diferencian por la inserción / deleción de 23 aminoácidos. En el evento representado para CYP2C8, el uso de un sitio de empalme 3 'alternativo elimina 71 nucleótidos, cambiando el marco de lectura y dando lugar a un codón de terminación prematuro en el exón (Figura 2c). En este caso, la transcripción alternativa más corta es un sustrato potencial para la desintegración mediada sin sentido [41, 42] y el evento AS puede usarse para regular el nivel de ARNm funcional / proteína producida.

Diferencias en la expresión del factor de empalme entre tejidos

Para explorar las diferencias en la expresión del factor de empalme en diferentes tejidos, se obtuvieron datos de expresión de ARNm disponibles a partir de dos estudios de microarrays de ADN diferentes [43-45]. Para esto trans-Análisis de factores, obtuvimos una lista de 20 factores de corte y empalme de las familias de proteínas SR, relacionadas con SR y hnRNP a partir de análisis proteómicos del espliceosoma humano [46-48] (consulte Materiales y métodos para obtener la lista de genes). La variación en la expresión del factor de empalme entre pares de tejidos se estudió calculando el coeficiente de correlación de Pearson (producto-momento) (r) entre los vectores de 20 dimensiones de los valores de expresión del factor de corte y empalme entre todos los pares de 26 tejidos humanos. Los estudios de microarrays de ADN analizaron 10 tejidos además de los 16 estudiados previamente (Figura 3). Un valor bajo de r entre un par de tejidos indica un bajo grado de concordancia en los niveles relativos de expresión de ARNm en este conjunto de factores de empalme, mientras que un valor alto de r indica una fuerte concordancia.

Correlación de los niveles de expresión de ARNm de 20 factores de empalme conocidos (ver Materiales y métodos) en 26 tejidos humanos (diagonal inferior: datos del experimento de microarrays de ADN Affymetrix HU-133A [45] diagonal superior: datos del experimento de microarrays de ADN Affymetrix HU-95A [43 ]). Los cuadrados pequeños están coloreados para representar el grado de correlación entre los patrones de expresión de ARNm de los 20 genes del factor de corte y empalme en cada par de tejidos (ver la escala en la parte superior de la figura).

Si bien la mayoría de los tejidos examinados mostraron un grado muy alto de correlación en los niveles de expresión de los 20 factores de empalme estudiados (típicamente con r & gt 0,75 Figura 3), el hígado adulto humano fue claramente un valor atípico, con una baja concordancia en la expresión del factor de empalme con la mayoría de los otros tejidos (típicamente r & lt 0.6, y a menudo mucho más bajo). La expresión inusual del factor de corte y empalme en el hígado humano se observó de manera consistente en los datos de dos estudios de microarrays de ADN independientes usando diferentes conjuntos de sondas (compare las dos mitades de la Figura 3). La baja correlación observada entre el hígado y otros tejidos en la expresión del factor de empalme es estadísticamente significativa incluso en relación con colecciones arbitrarias de 20 genes (consulte el archivo de datos adicionales 8). Al examinar los niveles relativos de factores de corte y empalme específicos en el hígado adulto humano frente a otros tejidos, el nivel relativo de mensaje SRp30c fue consistentemente más alto en el hígado y los niveles relativos de mensajes SRp40, hnRNP A2 / B2 y Srp54 fueron consistentemente más bajos. Un paradigma bien establecido en el campo del empalme de ARN es que el uso de sitios de empalme alternativos a menudo está controlado por las concentraciones relativas de proteínas SR específicas y proteínas hnRNP [49-52]. Este antagonismo funcional entre determinadas proteínas SR y hnRNP se debe a menudo a la competencia por la unión de sitios cercanos en pre-mRNA [49, 53, 54]. Por lo tanto, parece probable que los patrones de expresión inusuales observados en el hígado adulto humano para estas familias de factores de empalme puedan contribuir al alto nivel de uso de sitios de empalme alternativo observado en este tejido. También es interesante que la expresión del factor de corte y empalme en el hígado fetal humano sea altamente concordante con la mayoría de los otros tejidos, pero tiene una baja concordancia con el hígado adulto (Figura 3). Esta observación sugiere que pueden producirse cambios sustanciales en la expresión del factor de corte y empalme durante el desarrollo del hígado humano, lo que presumiblemente conduce a una serie de cambios en los patrones de corte y empalme de los genes expresados ​​en el hígado humano. Los datos de EST disponibles en la actualidad eran insuficientes para permitir un análisis sistemático de los patrones de EA en el hígado fetal en relación con el de un adulto.

Una advertencia importante para estos resultados es que los datos de la micromatriz de ADN utilizados en este análisis miden los niveles de expresión del ARNm en lugar de los niveles o actividades de las proteínas. La relación entre la cantidad de ARNm expresado a partir de un gen y la concentración de la proteína correspondiente se ha examinado previamente en varios estudios en levaduras, así como en tejidos hepáticos humanos y de ratón [55-58]. Estos estudios generalmente han encontrado que los niveles de expresión de ARNm se correlacionan positivamente con las concentraciones de proteínas, pero con divergencias bastante amplias para una fracción significativa de genes.

Motivos sobrerrepresentados en exones alternativos en el cerebro, los testículos y el hígado humanos

Los niveles inusualmente altos de empalme alternativo observados en el cerebro, los testículos y el hígado humanos nos llevaron a buscar motivos reguladores de empalme específicos de tejido candidatos en los exones de AS en genes expresados ​​en cada uno de estos tejidos. Usando un procedimiento similar al de Brudno et al. [59], se identificaron motivos de secuencia de cuatro a seis bases de largo que estaban significativamente enriquecidos en exones omitidos en genes AS expresados ​​en el cerebro humano en relación con exones constitutivos en genes expresados ​​en el cerebro. A continuación, estas secuencias se compararon entre sí y se agruparon en siete grupos, cada uno de los cuales compartía uno o dos motivos de cuatro bases (Tabla 2). Los motivos en el grupo BR1 (CUCC, CCUC) se asemejan al sitio de unión de consenso para la proteína de unión al tracto de polipirimidina (PTB), que actúa como represor del empalme en muchos contextos [60-63]. Se ha identificado un motivo similar (CNCUCCUC) en exones expresados ​​específicamente en el cerebro humano [29]. Los motivos en el grupo BR7 (que contiene UAGG) son similares al sitio de unión de alta afinidad UAGGG [A / U], identificado para la proteína represora de empalme hnRNP A1 mediante experimentos SELEX [64]. Las secuencias consenso para los grupos restantes BR2 a BR6 (GGGU, UGGG, GGGA, CUCA, UAGC, respectivamente), así como BR7, se parecían todos a motivos identificados en una pantalla de silenciadores de empalme exónico (ESS) en células humanas cultivadas (Z. Wang y CBB, resultados no publicados), lo que sugiere que la mayoría o todos los motivos BR1 a BR7 representan secuencias directamente implicadas en la mediación de la omisión de exón. En particular, los elementos ricos en G, que se sabe que actúan como potenciadores del empalme intrónico [65, 66], pueden funcionar como silenciadores del empalme cuando están presentes en un contexto exónico.

Una comparación de exones omitidos derivados de testículos humanos con exones incluidos constitutivamente en genes expresados ​​en el testículo identificó solo un grupo de secuencias, TE1, que comparten el tetrámero UAGG. El enriquecimiento de este motivo, común al grupo BR7 específico del cerebro, sugiere un papel para la regulación de la omisión de exón por parte de hnRNP A1, o un trans-factor de acción con preferencias vinculantes similares - en el testículo.

El uso alternativo del sitio de empalme da lugar a dos tipos de segmentos de exón: la porción 'central' común a ambas formas de empalme y la porción 'extendida' que está presente solo en la isoforma más larga. Two clusters of sequence motifs enriched in the core sequences of A5Es in genes expressed in the liver relative to the core segments of A5Es resulting from alignments of non-liver-derived ESTs were identified - LI1 and LI2. Both are adenosine-rich, with consensus tetramers AAAC and UAAA, respectively. The former motif matches a candidate ESE motif identified previously using the computational/experimental RESCUE-ESE approach (motif 3F with consensus [AG]AA [AG]C) [19]. The enrichment of a probable ESE motif in exons exhibiting alternative splice site usage in the liver is consistent with the model that such splicing events are often controlled by the relative levels of SR proteins (which bind many ESEs) and hnRNP proteins. Insufficient data were available for the analysis of motifs in the extended portions of liver A5Es (which tend to be significantly shorter than the core regions) or for the analysis of liver A3Es.

A measure of dissimilarity between mRNA isoforms

To quantify the differences in splicing patterns between mRNAs or ESTs derived from a gene locus, a new measure called the splice junction difference ratio (SJD) was developed. For any pair of mRNAs/ESTs that align to overlapping portions of the same genomic locus, the SJD is defined as the proportion of splice junctions present in both transcripts that differ between them, including only those splice junctions that occur in regions of overlap between the transcripts (Figure 4). The SJD varies between zero and one, with a value of zero for any pair of transcripts that have identical splice junctions in the overlapping region (for example, transcripts 2 and 5 in Figure 4, or for two identical transcripts), and has a value of 1.0 for two transcripts whose splice junctions are completely different in the regions where they overlap (for example, transcripts 1 and 2 in Figure 4). For instance, transcripts 2 and 3 in Figure 4 differ in the 3' splice site used in the second intron, yielding an SJD value of 2/4 = 0.5, whereas transcripts 2 and 4 differ by skipping/inclusion of an alternative exon, which affects a larger fraction of the introns in the two transcripts and therefore yields a higher SJD value of 3/5 = 0.6.

Computation of splice junction difference ratio (SJD). The SJD value for a pair of transcripts is computed as the number of splice junctions in each transcript that are not represented in the other transcript, divided by the total number of splice junctions in the two transcripts, in both cases considering only those splice junctions that occur in portions of the two transcripts that overlap (see Materials and methods for details). SJD value calculations for different combinations of the transcripts shown in the upper part of the figure are also shown.

The SJD value can be generalized to compare splicing patterns between two sets of transcripts from a gene - for example, to compare the splicing patterns of the sets of ESTs derived from two different tissues. In this case, the SJD is defined by counting the number of splice junctions that differ between all pairs of transcripts (I, j), with transcript I coming from set 1 (for example, heart-derived ESTs), and transcript j coming from set 2 (for example, lung-derived ESTs), and dividing this number by the total number of splice junctions in all pairs of transcripts compared, again considering only those splice junctions that occur in regions of overlap between the transcript pairs considered. Note that this definition has the desirable property that pairs of transcripts that have larger numbers of overlapping splice junctions contribute more to the total than transcript pairs that overlap less. As an example of the splice junction difference between two sets of transcripts, consider the set S1, consisting of transcripts (1,2) from Figure 4, and set S2, consisting of transcripts (3,4) from Figure 4. Using the notation introduced in Figure 4, SJD(S1,S2) = D(S1,S2) / t(S1,S2) = [D(1,3) + D(1,4) + D(2,3) + D(2,4)]/ [t(1,3) +t(1,4) + t(2,3) + t(2,4)] = [3 + 4 + 2 + 3]/ [3 + 4 + 4 + 5] = 12/16 = 0.75, reflecting a high level of dissimilarity between the isoforms in these sets, whereas the SJD falls to 0.57 for the more similar sets S1 = transcripts (1,2) versus S3 = transcripts (2,3). Note that in cases where multiple similar/identical transcripts occur in a given set, the SJD measure effectively weights the isoforms by their abundance, reflecting an average dissimilarity when comparing randomly chosen pairs of transcripts from the two tissues. For example, the SJD computed for the set S4 = (1,2,2,2,2), that is, one transcript aligning as transcript 1 in Figure 4 and four transcripts aligning as transcript 2, and the set S5 = (2,2,2,2,3) is 23/95 = 0.24, substantially lower than the SJD value for sets S1 versus S3 above, reflecting the higher fraction of identically spliced transcripts between sets S4 and S5.

Global comparison of splicing patterns between tissues

To make a global comparison of patterns of splicing between two different human tissues, a tissue-level SJD value was computed by comparing the splicing patterns of ESTs from all genes for which at least one EST was available from cDNA libraries representing both tissues. The 'inter-tissue' SJD value is then defined as the ratio of the sum of D(SA,SB) values for all such genes, divided by the sum of t(SA,SB) values for all of these genes, where SA y SB refer to the set of ESTs for a gene derived from tissues A and B, respectively, and D(SA,SB) y t(SA,SB) are defined in terms of comparison of all pairs of ESTs from the two sets as described above. This analysis uses all available ESTs for each gene in each tissue (rather than samples of a fixed size). A large SJD value between a pair of tissues indicates that mRNA isoforms of genes expressed in the two tissues tend to be more dissimilar in their splicing patterns than is the case for two tissues with a smaller inter-tissue SJD value. This definition puts greater weight on those genes for which more ESTs are available.

The SJD values were then used to globally assess tissue-level differences in alternative splicing. A set of 25 human tissues for which at least 20,000 genomically aligned ESTs were available was compiled for this comparison (see Materials and methods) and the SJD values were then computed between all pairs of tissues in this set (Figure 5a). A clustering of human tissues on the basis of their inter-tissue SJD values (Figure 5b) identified groups of tissues that cluster together very closely (for example, the ovary/thyroid/breast cluster, the heart/lymph cluster and the bone/B-cell cluster), while other tissues including the brain, pancreas, liver, peripheral nervous system (PNS) and placenta occur as outgroups. These results complement a previous clustering analysis based on data from microarrays designed to detect exon skipping [24]. Calculating the mean SJD value for a given tissue when compared to the remaining 24 tissues (Figure 5c) identified a set of human tissues including the ovary, thyroid, breast, heart, bone, B-cell, uterus, lymph and colon that have 'generic' splicing patterns which are more similar to most other tissues. As expected, many of these tissues with generic splicing patterns overlap with the set of tissues that have low levels of AS (Figure 1). On the other hand, another group of tissues including the human brain, pancreas, liver and peripheral nervous system, have highly 'distinctive' splicing patterns that differ from most other tissues (Figure 5c). Many of these tissues were identified as having high proportions of AS in Figure 1. Taken together, these observations suggest that specific human tissues such as the brain, testis and liver, make more extensive use of AS in gene regulation and that these tissues have also diverged most from other tissues in the set of spliced isoforms they express. Although we are not aware of reliable, quantitative data on the relative abundance of different cell types in these tissues, a greater diversity of cell types is likely to contribute to higher SJD values for many of these tissues.

Comparison of alternative mRNA isoforms across 25 human tissues. (a) Color-coded representation of SJD values between pairs of tissues (see Figure 4 and Materials and methods for definition of SJD). (B) Hierarchical clustering of SJD values using average-linkage clustering. Groups of tissues in clusters with short branch lengths (for example, thyroid/ovary, B-cell/bone) have highly similar patterns of AS. (C) Mean SJD values (versus other 24 tissues) for each tissue.


Difference between introns and exons

Definición

Introns: Introns are segments of DNA that do not encode any amino acid sequence in the coding region.

Exons: Exons are the segments of DNA that encode a part of an amino acid sequence of a complete protein.

Encode the DNA

Introns: Introns belong to non-coding DNA.

Exons: Exons belong to the DNA encoder.

Transcripción

Introns: Introns are considered as the bases located between two exons.

Exons: Exons are the bases that encode an amino acid sequence of a protein.

Presence

Introns: Introns are only found in eukaryotes.

Exons: Exons are found in both prokaryotes and eukaryotes.

Movement in Nucleus

Introns: Introns remain in the nucleus by splicing the primary mRNA transcript during mRNA processing within the nucleus.

Exons: Exons leave the nucleus towards the cytoplasm after the production of mature mRNA.

Sequence conservation

Introns: Sequences in introns are less conserved compared to exons.

Exons: The sequences in the exons are highly conserved.

Presence in the genome

Introns: Introns are found in the primary transcription of DNA and mRNA.

Exons: Exons are found in both DNA and mRNA.

Función

Introns: The function of introns is not clearly known, but it is considered to be a substantial fraction of the DNA.

Exons: The function of exons is to translate into a protein.

Conclusion

A gene is a segment of DNA that produces a functional product, either a polypeptide or an RNA. The intergenic regions of a gene are composed of introns. This means that a gene in eukaryotes consists of a coding region structure, which is divided into segments called exons Introns can be found between two exons. Introns belong to non-coding DNA.

All exons together with the intergenic regions are transcribed by RNA polymerase in the primary mRNA transcript. Introns are removed from the primary transcript during mRNA processing. Therefore, a mature mRNA consists only of exons.

Exon splicing can occur in an alternative way in polycistronic mRNAs in prokaryotes, producing more than one type of mature mRNA from a single primary mRNA transcript. Introns in the genome are considered a substantial fraction of the DNA, while exons encode proteins. Therefore, the main difference between introns and exons is their function in the genome.


Peer review information Naturaleza Estructural y Biología Molecular thanks Christopher Glass and the other, anonymous, reviewer(s) for their contribution to the peer review of this work. Peer reviewer reports are available. Anke Sparmann was the primary editor on this article and managed its editorial process and peer review in collaboration with the rest of the editorial team.

Publisher’s note Springer Nature permanece neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.


The Argument About Exon Biology

Scientists are only starting to understand the options presented by alternative splicing. There’s determined, a totally free on-line dictionary with highstock 4.2.

Linnean rankings are thought to be unimportant. Proctor Requirements A proctor is necessary for this course in case the student’s aim is to find a grade. That the fossil record, generally, suggests evolution is definitely an important bit of evidence, but it gets even more telling when it’s combined with other evidence for evolution.

An intriguing post that has made me think a little more about the matter. Burets are used when a precise number of liquid has to be used. For instance, an overfed pet may get obese and an individual’s skin tone may change because of exposure to the sun. We have a bath at least one time per day.

1 way which helps scientists place fossils. Some key transcripts can be spliced in a couple of different ways. Just the type of day you must find work done at the dig.

This may be due to the smaller quantity of SNVs existing within a little window, which can lessen the ability to detect PIRs. That’s the fossilization process on the job. These aren’t referred to and can be taken out at intervals to boost disc space. Introns contain quite a few of sequences that take part in splicing including spliceosome recognition websites. Since you may see, there’s a crystal clear signal around the splice websites and this signal is utilized by several programs that do splice site prediction.


Prokaryotic versus Eukaryotic Gene Expression

To understand how gene expression is regulated, we must first understand how a gene becomes a functional protein in a cell. The process occurs in both prokaryotic and eukaryotic cells, just in slightly different fashions.

Because prokaryotic organisms lack a cell nucleus, the processes of transcription and translation occur almost simultaneously. When the protein is no longer needed, transcription stops. As a result, the primary method to control what type and how much protein is expressed in a prokaryotic cell is through the regulation of DNA transcription into RNA. All the subsequent steps happen automatically. When more protein is required, more transcription occurs. Therefore, in prokaryotic cells, the control of gene expression is almost entirely at the transcriptional level.

The first example of such control was discovered using mi. coli in the 1950s and 1960s by French researchers and is called the lac operon. los lac operon is a stretch of DNA with three adjacent genes that code for proteins that participate in the absorption and metabolism of lactose, a food source for mi. coli. When lactose is not present in the bacterium’s environment, the lac genes are transcribed in small amounts. When lactose is present, the genes are transcribed and the bacterium is able to use the lactose as a food source. The operon also contains a promoter sequence to which the RNA polymerase binds to begin transcription between the promoter and the three genes is a region called the operator. When there is no lactose present, a protein known as a repressor binds to the operator and prevents RNA polymerase from binding to the promoter, except in rare cases. Thus very little of the protein products of the three genes is made. When lactose is present, an end product of lactose metabolism binds to the repressor protein and prevents it from binding to the operator. This allows RNA polymerase to bind to the promoter and freely transcribe the three genes, allowing the organism to metabolize the lactose.

Eukaryotic cells, in contrast, have intracellular organelles and are much more complex. Recall that in eukaryotic cells, the DNA is contained inside the cell’s nucleus and it is transcribed into mRNA there. The newly synthesized mRNA is then transported out of the nucleus into the cytoplasm, where ribosomes translate the mRNA into protein. The processes of transcription and translation are physically separated by the nuclear membrane transcription occurs only within the nucleus, and translation only occurs outside the nucleus in the cytoplasm. The regulation of gene expression can occur at all stages of the process (Figure 1). Regulation may occur when the DNA is uncoiled and loosened from nucleosomes to bind transcription factors ( epigenetic level), when the RNA is transcribed (transcriptional level), when RNA is processed and exported to the cytoplasm after it is transcribed ( post-transcriptional level), when the RNA is translated into protein (translational level), or after the protein has been made ( post-translational level).

Figura 1: Eukaryotic gene expression is regulated during transcription and RNA processing, which take place in the nucleus, as well as during protein translation, which takes place in the cytoplasm. Further regulation may occur through post-translational modifications of proteins.

The differences in the regulation of gene expression between prokaryotes and eukaryotes are summarized in Table 1.

  • RNA transcription occurs prior to protein translation, and it takes place in the nucleus. RNA translation to protein occurs in the cytoplasm.
  • RNA post-processing includes addition of a 5′ cap, poly-A tail, and excision of introns and splicing of exons.

Resultados

This study analyzed RNA-Seq data of hippocampus brain tissues from 74 participants from the ACT study. Participants were diagnosed as cognitively normal elder controls (CN) or AD patients. As shown in Table 1, there were 24 AD and 50 CN participants, and the mean Braak stages of AD and CN were 4.4 and 2.78, respectively.

Differentially expressed exons in AD hippocampus tissue

Using the computational pipeline described in Fig. 1, normalized expression levels were calculated for each exon in a genome-wide manner, and a generalized linear regression model was used to identify AD-associated exon skipping events. After adjusting for multiple comparisons using the FDR method, we identified three exon skipping events in two genes, RELN y NOS1, as significantly associated with the AD (FDR-corrected pag-value < 0.05 and fold change > 1.5). Two exons in RELN, exons 24 and 37, showed significantly lower expression levels in AD patients compared to CN participants, suggesting that the exons tend to be skipped more in the AD (Fig. 2a). The exon 24 was predicted to encode a hEGF domain region (PF00008, Fig. 2b). Furthermore, for AD participants, we investigated whether the Braak stage is associated with the exon skipping event. In 24 AD participants, 19 were in the Braak stages 4, 5 and 6. Among the 19 AD participants in higher Braak stages, 15 showed significantly lower expression levels of the exon 24 compared to the other 4 AD participants (one-way chi-squared test, pag-value = 0.01), suggesting that the exon tends to be skipped more in higher Braak stages of AD participants. En NOS1, exon 23 had lower expression levels in AD patients compared to CN participants (Fig. 3a) and was a part of the NO_synthase domain (PF02898, Fig. 3b). Our results suggest that these exon skipping events may affect the function of the corresponding protein products.

Two AD-associated exon skipping events in RELN. a Comparison of the expression levels of each exon between AD and CN participants, indicating two significant exon skipping events (exons 24 and 37) in the AD. B Exon structure and the hEGF domain encoded by the skipped exons (UCSC genome browser)

One AD-associated exon skipping event in NOS1. a Comparison of the expression levels of each exon between AD and CN participants, indicating a significant exon skipping event (exon 23) in the AD. B Exon structure and the NO_synthase domain encoded by the skipped exon (UCSC genome browser)

Prediction of the effect of the identified exon skipping events on protein

To characterize the potential impact of the variants on the protein, each variant was analyzed using UniProt web browser and RaptorX. All of three skipped exons in RELN y NOS1 resulted in producing a coding sequence which is out-of-frame, potentially generating an undesired protein product. As presented in Fig. 4, the first AD-associated exon skipping (exon 24) in RELN showed lower expression levels of the exon in AD compared to CN participants (Fig. 4b FDR-corrected pag-value = 0.034, fold change = 1.51). The adjacent exon 23 and 25 showed similar levels of difference but not significant (FDR = 0.154 for both exons, fold change = 1.39 and 1.37, respectively). The transcript (transcript1) retaining the exon 24, which encodes the hEGF, likely results in a functional version of the RELN gene, while the transcript which lacks exon 24 will lose the hEGF domain and thus produce the truncated protein product due to the out-of-frame of the exon length (Fig. 4a). Structural analysis of the truncated version of the protein suggests that exon skipping may be implicated in functional changes of RELN in the AD (Fig. 4c). The other exon (exon 37) in RELN is presented in Additional file 1: Figure S1. Additionally, exon 23 was identified as being skipped in NOS1 (Fig. 5a). AD participants had significantly lower expression levels of the exon compared to CN (Fig. 5b FDR corrected pag-value = 0.043, fold change = 1.90). The transcript (transcript1) retaining the exon 23, which encodes a part of the NO_synthase, can be translated into the protein with normal functions of NOS1. In contrast, the transcript with the skipping of exon 23 may not only lose the NO_synthase domain but also produce the truncated protein due to the out-of-frame of the exon length. We also showed the partial loss of the protein structure due to the skipped exon using the protein 3D structure analysis (Fig. 5c).

Functional impact of the AD-associated exon skipping event (exon 24) in RELN. a Schema of the potential functional implication of exon skipping and splicing-associated SNP. B Normalized expression levels for exon 24 between AD and CN participants. C Structure alignment of the pair of transcript1 retaining exon 24 (green) and transcript 2 with the exon skipping (red)

Functional impact of the AD-associated exon skipping event (exon 23) in NOS1. a Skipping of exon 23. B Normalized expression levels for exon 23 between AD and CN participants. C Structure alignment of the pair of transcript1 retaining exon 23 (green) and transcript 2 with the exon skipping (red)

Association of SNPs affecting exon skipping with AD-related neuroimaging phenotypes

Next, we performed an association analysis of SNPs affecting exon skipping events with a global cortical measure of amyloid-β deposition as an AD-related quantitative phenotype. Using the splicing decision model, we first identified 46 and 11 SNPs in RELN y NOS1, respectively, potentially affecting the identified three exon skipping events (MAF > 1%) from HRC-based imputed ADNI GWAS data. We identified one SNP (rs362771) in intron adjacent to the skipped exon 24 in RELN as significantly associated with cortical amyloid-β levels (Fig. 6a permutation-based corrected pag-value < 0.05). Furthermore, we performed an unbiased whole-brain-based imaging association analysis using age, sex, years of education as covariates to assess the effect of rs362771 on whole-brain amyloid-β deposition and identified significant associations after adjustment for multiple comparisons using cluster-wide FDR procedure. The minor allele of rs362771 conferred decreases in cortical amyloid-β levels in the right temporal and bilateral parietal lobes (Fig. 6b). As shown in Fig. 4a, we found that the SNP (rs362771) is located within the ISE site (5th site of hexametric sequence CCTTCC), suggesting that the SNP may affect the exon skipping and the skipped exon may be associated with AD pathogenesis.

Regional effects (a global cortical amyloid-β load) and voxel-wide association (B) of rs362771 in RELN affecting exon skipping with amyloid-β deposition


Creating families of proteins through differential nRNA splicing

The average vertebrate nRNA consists of relatively short exons (averaging about 140 bases) separated by introns that are usually much longer. Most mammalian nRNAs contain numerous exons. By splicing together different sets of exons, different cells can make different types of mRNAs, and hence, different proteins. Whether a sequence of RNA is recognized as an exon or as an intron is a crucial step in gene regulation. What is an intron in one cell's nucleus may be an exon in another cell's nucleus.

Alternative nRNA splicing is based on determining which sequences can be spliced out as introns. This can occur in several ways (Figure 5.28). Cells can differ in their ability to recognize the 5´ splice site (at the beginning of the intron) or the 3´ splice site (at the end of the intron). Or some cells could fail to recognize a sequence as an intron at all, retaining it within the message. The splicing of nRNA is mediated through a complex called a spliceosome, made up of small nuclear RNAs (snRNA) and proteins, that assembles at a splice site. Whether a spliceosome recognizes the splice sites depends on certain factors in the nucleus that can interact with those sites and compete or cooperate with the proteins that direct spliceosome formation. The 5´ splice site is normally recognized by small nuclear RNA U1 (U1 snRNA) and splicing factor 2 (SF2 also known as alternative splicing factor). The choice of alternative 3´ splice sites is often controlled by which splice site can best bind a protein called U2AF. The spliceosome forms when the 5´ and 3´ splice sites are brought together and the intervening RNA is cut out.

Figure 5.28

Schematic diagram of alternative nRNA splicing. Exons are represented as shaded boxes, alternatively spliced exons are represented by hatched boxes, and introns are represented by broad lines. By convention, the path of splicing is shown by fine V-shaped (more. )

WEBSITE

5.14 The mechanism of differential nRNA splicing. Differential nRNA splicing depends on the assembly of the nucleosome and upon the ratio of certain proteins in the nucleus of the cell. http://www.devbio.com/chap05/link0514.shtml

Differential RNA processing has been found to control the alternative forms of expression of genes encoding over 100 proteins. The deletion of certain potential exons in some cells but not in others enables one gene to create a family of closely related proteins. Instead of one gene-one polypeptide, one can have one gene-one family of proteins. For instance, alternative RNA splicing enables the α-tropomyosin gene to encode brain, liver, skeletal muscle, smooth muscle, and fibroblast forms of this protein (Figure 5.29 Breitbart et al. 1987). The nuclear RNA for α-tropomyosin contains 11 potential exons, but different sets of exons are used in different cells. Such different proteins encoded by the same gene are called splicing isoforms of the protein.

Figure 5.29

Alternative RNA splicing to form a family of rat α-tropomyosin proteins. The α-tropomyosin gene is represented on top. The numbers correspond to the amino acids encoded by the exons. The thin lines represent the sequences that become introns (more. )

In some instances, alternatively spliced RNAs yield proteins that play similar, yet distinguishable, roles in the same cell. The nuclear RNA for the Pax6 transcription factor is actually spliced to yield two types of Pax6 proteins. In about half the mRNAs, there is an added exon that interrupts one major DNA-binding site and enables another to be used (Epstein et al. 1994). The two forms of Pax 6 appear to be made at similar rates in all the cells expressing the Pax6 gene. If the human gene for PAX6 is mutated such that the 5´ splicing site becomes more efficient, the Pax6 isoform containing the amino acids encoded by the alternatively spliced exon is made in excess. The eyes of people with this mutation have defects in their lenses, corneas, and pupils.

If you think that differential splicing means that certain genes with dozens of introns can create thousands of different related proteins, you are probably correct. Proteins derived from the neurexin genes, for example, are found on the cell surfaces of developing neurons, and they may be important in specifying the connections that these neurons make. * These genes can be alternatively spliced at several different sites, creating hundreds of proteins from the same gene (Ullrich et al. 1995 Ichtchenko et al. 1995).

Differential nRNA Processing and Drosophila Sex Determination.


Ver el vídeo: Splicing (Junio 2022).