Información

5.5: Ejercicio 2- Uso de la base de datos del genoma de Saccharomyces - Biología

5.5: Ejercicio 2- Uso de la base de datos del genoma de Saccharomyces - Biología


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

La base de datos del genoma de Saccharomyces (SGD) es un recurso importante para la comunidad de investigación de levaduras. Este ejercicio le presentará algunos recursos útiles en el SGD.

Dirija su navegador a: http://www.yeastgenome.org

Para dispositivos móviles, una aplicación Yeast Genome está disponible a través de iTunes.

• Escriba el nombre de su REUNIÓ gene en el cuadro de búsqueda. Esto abre la página de resumen de su gen. Tenga en cuenta que el nombre sistemático de su gen es idéntico al nombre del locus asignado por el proyecto del genoma.

Registre el nombre estándar de su gen _________________

¿Existen nombres alternativos (alias) para su gen? ¿Qué son?

Los nombres estándar para muchos S. cerevisiae los genes se asignaron originalmente durante las pruebas genéticas clásicas. Un cribado de mutantes incapaces de sintetizar Met, por ejemplo, podría generar una colección de cepas mutantes a las que se asignarían números arbitrariamente: met1, met2.....metN. Ocasionalmente, el mismo gen puede aparecer en las pantallas de diferentes fenotipos, en cuyo caso puede haber dos nombres diferentes para un gen. Por ejemplo, MET5 es lo mismo que ECM17, porque met5 Los mutantes se aislaron en un cribado de defectos en la pared celular, así como cribados de auxotrofia de metionina. (ECM significa matriz extracelular).

¿Qué papel juega el producto de su gen MET en el metabolismo?

los REUNIÓ Todos los genes que estamos estudiando codifican enzimas implicadas en la síntesis de Met. Estas enzimas son parte de vías muy reguladas en las células. Encuentra el "Caminos" campo en la página de resumen de SGD para su gen. Verá enlaces a una o más vías en las que se ha implicado el producto proteico de su gen. La evidencia experimental apoya estas vías, que están organizadas en la base de datos MetaCyc de vías metabólicas.

  • Enumere la (s) vía (s) MetaCyc en las que participa su enzima. Si la enzima está implicada en más de una vía, ¿las vías están relacionadas entre sí? ¿Cómo?
  • Haga clic en uno de los enlaces de la ruta. Localice la posición de su producto genético en la vía. ¿Cuál es el nombre oficial de la enzima codificada por su REUNIÓ ¿gene?
  • Debajo del nombre de su enzima, verá un número con 3 puntos decimales. Ésta es la clasificación oficial dada a la enzima por la Comisión de Enzimas, que clasifica las enzimas en muy detalle. El primer número indica la amplia clase de enzima, p. Ej. hidrolasa, transferasa, oxidorreductasa. Los números siguientes profundizan en los tipos de enlaces alterados en la reacción y, finalmente, en sustratos específicos. Las enzimas de diferentes organismos con el mismo número de CE son esperado para catalizar la misma reacción. Registre el número de C.E. Este número de CE será importante más adelante en el semestre, cuando evalúe si es probable que los homólogos de otras especies catalicen la misma reacción que la enzima S. cerevisiae.
  • Haga clic en el número CE para ver la reacción catalizada por la enzima.
  • ¿Cuáles son los sustratos y productos para su enzima? Dibuja las estructuras del sustrato y el producto que son intermedios en la síntesis de metionina. (No es necesario dibujar las estructuras de otros sustratos / productos como ATP / ADP).
  • La posición de su enzima en la vía será importante en el próximo experimento, donde se usa la siembra selectiva para identificar el grupo reunió mutantes.

    ¿Qué gen codifica la enzima que cataliza el paso PRECEDENTE de la vía? Este paso genera el sustrato para la reacción que está estudiando.

    ¿Qué gen codifica la enzima que cataliza el SIGUIENTE paso en la vía? El producto de su reacción se metabolizará en este paso.

La expresion genica

La expresión de un gen en diferentes condiciones ambientales a menudo proporciona pistas sobre su importancia fisiológica. Pocos genes se regulan de forma autónoma. En cambio, la mayoría de los genes codifican proteínas que forman parte de redes que ayudan a las células a adaptarse a los cambios en las condiciones ambientales. Los microarrays de ADN ofrecen a los investigadores un método para monitorear los cambios en la expresión de miles de genes en respuesta a un cambio ambiental. Los genes que muestran patrones de expresión similares suelen ser miembros de una red de genes. Los biólogos de la levadura han realizado miles de experimentos de microarrays, proporcionando una gran cantidad de información para cada gen de la levadura. (Si no está familiarizado con los microarrays, puede que le resulte útil el siguiente tutorial: learn.genetics.utah.edu/content / labs / microarray /.)

  • Haga clic en la pestaña Expresión en la parte superior de la página de resumen de su gen en yeastgenome.org. El histograma Expression Overview en la parte superior de la nueva página muestra el número de experimentos en los que el nivel de expresión génica se alteró con un cambio en las condiciones experimentales. Los resultados se expresan en unidades log2 (2X), donde 0 indica que no hay cambios, 1 indica un cambio de 2 veces, 2 un cambio de 4 veces, etc.) Los histogramas muestran los resultados de miles de experimentos. En la mayoría de los experimentos, el nivel de expresión genética no cambió o cambió poco. (Esto se vuelve más claro cuando selecciona un eje y lineal). Los niveles de expresión aumentaron en algunos experimentos (barras rojas) y disminuyeron (barras verdes) en otros. Al hacer clic en una barra del histograma, aparecen los experimentos específicos que proporcionaron esos resultados en Anotaciones. ¿Qué condiciones produjeron las tasas más altas de transcripción de su gen?
  • Mueva el cursor hacia abajo hasta "Perfiles de expresión similares" (o use el enlace en el panel de la izquierda) para encontrar un resumen gráfico de genes que muestran patrones de regulación similares a los de su propio gen de interés en múltiples experimentos (conjuntos de datos). Las líneas de conexión entre genes indican que su expresión estaba correlacionada. El ancho de las líneas de conexión refleja el número de estudios en los que se correlacionó la expresión. Una barra deslizante en la parte inferior del gráfico le permite filtrar el número de estudios donde se coexpresaron genes particulares. Tenga en cuenta que la cantidad de genes coexpresados ​​disminuye a medida que aumenta la cantidad de conjuntos de datos.

    En su forma más estricta (coexpresión en el mayor número de conjuntos de datos), ¿qué genes están co-regulados con su gen MET? Busque las reacciones catalizadas por sus productos genéticos. ¿Observa algún patrón en los genes que se exprese de manera coordinada con su REUNIÓ ¿gene? ¿Aparecen en la lista otros genes de la vía biosintética de Met?

    En el escenario menos estricto, ¿aparecen genes fuera de la vía de biosíntesis de Met y Cys? ¿Que son estos? Formule una hipótesis sobre por qué estos nuevos grupos de genes estarían co-regulados con genes MET.

Información del fenotipo

De acuerdo con su misión de servir como recurso para la comunidad de investigación de levaduras, que incluye a muchos genetistas, el SGD también recopila información sobre cepas mutantes y sus fenotipos. Las cepas de deleción que usaremos en nuestros experimentos no pueden crecer en ausencia de metionina, pero pueden demostrar fenotipos adicionales.

  • Haga clic en la pestaña Fenotipo en la parte superior de la página para obtener más información. Hoy en día, se están identificando muchos fenotipos en experimentos de alto rendimiento que a menudo generan fenotipos complejos y / o sutiles. ¿Cómo se compara el número de fenotipos generados por estudios de alto rendimiento con el número de fenotipos descubiertos por la genética clásica?
  • Nos centraremos en los fenotipos más sencillos que se han identificado utilizando genética clásica. Haga clic en la barra de genética clásica en el histograma para mostrar información sobre fenotipos individuales bajo el encabezado de la anotación. ¿Qué fenotipos se detectan en mutantes nulos (los mutantes nulos carecen del gen o producen una proteína inactiva)?
  • Mutaciones en algunos REUNIÓ Los genes tienen fenotipos asociados con la acumulación de telurio y la resistencia (Ottoson et al., 2010). Encuentra telurio en la tabla periódica. ¿Cómo cree que está funcionando el telurio?

Resultados

Ensambles de genoma a nivel de población de un extremo a otro

Aplicamos secuenciación profunda PacBio (100 × –300 ×) e Illumina (200 × –500 ×) a siete S. cerevisiae y cinco S. paradoxus cepas que representan subpoblaciones evolutivamente distintas de ambas especies 1,6 (Tablas complementarias 1 y 2). El PacBio crudo de novo Los ensamblajes de genomas tanto nucleares como mitocondriales mostraron una exhaustividad y precisión convincentes, con la mayoría de los cromosomas ensamblados en contigs únicos y regiones altamente complejas ensambladas con precisión (Fig. 1 complementaria). Después del llenado manual de espacios y la corrección de errores basada en lectura de Illumina (métodos en línea), obtuvimos ensamblajes de extremo a extremo para casi todos los 192 cromosomas, con solo la matriz de ADNr en el cromosoma XII y 26 de 384 (6,8%) extremos cromosómicos. quedando no completamente ensamblado. Estimamos que sólo quedan 45-202 errores de secuenciación de nivel de base en cada genoma nuclear de 12 Mb (Tablas complementarias 3 y 4). Para cada ensamblaje, anotamos centrómeros, genes que codifican proteínas, ARNt, elementos retrotransponibles Ty, elementos X del núcleo, elementos Y ′ y genes del ARN mitocondrial (Tablas complementarias 5-7). Los cromosomas se nombraron de acuerdo con sus centrómeros abarcados.

Cuando se evalúa contra la corriente S. cerevisiae y S. paradoxus genomas de referencia, nuestros ensamblajes PacBio de las mismas cepas (S288C y CBS432, respectivamente) muestran una colinealidad limpia para los genomas nucleares y mitocondriales (Fig.1a, b) con solo unas pocas discrepancias en escalas más finas, que fueron causadas por problemas de ensamblaje en el genomas de referencia. Por ejemplo, encontramos cinco inserciones Ty1 sin referencia en el cromosoma III en nuestro ensamblaje S288C (Fig. 1a, recuadro), que fueron corroboradas por estudios previos 22,23,24, así como nuestras propias amplificaciones de PCR de largo alcance. Asimismo, encontramos un ensamblaje incorrecto en el cromosoma IV (Figura 1b, recuadro) en el S. paradoxus genoma de referencia, que fue confirmado por Illumina y Sanger dice 1. Además, verificamos varios casos conocidos de variantes de número de copia (CNV) (por ejemplo, elementos Y ′ 25, el CUP1 locus 6 y ARR 6 grupos de genes) y SV (por ejemplo, los de Malasia S. cerevisiae UWOPS03-461.4) 26 y todos fueron recapturados correctamente en nuestras asambleas.

(a) Comparación de la S. cerevisiae genoma de referencia (cepa S288C) y nuestro conjunto PacBio S288C. Las señales de homología de secuencia se indican en rojo (coincidencia directa) o azul (coincidencia inversa). Recuadros, comparaciones ampliadas para el cromosoma III (chrIII) y el genoma mitocondrial (chrmt). Las flechas negras indican regiones que contienen Ty que faltan en el S. cerevisiae genoma de referencia. (B) Comparación de la S. paradoxus genoma de referencia (cepa CBS432) y nuestro conjunto CBS432 PacBio, codificado por colores como en a. Recuadros, comparación ampliada para el cromosoma IV (chrIV) y chrmt. La flecha negra indica el ensamblaje incorrecto del cromosoma IV en el S. paradoxus genoma de referencia. (C,D) Longitudes acumulativas de características genómicas anotadas en relación con el tamaño total del ensamblaje del núcleo (C) y genoma mitocondrial (D). CDS, secuencia codificante. (mi) Relaciones filogenéticas de los siete S. cerevisiae cepas (azul) y cinco S. paradoxus cepas (rojo) secuenciadas en este estudio. Seis cepas de otras estrechamente relacionadas Saccharomyces las especies se utilizaron como grupos externos. Todos los nodos internos tienen soporte 100% de arranque rápido. Recuadro, relaciones detalladas de la S. cerevisiae son.

Los tamaños de ensamblaje final de estas 12 cepas variaron de 11,73 a 12,14 Mb para el genoma nuclear (excluyendo los huecos de ADNr) y de 69,95 a 85,79 kb para el genoma mitocondrial (Fig. 1c, dy Tablas complementarias 8 y 9). La abundancia de elementos Ty e Y 'contribuyó sustancialmente a las diferencias de tamaño del genoma nuclear (Fig. 1c y Tabla complementaria 8). Por ejemplo, observamos un enriquecimiento específico de la cepa de Ty1 de longitud completa en S. cerevisiae S288C, Ty4 en S. paradoxus UFRJ50816 y Ty5 en S. paradoxus CBS432, mientras que no se encontró Ty completo en S. cerevisiae UWOPS03-461.4 (Tabla complementaria 6). De manera similar, se encontraron & gt30 copias del elemento Y ′ en S. cerevisiae SK1 pero ninguno en S. paradoxus N44 (Tabla complementaria 5). La variación del tamaño del genoma mitocondrial depende en gran medida de la presencia o ausencia de intrones del grupo I y del grupo II en COB1, COX1 y ARNr 21S (rnl) (Fig. 1d y Tablas complementarias 9 y 10). A pesar de los reordenamientos intercromosómicos a gran escala en algunas cepas (S. cerevisiae UWOPS03-461.4, S. paradoxus UFRJ50816 y S. paradoxus UWOPS91-917.1), las 12 cepas mantuvieron 16 cromosomas nucleares.

Tasa de evolución molecular y escala de tiempo de diversificación

Para medir la dinámica estructural en un contexto evolutivo bien definido, realizamos un análisis filogenético para las 12 cepas y 6 Saccharomyces sensu stricto grupos externos basados ​​en 4.717 ortólogos uno a uno de genes codificadores de proteínas nucleares (Conjunto de datos suplementarios 1). La filogenia resultante es consistente con nuestro conocimiento previo sobre estas cepas (Fig. 1e). Analizando este árbol filogenético, encontramos todo el S. cerevisiae linaje para haber evolucionado más rápido que el S. paradoxus linaje, como lo indica la rama más larga general desde el ancestro común de las dos especies hasta cada punta del árbol (Fig. 1e). Confirmamos tales diferencias de tasa mediante la prueba de tasa relativa de Tajima 27 para todos S. cerevisiaeS. paradoxus pares de cepas, usando Saccharomyces mikatae como el grupo externoPAG & lt 1 × 10 −5 para todas las comparaciones por pares). En contraste, el análisis de datación molecular muestra que el tiempo de diversificación acumulativo para los cinco S. paradoxus cepas fue 3,87 veces mayor que para las siete S. cerevisiae cepas, lo que sugiere un lapso de tiempo mucho más largo para la acumulación de cambios genéticos específicos de la especie en la primera (Fig. complementaria 2a). Esta diferencia en la escala de tiempo se vio respaldada además por la tasa de sustitución sinónima (dS) (Fig. 2b complementaria).

Partición cromosómica núcleo-subtélómero

Conceptualmente, los cromosomas nucleares lineales se pueden dividir en núcleos cromosómicos internos, subtélómeros intersticiales y extremos cromosómicos terminales. Sin embargo, sus límites precisos son difíciles de demarcar sin una definición rígida de subtelómero. Aquí proponemos una forma explícita de identificar subtelómeros de levadura sobre la base de la comparación de múltiples genomas, que se puede aplicar a otros organismos eucariotas. Para cada subtelómero, localizamos su límite proximal sobre la base de la pérdida repentina de la conservación de sintenia y delimitamos su límite distal por los elementos del núcleo X e Y ′ asociados a los telómeros (Métodos en línea y Fig. 3 complementaria). La división del brazo izquierdo del cromosoma I se ilustra en la Figura 2a. La estricta conservación de la síntesis genética se pierde después GDH3, marcando así el límite entre el núcleo y el subtelómero para este brazo cromosómico (Fig. 2a). Todos los núcleos cromosómicos y subtelómeros y 358 de los 384 extremos cromosómicos de las 12 cepas podrían definirse de esta manera (Tablas complementarias 11-13 y Conjuntos de datos complementarios 2 y 3). Para los 26 extremos cromosómicos restantes, los elementos X e Y ′ y las repeticiones teloméricas (TG1–3) faltaban. Asignamos la ortología de subtelómeros de diferentes cepas sobre la base de la identidad cromosómica ancestral de sus núcleos cromosómicos flanqueantes (métodos en línea). Aquí usamos números arábigos para denotar tales identidades cromosómicas ancestrales y los subtelómeros asociados, teniendo en cuenta los reordenamientos intercromosómicos a gran escala que se han producido en algunas cepas (Fig. 4 complementaria y Tabla 12 complementaria). Esta ortología subtelomérica asignada con precisión, junto con la partición cromosómica explícita, permite un examen en profundidad de la dinámica evolutiva subtelomérica.

(a) Partición del brazo izquierdo del cromosoma I en el núcleo (verde), el subtelómero (amarillo) y el extremo del cromosoma (rosa) basándose en la conservación de sintenia y los elementos X e Y ′ del núcleo asociado a los telómeros de levadura. El cladograma (izquierda) muestra las relaciones filogenéticas de las 12 cepas. El mapa de disposición de genes (derecha) ilustra el perfil de conservación sinténica en las regiones central y subtelomérica. Los nombres de los genes dentro del bloque sinténico están subrayados. (B,C) Acumulación de CNV (B) y acumulación de CNV ajustada por tiempo de diversificación (C) de pares de cepas dentro S. cerevisiae (Carolina del Sur.S.p.), dentro de S. paradoxus (Carolina del Sur.S.p.) y entre las dos especies (Carolina del Sur.S.p.) (Iniciar sesión10 escala). (D,mi) GOL (D) y GOL ajustado por tiempo de diversificación (mi) de pares de cepas. Líneas centrales, cajas medianas, bigotes de rango intercuartílico (IQR), 1,5 × IQR. Los puntos de datos más allá de los bigotes son valores atípicos.

Nuestro análisis captura distintas propiedades de núcleos cromosómicos y subtelómeros. Todos los genes esenciales previamente definidos en S. cerevisiae S288C 28 cayó en los núcleos cromosómicos, mientras que todos los bloques de duplicación subteloméricos descritos anteriormente en S288C (http://www2.le.ac.uk/colleges/medbiopsych/research/gact/images/clusters-fixed-large.jpg) fueron completamente incluido en nuestros subtelómeros S288C definidos. Además, los genes de nuestros subtelómeros definidos mostraron una acumulación de NVC 36,6 veces mayor que los de los núcleos (Mann-Whitney unilateral U prueba, PAG & lt 2,2 × 10 −16) (Fig. 2b, c). Al considerar solo ortólogos uno a uno, los genes subteloméricos mostraron una pérdida de orden de genes (GOL) 8.4 veces mayor 29,30,31 que sus contrapartes centrales (Mann-Whitney unilateral U prueba, PAG & lt 2,2 × 10 −16) (Fig. 2d, e). Además, los ortólogos subteloméricos uno a uno también mostraron una tasa de tasa de sustitución no sinónima a sinónima significativamente más alta (dN / dS) que los de los núcleos en el S. cerevisiae – S. cerevisiae y S. cerevisiae – S. paradoja comparaciones (unilateral Mann-Whitney U prueba, PAG & lt 2,2 × 10 −16), aunque no se encontró una tendencia clara en el S. paradoxusS. paradoxus comparación (unilateral Mann-Whitney U-prueba, PAG = 0,936). Estas observaciones encajan bien con las propiedades conocidas de los núcleos y subtelómeros y proporcionan la primera evaluación cuantitativa de los contrastes núcleo-subtelómeros en la dinámica del genoma. En particular, además de estos contrastes entre el núcleo y el subtelómero, también observamos claras diferencias interespecíficas en las tres mediciones. S. cerevisiae cepas mostraron una acumulación de NVC más rápida (Mann-Whitney unilateral U-prueba PAG = 6,7 × 10 −5 para núcleos, PAG = 5,1 × 10 −5 para subtelómeros) y GOL más rápido (Mann-Whitney unilateral U-prueba, PAG = 5,5 × 10 −5 para núcleos y PAG = 2.6 × 10 −5 para subtelómeros) que S. paradoxus cepas tanto en el núcleo como en los subtelómeros, respectivamente (Fig. 2c, e). Similar, S. cerevisiae genes subteloméricos también mostraron mayor dN / dS que sus S. paradoxus contrapartes (Mann-Whitney unilateral U-prueba, PAG = 4,3 × 10 −4), aunque sus genes centrales parecen tener dN / dS similares (Mann-Whitney unilateral U-prueba, PAG = 1.000). Estas observaciones sugieren colectivamente una evolución acelerada en S. cerevisiae relativo a S. paradoxus, especialmente en subtelómeros.

Reordenamientos estructurales en núcleos cromosómicos

Los reordenamientos estructurales pueden ser equilibrados (como con inversiones, translocaciones recíprocas y transposiciones) o no equilibrados (como con inserciones, deleciones y duplicaciones novedosas a gran escala) dependiendo de si el número de copias del material genético se ve afectado 10. Identificamos 35 reordenamientos equilibrados en total, incluidas 28 inversiones, 6 translocaciones recíprocas y 1 reordenamiento masivo (Fig. 3a, Fig. 5a-C complementaria y Conjunto de datos complementarios 4). Todos los eventos ocurrieron durante la diversificación específica de las dos especies, con 29 eventos ocurriendo en S. paradoxus y solo 6 en S. cerevisiae. Teniendo en cuenta la diferencia de tiempo evolutiva acumulada, S. paradoxus todavía mostró una acumulación 1,25 veces más rápida de reordenamientos equilibrados que S. cerevisiae. Seis inversiones fueron empaquetadas en una región de ∼ 200 kb en el cromosoma VII de América del Sur. S. paradoxus UFRJ50816, que indica un punto caliente de inversión específico de la cepa (Fig. 3b). Con respecto a los reordenamientos intercromosómicos, seis fueron translocaciones recíprocas que ocurrieron en dos S. paradoxus cepas (Fig. 3c y Fig. suplementaria 5a, b). El restante, en el malayo S. cerevisiae UWOPS03-461.4, fue particularmente notable: los cromosomas VII, VIII, X, XI y XIII se reorganizaron en gran medida, lo que confirma los datos de contacto cromosómico reciente 26 (Fig. 3c y Fig. 5c complementaria). Describimos esto como un reordenamiento masivo porque no puede explicarse por translocaciones recíprocas independientes típicas, pero es más probable que sea el resultado de un solo evento catastrófico que se asemeja a la cromotripsis observada en las células tumorales 32,33. Esta reordenación masiva en Malasia S. cerevisiae y la rápida acumulación de inversiones y translocaciones en la región sudamericana S. paradoxus resultó en configuraciones genómicas muy alteradas, lo que explica el aislamiento reproductivo de estos dos linajes 34,35. Como se observó anteriormente en levaduras en escalas de divergencia más grandes 36,37, los puntos de ruptura de esos reordenamientos equilibrados están asociados con los ARNt y Tys, lo que destaca el papel de estos elementos en la activación de la inestabilidad del genoma y sugiere la recombinación homóloga no alélica como mecanismo mutacional.

(a) Se produjeron reordenamientos estructurales equilibrados (izquierda) y desequilibrados (derecha) a lo largo de la historia evolutiva de las 12 cepas. IV, inversión TL, translocación MR, reordenamiento masivo IS, inserción DL, deleción DD, duplicación dispersa TD, duplicación en tándem. (B) Las seis inversiones agrupadas en el cromosoma VII (chrVII) del S. paradoxus La región resaltada de la cepa UFRJ50816 (arriba) se muestra en el gráfico ampliado (abajo). (C) Organización del genoma de UWOPS03-461.4, UFRJ50816 y UWOPS91-917.1 en relación con la de S288C, que está libre de reordenamientos intercromosómicos a gran escala. Los diamantes blancos indican las posiciones de los centrómeros. Se utilizan diferentes colores para diferenciar el contenido de genes en diferentes ancestros. S. cerevisiae cromosomas.

Teniendo en cuenta los reordenamientos estructurales desequilibrados en los núcleos cromosómicos, identificamos 7 inserciones nuevas, 32 deleciones, 4 duplicaciones dispersas y al menos 7 duplicaciones en tándem (Fig. 3a y conjunto de datos complementarios 5). Hubo dos casos adicionales en los que la historia evolutiva no pudo determinarse con seguridad debido a múltiples orígenes independientes potenciales o deleciones secundarias (Conjunto de datos suplementarios 5). Aunque se trata de una estimación conservadora, nuestros reordenamientos estructurales desequilibrados identificados superaron claramente en número a los equilibrados, como se informó recientemente en Lachancea levaduras 38. Encontramos eso S. cerevisiae acumuló tantos reordenamientos desequilibrados como S. paradoxus a pesar de su tiempo de diversificación acumulativo mucho más corto. Notamos que los puntos de ruptura de estos reordenamientos desequilibrados (a excepción de las duplicaciones en tándem) también se asociaron con frecuencia con Tys y tRNA, reflejando nuestra observación de reordenamientos equilibrados. Finalmente, encontramos que los genes involucrados en reordenamientos desequilibrados se enriquecen significativamente para los términos de la ontología genética (GO) relacionados con la unión, transporte y desintoxicación de iones metálicos (por ejemplo, Na +, K +, Cd 2+ y Cu 2+) ( Tabla complementaria 14), lo que sugiere que estos eventos probablemente sean adaptativos.

Dinámica evolutiva estructural de subtelómeros

Los ensamblajes completos y los límites de los subtelómeros bien definidos nos permitieron examinar las regiones subteloméricas con una resolución sin precedentes. Encontramos que tanto el tamaño como el contenido génico del subtelómero son muy variables entre diferentes cepas y brazos cromosómicos (Fig. 4a y Conjunto de datos suplementarios 3). El tamaño del subtelómero osciló entre 0,13 y 76 kb (mediana = 15,6 kb), el número de genes incluidos en cada subtelómero varió entre 0 y 19 (mediana = 4), y el número total de genes subteloméricos varió entre 134 y 169 (mediana = 146) por cepa. Mientras que los subtelómeros muy cortos (por ejemplo, el cromosoma 04-R y el cromosoma 11-L) pueden explicarse por un alto grado inesperado de conservación de sintenia que se extiende hasta el final, algunos subtelómeros excepcionalmente largos son el producto de múltiples mecanismos. Por ejemplo, el subtelómero del cromosoma 15-R de S. cerevisiae DBVPG6765 se ha alargado drásticamente mediante una transferencia genética horizontal de 65 kb (HGT) 39 (Fig. 4b y Fig. 6a complementaria). El subtelómero del cromosoma 07-R de S. paradoxus CBS432 se amplió mediante una serie de duplicaciones en tándem de MAL31-gusta y MAL33-como genes, así como la adición de la ARR grupo (Fig. 4c y Fig. complementaria 6b). El subtelómero del cromosoma 15-L de S. paradoxus UFRJ50816 aumentó de tamaño por duplicaciones de segmentos subteloméricos de otros dos cromosomas (Fig. 4d y Fig. 6c complementaria). También se han producido inversiones en subtelómeros, incluida una que afecta al HMRA1HMRA2 locus en UFRJ50816 y otro que afecta a un MAL11-como gen en CBS432 (Fig. 7 complementaria).

(a) Variación de tamaño de los 32 subtelómeros ortólogos en las 12 cepas. (B) Comparación de subtelómeros del cromosoma 15-R (chr15-R) entre S. cerevisiae DBVPG6765 y S288C. El subtelómero extendido DBVPG6765 chr15-R se explica por un evento de HGT de eucariota a eucariota 39. (C) Comparación de subtelómeros del cromosoma 07-R (chr07-R) entre S. paradoxus CBS432 y N44. La expansión del subtelómero chr07-R en CBS432 se explica por una serie de duplicaciones en tándem del MAL31-gusta y MAL33-como genes y una adición de la ARR-segmento que contiene del subtelómero del cromosoma 16-R ancestral. (D) Comparación de subtelómeros del cromosoma 15-L entre S. paradoxus UFRJ50816 y YPS138. El subtelómero del cromosoma 15-L expandido en UFRJ50816 se explica por los segmentos subteloméricos reubicados de los subtelómeros del cromosoma 10-L ancestral y del cromosoma 03-R. Coordenadas de la región en BD se basan en los subtelómeros definidos en lugar de los cromosomas completos.

El enriquecimiento de los bloques de duplicación segmentaria que se producen a través de la reorganización de la secuencia ectópica es una característica común de los subtelómeros eucariotas, sin embargo, los ensamblajes incompletos del genoma han impedido el análisis cuantitativo a nivel de población de este fenómeno. Aquí identificamos bloques de duplicación subteloméricos basados ​​en comparaciones por pares de diferentes subtelómeros dentro de la misma cepa (Fig. 5a y Conjunto de datos complementarios 6). En total, identificamos 173 pares de bloques de duplicación subteloméricos en las 12 cepas, con 8 a 26 pares para cada cepa (Tabla complementaria 15). Entre los 16 pares de bloques de duplicación subteloméricos identificados previamente en S288C (mencionado anteriormente), los 12 pares más grandes pasaron nuestros criterios de filtrado. En particular, el hawaiano S. paradoxus UWOPS91-917.1 tenía la mayoría de los bloques de duplicación subteloméricos, y la mitad de estos eran específicos de la cepa, lo que sugiere una evolución de subtelómeros única en esta cepa. Los segmentos duplicados siempre mantuvieron la misma orientación centrómero-telómero, apoyando un mecanismo mutacional de reparación de rotura de doble hebra (DSB) como los sugeridos previamente en otras especies 40,41. Además, resumimos esos 173 pares de bloques de duplicación de acuerdo con los subtelómeros ortólogos involucrados. Esto dio lugar a 75 pares de subtelómeros duplicados únicos, 59 (78,7%) de los cuales no se han descrito antes (Conjunto de datos suplementarios 7). Encontramos que 31 (41,3%) de estos pares únicos se comparten entre cepas o incluso entre especies con patrones de distribución de cepas altamente dinámicos (Fig. 5b y Fig. 8a complementaria). La mayor parte (87,1%) de este patrón de intercambio no pudo explicarse por la filogenia de la cepa (Conjunto de datos suplementarios 7). Esto sugiere un proceso constante de ganancia y pérdida de duplicaciones subteloméricas a lo largo de la historia evolutiva.

(a) Un ejemplo de bloques de duplicación subteloméricos compartidos entre los subtelómeros del cromosoma 01-L (chr01-L), chr01-R y chr08-R en S. cerevisiae S288C. El sombreado gris indica regiones homólogas compartidas con una identidad de secuencia ≥90%. (B) Señales de duplicación subteloméricas compartidas entre cepas. Para cada par de subtelómeros, el número de cepas que muestran una fuerte homología de secuencia (puntuación BLAT ≥5.000 e identidad ≥90%) se indica en el mapa de calor. (C) Agrupación jerárquica basada en la proporción de subtelómeros ortólogos conservados en comparaciones cruzadas dentro de S. cerevisiae y S. paradoxus. (D) Intensidades de reorganización de subtelómeros (log10 escala) dentro S. cerevisiae (S.c.–S.c.) y dentro S. paradoxus (S.p.–S.p.), ajustado por el tiempo de diversificación del par de cepas comparado. Líneas centrales, cajas medianas, bigotes de rango intercuartílico (IQR), 1,5 × IQR. Los puntos de datos más allá de los bigotes son valores atípicos.

Dada la reorganización desenfrenada de los subtelómeros, investigamos hasta qué punto la similitud en la composición de los subtelómeros ortólogos refleja las filogenias intraespecíficas. Medimos la proporción de subtelómeros ortólogos conservados en todos los pares de cepas dentro de la misma especie y realizamos agrupaciones jerárquicas en consecuencia (Fig. 5c). El agrupamiento en S. paradoxus recapituló correctamente la verdadera filogenia, mientras que la agrupación en S. cerevisiae mostró una topología diferente, y solo se recuperó correctamente la relación del par de cepas diversificado más recientemente (DBVPG6044 versus SK1). En particular, el vino / europeo (DBVPG6765) y el sake (Y12), parientes lejanos S. cerevisiae las cepas se agruparon juntas, lo que sugiere una posible evolución de subtelómeros convergentes durante su respectiva domesticación para la producción de bebidas alcohólicas. La proporción de subtelómeros ortólogos conservados entre S. cerevisiae cepas (56,3-81,3%) es comparable a la entre S. paradoxus cepas (50,0-81,3%), a pesar de las escalas de tiempo de diversificación mucho más pequeñas de S. cerevisiae. Esto se traduce en una diferencia de 3.8 veces en la intensidad de la reorganización subtelomérica entre las dos especies durante sus respectivas diversificaciones (Mann-Whitney unilateral U-prueba, PAG = 2,93 × 10 −8) (figura 5d). La frecuente reorganización de las secuencias subteloméricas a menudo tiene un impacto drástico en el contenido de genes, tanto cualitativa como cuantitativamente. Por ejemplo, cuatro genes (PAU3, ADH7, RDS1 y AAD3) se perdieron en S. cerevisiae Y12 debido a un solo evento de duplicación subtelomérica (del cromosoma 08-L al cromosoma 03-R) (Fig. 8b complementaria). Por lo tanto, la reorganización acelerada del subtelómero en S. cerevisiae Es probable que tenga importantes implicaciones funcionales.

Estructuras terminales cromosómicas nativas no canónicas

S. cerevisiae Los extremos de los cromosomas se caracterizan por dos secuencias asociadas a los telómeros: el núcleo X y el elemento 42 Y ′. El elemento central X está presente en casi todos los extremos de los cromosomas, mientras que el número de elementos Y ′ varía entre los extremos de los cromosomas y las cepas. Las dos estructuras terminales cromosómicas descritas anteriormente tienen (i) un elemento X de un solo núcleo o (ii) un elemento X de un solo núcleo seguido de 1–4 elementos Y ′ distales 42. S. paradoxus Los extremos de los cromosomas también contienen elementos centrales X e Y '43, pero sus estructuras detalladas y distribuciones en todo el genoma no se han caracterizado sistemáticamente. En nuestras 12 cepas, la mayoría (∼ 85%) de los extremos de los cromosomas tenían una de las dos estructuras descritas anteriormente, pero también descubrimos nuevos extremos de cromosomas (Tabla complementaria 13). Encontramos varios ejemplos de duplicaciones en tándem del elemento central X en ambas especies. En la mayoría de los casos, incluidos los de la S. cerevisiae genoma de referencia (cromosoma VIII-L y cromosoma XVI-R), los elementos X del núcleo duplicado proximal se habían degenerado, pero encontramos dos ejemplos en los que se retuvieron copias duplicadas intactas: el cromosoma XII-R en S. cerevisiae Y12 y el cromosoma III-L en S. paradoxus CBS432. Este último fue especialmente notable, con seis elementos X centrales (incluidas tres copias completas) dispuestos en tándem. Descubrimos cinco extremos cromosómicos que constan solo de elementos Y ′ (una o más copias) pero no elementos X centrales. Esto fue inesperado dada la importancia de los elementos centrales X para mantener la estabilidad del genoma 44,45. El descubrimiento de estas estructuras terminales cromosómicas no canónicas ofrece un nuevo paradigma para investigar el papel funcional de los elementos X centrales.

Evolución del genoma mitocondrial

A pesar de ser altamente repetitivos y ricos en AT, los genomas mitocondriales del S. cerevisiae las cepas mostraron altos grados de colinealidad (Fig. 6a). A diferencia de, S. paradoxus Los genomas mitocondriales mostraron reordenamientos estructurales específicos de linaje. Las dos cepas euroasiáticas (CBS432 y N44) comparten una transposición de la totalidad COX3RPM1 (rnpB) - segmento de ARNr de 15 s (rns), en el que el ARNr de 15 s se invirtió aún más (Fig. 6b-d). Además, dado el orden de los genes en dos grupos externos, la MAZORCA gen fue reubicado en el antepasado común de S. cerevisiae y S. paradoxus (Figura 6e). The phylogenetic tree inferred from mitochondrial protein-coding genes showed clear deviation from the nuclear tree (Fig. 6e). In particular, the Eurasian S. paradoxus lineage (CBS432 and N44) clustered with the seven S. cerevisiae strains before joining with the other S. paradoxus strains, which supports the idea of mitochondrial introgression from S. cerevisiae 46 (Fig. 6e). We found low topology consensus (normalized quartet score = 0.59, versus 0.92 for the nuclear gene tree) across different mitochondrial gene loci, suggesting heterogeneous phylogenetic histories. Together with the drastically dynamic presence and absence patterns of mitochondrial group I and group II introns (Supplementary Table 10), this reinforces the argument for extensive cross-strain recombination in yeast mitochondrial evolution 47 . además, el COX3 gen en S. paradoxus UFRJ50816 and UWOPS91-917.1 started with GTG rather than the typical ATG start codon, which was further supported by Illumina reads. This suggests either an adoption of an alternative ATG start codon nearby (for example, 45 bp downstream) or a rare case of a near-cognate start codon 48,49,50 .

(aD) Pairwise comparisons for the mitochondrial genomes of S288C and DBVPG6044 from S. cerevisiae (a), CBS432 and YPS138 from S. paradoxus (B), S. cerevisiae S288C and S. paradoxus CBS432 (C) y S. cerevisiae S288C and S. paradoxus YPS138 (D). (mi) Genomic arrangement of the mitochondrial protein-coding genes and RNA genes across the 12 sampled strains. Left, phylogenetic tree constructed on the basis of mitochondrial protein-coding genes, with the number at each internal node showing rapid bootstrap support. The detailed gene arrangement map is shown on the right. There is a large inversion in S. arboricolus that encompasses the entire COX2ATP8 (according to its original mitochondrial genome assembly), which we inverted back this segment for better visualization.

Fully resolved SVs illuminate complex phenotypic traits

SVs are expected to account for a substantial fraction of phenotypic variation fully resolved SVs can therefore be crucial in understanding complex phenotypic traits. We used the copper tolerance–related CUP1 locus and the arsenic tolerance–related ARR cluster as examples of associations between fully characterized genomic compositions (i.e., copy numbers and genotypes) and conditional growth rates. The PacBio assemblies precisely resolved these complex loci, and phenotype associations were consistent with previous findings based on copy number analysis 6,21,51 (Fig. 7a–d and Supplementary Note). We further illustrated their phenotypic contributions via linkage mapping using 826 phased outbred lines (POLs) derived from crossing the North American (YPS128) and West African (DBVPG6044) S. cerevisiae 52 (Online Methods). The linkage analysis accurately mapped a large-effect quantitative trait locus (QTL) at the chromosome 03-R subtelomere (the location of the ARR genes in DBVPG6044), but showed no arsenic resistance association with the YPS128 ARR locus on the chromosome 16-R subtelomere (Fig. 7e). This profile is consistent with the relocation of an active ARR cluster to the chromosome 03-R subtelomere in DBVPG6044 and the presence of deleterious mutations predicted to inactivate the ARR cluster in YPS128 (refs. 6,35). Thus, a full understanding of the relationship between genome sequence and arsenic resistance phenotype is not provided by the knowledge of copy number alone but rather requires the combined knowledge of genotype, genomic location and copy number as provided by our end-to-end assemblies (Fig. 7f).

(aD) Copy number and gene arrangement of the CUP1 locus (a) y el ARR cluster (C) across the 12 strains (asterisks denote involvement of pseudogenes), and generation time of the 12 strains in high-copper (B) and high-arsenic conditions (D). (mi) The rearrangement that relocates the ARR cluster to the chromosome 03-R (chr03-R) subtelomere in the West African S. cerevisiae DBVPG6044 is consistent with the linkage mapping analysis using phased outbred lines (POLs) derived from North American (YPS128) and West African (DBVPG6044) S. cerevisiae. (F) Phenotypic distribution of the 826 POLs for generation time in arsenic condition partitioned for genotype positions at the chr03-R and chr16-R subtelomeres and inferred copies of ARR clusters (bottom). Center lines, median boxes, interquartile range (IQR) whiskers, 1.5× IQR. Data points beyond the whiskers are outliers.


Saccharomyces Genome Database

The SGD provides Internet access to the complete Saccharomyces cerevisiae genomic DNA sequence, its genes and their products, the phenotypes of its mutants, and the literature supporting these data. In the peer-reviewed literature report, experiment result on function and interaction of yeast genes are extracted by high-quality manual curation and integrated within a well-developed database. The data are combined with quality high-throughput results and post on Locus Summary pages which is a powerful query engine and rich genome browser. Based on the complexity of information collection, multiple bioinformatic tools are used to integrate information and allow productive discovery of new biological details. [2] The gold standard for functional description of budding yeast is provided by SGD resource. The SGD resource also provide a platform from which to investigate related genes and pathways in higher organisms. The amount of information and the number of features provided by SGD have increased greatly following the release of the S. cerevisiae secuencia genómica. SGD aids researchers by providing not only basic information, but also tools such as sequence similarity searching that lead to detailed information about features of the genome and relationships between genes. SGD presents information using a variety of user-friendly, dynamically created graphical displays illustrating physical, genetic and sequence feature maps. All of the data in SGD are freely accessible to researchers and educators worldwide via web pages designed for optimal ease of use. [2]

Biocurator includes review of the published literature or sets of data, leading to the identification and abstraction of key results. The result then incorporated into database and use controlled vocabularies to associated with appropriate genes or chromosomal regions. As more data being recorded, biocuration is becoming more important for biomedical research.

SGD keep reference genome sequence for the budding yeast S.cerevisiae. SGD are the source of the genome sequence for S. cerevisiae S288C strain background, includes catalog of genes and chromosomal feature of genome.

One of important function of SGD is biocuration of the yeast literature. SGD biocurators search all the scientific literature that relevant to S. cerevisiae, read the papers and capture their major finding in various defined fields of the database. [2]

The biocurators at SGD aim to annotate each gene by identifying function(s) from primary literature and linking to terms using the structured knowledge representation in the gene ontology. [3] Additionally, functions identified from high throughput experiments as well as computationally predicted function annotations are included from GO Annotation project. [4]

Biochemical pathways are manually curated by SGD and provided using the Pathway Tools browser version 15.0 (13). The SGD biochemical pathways data set for S. cerevisiae, one of the most highly curated data sets among all Pathway Tools data sets available, is the gold standard for budding yeast SGD supports an ongoing effort to update and enhance these data. The Pathway Tools interface provides a complete description of each pathway, with molecular structures, E.C. numbers and full reference listing. The updated pathways browser provides several enhanced features, including download of a list of genes found in a pathway for further analysis with other tools available at SGD. The pathway browser is hyperlinked via the ‘Pathways’ section of the Locus Summary page. The Pathway display is available from http://pathway.yeastgenome.org. [2]

SGD continues to maintain the S. cerevisiae genomic nomenclature. The job is to promote the community-defined nomenclature standards and to ensure that the agreed-upon guidelines are followed in naming new genes or assigning new names to previously identified genes. Community guidelines state that the first published name for a gene becomes the standard name. However, prior to publication, a gene name may be registered and displayed in SGD in order to notify the community of its intended use. If there are disagreements or naming conflicts, we communicate with the relevant researchers within the community and negotiate an agreement whenever possible. The majority of those working on the gene in question must agree to any nomenclature change before it is implemented in SGD. In addition to maintaining genetic names, SGD ensures that the names of ORFs, ARS elements, tRNAs and other chromosomal features also conform to agreed-upon formats. Over the past two years 154 new gene names have been assigned and 21 community-initiated name changes have been processed. [2]

There are several different analysis tools provided by SGD.

EXPLOSIÓN, Basic Local Alignment Sbuscar Tool, the program is designed to find similar regions between biological sequences. SGD allows users to run BLAST searches of S. cerevisiae sequence datasets.

Fungal BLAST allows searches between multiple fungal sequences

Gene Ontology (GO) Term Finder searches for significant shared GO terms or their parents, and is used to describe the genes queried to help users discover what the gene have in common.

GO Slim Mapper maps annotations of a group of genes to more general terms and/or bins them into broad categories.

Pattern Matching is a resource that allows users to search for short nucleotide or peptide sequences of less than 20 residues, or ambiguous/degenerate patterns.

Restriction Analysis allows users to perform a restriction analysis by entering a sequence name or arbitrary DNA sequence [5]


Part 3: using BLAST to transfer functional information by finding homologs

Homo-, Ortho- and Paralogs

One of the most common ways to use BLAST as a tool, is in the situation where you have a sequence of unknown function, and want to find out which function it has. Since a large amount of sequence data has been gathered during the years, chances are that an evolutionarily related sequence with known function has already been identified. In general such a related sequence is known as a "homólogo".

  • A Homólogo is a general term that describes a sequence that is related by any evolutionary means.
  • Un Ortólogo ("Ortho" = True) is a sequence that is "the same gene" in a different organism: The sequences shared a single common ancestor sequence, and has now diverged through speciation (e.g. the Alpha-globin gene in Human and Mouse).
  • A Parálog arises due to a gene duplication within a species. For example Alpha- and Beta-globin are each others paralogs.

Notice that in both cases it's possible to transfer information, for example information about gene family / protein domains. We have already touched upon comparison of (potentially) evolutionarily related sequences in the pairwise alignment exercise. However, this time we do not start out with two sequences we assume are related, but we rather start out with a single sequence ("query sequence") which we will use to search the databases for homologs (we often informally speak of "BLAST hits", when discussing the sequences found).

BLAST example 1

Let's start out with a sequence that will produce some good hits in the database. The sequence below is a full-length transcript (mRNA) from a prokaryote. Let's find out what it is.

BLASTN search

Perform a BLAST search in the NR/NT database (BLASTN) using default settings. Remember to set Expect threshold back to the default value, 10. (2021 update: The new default is 0.05, that should work fine as well).

BLASTP search

Now let's try to do the same at the protein level.

  • Find the longest ORF using VirtualRibosome (hint: remember to search all positive reading frames) and save of copy the sequence in FASTA format.
  • BLAST the sequence (BLASTP) against the NR database.

  • Report your translated protein sequence in FASTA format.
  • Do we find any conserved protein domains? (Haga clic en el Graphic Summary tab). Identifying known protein domains can provide important clues to the function of an unknown protein.
  • Do we find any significant hits? (E-value?)
  • Are all the best hits the same category of enzymes?
  • From what you have seen, what is best for identifying intermediate quality hits - DNA or Protein BLAST?

BLAST example 2

In the previous section we have been cheating a bit by using a sequence that was already in the database - let's move on to the following sequence instead.

The sequence is a DNA fragment from an unknown non-cultivatable microorganism. It was cloned and sequenced directly from DNA extracted from a soil-sample, and it goes by the poetic name "CLONE12". It was amplified using degenerated PCR primers that target the middle ("core cloning") of the sequence of a group of known enzymes. (I can guarantee this particular sequence is not in the BLAST databases, since I have cloned and sequenced it myself, and it has never been submitted to GenBank).


INSTRUCTIONS: You are free to write the combined answer to this question in a free-style essay-like fashion - just be sure to include the subquestions in your answers. In an exam situation you will need to put all the clues together yourself, reason about the tools/databases to use, and document your findings.


STEP 1 - cleaning up the sequence:

The sequence is (more or less) in GenBank format and the NCBI BLAST server expects the input to be in FASTA format, or to be "raw" unformatted sequence.

  • There are two solutions to this:
    • Copy the sequence into a text-editor and manually create a FASTA file ("search and replace" and/or "rectangular selection" is useful for the reformatting).
      This is the most robust solution: it will always work. (Look at the JEdit exercise for a reminder of how to do this).
    • Hope the creators of the web-server you're using were kind enough to automatically remove non-DNA letters (paste in ONLY the DNA lines) - this turns out to be the case for both NCBI BLAST and VirtualRibosome, but it cannot be universally relied upon.

    Subquestion: convert the sequence to FASTA format (manually, in JEdit) and quote it in your report.


    STEP 2 - thinking about the task:

    Consider the following before you start on solving this task:

    • Based on the information given: is the sequence protein-coding?
    • If it is, can you trust it will contain both a START and STOP codon?
    • Do we know if the sequence is sense or anti-sense?

    and think which consequences the answers to these questions should have for your choice of methods and parameters.

    Subquestion: Give a summary of your considerations.


    STEP 3 - Performing the database search:

    Significado: We will put the criteria for significance at 1e-10 (remember: the higher the E-value, the worse the significance).

    Cover the following in your answer:

    • What tool(s) and database(s) will be relevant to use?
    • Document the results from the different BLAST searches - what works and what does not work?
    • You need to copy in small snippets of the BLAST results to document what you observe.
    • In conclusion: What kind of enzyme is CLONE12? Gather as much evidence as possible.

    Saccharomyces base de datos del genoma

    El objetivo de la Saccharomyces Genome Database (SGD) is to provide information about the genome of this yeast, the genes it encodes, and their biological functions. La secuencia del genoma de S. cerevisiae provides the structure around which information in SGD is organized value is added to the sequence by careful biological annotation drawn from a number of sources. SGD curates and stores information about budding yeast DNA and protein sequences, genetics, cell biology, and the associated community of researchers. SGD also provides search and analysis tools designed to help researchers mine the data for pieces or patterns of biological information relevant to their interests. A continuing challenge for the staff of SGD is to present up-to-date information about yeast genes in a format that is intuitive and useful to biomedical researchers, while responding to the needs of this community by providing resources and tools for exploring the data in new ways. This chapter describes the organization of SGD, the sources of the data stored in SGD, some methods for retrieving information from the database, connections SGD has with outside databases and non-yeast research communities, and SGD's repository of yeast community information.


    Omics analysis of acetic acid tolerance in Saccharomyces cerevisiae

    Acetic acid is an inhibitor in industrial processes such as wine making and bioethanol production from cellulosic hydrolysate. It causes energy depletion, inhibition of metabolic enzyme activity, growth arrest and ethanol productivity losses in Saccharomyces cerevisiae. Therefore, understanding the mechanisms of the yeast responses to acetic acid stress is essential for improving acetic acid tolerance and ethanol production. Although 329 genes associated with acetic acid tolerance have been identified in the Saccharomyces genome and included in the database ( http://www.yeastgenome.org/observable/resistance_to_acetic_acid/overview ), the cellular mechanistic responses to acetic acid remain unclear in this organism. Post-genomic approaches such as transcriptomics, proteomics, metabolomics and chemogenomics are being applied to yeast and are providing insight into the mechanisms and interactions of genes, proteins and other components that together determine complex quantitative phenotypic traits such as acetic acid tolerance. This review focuses on these omics approaches in the response to acetic acid in S. cerevisiae. Additionally, several novel strains with improved acetic acid tolerance have been engineered by modifying key genes, and the application of these strains and recently acquired knowledge to industrial processes is also discussed.

    Palabras clave: Acetic acid tolerance Industrial strain Omics analysis Post-genomic approach Saccharomyces cerevisiae.


    Ver el vídeo: Proyecto Genoma Humano (Junio 2022).