Información

¿Por qué la secuenciación de Sanger es inferior para detectar SNP en células cancerosas?

¿Por qué la secuenciación de Sanger es inferior para detectar SNP en células cancerosas?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Estoy familiarizado con la secuenciación de Sanger, pero al nivel de un estudiante universitario. Un profesor mío trató de describir la secuenciación de Sanger como perder la información de la secuencia en el ruido cuando se usa para detectar cáncer. Este artículo también dice que "carece de sensibilidad suficiente para detectar alelos mutantes en biopsias de tumores" (Thomas et al., 2006). ¿Qué tiene Sanger que lo hace demasiado insensible para el análisis SNP?

Thomas, R., K., et al. (2006) Detección de mutaciones sensibles en muestras de cáncer heterogéneas mediante secuenciación masiva en paralelo del reactor de picolitros. Nat. Medicina. 12, 852-855


En el enfoque de Sanger, el ADN se aislaría de la biopsia y contendría tanto alelos normales como alelos mutantes de genes asociados con el desarrollo del tumor. Si, por ejemplo, se utilizara la amplificación por PCR para derivar una muestra de una región de plantilla diana, este material terminaría siendo secuenciado como una población mixta: la secuencia derivada sería un promedio de esa población de secuencias, y los alelos raros serían enmascarado.

La diferencia clave en la mayoría de los enfoques de próxima generación es que la plantilla de ADN se "clona" físicamente (por ejemplo, secuestrando moléculas individuales en gotitas o uniéndolas a una superficie) para que las secuencias de estas moléculas individuales se puedan determinar en paralelo. Este enfoque revelaría polimorfismos asociados a tumores cuando se compararan las secuencias de las moléculas de plantilla individuales.

Agregado más adelante como información complementaria.

Ahora he examinado el documento citado en la pregunta. Esta cita de la Introducción confirma mi punto principal sobre la secuenciación de una mezcla de plantillas que difieren en solo unas pocas posiciones clave.

Aunque se usa comúnmente en muchos entornos clínicos, la secuenciación de terminación de la cadena de didesoxinucleótidos (o 'Sanger') de los productos de PCR a menudo carece de sensibilidad suficiente para detectar alelos mutantes en biopsias de tumores, donde la tasa de falla ha alcanzado el 75% en algunos casos. Las mutaciones oncogénicas de ganancia de función son frecuentemente eventos heterocigotos o pueden representar un solo alelo de un gen amplificado; por tanto, la señal de los residuos mutados se reduce típicamente en relación con las bases vecinas. Además, la capacidad de detectar mutaciones de una sola base o pequeñas inserciones o deleciones en el material de biopsia mediante secuenciación de Sanger depende en gran medida de la pureza de la muestra (por ejemplo, el grado de contaminación del ADN estromal) y de la integridad del ADN genómico. Además, la resistencia a los inhibidores de cinasa puede correlacionarse con mutaciones de segundo sitio de baja frecuencia. Estas observaciones subrayan los desafíos para la detección precisa de mutaciones en muestras de cáncer.

Un enfoque de secuenciación por síntesis masivamente paralelo, 'pirosecuenciación en placa de picotiter', proporciona una nueva alternativa a la secuenciación de Sanger. Este enfoque se basa en la amplificación clonal basada en PCR en emulsión de una biblioteca de ADN adaptada en perlas de tamaño micrométrico y la posterior pirosecuenciación por síntesis de cada plantilla amplificada clonalmente en una placa de picotiter, generando más de 200.000 lecturas de secuenciación clonal únicas por experimento. Las variantes de secuencia que representan una fracción de una muestra compleja se pueden sobremuestrear enormemente, lo que permite una cuantificación estadísticamente significativa de variantes de baja abundancia.


Análisis comparativo sistemático de métodos de detección de variantes de un solo nucleótido a partir de datos de secuenciación de ARN de una sola célula

El interrogatorio sistemático de variantes de un solo nucleótido (SNV) es uno de los enfoques más prometedores para delinear la heterogeneidad celular y las relaciones filogenéticas a nivel unicelular. Si bien la detección de SNV a partir de abundantes datos de secuenciación de ARN unicelular (scRNA-seq) es aplicable y rentable para identificar variantes expresadas, inferir subclones y descifrar enlaces genotipo-fenotipo, hay una falta de métodos computacionales desarrollados específicamente para SNV llamando en scRNA-seq. Aunque los llamadores variantes para la secuencia de ARN en masa se han utilizado esporádicamente en la secuencia de ARNc, no se han evaluado los rendimientos de diferentes herramientas.

Resultados

Aquí, realizamos una comparación sistemática de siete herramientas, incluidas SAMtools, la canalización GATK, CTAT, FreeBayes, MuTect2, Strelka2 y VarScan2, utilizando conjuntos de datos de simulación y scRNA-seq, e identificamos múltiples elementos que influyen en su rendimiento. Si bien las especificidades son generalmente altas, con sensibilidades que superan el 90% para la mayoría de las herramientas cuando se llaman SNV homocigotos en regiones de codificación de alta confianza con profundidades de lectura suficientes, dichas sensibilidades disminuyen drásticamente cuando se llaman SNV con profundidades de lectura bajas, frecuencias de alelos variantes bajas o en específico contextos genómicos. SAMtools muestra la mayor sensibilidad en la mayoría de los casos, especialmente con lecturas de apoyo bajas, a pesar de la especificidad relativamente baja en intrones o regiones de alta identidad. Strelka2 muestra un rendimiento consistentemente bueno cuando se proporcionan suficientes lecturas de apoyo, mientras que FreeBayes muestra un buen rendimiento en los casos de altas frecuencias de alelos variantes.

Conclusiones

Recomendamos SAMtools, Strelka2, FreeBayes o CTAT, según las condiciones específicas de uso. Nuestro estudio proporciona la primera evaluación comparativa para evaluar el rendimiento de diferentes herramientas de detección de SNV para datos de scRNA-seq.


Descripción general del flujo de trabajo

Thermo Fisher Scientific ha integrado todas las herramientas necesarias para la edición del genoma y el análisis posterior (Figura 1). La herramienta de diseño Invitrogen ™ GeneArt ™ facilita el diseño y la ordenación de ARNg específicos de objetivos para la edición del genoma mediada por CRISPR o TAL para la edición del genoma mediada por TALEN. Los reactivos de transfección de Invitrogen ofrecen varias opciones para la entrega de herramientas de edición del genoma en células eucariotas. Además, los vectores de clonación Invitrogen TOPO ™ TA y las células competentes facilitan el análisis de secuencia de transformantes primarios. El medio Gibco ™ está disponible para hacer crecer los transformantes primarios y los cultivos secundarios después de la expansión clonal. Finalmente, los instrumentos y reactivos de secuenciación de Applied Biosystems permiten la determinación de eventos específicos de edición genómica. En esta nota de aplicación, demostramos cómo este flujo de trabajo se combina para generar e identificar mutaciones en el gen de la hipoxantina fosforribosil transferasa humana (HPRT).

En la Figura 2 se muestra una breve descripción general de los pasos utilizados para generar y analizar un cultivo primario con mutaciones de HPRT. La secuencia de ARN CRISPR (crRNA) específica de la diana dentro del ARNg se diseñó para un locus específico de HPRT. El gRNA se sintetizó mediante transcripción in vitro utilizando el kit de síntesis de gRNA de Invitrogen GeneArt Precision. Después de la síntesis y purificación, el ARNg se cotransfectó con ARNm de Cas9 en células 293FT usando el reactivo de transfección Invitrogen Lipofectamine ™ MessengerMAX ™. Las células se recolectaron 78 horas después de la transfección. Los lisados ​​celulares se usaron luego junto con cebadores que flanqueaban la diana de HPRT para generar amplicones de PCR de no más de 600 pb de longitud. A continuación, los productos de la PCR se subclonaron usando el kit de clonación de PCR Invitrogen Zero Blunt ™ TOPO y se transformaron en células de E. coli Invitrogen TOP10. Se seleccionaron noventa y seis colonias bacterianas por grupo transformado de células editadas genéticamente y se procesaron para el aislamiento de ADN utilizando el sistema de purificación de plásmidos Invitrogen PureLink ™ 96 y se sometieron a secuenciación Sanger. Los datos de secuenciación resultantes se analizaron luego para medir el porcentaje de productos de PCR que contienen la secuencia editada con precisión y para seleccionar qué aislados clonales mantener. Alternativamente, aunque no se realizó para este estudio, el producto de PCR podría secuenciarse directamente, sin subclonar en células TOPO.

Figura 1. Flujo de trabajo general para la edición del genoma CRISPR. Thermo Fisher Scientific proporciona las herramientas, los reactivos y la experiencia necesarios para el éxito en cada paso del flujo de trabajo.

Figura 2. Pasos para determinar la eficiencia de una edición usando la clonación TOPO y secuenciación Sanger por CE. 1. Transfecte el ARNg y el ARNm de Cas9 en las células. 2. Incubar las células para permitir el procesamiento del cambio genómico. 3. Purifique el ADN genómico del cultivo celular, amplifique por PCR el locus diseñado del cultivo heterogéneo y clone los fragmentos de PCR en el vector TOPO. 4. Aísle los plásmidos de colonias individuales y amplifique el inserto mediante PCR. 5. Secuencia del inserto. La eficiencia de la edición es la relación entre el número de inserciones con un cambio de ingeniería y el número total de inserciones secuenciadas. Una mayor eficiencia probablemente resultará en menos clones secundarios que deban ser examinados para identificar células específicas con el cambio.


El desarrollo de tecnologías de secuenciación de ARN.

No fue hasta 1953 cuando Watson y Crick propusieron la estructura de doble hélice que la gente realmente se dio cuenta a nivel molecular de que la esencia de la vida es el resultado de interacciones genéticas [4]. El desarrollo continuo de la secuenciación de ARN ha marcado el comienzo del análisis de transcriptomas en una nueva era, con mayor eficiencia y menor costo. La línea de tiempo de las tecnologías de secuenciación de ARN se muestra en la Fig.1.

El cronograma de desarrollo de las tecnologías de secuenciación de ARN

La tecnología de secuenciación de primera generación también se denomina secuenciación de Sanger. El método de terminación de cadena fue iniciado por Sanger en 1977, seguido por el método de degradación química desarrollado por Maxam y Gilbert [5, 6]. El mismo año, Sanger determinó el genoma de 5368 pb del fago φX174, que es el primer genoma de ADN secuenciado [7]. La micromatriz de ADN ha contribuido a un progreso significativo en muchos campos desde que se introdujo por primera vez. Sin embargo, los microarrays requieren un conocimiento previo de las secuencias de genes y son incapaces de identificar la expresión de genes nuevos [8]. Después de que apareciera la primera plataforma de secuenciación de alto rendimiento en 2005 [1], siguieron varias plataformas de secuenciación de próxima generación (Tabla 1, Figs. 2, 3). La precisión y reproducibilidad entre las diferentes plataformas dependían de varios factores, incluidas las características inherentes de la plataforma y los correspondientes canales de análisis [9, 10]. La pirosecuenciación que dejó de ser compatible después de 2016, desarrollada por 454 Life Sciences, utilizó un método de “secuenciación por síntesis” [1, 11,12,13]. La plataforma de secuenciación de torrente de iones también se basa en el método de "secuenciación por síntesis", que supera a la pirosecuenciación con respecto a la sensibilidad. SOLiD (Secuenciación por Ligación y Detección de Oligonucleótidos) exhibe una alta precisión, ya que cada base se secuencia dos veces, pero la longitud de lectura es corta [11,12,13]. DNBS (secuenciación de nanobolas de ADN) permite una gran colección de nanobolas de ADN para la secuenciación simultánea. La tecnología de secuenciación basada en Illumina representa un método de "secuenciación de terminación reversible". La secuenciación de alto rendimiento tiene la ventaja de una velocidad rápida, un bajo costo de secuenciación y una alta precisión, también conocida como secuenciación de próxima generación (NGS). En comparación con los microarrays, puede detectar secuencias de expresión génica desconocidas, pero requiere mucho tiempo [14].

Extracción de ARN y preparación de plantillas antes de la secuenciación de ARN. El ARN se extrajo de los tejidos y, después de la fragmentación, las moléculas de ADN fragmentadas se convirtieron en ADNc mediante transcripción inversa y luego se amplificaron mediante PCR en emulsión o PCR puente para preparar la biblioteca de secuenciación.

Tres tipos de métodos de secuenciación. Estos métodos contienen secuenciación por síntesis, secuenciación por terminador reversible y secuenciación por ligación. Y sus diferentes mecanismos se muestran en detalle

Además de NGS, hay secuenciación de tercera generación, que permite la secuenciación de lectura larga de moléculas de ARN individuales [15]. La secuenciación de ARN de una sola molécula permite la generación de transcripciones de ADNc de longitud completa sin amplificación clonal o ensamblaje de transcripciones. Por tanto, la secuenciación de tercera generación está libre de las deficiencias generadas por la amplificación por PCR y el mapeo de lectura. Puede reducir en gran medida la tasa de falsos positivos de los sitios de empalme y capturar la diversidad de isoformas de transcripción [15]. Las plataformas de secuenciación de una sola molécula comprenden la secuenciación de una sola molécula en tiempo real (SMRT) de Pacific Biosciences (PacBio) [16], la secuenciación fluorescente de una sola molécula Helicos [17] y la secuenciación de nanoporos de Oxford Nanopore Technologies (ONT) [18]. Además, RNA-seq evolucionó recientemente de la secuenciación masiva a la secuenciación unicelular. La secuenciación de ARN unicelular se publicó por primera vez en 2009 para perfilar el transcriptoma a una resolución unicelular [19]. Drop-Seq e InDrop se informaron inicialmente en 2015 mediante el análisis de transcriptomas de células de la retina de ratón y células madre embrionarias, identificando nuevos tipos de células. Sci-RNA-seq, secuenciación de ARN de indexación combinatoria de una sola célula, se desarrolló en 2017, y SPLiT-seq (secuenciación de transcriptomas basada en ligación de grupo dividido) se informó por primera vez en 2018. Ambos enfoques utilizan una estrategia de indexación combinatoria en la que se adjuntan ARN están etiquetados con códigos de barras que indican su origen celular [20, 21].

Aunque los datos de una sola celda permiten la transcriptómica de una sola celda, pueden perder información espacial durante el aislamiento de una sola celda. Para resolver este problema, ha surgido la transcriptómica espacial. La transcriptómica espacial emplea códigos de barras posicionales únicos para visualizar las distribuciones de ARN en la secuenciación de ARN de secciones de tejido y se publicó por primera vez en 2016 [22]. Slide-seq, publicado en 2019, utiliza perlas de códigos de barras de ADN con información posicional específica [23]. Geo-seq se introdujo en 2017 e integró scRNA-seq con microdisección por captura láser (LCM), que puede aislar células individuales [24]. La secuenciación in situ se refiere a la secuenciación dirigida de fragmentos de ARN en tejidos o células conservados morfológicamente sin extracción de ARN, incluida la síntesis de ADNc in situ mediante sondas de candado o amplicones de ADNc entrecruzados de forma estable en secuenciación de ARN in situ fluorescente (FISSEQ) y amplificación in situ por laminación -amplificación circular (RCA) [25, 26]. Además, se han desarrollado varias tecnologías nuevas basadas en RNA-seq para aplicaciones específicas. Por ejemplo, un tipo de secuenciación de ARN dirigido, CaptureSeq, emplea sondas de oligonucleótidos biotinilados y da como resultado el enriquecimiento de ciertas transcripciones para identificar la fusión de genes [27, 28].


Referencias

Darwin, C. En el origen de las especies (Prensa de John Murray, 1859).

Luria, S. E. & amp Delbrück, M. Mutaciones de bacterias de sensibilidad a virus a resistencia a virus. Genética 28, 491–511 (1943).

Cairns, J. Selección de mutaciones y la historia natural del cáncer. Naturaleza 255, 197–200 (1975).

Fisher, R. y col. La secuenciación profunda revela mutaciones menores de resistencia a la proteasa en pacientes que fallan en un régimen de inhibidores de la proteasa. J. Virol. 86, 6231–6237 (2012).

Schmitt, M. W., Loeb, L. A. & amp Salk, J. J. La influencia de las mutaciones de resistencia subclonal en la terapia dirigida contra el cáncer. Nat. Rev. Clin. Oncol. 13, 335–347 (2016).

Maher, G. J. y col. Visualización de los orígenes de mutaciones egoístas de novo en túbulos seminíferos individuales de testículos humanos. Proc. Natl Acad. Sci. Estados Unidos 113, 2454–2459 (2016).

Kennedy, S. R., Loeb, L. A. & amp Herr, A. J. Mutaciones somáticas en el envejecimiento, el cáncer y la neurodegeneración. Mech. Envejecimiento Dev. 133, 118–126 (2012).

Vijg, J. Mutaciones somáticas, mosaicismo del genoma, cáncer y envejecimiento. Curr. Opin. Gineta. Dev. 26, 141–149 (2014).

Shendure, J. y col. Secuenciación de ADN a los 40: pasado, presente y futuro. Naturaleza 550, 345–353 (2017).

Goodwin, S., Mcpherson, J. D. & amp Mccombie, W. R. Mayoría de edad: diez años de tecnologías de secuenciación de próxima generación. Nat. Rev. Genet. 17, 333–351 (2016).

Sanger, F., Nicklen, S. & amp Coulson, A. R. Secuenciación de ADN con inhibidores de terminación de cadena. Proc. Natl Acad. Sci. Estados Unidos 74, 5463–5467 (1977). Una de las dos metodologías de secuenciación de ADN ganadoras del premio Nobel publicadas en 1977 (la otra es la de Maxam y Gilbert). El enfoque de Sanger formó la base del Proyecto Genoma Humano.

Ley, T. J. et al. Secuenciación del ADN de un genoma de leucemia mieloide aguda citogenéticamente normal. Naturaleza 456, 66–72 (2008).

Zagordi, O., Klein, R., Däumer, M. & amp Beerenwinkel, N. Corrección de errores de datos de secuenciación de próxima generación y estimación confiable de cuasiespecies del VIH. Ácidos nucleicos Res. 38, 7400–7409 (2010).

Parsons, B. L. & amp Heflich, R. H. Métodos de selección genotípica para el análisis directo de mutaciones puntuales. Mutat. Res. 387, 97–121 (1997).

Bielas, J. H. & amp Loeb, L. A. Cuantificación de mutaciones genómicas aleatorias. Nat. Métodos 2, 285–290 (2005).

Li, J. y col. La sustitución de la PCR por COLD-PCR enriquece las secuencias de ADN variantes y redefine la sensibilidad de las pruebas genéticas. Nat. Medicina. 14, 579–584 (2008).

Sykes, P. J. y col. Cuantificación de dianas para PCR mediante el uso de dilución limitante. Biotecnología 13, 444–449 (1992).

Vogelstein, B. y Kinzler, K. W. Digital, P. C. R. Proc. Natl Acad. Sci. Estados Unidos 96, 9236–9241 (1999).

Hindson, B. J. y col. Sistema de PCR digital de gotas de alto rendimiento para la cuantificación absoluta del número de copias de ADN. Anal. Chem. 83, 8604–8610 (2011).

Fox, E. J., Reid-Bayliss, K. S., Emond, M. J. & amp Loeb, L. A. Precisión de las plataformas de secuenciación de próxima generación. Next Gener. Seq. Apl. 1, 1000106 (2014).

Blokzijl, F. et al. Acumulación de mutaciones específicas de tejido en células madre adultas humanas durante la vida. Naturaleza 538, 260–264 (2016).

Ewing, B. & amp Green, P. Llamada base de trazas de secuenciador automático usando phred. II. Probabilidades de error. Genome Res. 8, 186–194 (1998). Entre los primeros y más importantes usos de métodos estadísticos rigurosos para asignar un grado de certeza a los datos de secuenciación del ADN.

Cock, P. J. A., Fields, C. J., Goto, N., Heuer, M. L. & amp Rice, P. M. El formato de archivo Sanger FASTQ para secuencias con puntuaciones de calidad y las variantes Solexa / Illumina FASTQ. Ácidos nucleicos Res. 38, 1767–1771 (2010).

Cibulskis, K. et al. Detección sensible de mutaciones puntuales somáticas en muestras de cáncer impuras y heterogéneas. Nat. Biotechnol. 31, 213–219 (2013).

Koboldt, D. C. et al. VarScan 2: descubrimiento de la mutación somática y la alteración del número de copias en el cáncer por secuenciación del exoma. Genome Res. 22, 568–576 (2012).

Wang, Q. et al. Detección de mutaciones puntuales somáticas en los datos de secuenciación del genoma del cáncer: una comparación de los llamadores de mutaciones. Genome Med. 5, 91 (2013).

Li, H. Alineación de lecturas de secuencia, secuencias de clonación y contigs de ensamblaje con BWA-MEM. Preimpresión en ArXiV arXiv: 1303.3997v2 [q-bio.GN] (2013).

Wei, Z., Wang, W., Hu, P., Lyon, G. J. & amp Hakonarson, H. SNVer: una herramienta estadística para llamadas de variantes en el análisis de datos de secuenciación de próxima generación agrupados o individuales. Ácidos nucleicos Res. 39, e132 – e132 (2011).

Wilm, A. y col. LoFreq: un llamador de variantes ultrasensible y consciente de la calidad de la secuencia para descubrir la heterogeneidad de la población celular a partir de conjuntos de datos de secuenciación de alto rendimiento. Ácidos nucleicos Res. 40, 11189–11201 (2012).

Gerstung, M. y col. Detección confiable de variantes subclonales de un solo nucleótido en poblaciones de células tumorales. Nat. Comun. 3, 811 (2012).

Costello, M. y col. Descubrimiento y caracterización de mutaciones de artefactos en datos de secuenciación de captura dirigida de cobertura profunda debido al daño oxidativo del ADN durante la preparación de la muestra. Ácidos nucleicos Res. 41, e67 – e67 (2013).

Chen, L., Liu, P., Evans, T. C. & amp Ettwiller, L. M. El daño al ADN es una causa generalizada de errores de secuenciación, que confunden directamente la identificación de variantes. Ciencias 355, 752–756 (2017).

Schirmer, M., D'Amore, R., Ijaz, U.Z., Hall, N. & amp Quince, C. Perfiles de error de Illumina: resolución de variaciones de escala fina en datos de secuenciación metagenómica. Bioinformática BMC 17, 125 (2016).

Martincorena, I. et al. Evolución del tumor. Alta carga y selección positiva generalizada de mutaciones somáticas en piel humana normal. Ciencias 348, 880–886 (2015).

Welch, J. S. et al. El origen y evolución de las mutaciones en la leucemia mieloide aguda. Celda 150, 264–278 (2012).

Nik-Zainal, S. et al. Panorama de mutaciones somáticas en 560 secuencias del genoma completo del cáncer de mama. Naturaleza 534, 47–54 (2016).

Kircher, M., Sawyer, S. & amp Meyer, M. La indexación doble supera las inexactitudes en la secuenciación múltiple en la plataforma Illumina. Ácidos nucleicos Res. 40, e3 (2012). Una descripción importante de lo común de las quimeras de PCR, los duplicados ópticos y el intercambio de índices que se produce durante la preparación de la biblioteca NGS y la formación de polonias. Esto contribuyó a la práctica ahora común de la indexación dual para aplicaciones sensibles a errores.

Potapov, V. & amp Ong, J. L. Examen de las fuentes de error en la PCR mediante secuenciación de una sola molécula. MÁS UNO 12, e0169774 (2017).

Brodin, J. y col. Las transiciones inducidas por PCR son la principal fuente de error en los datos depurados de pirosecuenciación ultraprofunda. MÁS UNO 8, e70388 (2013).

Star, B. et al. Artefactos de secuencia palindrómica generados durante la preparación de la biblioteca de secuenciación de próxima generación a partir de ADN histórico y antiguo. MÁS UNO 9, e89676 (2014).

Van Allen, E. M. y col. Secuenciación del exoma completo e interpretación clínica de muestras tumorales incluidas en parafina y fijadas con formalina para orientar la medicina de precisión contra el cáncer. Nat. Medicina. 20, 682–688 (2014).

Arbeithuber, B., Makova, K. D. & amp Tiemann-Boege, I. Las mutaciones artificiales resultantes de las lesiones del ADN limitan los niveles de detección en aplicaciones de secuenciación ultrasensible. DNA Res. 23, 547–559 (2016).

Lindahl, T. & amp Nyberg, B. Tasa de depurinación del ácido desoxirribonucleico nativo. Bioquímica 11, 3610–3618 (1972).

Knierim, E., Lucke, B., Schwarz, J. M., Schuelke, M. & amp Seelow, D. Comparación sistemática de tres métodos para la fragmentación de productos de PCR de largo alcance para la secuenciación de próxima generación. MÁS UNO 6, e28240 (2011).

Do, H. & amp Dobrovic, A. Secuencia de artefactos en el ADN de tejidos fijados con formalina: causas y estrategias para su minimización. Clin. Chem. 61, 64–71 (2015).

Lou, D. I. y col. Los errores de secuenciación de ADN de alto rendimiento se reducen en órdenes de magnitud mediante la secuenciación circular. Proc. Natl Acad. Sci. Estados Unidos 110, 19872–19877 (2013). La primera descripción importante de secuenciación de consenso por duplicación en tándem de moléculas de biblioteca. Aunque es un desafío para los secuenciadores de lectura corta, es probable que este concepto se vuelva muy importante a medida que los secuenciadores de una sola molécula mejoren en los próximos años.

Chen, G., Mosier, S., Gocke, C. D., Lin, M.-T. & amp Eshleman, J. R. La desaminación de la citosina es una de las principales causas del ruido de referencia en la secuenciación de próxima generación. Mol. Diagn. El r. 18, 587–593 (2014).

Schaaper, R. M., Kunkel, T. A. & amp Loeb, L. A. Infidelidad de la síntesis de ADN asociada con el desvío de sitios apurínicos. Proc. Natl Acad. Sci. Estados Unidos 80, 487–491 (1983).

Sagher, D. & amp Strauss, B. Inserción de nucleótidos opuestos a sitios apurínicos / apirimidínicos en ácido desoxirribonucleico durante la síntesis in vitro: singularidad de los nucleótidos de adenina. Bioquímica 22, 4518–4526 (1983).

Nishimura, S. 8-Hydroxyguanine: una base para el descubrimiento. Reparación de ADN 10, 1078–1083 (2011).

Sinha, R. y col. El cambio de índice provoca la "propagación de la señal" entre las muestras multiplexadas en la secuenciación de ADN de Illumina HiSeq 4000. https://doi.org/10.1101/125724 (2017).

Hiatt, J. B., Turner, E. H., Patwardhan, R. P., Caperton, L. & amp Shendure, J. Secuenciación de ADN de próxima generación para el ensamblaje del genoma de novo. Foro de investigación médica de estudiantes occidentales (2009).

Hiatt, J. B., Patwardhan, R. P., Turner, E. H., Lee, C. & amp Shendure, J. Montaje paralelo, dirigido por etiquetas de lecturas de secuencia corta derivadas localmente. Nat. Métodos 7, 119–122 (2010). La primera descripción de la secuenciación por consenso de la PCR se duplica para la corrección de errores, tanto con UMI como sin ella.

Casbon, J. A., Osborne, R. J., Brenner, S. & amp Lichtenstein, C. P. Un método para contar moléculas de plantilla de PCR con aplicación a la secuenciación de próxima generación. Ácidos nucleicos Res. 39, e81 (2011).

Kinde, I., Wu, J., Papadopoulos, N., Kinzler, K. W. & amp Vogelstein, B. Detección y cuantificación de mutaciones raras con secuenciación masivamente paralela. Proc. Natl Acad. Sci. Estados Unidos 108, 9530–9535 (2011). Una descripción temprana clave de la corrección de errores basada en etiquetas de una sola hebra para la detección de variantes raras. Esta publicación puso la importancia en el contexto clínico y fue probablemente el lanzamiento más importante para el campo.

Jabara, C. B., Jones, C. D., Roach, J., Anderson, J. A. & amp Swanstrom, R. Muestreo preciso y secuenciación profunda del gen de la proteasa del VIH-1 utilizando un Primer ID. Proc. Natl Acad. Sci. Estados Unidos 108, 20166–20171 (2011).

Fu, G. K., Hu, J., Wang, P.-H. & amp Fodor, S. P. A. Recuento de moléculas de ADN individuales mediante la unión estocástica de diversas etiquetas. Proc. Natl Acad. Sci. Estados Unidos 108, 9026–9031 (2011).

Kivioja, T. et al. Contar números absolutos de moléculas utilizando identificadores moleculares únicos. Nat. Métodos 9, 72–74 (2011).

Shiroguchi, K., Jia, T. Z., Sims, P. A. & amp Xie, X. S. La secuenciación de ARN digital minimiza el sesgo dependiente de la secuencia y el ruido de amplificación con códigos de barras optimizados de una sola molécula. Proc. Natl Acad. Sci. Estados Unidos 109, 1347–1352 (2012).

Schmitt, M. W. y col. Detección de mutaciones ultrararas mediante secuenciación de próxima generación. Proc. Natl Acad. Sci. Estados Unidos 109, 14508–14513 (2012). La descripción inicial de DupSeq y el concepto de etiquetar copias de ambas cadenas de moléculas individuales de doble cadena para permitir su secuenciación y comparación para una precisión aún mayor. Esta técnica abrió la puerta a la investigación de variantes ultrararas, como las que ocurren en el envejecimiento y con la exposición química mutagénica.

Hoang, M. L. y col. Cuantificación de todo el genoma de mutaciones somáticas raras en tejidos humanos normales mediante secuenciación masivamente paralela. Proc. Natl Acad. Sci. Estados Unidos 113, 9846–9851 (2016). Un enfoque de secuenciación dúplex a muy baja profundidad y que no requiere UMI exógenos. Un excelente ejemplo de genotoxicidad y aplicaciones de envejecimiento.

Nachmanson, D. et al. CRISPR-DS: un método de entrada de ADN bajo y eficiente para una secuenciación ultraprecisa. Preimpresión en bioRxivhttps://doi.org/10.1101/207027 (2017).

Liang, R. H. y col. Evaluación teórica y experimental del marcado de cebadores degenerados en aplicaciones ultraprofundas de secuenciación de próxima generación. Ácidos nucleicos Res. 42, e98 (2014).

Zhang, T.-H., Wu, N. C. & amp Sun, R. Un estudio de referencia sobre la corrección de errores mediante el emparejamiento de lecturas y la agrupación de etiquetas en la secuenciación profunda basada en amplicones. BMC Genomics 17, 108 (2016).

Smith, T., Heger, A. & amp Sudbery, I. UMI-tools: modelado de errores de secuenciación en identificadores moleculares únicos para mejorar la precisión de la cuantificación. Genome Res. 27, 491–499 (2017).

Ståhlberg, A. et al. Los códigos de barras de ADN simples, multiplexados y basados ​​en PCR permiten la detección sensible de mutaciones en biopsias líquidas mediante secuenciación. Ácidos nucleicos Res. 44, e105 (2016).

Ståhlberg, A. et al. Códigos de barras de ADN basados ​​en PCR multiplexados simples para la detección de mutaciones ultrasensibles mediante secuenciación de próxima generación. Nat. Protocolos. 12, 664–682 (2017).

Hiatt, J. B., Pritchard, C. C., Salipante, S. J., O'Roak, B. J. & amp Shendure, J. Sondas de inversión molecular de molécula única para la detección dirigida de alta precisión de la variación de baja frecuencia. Genome Res. https://doi.org/10.1101/gr.147686.112 (2013).

Carlson, K. D. y col. MIPSTR: un método para el genotipado múltiple de la línea germinal y la variación de STR somática en muchos individuos. Genome Res. 25, 750–761 (2015).

Boyle, E. A., O'Roak, B. J., Martin, B. K., Kumar, A. & amp Shendure, J. MIPgen: modelado optimizado y diseño de sondas de inversión molecular para resecuenciación dirigida. Bioinformática 30, 2670–2672 (2014).

Wang, K. y col. Detección ultraprecisa de mutaciones mediante amplificación basada en gotas de ADN circularizado. BMC Genomics 17, 214 (2016). Una descripción importante de varias técnicas bioquímicas para mejorar la eficiencia de la toma de consenso y reducir los costos.

Hong, L. Z. y col. BAsE-Seq: un método para obtener haplotipos virales largos a partir de lecturas de secuencia corta. Genome Biol. 15, 517 (2014).

Schmitt, M. W., Fox, E. J. & amp Salk, J. J. Riesgos de la doble contabilización en la secuenciación profunda. Proc. Natl Acad. Sci. Estados Unidos 111, E1560 (2014).

Hong, J. & amp Gresham, D. La incorporación de identificadores moleculares únicos en los adaptadores TruSeq mejora la precisión de la secuenciación cuantitativa. Biotecnología 63, 221–226 (2017).

Narayan, A. et al. Medición ultrasensible de mutaciones de hotspot en el ADN tumoral en sangre mediante secuenciación profunda multiplexada con supresión de errores. Cancer Res. 72, 3492–3498 (2012).

Gregory, M. T. y col. Detección de mutaciones de molécula única dirigida con secuenciación masivamente paralela. Ácidos nucleicos Res. 44, e22 – e22 (2016).

Pel, J. y col. Secuenciación de proximidad dúplex (Pro-Seq): un método para mejorar la precisión de la secuenciación del ADN sin el costo de la redundancia de códigos de barras moleculares. Preimpresión en bioRxiv https://doi.org/10.1101/163444 (2017).

Kennedy, S. R. y col. Detección de mutaciones de frecuencia ultrabaja mediante secuenciación dúplex. Nat. Protocolos. 9, 2586–2606 (2014).

Roach, J. C. et al. Análisis de la herencia genética en un cuarteto familiar mediante secuenciación del genoma completo. Ciencias 328, 636–639 (2010).

Kennedy, S. R., Salk, J. J., Schmitt, M. W. & amp Loeb, L. A. La secuenciación ultrasensible revela un aumento relacionado con la edad en las mutaciones mitocondriales somáticas que son incompatibles con el daño oxidativo. PLOS Genet. 9, e1003794 (2013). La primera descripción de la secuenciación por consenso de alta precisión para medir el efecto del envejecimiento humano sobre la carga de mutaciones somáticas.

Taylor, P. H., Cinquin, A. & amp Cinquin, O. Cuantificación de la acumulación de mutaciones progenitoras in vivo con tasa de error ultrabaja y ADN de entrada mínima utilizando SIP-HAVA-seq. Genome Res. 26, 1600–1611 (2016).

Hoekstra, J. G., Hipp, M. J., Montine, T. J. & amp Kennedy, S. R. Las mutaciones del ADN mitocondrial aumentan en la enfermedad de Alzheimer en etapa temprana y son incompatibles con el daño oxidativo. Ana. Neurol. 80, 301–306 (2016).

Pickrell, A. M. y col. La parkina endógena conserva las neuronas dopaminérgicas de la sustancia negra tras el estrés mutagénico del ADN mitocondrial. Neurona 87, 371–381 (2015).

Reid-Bayliss, K. S., Arron, S. T., Loeb, L. A., Bezrookove, V. & amp Cleaver, J. E. Por qué los pacientes con síndrome de Cockayne no contraen cáncer a pesar de su deficiencia de reparación del ADN. Proc. Natl Acad. Sci. Estados Unidos 113, 10151–10156 (2016).

Chawanthayatham, S. et al. Los espectros mutacionales de la aflatoxina B1 in vivo establecen biomarcadores de exposición para el carcinoma hepatocelular humano. Proc. Natl Acad. Sci. Estados Unidos 114, E3101 – E3109 (2017).

Mattox, A. K. et al. Dúplex convertidos con bisulfito para la detección y cuantificación de mutaciones raras de cadenas específicas. Proc. Natl Acad. Sci. Estados Unidos 114, 4733–4738 (2017).

Kumar, V. y col. Conversión parcial de bisulfito para secuenciación de plantillas únicas. Ácidos nucleicos Res. https://doi.org/10.1093/nar/gkx1054 (2017).

Deamer, D., Akeson, M. & amp Branton, D. Tres décadas de secuenciación de nanoporos. Nat. Biotechnol. 34, 518–524 (2016).

Eid, J. y col. Secuenciación de ADN en tiempo real a partir de moléculas de polimerasa individuales. 323, 133–138 (2009).

Madoui, M.-A. et al. Ensamblaje del genoma utilizando lecturas de ADN largas y sin errores guiadas por nanoporos. BMC Genomics 16, 327 (2015).

Schüle, B. et al. Enfermedad de Parkinson asociada con expansión de repetición ATXN10 pura. NPJ Parkinsons Dis. 3, 27 (2017).

Li, C. y col. INC-Seq: lecturas precisas de una sola molécula mediante secuenciación de nanoporos. Gigascience 5, 34 (2016).

Jain, M., Olsen, H. E., Paten, B. & amp Akeson, M. The Oxford Nanopore MinION: entrega de secuenciación de nanoporos a la comunidad genómica. Genome Biol. 17, 239 (2016).

Travers, K. J., Chin, C.-S., Rank, D. R., Eid, J. S. & amp Turner, S. W. Un formato de plantilla flexible y eficiente para secuenciación de consenso circular y detección de SNP. Ácidos nucleicos Res. 38, e159 (2010). La primera descripción de la secuenciación de consenso basada en la resecuenciación iterativa de ambas cadenas de moléculas individuales. Este concepto, aunque actualmente es un desafío, probablemente se volverá muy importante a medida que mejoren los secuenciadores de ADN de una sola molécula.

Loomis, E. W. et al. Secuenciación de lo no secuenciable: alelos de repetición CGG expandidos del gen X frágil. Genome Res. 23, 121–128 (2013).

Russo, G. y col. Detección no invasiva y altamente sensible de mutaciones de cáncer colorrectal mediante secuenciación de tercera generación de una sola molécula. Apl. Transl Genom. 7, 32–39 (2015).

Frank, J. A. et al. Ensambles de metagenoma mejorados y agrupamiento taxonómico utilizando datos de secuencia de consenso circular de lectura larga. Sci. Reps. 6, 25373 (2016).

Hestand, M. S., Van Houdt, J., Cristofoli, F. & amp Vermeesch, J. R. Tasas de error específicas de la polimerasa y perfiles identificados por secuenciación de una sola molécula. Mutat. Res. 784–785, 39–45 (2016).

Heerema, S. J. & amp Dekker, C. Nanodispositivos de grafeno para secuenciación de ADN. Nat. Nanotechnol. 11, 127–136 (2016).

Beechem, J. Biblioteca de secuenciación dirigida libre de muestras de ADN genómico nativo FFPE utilizando tecnología Hyb & amp Seq, el sistema de secuenciación de una sola molécula basado en hibridación. Reunión Anual de Avances en Biología y Tecnología del Genoma https://www.nanostring.com/application/files/3815/0206/1895/AGBT2017_HybSeq_Chemistry_Final.pdf (2017).

Johnson, S. S., Zaikova, E., Goerlitz, D. S., Bai, Y. & amp Tighe, S. W. Secuenciación de ADN en tiempo real en los valles secos de la Antártida utilizando el secuenciador Oxford Nanopore. J. Biomol. Tech. 28, 2–7 (2017).

Wang, K. y col. Uso de secuenciación ultrasensible de próxima generación para diseccionar mutagénesis inducida por daños en el ADN. Sci. Reps. 6, 25310 (2016).

Stoler, N., Arbeithuber, B., Guiblet, W., Makova, K. D. & amp Nekrutenko, A. Análisis simplificado de datos de secuenciación dúplex con Du Novo. Genome Biol. 17, 180 (2016).

Newman, A. M. y col. Supresión de errores digital integrada para una mejor detección del ADN tumoral circulante. Nat. Biotechnol. 34, 547–555 (2016). Una descripción temprana e importante y exhaustiva de un enfoque de biopsia líquida de ADNcf utilizando técnicas de corrección de errores basadas en etiquetas.

Zheng, Z. et al. PCR multiplex anclada para secuenciación dirigida de próxima generación. Nat. Medicina. 20, 1479–1484 (2014).

Kennedy, S. & amp Hipp, MJ Eliminación de secuenciadores y artefactos de PCR para análisis forense de ADN en plataformas de secuenciación masivamente paralelas: https://www.promega.com/-/media/files/products-and-services/genetic-identity/ishi -28-resúmenes-orales / kennedy-ishipaper.pdf (2017).

Krimmel, J. D., Salk, J. J. y Risques, R.-A. Mutaciones similares al cáncer en tejidos no cancerosos: hacia una mejor comprensión de la carcinogénesis en varios pasos. Transl Cancer Res. https://doi.org/10.21037/tcr.2016.11.67 (2016).

Loeb, L. A., Springgate, C. F. & amp Battula, N. Errores en la replicación del ADN como base de cambios malignos. Cancer Res. 34, 2311–2321 (1974).

Merlo, L. M. F., Pepper, J. W., Reid, B. J. & amp Maley, C. C. El cáncer como proceso evolutivo y ecológico. Nat. Rev.Cáncer 6, 924–935 (2006).

Gatenby, R. A. & amp Gillies, R. J. Un modelo microambiental de carcinogénesis. Nat. Rev.Cáncer 8, 56–61 (2008).

Salk, J. J., Fox, E. J. & amp Loeb, L. A. Heterogeneidad mutacional en cánceres humanos: origen y consecuencias. Annu. Rev. Pathol. 5, 51–75 (2010).

Greaves, M. & amp Maley, C. C. Evolución clonal en el cáncer. Naturaleza 481, 306–313 (2012).

Burrell, R. A., McGranahan, N., Bartek, J. & amp Swanton, C. Las causas y consecuencias de la heterogeneidad genética en la evolución del cáncer. Naturaleza 501, 338–345 (2013).

Gerlinger, M. y col. Heterogeneidad intratumoral y evolución ramificada revelada por secuenciación multirregional. N. Engl. J. Med. 366, 883–892 (2012).

Sottoriva, A. et al. La heterogeneidad intratumoral en el glioblastoma humano refleja la dinámica evolutiva del cáncer. Proc. Natl Acad. Sci. Estados Unidos 110, 4009–4014 (2013).

Zhang, J. y col. Heterogeneidad intratumoral en adenocarcinomas de pulmón localizados delimitados por secuenciación multirregional. Ciencias 346, 256–259 (2014).

de Bruin, E. C. et al. La diversidad espacial y temporal en los procesos de inestabilidad genómica define la evolución del cáncer de pulmón. Ciencias 346, 251–256 (2014).

Naxerova, K. et al. El ADN hipermutable narra la evolución del cáncer de colon humano. Proc. Natl Acad. Sci. Estados Unidos 111, E1889 – E1898 (2014).

Reiter, J. G. et al. Reconstrucción de patrones de siembra metastásica de cánceres humanos. Nat. Comun. 8, 14114 (2017).

Marusyk, A. et al. La conducción no autónoma de células del crecimiento tumoral apoya la heterogeneidad subclonal. Naturaleza 514, 54–58 (2014).

Yates, L. R. y col. Diversificación subclonal del cáncer de mama primario revelada por secuenciación multirregional. Nat. Medicina. 21, 751–759 (2015).

Ding, L. et al. Evolución clonal en la leucemia mieloide aguda recidivante revelada por secuenciación del genoma completo. Naturaleza 481, 506–510 (2012).

Sequist, L. V. et al. Evolución genotípica e histológica de cánceres de pulmón que adquieren resistencia a inhibidores de EGFR. Sci. Transl Med. 3, 75ra26 (2011).

Jamal-Hanjani, M. et al. Seguimiento de la evolución del cáncer de pulmón de células no pequeñas. N. Engl. J. Med. 376, 2109–2121 (2017).

Andor, N. et al. Análisis pancáncer del alcance y las consecuencias de la heterogeneidad intratumoral. Nat. Medicina. 22, 105–113 (2016).

Mroz, E. A. et al. La alta heterogeneidad genética intratumoral se relaciona con un peor resultado en pacientes con carcinoma de células escamosas de cabeza y cuello. Cáncer 119, 3034–3042 (2013).

Parker, W. T., Ho, M., Scott, H. S., Hughes, T. P. & amp Branford, S. Respuesta deficiente a los inhibidores de quinasa de segunda línea en pacientes con leucemia mieloide crónica con múltiples mutaciones de bajo nivel, independientemente de su perfil de resistencia. Sangre 119, 2234–2238 (2012).

Landau, D. A. et al. Evolución e impacto de las mutaciones subclonales en la leucemia linfocítica crónica. Celda 152, 714–726 (2013).

Klco, J. M. et al. Asociación entre la eliminación de mutaciones después de la terapia de inducción y los resultados en la leucemia mieloide aguda. JAMA 314, 811–822 (2015).

Misale, S. et al. Aparición de mutaciones de KRAS y resistencia adquirida a la terapia anti-EGFR en el cáncer colorrectal. Naturaleza 486, 532–536 (2012).

Stroun, M., Anker, P., Lyautey, J., Lederrey, C. & amp Maurice, P. A. Aislamiento y caracterización del ADN del plasma de pacientes con cáncer. EUR. J. Cancer Clin. Oncol. 23, 707–712 (1987).

Bettegowda, C. et al. Detección de ADN tumoral circulante en neoplasias malignas humanas en etapa temprana y tardía. Sci. Transl Med. 6, 224ra24 (2014).

Wan, J. C. M. y col. Las biopsias líquidas alcanzan la mayoría de edad: hacia la implementación del ADN tumoral circulante. Nat. Rev.Cáncer 17, 223–238 (2017).

Murtaza, M. et al. Análisis no invasivo de la resistencia adquirida a la terapia del cáncer mediante secuenciación del ADN plasmático. Naturaleza 497, 108–112 (2013).

García-Murillas, I. et al. El seguimiento de mutaciones en el ADN tumoral circulante predice la recaída en el cáncer de mama temprano. Sci. Transl Med. 7, 302ra133 (2015).

Tie, J. y col. El análisis de ADN tumoral circulante detecta una enfermedad residual mínima y predice la recurrencia en pacientes con cáncer de colon en estadio II. Sci. Transl Med. 8, 346ra92 (2016).

Newman, A. M. y col. Un método ultrasensible para cuantificar el ADN tumoral circulante con una amplia cobertura de pacientes. Nat. Medicina. 20, 548–554 (2014).

Fujii, T. et al. Secuenciación de próxima generación de enriquecimiento de mutaciones para la detección cuantitativa de mutaciones de KRAS en el ADN libre de células de la orina de pacientes con cánceres avanzados. Clin. Cancer Res. 23, 3657–3666 (2017).

Wang, Y. et al. Detección de ADN derivado de tumores en el líquido cefalorraquídeo de pacientes con tumores primarios del cerebro y la médula espinal. Proc. Natl Acad. Sci. Estados Unidos 112, 9704–9709 (2015).

Kinde, I. et al. Evaluación del ADN de la prueba de Papanicolaou para detectar cánceres de ovario y endometrio. Sci. Transl Med. 5, 167ra4 (2013).

Maritschnegg, E. et al. Lavado de la cavidad uterina para la detección molecular de carcinomas del conducto de Müller: un estudio de prueba de concepto. J. Clin. Oncol. 33, 4293–4300 (2015).

Wang, Y. et al. Detección de mutaciones somáticas y VPH en saliva y plasma de pacientes con carcinomas epidermoides de cabeza y cuello. Sci. Transl Med. 7, 293ra104 (2015).

Sidransky, D. et al. Identificación de mutaciones del oncogén ras en las heces de pacientes con tumores colorrectales curables. Ciencias 256, 102–105 (1992).

Aravanis, A. M., Lee, M. y Klausner, R. D.Secuenciación de próxima generación del ADN tumoral circulante para la detección temprana del cáncer. Celda 168, 571–574 (2017).

Armitage, P. & amp Doll, R. La distribución por edades del cáncer y una teoría de la carcinogénesis en múltiples etapas. Br. J. Cáncer 8, 1–12 (1954).

Genovese, G. y col. Riesgo de hematopoyesis clonal y cáncer de sangre inferido de la secuencia del ADN sanguíneo. N. Engl. J. Med. 371, 2477–2487 (2014).

Jaiswal, S. y col. Hematopoyesis clonal relacionada con la edad asociada con resultados adversos. N. Engl. J. Med. 371, 2488–2498 (2014).

Young, A. L., Challen, G. A., Birmann, B. M. & amp Druley, T. E. La hematopoyesis clonal que alberga mutaciones asociadas con AML es ubicua en adultos sanos. Nat. Comun. 7, 12484 (2016). Una descripción del uso de una técnica de corrección de errores basada en etiquetas de una sola hebra para identificar clones preneoplásicos en casi todos los adultos, que se creía que solo 2 años antes ocurría en solo un subconjunto de individuos muy ancianos. Es un ejemplo importante de cómo una comprensión biológica fundamental puede cambiar rápidamente con tecnologías de descubrimiento mejoradas.

Krimmel, J. D. et al. La secuenciación ultra profunda detecta células de cáncer de ovario en el líquido peritoneal y revela mutaciones somáticas de TP53 en tejidos no cancerosos. Proc. Natl Acad. Sci. Estados Unidos 113, 6005–6010 (2016).

Salk, J. J. et al. La secuenciación dúplex detecta mutaciones asociadas al cáncer que surgen durante el envejecimiento normal: evolución clonal durante un siglo de vida humana [resumen]. Cancer Res. 77, 3041 (2017).

Jee, J. y col. Tasas y mecanismos de mutagénesis bacteriana a partir de la secuenciación de máxima profundidad. Naturaleza 534, 693–696 (2016).

Maslov, A. Y., Quispe-Tintaya, W., Gorbacheva, T., White, R. R. & amp Vijg, J. Secuenciación de alto rendimiento en la detección de mutaciones: ¿una nueva generación de pruebas de genotoxicidad? Mutat. Res. 776, 136–143 (2015).

Fielden, M. R. et al. Modernización de la evaluación del riesgo de cáncer humano de la terapéutica. Trends Pharmacol. Sci. https://doi.org/10.1016/j.tips.2017.11.005 (2017).

Kim, D., Kim, S., Kim, S., Park, J. y Kim, J.-S. Las especificidades diana de todo el genoma de las nucleasas CRISPR-Cas9 reveladas por multiplex Digenome-seq. Genome Res. 26, 406–415 (2016).

Caperton, L. et al. Las tecnologías de reproducción asistida no alteran la frecuencia ni el espectro de las mutaciones. Proc. Natl Acad. Sci. Estados Unidos 104, 5085–5090 (2007).

Nelson, J. L. La alteridad del yo: microquimerismo en la salud y la enfermedad. Trends Immunol. 33, 421–427 (2012).

Eun, J. K., Guthrie, K. A., Zirpoli, G. & amp Gadi, V. K. Cáncer de mama in situ y microquimerismo. Sci. Reps. 3, 2192 (2013).

Fan, H. C., Blumenfeld, Y. J., Chitkara, U., Hudgins, L. & amp Quake, S. R. Diagnóstico no invasivo de aneuploidía fetal mediante secuenciación de ADN de sangre materna. Proc. Natl Acad. Sci. Estados Unidos 105, 16266–16271 (2008).

Chiu, R. W. K. y col. Evaluación prenatal no invasiva de la trisomía 21 mediante secuenciación multiplexada del ADN del plasma materno: estudio de validez a gran escala. BMJ 342, c7401 (2011).

Bianchi, D. W. y col. Pruebas prenatales no invasivas y detección incidental de neoplasias maternas ocultas. JAMA 314, 162–169 (2015).

Jamuar, S. S. & amp Walsh, C. A. Mutaciones somáticas en malformaciones corticales cerebrales. N. Engl. J. Med. 371, 2038–2038 (2014).

Poduri, A., Evrony, G. D., Cai, X. & amp Walsh, C. A. Mutación somática, variación genómica y enfermedad neurológica. Ciencias 341, 1237758–1237758 (2013).

De Vlaminck, I. et al. El ADN libre de células circulantes permite un diagnóstico no invasivo del rechazo del trasplante de corazón. Sci. Transl Med. 6, 241ra77 (2014).

Shugay, M. y col. Hacia la elaboración de perfiles sin errores de repertorios inmunes. Nat. Métodos 11, 653–655 (2014).

DeWitt, W. S. et al. Dinámica de la respuesta de las células T citotóxicas a un modelo de infección viral aguda. J. Virol. 89, 4517–4526 (2015).

Hsu, M. S. et al. La secuenciación de TCR puede identificar y rastrear las células T que se infiltran en el glioma después de la vacunación con DC. Cancer Immunol. Res. 4, 412–418 (2016).

Tumeh, P. C. et al. El bloqueo de PD-1 induce respuestas inhibiendo la resistencia inmunitaria adaptativa. Naturaleza 515, 568–571 (2014).

Goodnow, C. C. patogénesis de múltiples etapas de la enfermedad autoinmune. Celda 130, 25–35 (2007).

Qian, J. y col. Los superpotenciadores de células B y los grupos reguladores reclutan actividad tumorigénica de la AID. Celda 159, 1524–1537 (2014).

Consorcio del Proyecto del Microbioma Humano. Estructura, función y diversidad del microbioma humano sano. Naturaleza 486, 207–214 (2012).

Lynch, S. V. & amp Pedersen, O. El microbioma intestinal humano en la salud y la enfermedad. N. Engl. J. Med. 375, 2369–2379 (2016).

Van de Wiele, T., Van Praet, J. T., Marzorati, M., Drennan, M. B. & amp Elewaut, D. Cómo la microbiota da forma a las enfermedades reumáticas. Nat. Rev. Rheumatol. 12, 398–411 (2016).

Rosenbaum, M., Knight, R. & amp Leibel, R. L. La microbiota intestinal en la homeostasis energética humana y la obesidad. Tendencias Endocrinol. Metab. 26, 493–501 (2015).

Alexander, J. L. et al. Modulación de la microbiota intestinal de la eficacia y toxicidad de la quimioterapia. Nat. Rev. Gastroenterol. Hepatol. 1805, 105 (2017).

Vindigni, S. M. & amp Surawicz, C. M. Trasplante de microbiota fecal. Gastroenterol. Clin. North Am. 46, 171–185 (2017).

Domínguez-Bello, M. G. et al. Restauración parcial de la microbiota de los recién nacidos por cesárea mediante transferencia microbiana vaginal. Nat. Medicina. 22, 250–253 (2016).

Roach, D. J. y col. Un año de infección en la unidad de cuidados intensivos: la secuenciación prospectiva del genoma completo de aislados clínicos bacterianos revela transmisiones crípticas y una nueva microbiota. PLOS Genet. 11, e1005413 (2015).

Cummings, L. A. et al. La secuenciación clínica de próxima generación supera al cultivo microbiológico estándar para caracterizar muestras polimicrobianas. Clin. Chem. 62, 1465–1473 (2016).

Grumaz, S. et al. Diagnóstico de secuenciación de próxima generación de bacteriemia en pacientes sépticos. Genome Med. 8, 73 (2016).

Kim, S. y col. Preparación de muestras microfluídica automatizada de alto rendimiento para una genómica microbiana precisa. Nat. Comun. 8, 13919 (2017).

Acevedo, A., Brodsky, L. & amp Andino, R. Paisajes mutacionales y de aptitud de un virus de ARN revelados mediante secuenciación de poblaciones. Naturaleza 505, 686–690 (2014).

Eigen, M. El concepto de cuasiespecie pronto cumplirá 50 años. Introducción. Curr. Cima. Microbiol. Immunol. 392, vii (2016).

Henn, M. R. y col. La secuenciación profunda del genoma completo del VIH-1 revela el impacto de las primeras variantes menores sobre el reconocimiento inmunológico durante la infección aguda. PLOS Pathog. 8, e1002529 (2012).

Solmone, M. y col. Uso de pirosecuenciación ultraprofunda masivamente paralela para caracterizar la diversidad genética del virus de la hepatitis B en pacientes resistentes a fármacos y sin tratamiento previo y para detectar variantes menores en la transcriptasa inversa y el antígeno S de la hepatitis B. J. Virol. 83, 1718–1726 (2009).

Svarovskaia, E. S., Martin, R., McHutchison, J. G., Miller, M. D. & amp Mo, H. Abundantes mutantes NS3 resistentes a fármacos detectados mediante secuenciación profunda en pacientes infectados con el virus de la hepatitis C que se someten a monoterapia con inhibidor de proteasa NS3. J. Clin. Microbiol. 50, 3267–3274 (2012).

Daum, L. T. y col. Secuenciación de torrentes de iones de próxima generación de mutaciones de resistencia a fármacos en Tuberculosis micobacteriana son. J. Clin. Microbiol. 50, 3831–3837 (2012).

Katz, M., Hover, B. & amp Brady, S. Descubrimiento independiente de la cultura de productos naturales a partir de metagenomas del suelo. J. Ind. Microbiol. Biotechnol. 43, 129–141 (2016).

Bassil, N. M., Bryan, N. & amp Lloyd, J. R. Degradación microbiana del ácido isosacarínico a pH alto. ISME J. 9, 310–320 (2015).

Yamamoto, S. et al. La metabarcoding de ADN ambiental revela comunidades de peces locales en un mar costero rico en especies. Sci. Reps. 7, 40368 (2017).

Mayo, B. y col. Impacto de las técnicas de secuenciación de próxima generación en microbiología alimentaria. Curr. Genom. 15, 293–309 (2014).

Jäger, A. C. et al. Validación del desarrollo del sistema de genómica forense MiSeq FGx para la secuenciación dirigida de próxima generación en laboratorios de bases de datos y trabajo de casos de ADN forense. Ciencia forense. En t. Gineta. 28, 52–70 (2017).

Stiller, M. y col. Patrones de incorporación errónea de nucleótidos durante la amplificación enzimática y la secuenciación directa a gran escala de ADN antiguo. Proc. Natl Acad. Sci. Estados Unidos 103, 13578–13584 (2006).

Avery, O. T., Macleod, C. M. & amp McCarty, M. Estudios sobre la naturaleza química de la sustancia que induce la transformación de tipos neumocócicos: inducción de transformación por una fracción de ácido desoxirribonucleico aislada de neumococo tipo III. J. Exp. Medicina. 79, 137–158 (1944).

Lander, E. S. et al. Secuenciación inicial y análisis del genoma humano. Naturaleza 409, 860–921 (2001).

Mostovoy, Y. et al. Un enfoque híbrido para el ensamblaje y la fase de secuencia del genoma humano de novo. Nat. Métodos 13, 587–590 (2016).

Bickhart, D. M. y col. La secuenciación de una sola molécula y la captura de la conformación de la cromatina permiten el ensamblaje de referencia de novo del genoma de la cabra doméstica. Nat. Gineta. 49, 643–650 (2017).

King, D. A. et al. Variación estructural de mosaico en niños con trastornos del desarrollo. Tararear. Mol. Gineta. 24, 2733–2745 (2015).

Navin, N. et al. Evolución del tumor inferida por secuenciación unicelular. Naturaleza 472, 90–94 (2011).

Vitak, S. A. et al. Secuenciación de miles de genomas unicelulares con indexación combinatoria. Nat. Métodos 14, 302–308 (2017).

Zheng, G. X. Y. y col. Perfiles transcripcionales digitales masivamente paralelos de células individuales. Nat. Comun. 8, 14049 (2017).

Rosenberg, A. B. et al. Escalar la transcriptómica unicelular a través de códigos de barras de grupo dividido. Preimpresión en bioRxiv https://doi.org/10.1101/105163 (2017).

Ullal, A. V. y col. El perfil de células cancerosas mediante códigos de barras permite el análisis de proteínas multiplexado en aspirados con aguja fina. Sci. Transl Med. 6, 219ra9 (2014).

Consorcio Proyecto ENCODE. Una enciclopedia integrada de elementos del ADN en el genoma humano. Naturaleza 489, 57–74 (2012).

Sun, W.-J. et al. RMBase: un recurso para decodificar el panorama de modificaciones de ARN a partir de datos de secuenciación de alto rendimiento. Ácidos nucleicos Res. 44, D259–265 (2016).

Colección Bienvenida. Charles Robert Darwin. Fotografía de L. Darwin. Bienvenida Confianza https://wellcomecollection.org/works/s6x9wbsj?page=1&query=darwin (2016).


Resultados

El SCP y su implementación en el flujo de trabajo de genotipado unicelular

El principio SCP original se ha descrito previamente en detalle [15]. Las figuras 1A-1C muestran el prototipo de SCP que usamos para el presente estudio y el flujo de trabajo para el aislamiento y análisis de una sola celda en el formato de 384 pocillos: Primero, la suspensión celular se pipetea en el cartucho desechable que consiste en una pieza de plástico molida. y el chip dispensador de microfluidos (Fig. 1A). A continuación, el cartucho se monta en el cabezal de impresión que comprende el accionador piezoeléctrico que impulsa el chip dispensador (figura 1B). Un sistema de visión microscópica monitorea la boquilla del chip dispensador y proporciona los datos de imagen para la detección, clasificación y aislamiento de las células (ver más abajo). Las gotas no deseadas se eliminan a través de un sistema de obturador de vacío. El cabezal de impresión está montado en una plataforma robótica de tres ejes que permite la deposición precisa de gotitas encapsulantes de celda única en micropocillos especificados en el software SCP por el operador. A diferencia de las aplicaciones anteriores, en el presente estudio, el SCP se utilizó para el aislamiento de células cancerosas y la posterior lisis celular, WGA y análisis genéticos moleculares (Fig. 1D).

(A) La suspensión de células se introduce en el cartucho estéril de un solo uso. (B) El soporte de la placa de micropocillos está equipado con una cámara para determinar y ajustar automáticamente la compensación del dispensador antes de la impresión de la celda (compensación de compensación automática, AOC). El dispensador con el cartucho montado y la óptica de detección de células forman parte del cabezal de impresión. (C) Vista total del prototipo de SCP que se utilizó en este estudio. (D) Ilustración del flujo de trabajo para el genotipado unicelular. Las células individuales se aíslan mediante el SCP. Después de la lisis celular, el ADN se somete a amplificación del genoma completo (WGA), que luego se puede utilizar para análisis genéticos moleculares de rutina.

Evaluación de la precisión y eficiencia de la deposición unicelular.

Un requisito previo para los análisis genéticos es la deposición exacta de la célula individual en el pocillo, ya que solo entonces la lisis celular y la WGA se pueden realizar de manera confiable, dados los pequeños volúmenes de reacción.

Aunque la precisión del dispensador es lo suficientemente alta como para depositar gotitas encapsulantes de celda única en micropocillos, observamos que la posición de las gotitas dentro del pozo puede variar. La razón es una variación de la posición de la boquilla debido al proceso de fabricación del cartucho y la fijación del cartucho al cabezal de impresión. Con el fin de depositar las gotas con precisión en el fondo del pozo de forma automatizada, diseñamos una herramienta para compensar dicha compensación midiendo la posición de colocación de las gotas antes y durante el proceso de aislamiento de la celda. Para esto, las gotas se dispensan en un portaobjetos de vidrio que es fotografiado por una cámara digital unida al portaplacas de micropocillos (Fig 2). La posición de la gota se extrae de los datos de la imagen y el algoritmo calcula automáticamente la posición de dispensación correcta para apuntar al centro de los micropocillos.

(A) Para esto, las gotas se dispensan en un portaobjetos de vidrio que es fotografiado por una cámara digital. (B) La posición real de la gota se extrae de los datos de la imagen mediante el procesamiento de imágenes con openCV. (C) muestra la imagen binaria después del umbral. El algoritmo calcula automáticamente la posición de dispensación correcta para apuntar al centro del micropocillo.

Además, las gotas que vuelan libremente pueden ser desviadas por fuerzas electrostáticas, que se producen debido a la carga eléctrica que se acumula tanto en la gota como en la placa. Por lo tanto, usamos aire ionizado para neutralizar la carga electrostática de la placa de micropocillos.

Para evaluar si el SCP con la compensación automática de dispensación de dispensación y la desionización deposita gotas individuales con alta eficiencia y precisión, se imprimieron perlas de látex verde fluorescente de tamaño único de 10 μm como equivalentes de células en los pocillos de una placa de 384 micropocillos, y el Se evaluaron las eficiencias de eyección y deposición. La eficiencia de expulsión (es decir, se ha expulsado realmente una sola gota de la boquilla) se determinó a través de las imágenes almacenadas automáticamente por el SCP que muestran la boquilla antes, durante y después de la dispensación (Fig. 3A-3E). La eficiencia de la deposición (es decir, se entregó con éxito una sola perla al fondo del pocillo) se concluyó a partir de imágenes de microscopía de fluorescencia (Fig. 3F).

Se almacenan automáticamente cuatro imágenes consecutivas para cada evento de impresión: (C.A) Una celda (o perla como equivalente de celda) se transporta hacia la boquilla del dispensador-chip, donde se detecta y se clasifica dentro de una región de interés (ROI, área verde). Solo si el reconocimiento del objeto cumple con los criterios predefinidos en términos de tamaño, redondez y singularidad, la gota expulsada de la boquilla se dirigirá al pozo. (D) Una imagen final confirma la ausencia de la celda en la boquilla después de la expulsión de las gotas. La serie de imágenes se puede utilizar para proporcionar evidencia directa de que realmente se expulsó una sola celda. (MI) muestra un ejemplo de una imagen en la que dos celdas entrarían en la gota. Estas gotas se eliminan automáticamente mediante la succión al vacío. Para evaluar la precisión del instrumento, se imprimieron 2304 perlas fluorescentes individuales en seis placas de 384 micropocillos. Las imágenes se evaluaron para determinar la eficiencia de eyección (99,7%). (F) Las perlas depositadas correctamente (círculo de trazos) se visualizaron mediante microscopía de fluorescencia de los fondos de los pocillos (1,2 mm de diámetro). (GRAMO) Las perlas se administraron correctamente en un promedio del 98,8% de los pocillos si la placa de micropocillos se neutralizó electrostáticamente antes de la impresión.

De las perlas fluorescentes, se dispensaron 1152 cada una en tres placas de 384 pocillos sin tratar o tres desionizadas, lo que equivalía a un número total de 2304 perlas. La eficiencia global de eyección de una sola perla fue en promedio 99,7 ± 0,3%. La eficiencia de la deposición dependía de si la placa estaba desionizada o no. Sin desionización previa, sólo en el 20,7 ± 8,4% de los fondos de los pozos se detectó una sola perla, mientras que después de la desionización se entregaron correctamente 98,8 ± 1,5% de las perlas (Fig. 3G).

Siguiendo este flujo de trabajo, se imprimieron un total de 150 células individuales de diferentes orígenes (U-2 OS, n = 40 Kasumi-1, n = 44 pacientes con AML, n = 66) en placas desionizadas de 384 pocillos que dieron como resultado un total de eficiencia de eyección de células del 98,7%. Un subconjunto de las células impresas de cada muestra se sometió a WGA y genotipado (como se detalla a continuación).

Amplificación del genoma completo de células individuales

Las células individuales se sometieron a WGA antes del análisis molecular aguas abajo. Para minimizar las probabilidades de contaminar el ADN que sería coamplificado por el WGA, trabajamos con cartuchos y placas sin ADN y redujimos los pasos prácticos durante el aislamiento celular, la lisis y la amplificación. El éxito de la WGA se evaluó mediante cuantificación fluorométrica del ADN y una PCR en repetición LÍNEA 1 Se utilizaron transposones para controlar la amplificación del ADN humano en las muestras y su ausencia en el control sin molde.

De las 40 células U-2 OS que se depositaron en los micropocillos desionizados, 25 se sometieron a un WGA que dio como resultado un rendimiento medio de ADN de 3.8 μg (rango, 3.5-5.5 μg) por célula (Fig 4A) la PCR en el LÍNEA 1 los transposones fueron positivos en todas las muestras (Fig. 4B). De Kasumi-1, 33 células se sometieron a WGA, lo que resultó en un rendimiento medio de ADN de 14,3 μg (rango, 8,6-20,8 μg) por célula, y el LÍNEA 1 La PCR fue positiva en todas las células (Fig. S1). Entre las 23 células individuales de un paciente con AML, la WGA dio como resultado un rendimiento medio de ADN de 16,3 μg (rango, 14,0-19,3 μg) por célula y un resultado positivo LÍNEA 1 PCR en todas las células (Fig. S2).

(A) Diagrama de barras que muestra los rendimientos de ADN WGA de las células U-2 OS individuales y los controles respectivos, medidos por Qubit ™. (B) Gel de agarosa que ilustra los productos de diferentes tamaños del LÍNEA 1 PCR multiplex que se realizó en el ADN WGA de las células U-2 OS individuales. (C) Ejemplos de cromatogramas de secuenciación del SLC34A2 y TET2 mutaciones genéticas en la masa celular y en células individuales. (D) Conclusiones sobre la aparición de abandono alélico (ADO) a través de la secuenciación de polimorfismos de un solo nucleótido (SNP). Los SNP rs1391438 y rs7655890 se encuentran en estrecha proximidad genómica al TET2 mutación y muestran patrones heterocigotos en el volumen celular (izquierda). En las células B8 y C10 de U-2 OS individuales, solo se detecta el tipo salvaje en el TET2 sitio de mutación. Los patrones heterocigotos de los SNP en B8 sugieren un verdadero tipo salvaje en TET2, mientras que la detección de un solo alelo de ambos SNP en C10 sugiere pérdida de la región genómica debido a ADO. NTC: control sin plantilla, PTC: control positivo.

También examinamos si el ADN flotante estaba presente en las gotitas generadas por el SCP. Dicho ADN, si se amplifica mediante la WGA, dificultaría los análisis genéticos de las células individuales. Por lo tanto, las gotitas vacías (n = 1, 3 y 10, respectivamente) de una suspensión de células Kasumi-1 se imprimieron en pocillos individuales de una placa de 384 pocillos y luego se sometieron a WGA. Todas las gotas vacías no produjeron ningún producto en la siguiente LÍNEA 1 PCR, mientras que las gotitas que contienen células Kasumi-1 individuales fueron positivas (Fig. S3).

Genotipado de células cancerosas individuales

Buscamos evaluar la aplicabilidad del SCP para el aislamiento y análisis genéticos de células cancerosas individuales. Para ello, estudiamos variantes genéticas representativas en U-2 OS, Kasumi-1 y las PBMC de un paciente con AML.

U-2 OS alberga mutaciones en el SLC34A2 (ENST00000382051: c.1538G & gtT p.R513L) y TET2 genes (ENST00000380013: c.1394C & gtT p.P465L) [17], ambos de importancia funcional en cánceres [19-21]. Confirmamos las mutaciones en SLC34A2 y TET2 en la muestra a granel. De acuerdo con los datos publicados [17], los cromatogramas sugirieron que el SLC34A2 mutación era homo- o hemicigótica y la TET2 mutación heterocigota.A partir de los datos de nuestra matriz CNV, llegamos a la conclusión de que la cigosidad del SLC34A2 La mutación se debió a la pérdida de heterocigosidad (LOH) de la región genómica respectiva. En las 25 células U-2 OS analizadas, el SLC34A2 mutación se detectó en 23 y la TET2 mutación en 19 células (Figs. 4C y 5A). En una celda, el SLC34A2 PCR y, en otra celda, tanto el SLC34A2 y TET2 La PCR falló repetidamente, lo que sugiere una amplificación insuficiente de la región objetivo por el WGA. Como se esperaba de la cigosidad en la masa, ninguna celda con SLC34A2 Se detectó una secuencia de tipo salvaje. A diferencia de, TET2 La secuencia de tipo salvaje solo se detectó en 5 células. Estas células se evaluaron para determinar la presencia de ADO para permitir conclusiones sobre la co-ocurrencia de mutaciones en las células individuales (ver más abajo).

(A) Línea celular U-2 OS, (B) Línea celular Kasumi-1 y (C) Paciente con AML. Se muestran los nucleótidos identificados mediante la secuenciación de las muestras a granel y las células individuales (anotadas, por ejemplo, B1 o C1). Destacada en rojo está la presencia y en verde la ausencia de la secuencia mutada respectiva. Destacados en gris son los análisis no concluyentes, ya sea debido a PCR fallida (n.d., no determinado) o la probable ocurrencia de abandono alélico (*). Para los análisis de mutación genética, se muestra esquemáticamente la arquitectura clonal concluida a partir de los análisis unicelulares.

Kasumi-1 alberga mutaciones en la tirosina quinasa EQUIPO (ENST00000288135: c.2466T & gtA p.N822K) y el supresor de tumores TP53 (ENST00000269305: c.743G & gtA p.R248Q) [17]. Las mutaciones en EQUIPO y TP53 fueron confirmados por NGS en una muestra global de Kasumi-1. Según lo verificado por pirosecuenciación, la VAF de la EQUIPO la mutación fue del 84,0% en la mediana (rango, 83,3-85,2%). La sobrerrepresentación del alelo mutado se debe a la amplificación del EQUIPO región genómica [22, 23]. los TP53 la mutación estaba presente con una VAF del 100% en línea con una LOH de la región del cromosoma 17p en la matriz CNV. los EQUIPO se detectó mutación en 30 y la TP53 mutación en 25 células (Fig. 5B). En las celdas restantes, el EQUIPO o TP53 La PCR falló, muy probablemente debido a una amplificación ineficaz de las regiones respectivas por el WGA. Sin celda con EQUIPO o TP53 sólo se detectó la secuencia de tipo salvaje. Con respecto a la co-ocurrencia de las mutaciones, los análisis arrojaron resultados informativos para ambas mutaciones en 23 células. Todas estas células albergaban tanto la EQUIPO y TP53 mutación (Fig. 5B).

En las PBMC de un paciente con LMA, evaluamos el SNP no sinónimo potencialmente patógeno rs1042522 en TP53 (ENST00000269305: c.215C & gtG p.P72R) [24,25]. Decidimos adoptar este enfoque ya que no se detectó ningún alelo C mediante la secuenciación de Sanger de la muestra a granel y dado que, como lo indica la matriz FISH y CNV, la LMA albergaba uno o más clones con pérdida de un alelo del cromosoma 17p (incluido TP53 S4 Fig) y pérdida cromosómica de TP53 en los cánceres afecta preferentemente al alelo C de rs1042522 [25]. Por lo tanto, probamos si un alelo C ancestral aún sería detectable en un subconjunto de células individuales. De hecho, el TP53 La PCR produjo un producto en 21 células, en 5 de las cuales se detectó el alelo C (Fig. 5C).

Evaluación de abandono alélico y co-ocurrencia de mutaciones en U-2 OS

Como se indicó anteriormente, en 5 celdas U-2 OS el TET2 sólo se detectó la secuencia de tipo salvaje. Evaluar si la ausencia de TET2 mutaciones en estas células se debieron a ADO, analizamos los SNPs rs1391438 y rs7655890 (ubicados 4.650 pb y 15.992 pb 5 'del TET2 mutación, respectivamente) en estas células, ambos SNP eran heterocigotos en la muestra global (Fig. 4C). En una de las 5 células, solo se detectó uno de los dos alelos de cada SNP, lo que sugiere fuertemente que ADO ha ocurrido en la región genómica que incluía los SNP y TET2 mutación (Fig. 4C). Por lo tanto, consideramos que el análisis de esta celda no es concluyente. En las 4 células restantes, ambos SNP eran heterocigotos, lo que sugiere que WGA ha amplificado con éxito ambos alelos (Figura 4C), lo que hace que sea poco probable que la ausencia del TET2 la mutación en estas células se debió a ADO. Por lo tanto, llegamos a la conclusión de que estas 4 células carecían de la TET2 mutación.

Por lo tanto, en términos de co-ocurrencia, nuestros análisis arrojaron resultados informativos para ambos sitios de mutación en 22 células. De estas, 18 células albergaban tanto la SLC34A2 y TET2 mutación mientras que 4 albergaba la SLC34A2 pero no el TET2 mutación, que indica heterogeneidad clonal con respecto a TET2 células mutadas dentro de la línea celular U-2 OS (Fig. 5A).

En Kasumi-1, no fue necesaria una evaluación de ADO ya que ninguna celda con EQUIPO o TP53 sólo se detectó la secuencia de tipo salvaje.


Solución de problemas de sus datos

Las dos causas más comunes por las que no se obtienen datos correctos o de secuencia para sus muestras son la pureza y la concentración de su ADN de plantilla. Si tiene problemas para obtener buenos resultados de secuenciación para sus muestras, es posible que primero desee consultar nuestra sección Conceptos básicos de secuenciación para obtener algunas recomendaciones sobre la preparación y cuantificación de plantillas. Si parece que ha hecho todo correctamente y ha seguido nuestras sugerencias, busque a continuación algunas razones adicionales por las que podría obtener una calidad de datos de secuencia de ADN inferior a la óptima.

Sin datos de secuencia

Porque: sitio de cebado no presente
Soluciones: Si ha elegido uno de los cebadores de vector de la instalación de secuenciación, asegúrese de que esté presente en su vector. Si bien muchos de los cebadores que proporcionamos son bastante comunes a muchos vectores diferentes (por ejemplo, T7, M13-48R), otros son específicos de un tipo particular (por ejemplo, el cebador GL 1 se puede usar con el vector pGL2 pero no con el vector pGL3). Verifique sus mapas / secuencias de plásmidos.

- Si ha diseñado su propio cebador personalizado a partir de datos de secuencia anteriores, asegúrese de estar utilizando un área de secuencia confiable: busque picos nítidos y bien definidos sin ambigüedad. Evite las áreas donde los picos son más anchos y no están bien separados; esto ocurrirá hacia el final de la secuencia donde los fragmentos son más grandes y el polímero no puede resolver adecuadamente los nucleótidos individuales, lo que provoca una llamada de base inexacta.

Porque: No hay suficiente ADN / cebador en el tubo o no hay suficiente
Soluciones: Verifique dos veces sus cuantificaciones, concentraciones de stock y diluciones. Consulte nuestro ¿Qué tipo de ADN podemos secuenciar y cuánto necesitamos? sección para asegurarse de haber proporcionado la cantidad adecuada de ADN y / o cebador. Si bien nuestros secuenciadores son muy sensibles y pueden detectar una variedad de concentraciones de ADN, todavía hay una cantidad "umbral" que debe alcanzarse para obtener los datos de la secuencia.

Porque: Contaminante inhibitorio
Soluciones: La reacción de secuenciación cíclica utilizada para amplificar muestras para la secuenciación automática es muy sensible a la presencia de ciertos contaminantes, algunos de los cuales inhibirán completamente nuestra enzima de secuenciación. Consulte la tabla de contaminantes en los Preparación y purificación de plantillas sección para obtener una lista de inhibidores potenciales y las cantidades que son tolerables. Es posible que deba volver a preparar su muestra para eliminar suficientemente uno o más componentes inhibidores para obtener cualquier dato de secuencia.

Porque: Reactivos caducados
Soluciones: Los reactivos no pueden caducar

Datos ruidosos con señal débil

Los datos "ruidosos" se pueden identificar por la presencia de múltiples picos y numerosas "N" dentro de su secuencia. El programa de análisis de secuenciación asigna una "N" como identificación de base cuando hay dos o más picos presentes en una posición. Esta "N" puede significar la aparición legítima de dos nucleótidos, como en el caso de un heterocigoto, pero también puede ser cuando el ruido de fondo es alto o cuando hay varios productos presentes. Cuando la muestra presenta una señal débil, el software intenta compensar aumentando la señal de las bandas de la muestra a niveles detectables. Sin embargo, el ruido de fondo también se amplificará artificialmente, dando un mala relación señal-ruido. El ruido de fondo aparece como muchos picos más pequeños e indefinidos debajo de los picos de su secuencia de interés. Este ruido siempre está presente, pero con muestras bien preparadas de buena intensidad de señal, será indetectable. Para determinar si su los datos ruidosos pueden deberse a una señal débil, mire su archivo de traza ABI. Si está mirando un cromatograma en papel, mire hacia la parte superior y media de su traza para ver una línea que diga "Señal". Si el archivo está en y nuestra computadora, haga clic en el botón de radio "A" en la esquina inferior izquierda, que es visible cuando ha abierto el archivo de seguimiento dentro de un programa de visualización, como EditView o Chromas. Desplácese hacia abajo hasta la línea que dice "Señal" y verá los cuatro nucleótidos seguidos de números entre paréntesis. Estos números representan la fuerza de señal promedio de cada nucleótido y sus valores deberían, de manera óptima, estar entre 200-400. Si son mucho menos de 100, entonces puede asumir que sus datos ruidosos se deben al menos en parte a su señal débil.

Porque: No hay suficiente ADN
Soluciones: Verifique dos veces sus cuantificaciones, concentraciones de stock, cálculos y diluciones. Consulte nuestro ¿Qué tipo de ADN podemos secuenciar y cuánto necesitamos? sección para asegurarse de haber proporcionado la cantidad adecuada de ADN y / o cebador.

Porque: Contaminante inhibidor, por ejemplo, sales, fenol
Soluciones: La reacción de secuenciación cíclica utilizada para amplificar muestras para la secuenciación automática es muy sensible a la presencia de ciertos contaminantes, algunos de los cuales pueden inhibir parcial o completamente nuestra enzima de secuenciación. Consulte la tabla de contaminantes en el Preparación y purificación de plantillas sección para obtener una lista de inhibidores potenciales y las cantidades que son tolerables. Es posible que deba volver a purificar su muestra para eliminar suficientemente uno o más componentes inhibidores para obtener mejores datos de secuencia.

Porque: ADN degradado de nucleasas, congelación-descongelación repetida, exposición excesiva a la luz ultravioleta, tratamiento con bisulfito.
Soluciones: La contaminación por nucleasa en una preparación de plantilla, así como los ciclos repetidos de congelación-descongelación, pueden degradar el ADN con el tiempo. Incluso pequeñas cantidades de nucleasas pueden degradar ampliamente el ADN dependiendo de las condiciones y temperaturas de almacenamiento, así como del período de tiempo que se almacena el ADN. Generalmente, será necesario volver a aislar y purificar el ADN molde para obtener una buena secuencia de ADN. Al extraer productos de PCR de un gel, la exposición prolongada a la luz ultravioleta degradará y dañará el ADN. Limite el tiempo y la intensidad de los rayos UV tanto como sea posible para evitar la degradación. Al tratar ADN con bisulfito para experimentos de metilación, es importante evitar incubaciones prolongadas a temperaturas más altas, ya que en este proceso se degradarán cantidades sustanciales de ADN.

Causa: Tromper en el empeoramiento de los datos?
Soluciones: Si anteriormente ha podido obtener buenos datos de secuencia pero comienza a ver un deterioro en la calidad que empeora progresivamente, es posible que tenga algo de contaminación en uno o más reactivos, o que algunos reactivos hayan llegado al final de su utilidad. Prepare reservas frescas de reactivos de uso común, como tampones, y utilice siempre agua destilada de alta calidad en sus preparaciones.

Porque younión de cebadores ineficaz (Tm baja, cebadores degenerados, desajuste)
Soluciones: la Tm de un cebador se define como la temperatura a la que el 50% del oligonucleótido y su complemento perfecto están en dúplex. La Tm de un oligo se puede calcular aproximadamente mediante la fórmula:

Esta es la fórmula más comúnmente utilizada para calcular la Tm, aunque no es la más precisa ya que no tiene en cuenta las concentraciones de sal o formamida. Un buen sitio web para consultar si está interesado en alguna teoría detallada detrás de los cálculos de Tm es http://www.sigma-genosys.com/oligo_meltingtemp.asp.

En nuestra reacción de secuenciación del ciclo, nuestro paso de recocido de cebador / molde se produce a 50ºC. Por lo tanto, si la Tm de su cebador es mucho menor que 50ºC, la hibridación con su plantilla complementaria será mucho menos eficiente y se generará un número menor de fragmentos extendidos. Aumente su Tm de imprimación agregando bases adicionales en el extremo 5 'o 3' para elevar la Tm dentro del rango de 52ºC-58ºC. Los cebadores degenerados y aquellos con bases no coincidentes también mostrarán una menor eficiencia de hibridación debido a la reducción de la estabilidad de la unión del cebador, y si se producen degeneraciones o desajustes en o cerca del extremo 3 'de su cebador, es muy probable que su intento de secuenciación falle. .

Múltiples picos dentro de su secuencia

La presencia de múltiples picos dentro de su secuencia puede deberse a numerosos factores. Para ayudar a determinar la causa, puede ser útil observar dos aspectos: dónde comienzan los picos múltiples, así como la fuerza general de la señal de su muestra. Como se mencionó anteriormente en la sección Datos ruidosos con señal débil, las muestras con baja intensidad de señal pueden tener un ruido de fondo artificialmente alto que puede dar la apariencia de múltiples picos. Sin embargo, si los números de intensidad de la señal promedio están por encima de 100 aproximadamente, es poco probable que la interferencia de fondo sea su problema exclusivo. Hemos dividido esta sección en dos partes, según el lugar donde comienzan sus múltiples picos.

Desde el principio

Porque: Múltiples sitios de cebado que involucran vectores
Solución: Su cebador puede tener un sitio de hibridación secundario que puede ser idéntico o estar estrechamente relacionado, con diferentes secuencias de nucleótidos después de cada sitio, dando bandas superpuestas dentro de su secuencia. Si los sitios de cebado son idénticos (como cuando está presente más de un sitio del promotor T7, por ejemplo), los picos dobles serán fuertes desde el principio. Los fragmentos también pueden mostrar migración desplazada de modo que los picos dobles no estén directamente uno encima del otro, sino que estarán desplazados hacia un lado o hacia el otro debido a los diferentes patrones de movilidad de las hebras con diferente composición de nucleótidos. En otros casos, un sitio de cebado secundario puede no ser exactamente el mismo, pero puede diferir en algunas bases internas. En este caso, es posible que el cebador no coincidente no hibride de manera tan eficiente, pero aún puede hibridar y extenderse, y dar lugar a fragmentos menos intensos que se pueden ver debajo de los picos de interés. En ambos casos, es necesario seleccionar tanto su vector como insertarlo cuidadosamente para buscar secuencias que puedan coincidir o ser similares a su cebador propuesto. Es posible que deba elegir otro cebador de vector en el mismo extremo del sitio de clonación múltiple o rediseñar su cebador personalizado. Cuando es difícil elegir otra imprimación, como cuando la imprimación camina a través de un área repetitiva, intente encontrar una imprimación que tenga una coincidencia de base 3 'específica para su área de interés que pueda ayudar a actuar como un "ancla".

Porque: Múltiples sitios de cebado en PCR
Solución: Esto puede ocurrir cuando uno o ambos cebadores de PCR se hibridan con más de una posición en el ADN molde, dando lugar a múltiples productos de PCR. A menudo, esto será obvio al visualizar los productos de PCR en un gel de agarosa, ya que habrá más de una banda presente. En este caso, será necesaria la purificación en gel del producto deseado. Sin embargo, se pueden encontrar dificultades cuando los productos son de tamaño muy similar, lo que puede surgir al amplificar ADN relacionado o repetitivo, y no se separan bien en el gel. En este caso, puede ser necesaria la optimización de la reacción de PCR o el rediseño de los cebadores de PCR para elegir un sitio de cebado más específico.

Porque: Cebadores de PCR que actúan como directo e inverso
Solución: A veces, se puede generar un producto de PCR cuando un cebador funciona como cebador directo e inverso en la reacción de PCR, dando lugar a un producto artificial. Esto es bastante fácil de detectar cuando se secuencia el producto de PCR, ya que un cebador dará picos dobles desde el principio, mientras que el otro no proporciona datos de secuencia. Rediseñe su conjunto de cebadores de PCR.

Porque: Cebadores de PCR residuales y / o dNTP
Solución: Como hay dos cebadores presentes en la reacción de PCR, la eliminación incompleta de estos cebadores puede dar lugar a picos dobles en los datos de secuenciación. Ambos cebadores actuarán como cebadores de secuenciación y conducirán a bandas superpuestas que corresponden a las hebras complementarias de orientaciones opuestas. Es fundamental eliminar el exceso de cebadores y dNTP de la reacción de PCR mediante purificación (consulte nuestra Preparación y purificación de plantillas sección para nuestras recomendaciones sobre purificación por PCR). Si intenta realizar una secuenciación directa de productos de PCR sin purificación diluyendo una alícuota de su producto de PCR con agua para reducir la concentración de cebadores residuales y dNTPS (un método que no recomendamos), entonces es imperativo optimizar su reacción de PCR para que los cebadores y dNTPS se utilizan en cantidades limitadas, de modo que la mayoría se agotan al final de la PCR.

Porque: Imprimaciones con alta Tm
Solución: Los cebadores que tienen una Tm mucho más alta (& gt65ºC) que los 52ºC-58ºC sugeridos a menudo no funcionan bien como cebadores de secuenciación. Cuando los cebadores tienen una Tm tan alta, a menudo es el resultado de un mayor contenido de G-C o porque el cebador es bastante largo, ambos factores pueden aumentar el potencial de formación de la estructura secundaria del cebador. Si es posible, elija otra imprimación con una Tm más baja. Si eso no es óptimo, avísenos y podemos realizar un método de secuenciación de ciclo de dos pasos que elimina el paso de recocido de temperatura más baja de 50ºC y procede del paso de desnaturalización de 96ºC al paso de extensión de 60ºC. El paso de 60ºC, en este caso, funcionará como paso de recocido y de extensión. A veces, esto puede mejorar los resultados de la secuenciación.

Porque: Cebadores con población n-1

Solución: Este problema no es infrecuente y puede resultar de una síntesis de mala calidad de los cebadores de secuenciación. Los cebadores se sintetizan desde el extremo 3 'al extremo 5' y cuando la síntesis es ineficaz, puede haber una población significativa de cebadores inferiores a los de longitud completa, n-1, que son cebadores de longitud completa menos una base, más otros más cortos. derivados. Estos cebadores tienen un extremo 3 común pero diferentes extremos 5, por lo que las cadenas que terminan en la misma posición tendrán diferentes longitudes y se ejecutarán en diferentes posiciones en el gel. Los imprimadores que se han degradado desde el extremo 3 también darán esta apariencia. Es fácil detectar este problema dentro del cromatograma de secuenciación ya que cada posición contendrá el pico verdadero así como el pico inmediatamente a la derecha, dando la apariencia de picos de "sombra". Cualquiera que sea la causa de los n-1, será necesario resintetizar el cebador para obtener un oligo de calidad adecuada para la secuenciación. Cuando se utilizan reactivos de alta calidad y protocolos adecuados durante la síntesis de oligonucleótidos, normalmente no es necesaria la purificación por cartucho o HPLC de los cebadores para los oligonucleótidos típicos (& lt30 pb), pero a veces puede resultar beneficiosa una purificación adicional.

Empiece más lejos en la secuencia

Porque: Preparación de plásmidos mixtos
Solución: Una preparación de plásmido que está contaminada por más de un producto, como dos vectores con insertos diferentes o un vector con inserto y vector sin, generalmente mostrará una sección temprana de datos de secuencia limpia (secuencia de sitios de clonación múltiple de vector común) seguida de picos dobles.Ocasionalmente, un plásmido puede contener más de una molécula de vector o puede encontrar deleciones o inserciones espontáneas durante el crecimiento. El punto en el que comienzan los picos dobles corresponde al inicio del sitio de clonación del inserto. Para evitar este problema, es importante elegir con cuidado una sola colonia de su placa de crecimiento, volviendo a sembrar si es necesario, para asegurarse de que su colonia sea completamente clonal. Debe continuar con una digestión de restricción de su plásmido en un gel de agarosa para asegurarse de que el vector y el inserto estén presentes como se esperaba.

Porque: Regiones homopoliméricas

Solución: Las regiones que contienen tramos largos de un solo nucleótido pueden ser difíciles de secuenciar con precisión. Los tramos cortos de regiones homopoliméricas generalmente no son difíciles de atravesar, pero los tramos más largos pueden ser un desafío. Los datos de secuencia hasta la región polinucleotídica inclusive pueden estar bien, pero la última base de la región poli y todos los picos que la siguen pueden mostrar un patrón de tartamudeo en forma de onda de picos dobles que no se pueden interpretar. Esto tiende a ser más problemático en los productos de PCR, pero también puede ocurrir cuando se secuencian plásmidos, especialmente cuando se intenta secuenciar la región poliA del ADNc. Se cree que esta dificultad surge debido al "deslizamiento" de la enzima cuando la hebra en crecimiento no permanece emparejada correctamente con el ADN molde durante la polimerización a través de la región del homopolímero, dando lugar a fragmentos de diferentes longitudes que tienen la misma secuencia después de esta área. Al secuenciar el ADN clonado con una región de homopolímero, se pueden probar varias opciones. En nuestra química de secuenciación BigDye Terminator, dTTP ha sido reemplazado por dUTP, que reduce la temperatura de fusión del ADN. Sin embargo, también tiene el efecto de aumentar la predisposición al deslizamiento que se produce a través de las regiones polyT (donde A está en la hebra plantilla). Se puede utilizar una química de secuenciación alternativa, la química de la dRhodamina, en la que el dTTP todavía está en la reacción y, en general, da mejores resultados a través de estas regiones poliA. Alternativamente, se puede usar un cebador oligo dT (12-15) que contenga una base oscilante (A, G o C) en el extremo 3 'para anclar el cebador en su lugar al final de la región poliA y obtener una secuencia limpia a continuación. La secuenciación de la hebra opuesta a veces puede tener más éxito, especialmente cuando se pasa por una región polyG, ya que la hebra polyC suele ser más fácil de atravesar. A veces, el diseño de un cebador nuevo que esté más cerca de la región homopolimérica puede ayudar, ya que la concentración de nucleótidos y la actividad enzimática estarán en un rango más óptimo al extender los fragmentos más pequeños en la reacción de secuenciación del ciclo. Y, por último, podemos intentar ajustar las condiciones de secuenciación de nuestro ciclo, ya que las temperaturas de recocido más altas y los tiempos de extensión más largos a veces pueden ser útiles en casos como este. Se pueden usar enfoques similares cuando se intenta secuenciar productos de PCR con regiones homopoliméricas, pero, al final, a veces puede ser necesario clonar el producto de PCR para leer el tramo repetitivo.

Porque: Compresión
Solución: A veces se pueden observar compresiones cuando se forma una región de estructura secundaria en la hebra amplificada de ADN, lo que conduce a una alteración en la movilidad electroforética de la hebra de ADN. Esto puede aparecer como fragmentos superpuestos después de cierto punto y puede parecerse a una preparación de plásmido contaminada, pero la preparación contaminada mostrará picos dobles que comienzan en el sitio de inserción. Para relajar esta compresión, a veces podemos alterar las condiciones de secuenciación del ciclo o usar aditivos para desnaturalizar la estructura secundaria. Alternativamente, puede linealizar su ADN o usar 7-deaza-dGTP en una reacción de PCR para ayudar a aliviar la compresión.

Porque: Mutación con desplazamiento de la pauta de lectura
Solución: Una mutación de cambio de marco puede ocurrir cuando se insertan o eliminan una o más bases en el ADN de la plantilla y si hay múltiples productos presentes en su muestra, ya sea ADN plasmídico o producto de PCR, verá una secuencia limpia hasta el punto de la mutación. , seguido de picos dobles causados ​​por el cambio en la secuencia de nucleótidos. En el caso del ADN plasmídico, será necesario volver a aislar su ADN para obtener un clon puro que contenga solo una de las moléculas. Con los productos de PCR, deberá purificar en gel los dos productos para separarlos.

Secuencias truncadas

Las secuencias truncadas se pueden caracterizar como abruptas o graduales. Los truncamientos abruptos mostrarán una señal fuerte y limpia hasta un punto y luego caerán bruscamente en el transcurso de unos pocos nucleótidos a una señal mucho más débil o no detectable. Los truncamientos graduales mostrarán buenos datos de secuencia inicialmente, pero luego comenzarán a disminuir progresivamente a picos más pequeños y más débiles hasta que no haya nada más que ruido de fondo. La naturaleza del truncamiento a veces puede ayudar a determinar su causa.

Porque: Estructura secundaria


Porque: ADN linealizado
Solución: Si su ADN ha sido cortado con una o más enzimas de restricción, los datos de la secuencia terminarán bruscamente en el sitio de reconocimiento de la enzima que cortó en el extremo 3 'de su inserto. ¿Nos enviaste accidentalmente ADN digerido? Ejecútelo en un gel para ver.

Porque: Demasiado ADN


Solución: Si bien existe un rango de concentraciones de ADN que podemos secuenciar de manera confiable, demasiado ADN provocará la terminación prematura de la señal. La sobrecarga de ADN exhibirá picos superiores pesados ​​seguidos de un rápido debilitamiento de la altura y la fuerza de los picos. Esto ocurre porque el dNTPS en la reacción de secuenciación del ciclo se distribuirá entre demasiadas cadenas que se extienden y se agotará al principio, lo que dará como resultado una cantidad excesiva de fragmentos cortos. La sobrecarga es una preocupación especial al realizar la secuenciación en nuestro sistema capilar 3100, ya que es mucho más sensible a la concentración de ADN y menos tolerante a la sobrecarga de ADN, y la sobrecarga severa reducirá la vida útil de nuestras matrices capilares (muy caras). Además, si su plantilla es impura, las concentraciones más altas de ADN pueden ir acompañadas de cantidades más altas de contaminantes que pueden empeorar aún más la calidad de su secuencia de ADN. Por lo tanto, cuantifique cuidadosamente el ADN de su plantilla y consulte nuestra Métodos para la sección de cuantificación. por nuestras recomendaciones.

Porque: Sales
Solución: Cantidades excesivas de sales también darán lugar a una terminación prematura y pueden parecer similares a la sobrecarga del ADN, con una señal fuerte seguida de una señal que se debilita progresivamente. Las sales tienen un efecto inhibidor sobre la procesividad de la secuenciación de la polimerasa Taq, lo que puede conducir a una sobreabundancia de fragmentos cortos, o si la concentración de sal es demasiado grande, la enzima se inhibirá por completo sin que se obtengan datos de secuencia. Si las sales son un problema potencial, realice una precipitación con etanol para eliminar la sal.

Porque: Regiones repetitivas

Solución: La composición de nucleótidos, así como el tamaño, de una región repetitiva pueden jugar un papel importante en el éxito de la secuenciación a través de dicha área. En general, las repeticiones de GC y GT (que se ven a menudo en el ADN tratado con bisulfito) tienden a ser las más problemáticas, aunque, como se mencionó anteriormente, la versión más reciente de Applied Biosystems BigDye Terminator v3.1 contiene algunas modificaciones que han permitido algunas mejoras sorprendentes en ciertas plantillas previamente difíciles. Sin embargo, todavía hay algunos que siguen siendo un dolor. En general, se puede secuenciar parcialmente a través de la región repetitiva y la señal comienza a desvanecerse y finalmente se vuelve ilegible. Esto puede deberse al agotamiento prematuro de dNTP, la formación de estructuras secundarias o el deslizamiento de la enzima. Se pueden probar varios métodos para secuenciar la repetición por completo, y muchos son similares a los que usaríamos para las plantillas ricas en G-C que forman estructuras secundarias, incluida la adición de betaína o DMSO y / o alteraciones en los parámetros de secuenciación del ciclo. Si la región de repetición no es excesivamente grande, la secuenciación de la hebra opuesta para completar la región puede tener éxito, especialmente si la hebra complementaria tiene una composición de nucleótidos que se extiende de manera más eficaz. Sin embargo, si la región es grande, puede resultar difícil completar su secuencia completa y determinar el número exacto de repeticiones presentes. Puede ser necesario utilizar métodos alternativos, tales como deleciones dirigidas o el uso de un sistema de transposones in vitro.

Artefactos de secuenciación

Definitivamente existe un vínculo entre la preparación de la plantilla y el grado en que estos artefactos pueden ser un problema, por lo que cuanto más limpia y cuantificada sea su muestra, menos problemas serán estos artefactos. Las muestras limpias con una señal fuerte generalmente no se ven afectadas por estos artefactos y, si lo están, muchas veces se pueden identificar y corregir los picos verdaderos. Inspeccionamos visualmente cada cromatograma y editamos lo que podemos. Pero cuando detectamos un artefacto que probablemente se debió a un problema de limpieza del instrumento o secuenciación posterior al ciclo, y no podemos estar seguros de la llamada base correcta, y su muestra tuvo una buena intensidad de señal y ningún otro problema obvio, repetiremos la muestra, BAJO PEDIDO, sin cargo. Le pedimos que también inspeccione su cromatograma y si hay un artefacto de secuenciación que causa dificultad con su análisis y cumple con los criterios anteriores, háganoslo saber de inmediato y volveremos a analizar la muestra tan pronto como podamos. Almacenamos las muestras que han reaccionado durante varios días (ADN y cebadores durante 2-3 meses) pero luego las desechamos, así que avísenos lo antes posible si desea que se repita.

Artefacto: "Manchas de tinte"

Solución: Las gotas de colorante son moléculas terminadoras de colorante no incorporadas que han pasado a través de las columnas de limpieza y permanecen en solución con el ADN purificado cargado en los secuenciadores. Se ven con mayor frecuencia con muestras que tienen baja intensidad de señal. Las muestras con señal débil generalmente 1) no tenían suficiente ADN, por lo que había menos plantilla inicial para amplificar y marcar, dejando así una mayor proporción de moléculas de colorante no incorporadas o 2). contenía contaminantes que inhibían la reacción de secuenciación y se teoriza que ciertos contaminantes pueden tener una predisposición a unirse a estos grumos de tinte. Y hemos notado un patrón en el que ciertas muestras de clientes, en su conjunto, tienen más probabilidades de contener manchas de colorante independientemente de la intensidad de la señal. En general, las manchas de colorante aparecen como picos anchos e indefinidos de uno o dos colores (generalmente rojo y azul en los datos de 3100) con los verdaderos picos de ADN debajo, y tienden a ocurrir relativamente temprano en los datos, generalmente antes de 50-60 pb. así que para muchos, no son un gran problema ya que sigue siendo una secuencia vectorial. La repetición de muestras con manchas de tinte generalmente no es demasiado exitosa, ya que no suelen desaparecer, pero a veces se vuelven menos intensas. Con muestras muy débiles, a menudo no hay mucho que podamos hacer para corregir los datos. Sin embargo, con muestras de intensidad de señal promedio, generalmente se pueden corregir fácilmente, ya que los picos reales a menudo son visibles debajo.

Artefacto: "Picos"

Solución: Los "picos" se ven como picos multicolores dentro de la secuencia que generalmente oscurecen los datos de solo uno o dos nucleótidos, y ocurren en muestras procesadas en secuenciadores capilares como el 3100. Son causadas por pequeñas burbujas de aire dentro del polímero líquido. o por pequeños trozos de polímero seco que se han desprendido y han entrado en un capilar. Nuevamente, parece haber una ligera predisposición a que algunas muestras de clientes experimenten estos artefactos y, cuando ocurren, son mucho más pronunciados en muestras con señal débil. Cuando una muestra tiene una señal fuerte, a menudo no son detectables, pero hay ocasiones en las que pueden ser muy visibles. Lo bueno es que, en la mayoría de los casos, siempre se pueden corregir al volver a ejecutar. Por lo tanto, háganos saber si desea una repetición debido a un pico; para aquellos de ustedes que solo estén interesados ​​en una pequeña región separada que no se vea afectada por algo como esto, no habría necesidad de volver a ejecutar, pero para aquellos que están buscando en un marco de lectura completo, por ejemplo, nos damos cuenta de que esto sería un problema. Por lo tanto, como no podemos conocer los experimentos y las regiones de interés de todos, le pedimos que nos ayude y nos informe cuando este problema afecte sus análisis y lo repetiremos rápidamente.

Artefacto: Pérdida de resolución

Solución: Las muestras que exhiben pérdida de resolución (o LOR) inicialmente mostrarán picos nítidos y bien definidos que, después de un tiempo, comienzan a ensancharse y a deteriorarse progresivamente en calidad hasta un punto en el que estos picos anchos se vuelven ilegibles. La aparición de este problema a veces puede estar relacionada con el instrumento y en otras ocasiones puede estar relacionada con la muestra. Cuando la causa está relacionada con el instrumento, generalmente se debe a un llenado capilar inadecuado cuando se bombea polímero nuevo a través de la matriz. Al modificar un parámetro en el software que condujo a un llenado más lento y completo de los capilares, hemos podido reducir drásticamente la incidencia de LOR. Cuando el problema está relacionado con la muestra, se cree que se debe a un contaminante (actualmente) desconocido. Se ha especulado que es más probable que este contaminante esté presente cuando las columnas disponibles en algunos kits comerciales de minipreparación están muy sobrecargadas. Como suele ser difícil determinar la causa exacta de la LOR esporádica, volvemos a analizar automáticamente las muestras que presentan LOR y, casi siempre, la muestra funcionará bien la segunda vez.

Regiones homopoliméricas

- Consulte la discusión sobre homopolímeros más arriba en Múltiples picos dentro de sus secuencias, regiones homopoliméricas.

Bases faltantes / extra

Cuando está analizando los datos de su secuencia y parece que se han insertado o eliminado una o más bases, lo primero que debe hacer siempre es inspeccionar visualmente su cromatograma. A menudo, la ambigüedad se debe a un análisis de software incorrecto de los picos y, por lo general, se producirá al principio de la secuencia o mucho más tarde, cuando la resolución de fragmentos grandes no sea la óptima. Los problemas de análisis suelen corregirse fácilmente. Lee nuestro Interpretando sus cromatogramas primero para obtener una descripción general básica sobre cómo evaluar rápidamente una traza y tener una idea de su calidad general. Luego, busque a continuación algunos ejemplos más específicos de problemas de software, así como algunas situaciones menos comunes en las que los nucleótidos realmente pueden faltar o estar insertados.

Porque: Dificultades de llamada base
Solución: Como se mencionó anteriormente, nuestro software de análisis de secuenciación no siempre es 100% preciso al asignar designaciones de base, y estos errores ocurren con mayor frecuencia al principio de la secuencia (los primeros 50 pb más o menos) y mucho más tarde en la secuencia, para diferentes razones. Al principio de la secuencia, los fragmentos más pequeños muestran una variabilidad menor en la migración que puede desviar los cálculos que utiliza el software para ajustar el espaciado de picos adecuado, siendo ciertas combinaciones de nucleótidos más susceptibles que otras. Como se mencionó anteriormente, inspeccionamos visualmente todos los archivos de seguimiento y editaremos manualmente las alteraciones que detectemos, y la mayoría son muy fáciles de corregir. Nuestras ediciones manuales aparecerán como letras minúsculas dentro de la secuencia. Sin embargo, siempre le sugerimos ENCARECIDAMENTE que también revise sus archivos de cromatograma para verificar los datos de la secuencia. Lo que buscamos, al principio, son picos que migran muy juntos con un espacio de separación que puede ocurrir en ambos lados. En casos como este, la computadora puede insertar una "N" para compensar el extraño espaciado de picos, aunque en realidad no hay nucleótidos allí. Alternativamente, cuando hay un espacio de espacio como este, el software puede interpretar un pequeño aumento en el ruido de fondo como un pico e insertar por error una base adicional donde no debería haberlo. A veces, cuando los picos están muy juntos, también existe la tendencia de que el software pierda uno de ellos por completo y omita un nucleótido de la secuencia. Y, por último, algunas de las moléculas de tinte no incorporadas en exceso migrarán en la misma posición que las primeras bases de su secuencia, a veces oscureciendo las primeras 10-20 bases. Además, los fragmentos más pequeños no siempre se resuelven de forma muy precisa, un problema que parece ser más pronunciado en secuenciadores basados ​​en capilares. Por todas las razones mencionadas anteriormente, siempre es mejor elegir un cebador que esté al menos a 40-50 bases de distancia de su secuencia de interés para que pueda estar seguro de que se encuentra en una región de la mayor precisión. Es más probable que ciertas combinaciones de nucleótidos muestren una migración extraña en los primeros 40-50 pb y, a veces, se mezclan o no se separan bien. Verifique dos veces los datos de la secuencia donde las C son seguidas por A, donde las A son seguidas por G y donde hay dos o tres A seguidas.

También puede encontrar que las ocurrencias de bases adicionales o faltantes se vuelven más frecuentes hacia el final de la secuencia. Existe una limitación en el poder de resolución del polímero para separar los fragmentos más grandes, por lo que aunque la intensidad de la señal de las últimas bandas puede ser todavía bastante fuerte, los picos se volverán más anchos y menos nítidos. La última versión del software Sequencing Analysis incluye algoritmos mejorados que permiten una mejor interpretación del espaciado de estos fragmentos más grandes y ha mostrado una mayor precisión de la llamada base más lejos, pero todavía hay un límite. Con el uso de nuestros protocolos POP-7 modificados y una matriz de 50 cm en nuestros 3100, a menudo obtenemos 900-950 bases, y a menudo más, de & gt98% de precisión en bien preparado plantillas.

Porque: Cebadores de mutagénesis dirigidos al sitio
Solución: Al hacer un cebador de ADN, la síntesis del oligo procede del extremo 3 'al extremo 5'. Durante el procedimiento de síntesis, pueden producirse truncamientos cuando una base específica no se agrega a la cadena de oligo en crecimiento. La química de secuenciación del ADN generalmente permite que estas secuencias de falla se bloqueen y no se extiendan más, pero este proceso no siempre es 100% eficiente y algunos de estos truncamientos continuarán alargándose, con la base interna eliminada. Como resultado, una síntesis de ADN completa no solo contendrá el producto de longitud completa deseado, sino también potencialmente una población de una combinación de todas las posibles secuencias internas de deleción de una sola base. La purificación del cebador eliminará la mayoría de estas secuencias de falla, pero aún puede permanecer una pequeña proporción de estos truncamientos. Entonces, cuando se usa un cebador sintético para la mutagénesis dirigida al sitio, existe la posibilidad de elegir un clon que contenga un oligo que sea uno de estos productos de deleción y no su cebador de longitud completa. Si esto ocurriera, debería intentar seleccionar algunos otros clones para la secuenciación y, a menudo, encontrará uno que contenga el cebador de mutagénesis deseado. Si encuentra que sus clones contienen consistentemente la misma eliminación en la región de su cebador, es posible que se haya producido un error al programar la secuencia del cebador y debe comunicarse con la empresa de síntesis para obtener un cebador nuevo. Para los cebadores de mutagénesis dirigida al sitio, siempre es recomendable optar por purificar el oligo mediante HPLC para minimizar la población de secuencias de falla.


Afiliaciones

Departamento de Biología Molecular Animal, Instituto Nacional de Investigación de Producción Animal, Krakowska 1, Balice, 32-083, Cracovia, Polonia

Klaudia Pawlina-Tyszko, Ewelina Semik-Gurgul, Artur Gurgul, Maria Oczkowicz & amp Tomasz Szmatoła

Centro de Medicina Experimental e Innovadora, Universidad de Agricultura de Cracovia, Rędzina 1c, 30-248, Cracovia, Polonia

Artur Gurgul y amp Tomasz Szmatoła

Departamento de Reproducción Animal, Anatomía y Genómica, Universidad de Agricultura de Cracovia, al. Mickiewicza 24/28, 30-059, Cracovia, Polonia


Resultados

Rendimiento de NGS en muestras de ADN de material fresco congelado y fijado con formalina

Las ejecuciones de secuencia que contenían solo muestras de FF dieron como resultado lecturas significativamente más utilizables (p = 0,0009), definidas como lecturas que pasaron los filtros de calidad (Fig. 2A), aunque la diferencia absoluta en las lecturas utilizables fue solo del 7,1%. El análisis de las estadísticas de la biblioteca mostró un porcentaje significativamente mayor de lecturas en el objetivo (p = 0,002) para las muestras FF en comparación con las muestras FFPE (Fig 2B), donde el número de muestras que contenían un porcentaje bajo de lecturas en el objetivo era limitado. Además, las muestras con un porcentaje bajo en el objetivo y, por lo tanto, una cobertura baja, se pudieron identificar fácilmente: en total, el 7,7% de las muestras fueron excluidas debido a una cobertura media & lt800x, de las cuales el 71% mostró también & lt80% en el objetivo. Estas muestras excluidas consistieron en el 98% de las muestras de FFPE. Los parámetros de calidad restantes, incluido el número de lecturas mapeadas, no mostraron diferencias. Además, todas las regiones objetivo pudieron cubrirse adecuadamente, ya que ninguno de los amplicones mostró una cobertura media por debajo de 100x, lo que llevó a la exclusión del análisis y el 87% de los amplicones para las muestras de FFPE y el 94% de los amplicones para las muestras de FF estaban cubiertos & gt800x en promedio. (Figura S2). Durante el período de admisión de 1,5 años de este estudio, las ejecuciones de la secuencia se realizaron a un nivel estable (S3 Fig), con solo una ligera disminución del porcentaje de lecturas utilizables y un aumento en el porcentaje de ISP de baja calidad desde el momento de la inclusión de muestras FFPE a la mitad de este período de tiempo.

A) Diagrama de caja de las estadísticas de ejecución de muestras FFPE (verde) y FF (naranja) para 4 variables: 1. el porcentaje de densidad de ISP (Ion Sphere Particle) (los pozos direccionables en el chip que tienen una carga detectable) 2. lecturas utilizables de el número total de lecturas (porcentaje de ISP que pasan los filtros policlonales, de baja calidad y de dímero de cebador) 3. policlonales, ISP que contienen más de una secuencia de plantilla por ISP y 4. ISP de baja calidad con una señal baja o irreconocible. Las “bisagras” superior e inferior de las gráficas de caja corresponden al primer y tercer cuartiles (percentiles 25 y 75). El "bigote" superior se extiende desde la bisagra hasta el valor más alto que está dentro de 1,5 * IQR de la línea, donde IQR es el rango intercuartil (la distancia entre el primer y tercer cuartiles). El "bigote" inferior se extiende desde la bisagra hasta el valor más bajo dentro de 1,5 * IQR de la bisagra. Los datos más allá del final de las líneas verticales son valores atípicos y se representan como puntos. B) Las estadísticas de la biblioteca de muestras FFPE (verde) y FF (naranja) la profundidad de lectura de la base objetivo media (incluidas las bases objetivo no cubiertas) el número de lecturas mapeadas al genoma de referencia completo y el porcentaje de lecturas mapeadas que están alineadas con la región de destino. Las diferencias significativas calculadas mediante una prueba t independiente entre las muestras FFPE y FF se representan con ** p = 0,002 o *** p = 0,0009).

En resumen, una muestra de buena calidad podría reconocerse por una cobertura media de al menos 800x y & gt80% en el objetivo.

Al comparar la cobertura de todos los amplicones en Ampliseq Cancer Hotspot Panel v2 entre las muestras FFPE y FF, se observó una cobertura disminuida para los amplicones más largos en las muestras FFPE (Fig. S4). Tampoco hubo una diferencia significativa en la proporción de transiciones de base C & gt T o G & gt A en las muestras FFPE en comparación con las muestras FF (Fig. S5). [27, 28]

Definición de los requisitos para la llamada de mutaciones en muestras de ADN

Para determinar el límite de detección de variantes del ensayo, los experimentos de dilución de cuatro muestras de ADN FF con TP53 Se realizaron mutaciones. Con un R cuadrado de 94,53%, los datos de dilución estaban cerca de las frecuencias alélicas esperadas (línea ajustada, Fig. S6). El conocido TP53 las mutaciones se detectaron de forma fiable hasta una frecuencia alélica del 1%. Como los ensayos de dilución pueden sobrestimar la sensibilidad del ensayo, se estableció, por tanto, un límite de frecuencia de alelos del 5% para que fuera fiable para un uso diagnóstico futuro.

Dado que el porcentaje de células tumorales presentes en el material utilizado para la extracción de ADN es una variable importante que define la capacidad de cualquier ensayo para detectar mutaciones somáticas en muestras de diagnóstico, [29] predijimos que se podría detectar una variante cuando se detectaran al menos 20 lecturas. con una cobertura de 800x para el amplicón, dado que el material de entrada contenía al menos un 10% de células tumorales (Fig. 3). Para la llamada de mutación estándar, es probable que 800x no sea necesario, pero nuestro ensayo se diseñó para obtener una alta sensibilidad incluso para muestras con bajos porcentajes de células tumorales. A continuación, realizamos un análisis de todo el conjunto de datos para evaluar si el porcentaje de células tumorales del material de entrada afectaba la VAF media. Teóricamente, una mutación heterocigótica en una muestra diploide con un 10% de células tumorales puede detectarse de forma fiable cuando se utiliza un límite de detección de una frecuencia del 5%, pero no encontramos una relación entre el porcentaje tumoral y el VAR (fig. 4).

Las líneas representan la cobertura necesaria para un cierto porcentaje de tumores. En este estudio se utilizó un límite de detección de 20 variantes que, combinado con un porcentaje de tumor de al menos el 10%, conduce a una cobertura necesaria de 800x.

La frecuencia de alelos observada para todas las variantes detectadas usando NGS se representa frente al porcentaje de células tumorales determinado por un patólogo. La línea verde representa la línea teórica de la frecuencia alélica esperada de una mutación heterocigótica (somática) frente al porcentaje de células tumorales. Se trazó una línea de regresión lineal forzada (línea negra) para determinar si el aumento del porcentaje de tumor afecta la frecuencia de alelos media detectada con un coeficiente de correlación de 0,041.

Validación de perfiles mutacionales obtenidos con el ensayo Ampliseq

Validamos 328 variantes, de las cuales 323 eran concordantes entre la NGS y las técnicas convencionales, lo que resultó en una concordancia global del 98,5% (sensibilidad del 99,1%) (Figura 5, Tabla 1). De las 5 muestras discordantes, dos variantes falsas negativas de TP53 El exón 8 (p.G266E) se identificaron usando secuenciación de Sanger pero no usando NGS, una discrepancia que no pudo resolverse. Se identificó una tercera variante de falso negativo en TP53 exón 7 (c.757_758insA, p.T253fs * 11) que no fue llamado por TVC pero fue claramente visible en IGV. La única variante de falso positivo fue TP53, exón 7 (c.723delC, p.C242fs * 5) que fue llamado por TVC pero no era visible en IGV en la verificación manual. La variante discordante final se identificó en EGFR exón 21 (p.L858R) con una VAF del 7,3% que no se detectó mediante el análisis de HRM debido al bajo porcentaje de células tumorales del material de entrada (estimado en 5-10%). TP53 no está completamente cubierto en el panel Ampliseq resultando en 19 muestras donde un TP53 La variante se identificó con la secuenciación de Sanger, que no se pudo identificar usando NGS (Tabla S4). Estos datos apoyan la conclusión de que el flujo de trabajo Ion Torrent AmpliSeq es una técnica confiable para el análisis de mutaciones y las verificaciones manuales en IGV mejoran aún más su confiabilidad.

A) El número absoluto de muestras con una mutación en varios genes como se indica en el eje x que se utilizaron para la validación de NGS mediante la plataforma Ion Torrent. Todas las muestras están codificadas por colores: azul oscuro son las muestras concordantes con la misma mutación en estándar versus NGS, el azul intermedio son las muestras concordantes que no muestran ninguna mutación, la barra azul claro representa las muestras discordantes B) Los mismos datos que se muestran en la Figura 5A , sin embargo representados como porcentajes de todas las muestras analizadas para un gen determinado.

Interpretación de los datos obtenidos con el ensayo Ampliseq

Para comprender mejor si los resultados de NGS reflejan un patrón mutacional esperado, analizamos todas las mutaciones identificadas en el TP53, KRAS, BRAF, EGFR y PIK3CA genes en un conjunto de datos final que contiene 386 muestras, 290 derivadas de material FF y 96 derivadas de material FFPE. Aunque el panel AmpliSeq no cubre todo el TP53 gen, se identificaron mutaciones en toda la región objetivo (Fig. 6A). La comparación con la base de datos TCGA muestra una superposición del 82% de nuestros hallazgos en comparación con la base de datos TCGA (Fig. S8). Como era de esperar, se identificó una distribución de mutación limitada para KRAS, BRAF, EGFR y PIK3CA (Fig. 6B-6E) ya que estos genes contienen ubicaciones de puntos calientes mutacionales, que podrían detectarse de forma fiable en este ensayo. De interés, varias partes del PIK3CA Los genes se secuenciaron sin identificar mutaciones, lo que sugiere la ausencia de un sesgo sistemático hacia hallazgos falsos positivos basados ​​en la elección de los amplicones secuenciados.

Todos los gráficos representan un gráfico de paleta (adaptado de (Vohra y Biggin, 2013)) que muestra variantes identificadas en relación con una representación esquemática del gen. Cualquier posición con una mutación obtiene un círculo, la longitud de la línea depende del número de mutaciones detectadas en ese codón. La barra gris representa la proteína completa con las diferentes posiciones de aminoácidos (aa). Los cuadros de colores son dominios funcionales específicos. En la parte superior de las piruletas, las variantes más frecuentes se anotan como el cambio de aminoácidos en ese sitio específico. Las líneas negras debajo del cuadro gris indican las regiones donde el panel Ampliseq cubre el gen. A) Mutaciones identificadas en el TP53 gen usando NGS, B) KRAS, C) BRAF, D) EGFR y E) PIK3CA.

Para todas las muestras, se utilizó el sitio de origen del tumor para analizar la frecuencia de distribución mutacional entre los diferentes tipos de tumores. Como se esperaba, TP53 resultó ser el gen mutado con más frecuencia en este conjunto de tumores no seleccionados (Fig. 7A). El conjunto de datos contiene un sesgo de muestra hacia el cáncer colorrectal, el carcinoma de pulmón de células no pequeñas (NSCLC) y el melanoma probablemente causado por el hecho de que en estos tipos de tumores los datos mutacionales ya influyen en la elección de la terapia y, por lo tanto, es más probable que los médicos soliciten análisis NGS en los pacientes. con tales tumores (Fig. S7).

A) Mapa de calor del número de variantes por grupo tumoral. En el eje y se representa el sitio diferente del tumor primario y en el eje x se representan todos los genes con datos mutacionales. El número relativo de mutaciones se define como el número de mutaciones normalizadas por número de muestras en el grupo tumoral. B) co-ocurrencia de diferentes variantes en tumores colorrectales. El tamaño del círculo alrededor de un gen es indicativo del número de veces que se identifica una variante en el gen. Las líneas representan co-ocurrencias entre genes donde el grosor de la línea indica el número de co-ocurrencias. El color de los círculos indica la función del gen: oncogenes y genes supresores de tumores verdes, tirosina quinasas receptoras de color púrpura, vía rosa-PI3K, vía amarilla-KRAS / BRAF.


Conclusiones

Los avances tecnológicos permitieron mejorar las habilidades técnicas en la secuenciación de ácidos nucleicos. Desde los resultados iniciales de la técnica de Sanger hasta la secuenciación real de la próxima generación, se ha trabajado mucho tratando de considerar la “variabilidad individual” para pasar a la “medicina personalizada”. Actualmente, la tecnología NGS se destaca como uno de los enfoques más poderosos y efectivos para la secuenciación rápida de ADN / ARN. En la investigación del cáncer, muchos científicos se esfuerzan por aprovechar al máximo esta tecnología y algunos laboratorios están comenzando a mostrar datos interesantes, especialmente en el caso del CCR. Sin embargo, cabe señalar que la cantidad de datos en el campo aún es limitada. Se requieren estudios adicionales para obtener una confiabilidad más significativa de esta tecnología para la aplicación clínica. Esto significa que, tal vez, una optimización adecuada para descubrir todo el potencial de estas plataformas podría lograrse en algunos años a partir de ahora. El concepto del uso de NGS en la rutina clínica es desafiante, ya que estas herramientas producen buenos resultados en términos de detección de mutaciones clínicamente relevantes, pero a menudo no pueden repetir estas actuaciones exitosas cuando se someten a análisis regiones más amplias del genoma. Las mejoras específicas en los métodos de control de calidad (es decir, la identificación de parámetros de calidad correctos) podrían ayudar enormemente a superar estos problemas. Además, la introducción de la tecnología NGS como herramienta clínica requerirá medidas seguras para la estandarización de procesos, manejo e interpretación de datos. Se debe prestar mayor atención al trabajo de bioinformáticos y bioestadísticos para el análisis de la enorme cantidad de datos que estos sistemas generarán. Los desafíos clínicos se basan principalmente en la obtención de datos precisos que también pueden ser fáciles de interpretar, teniendo en cuenta los aspectos críticos relacionados con la detección de mutaciones somáticas en el CCR y los tumores sólidos, principalmente la precisión en la identificación de lesiones con frecuencias alélicas muy bajas. A este respecto, se deben diseñar enfoques innovadores para la alineación, el ensamblador y la llamada de variantes para aumentar la precisión de todo el flujo de trabajo de NGS. Aún hoy, los enfoques bioinformáticos son agnósticos sobre la enfermedad en estudio y no incorporan en su cálculo el conocimiento específico de la enfermedad o el gen bajo análisis, como lo hacen los científicos en sus evaluaciones. En esta dirección, un enfoque disruptivo sería idear nuevos métodos bioinformáticos que sean conscientes de la patología y enfermedad que buscan los científicos y sumen este conocimiento mientras ejecutan su análisis. En nuestra opinión, esto aumentaría considerablemente la precisión de los resultados de NGS. Al mismo nivel, se deben realizar inversiones para la educación y formación adecuadas de los médicos sobre la interpretación de la importancia clínica de los datos obtenidos.

En conclusión, la tecnología NGS seguramente representa un gran paso adelante en la dirección hacia la medicina personalizada contra el CCR, pero se necesitan más análisis para alcanzar resultados más completos y un nivel más alto en nuestra visión del panorama general.


Ver el vídeo: SECUENCIACION DE SANGER. REACCION DE EDMAN. LA BIOLOGIA MOLECULAR- GRUPO 4 (Junio 2022).