El análisis del perfil genómico de tipo difuso cánceres gástricos
Resumen Antecedentes
cáncer de estómago es la tercera más mortal de todos los cánceres en todo el mundo. Aunque la incidencia de cáncer gástrico de tipo intestinal se ha reducido, la incidencia de tipo difuso sigue aumentando y su progresión es notoriamente agresivo. No hay suficiente información sobre las variaciones del genoma de cáncer gástrico de tipo difuso, ya que sus células se mezclan generalmente con las células normales, y esto baja celularidad ha hecho que sea difícil analizar el genoma.
: Resultados de la Analizamos genomas enteros y exomas correspondientes de cáncer gástrico de tipo difuso, utilizando tumoral emparejados y muestras normales de 14 difusa de tipo y cinco de tipo intestinal pacientes con cáncer gástrico. variaciones somáticas se encuentran en el cáncer gástrico de tipo difuso se comparan con los de los de tipo intestinal y para informó anteriormente variantes. Determinamos la tasa de mutación somática exonic promedio de los dos tipos. Encontramos genes asociados conductor candidato, e identificar siete nuevas mutaciones somáticas en CDH1
, que es un gen asociado al cáncer gástrico bien conocido. análisis de la estructura tridimensional de la proteína E-cadherina mutada sugiere que estas nuevas mutaciones somáticas podrían causar perturbaciones funcionales significativas de sitios críticos de unión al calcio en la unión EC1-2. análisis de la inestabilidad cromosómica muestra que la MDM2
gen se amplifica. Después de un análisis estructural a fondo, una novedosa fusión de genes TSC2
se identifica -RNF216
, lo que puede alterar de forma simultánea las vías de tumor supresor y activar la tumorigénesis.
Conclusiones
Se presenta el perfil genómico de tipo difuso gástrico cánceres, incluyendo nuevas variantes somáticas, un gen de fusión novedosa, y la amplificación y supresión de determinadas regiones cromosómicas que contienen oncogenes y supresores de tumores.
Antecedentes
filas de cáncer de estómago como la tercera causa más importante de mortalidad mundial del cáncer [1]. Punto de vista histopatológico, el cáncer gástrico (CG) se pueden clasificar en dos categorías basadas en las diferencias morfológicas: de tipo intestinal GC (CIG) y de tipo difuso GC (DGC) [2, 3]. CIG se asocia típicamente con la infección por Helicobacter pylori
, y es especialmente común en Japón y Corea [4-6]. DGC se distribuye de manera uniforme geográficamente, e incluye formas agresivas clínicos, tales como linitis plástica, que tienen un mal pronóstico, especialmente en pacientes jóvenes [7, 8]. modificaciones del ADN genómico que conducen a GC pueden ocurrir como resultado de varios factores de riesgo ambientales, tales como una dieta alta en sal y el tabaco de fumar [9]. Aunque la incidencia de la CIG ha disminuido de forma constante durante varias décadas (reducción del 44% a partir de 1978 a 2005), DGC aumentó rápidamente (en un 62%) a partir de 1978 hasta 2000, antes de disminuir ligeramente en el período 2001-2005 [10]. A pesar de la evidencia acumulada de que CIG y DGC se desarrollan a través de diferentes vías cancerígenos [11, 12], los datos detallados escala genómica para la DGC con carencias debido a la disponibilidad limitada de muestras clínicas y un bajo nivel de pureza de la población de células cancerosas.
A la fecha, se han identificado muy pocos genes asociados con subtipos GC. El CDH1
gen, que codifica la proteína E-cadherina, son los genes más conocidos asociados con DGC hereditaria (CGDH) [13-16]. El cribado genético para estas mutaciones se ha sugerido con el fin de diagnosticar de inicio temprano GC [17]. disfunción E-cadherina, causada por mutaciones, pérdida de heterocigosidad y la hipermetilación del promotor, es el defecto más bien establecida en la iniciación y el desarrollo GC [18-20]. Un estudio de asociación del genoma mostró que los polimorfismos en el gen de la madre de la próstata antígeno de células (PSCA
) están fuertemente asociados con la susceptibilidad a la DGC [21]. El método basado en micromatrices, sin embargo, se limita a las variaciones de nucleótido único, y no puede detectar variaciones estructurales copia neutral (SVS). Dos estudios recientes informaron sobre exomas GC, y mostraron que las mutaciones en el gen ARID1A
se detectan con frecuencia en GC con inestabilidad de microsatélites, y en el virus de Epstein-Barr (EBV) -positivo GCs [22, 23]. No se realizó un análisis de subtipos de GC, y la mayoría de las muestras analizadas en los estudios provenía de pacientes con CIG.
secuenciación de próxima generación (NGS) ha permitido a los investigadores detectar variaciones asociadas a la enfermedad, y ayudó a descubrir los mecanismos subyacentes de desarrollo de la enfermedad. En particular, la secuenciación del genoma (WGS) puede detectar la mayoría de las variaciones genómicas, incluyendo los VE, como intracromosómica y reordenamientos interchromosomal. Alternativamente, toda la secuenciación del exoma (WES), un método de secuenciación-diana capturado, se puede utilizar para la secuenciación de alta profundidad de un gran número de muestras a un costo relativamente bajo [24], aunque solamente variaciones de nucleótido único (SNVS) y pequeñas inserciones o supresiones (indeles) pueden ser identificados mediante este método. WGS y WES cada uno tiene ventajas y desventajas, y una serie de estudios recientes han utilizado dos métodos [25-27].
Aquí presentamos una caracterización detallada de los genomas de DGC tumoral emparejados y muestras normales mediante la generación de perfiles genómicos enteros seguidos de WES . Utilizamos muestras de sangre como un control normal, como en estudios previos [28-31]. Con el fin de encontrar variaciones DGC-específica, los genomas CIG también fueron analizados y comparados con variaciones identificadas en los genomas de los PED. análisis de la estructura tridimensional de las proteínas se realizó por nuevas mutaciones somáticas del gen CDH1
, y esto identifica regiones críticas que fueron funcionalmente alterados por las mutaciones. Además, hemos encontrado un gen de fusión novedosa que podría estar implicada en la tumorigénesis.
Resultados y discusión
todo el genoma y la secuenciación del exoma
muestras tumorales y normales emparejados (sangre) de 14 pacientes con DGC (cuyas características clinicopatológicas de estos pacientes se muestran en la Tabla S1 en el archivo adicional 1), que eran todos relativamente jóvenes (edad media 38 años) las mujeres coreanas, fueron secuenciados utilizando un Illumina HiSeq 2000, que produjo gama emparejado, 90-base y de 101 bases de ADN lee. Además, cinco pares de muestras tumorales y normales emparejados de pacientes con IGC (edad media 42 años) fueron sometidos a secuenciación de ADN; Una de estas muestras fue identificado más tarde como un caso de inestabilidad de microsatélites (MSI) y por lo tanto se excluyeron del análisis de mutaciones. Ninguna de las muestras tenía ningún historial familiar de cáncer, y los subtipos fueron confirmados por histopatología. Sólo las células tumorales fueron recogidos por macrodissection después de la tinción de hematoxilina.
Para todo el análisis del genoma, en promedio, 92 gigabases (Gb) por muestra se produjeron a aproximadamente 32 veces la profundidad de secuenciación, alcanzando 3,5 terabases (TB) en total, y eran mapeado en el genoma de referencia (NCBI construir 37, hg19) a una velocidad mayor que la cartografía 94,5% (para las estadísticas de secuenciación, véase la disposición 1: Tabla S2). El uso de la final de 3,3 Tb de mapeado lee, una base de datos de perfil genómico fue construido para detectar SNVS, variaciones del número de copia (CNV), y SV. Debido a la pureza celular de una muestra de tumor es una característica crítica en el análisis del genoma del cáncer, se evaluó utilizando un método de cálculo de la casa (ver Materiales y Métodos; véase la disposición 1: Tabla S3 y Figura S1). Aunque hemos tratado de recoger las células tumorales únicos, nuestras muestras todavía mostraron un alto nivel de mezcla del estroma. Para aumentar la precisión de la detección de mutaciones en las regiones génicas incluso en muestras de baja pureza, WES adicional se realizó a aproximadamente 103 veces la profundidad de secuenciación en promedio, que produjo un total de 17 Gb de datos de secuencia. El WES capturado cubierto 93,1% de la región génica en 10 veces o mayor profundidad, y esta cobertura es similar a la de los datos exoma con anterioridad sobre la GC [22, 23].
Combinación de los datos WGS y WES, detectamos somática alteraciones en las muestras de la DGC, y los comparó con las alteraciones de la CIG (los datos se resumen en la Figura 1 como un diagrama de circo). Para verificar nuestros datos, se combinaron y los analizamos con datos de informes anteriores exoma de dos estudios diferentes (24 CIG y 5 muestras DGC, sin incluir MSI y muestras mixtas) [22, 23] y de la hibridación matriz comparativo del genoma de datos (CGH) ( 16 CIG y 14 muestras DGC) [32]. Aunque estos estudios utilizan principalmente CIG y se incluyen sólo un pequeño número de muestras DGC, podrían ser complementario a nuestros datos como control (proporcionando un mayor número de datos CIG y la eliminación de la especificidad de tejido). En la combinación de datos, se compararon las diferencias en las alteraciones entre las muestras de la DGC y CIG. Figura 1 Distribución del genoma completo de mutaciones somáticas y eventos de duplicación o deleción en el tipo difuso cánceres gástricos (PED). Todas las mutaciones somáticas, incluyendo la duplicación eventos /deleción, que se encontraron en los 14 genomas DGC, se fusionan en la trama de circo. Desde el exterior hacia el interior, la trama presenta las siguientes características: ideogramas de cromosomas, la frecuencia de eventos acumulados de amplificación o deleción (negro, amplificación; rojos, eliminación), y el número de variaciones de nucleótido único no es sinónimo somáticas (nsSNVs), indeles, y SNVS en los sitios de empalme para cada gen. triángulos negros indican los genes altamente mutadas. triángulos de color naranja denotan oncogenes, y los triángulos azules indican los supresores tumorales.
Identificación de SNVS difusa de tipo-específica y indeles
En cada par de muestras, se identificaron aproximadamente 3,7 millones de SNVS, los cuales fueron verificados usando polimorfismo de un solo nucleótido (SNP fichas) (tasa media de concordancia: 99,2%; véase la disposición 1: Tabla S4), y aproximadamente 0.690.000 indeles (para más detalles, véase el archivo adicional 1: Cuadro S5 y S6 Tabla). Se evaluó la primera frecuencia de mutación de ambos tipos de GC a nivel de nucleótido único (ver archivo adicional 1: Figura S2 a, b). El espectro de mutación somática fue dominada por C > T (G > A) transiciones, tanto en las muestras DGC y CIG, y no hubo diferencias significativas en los contextos de mutación entre los dos tipos de GC, de acuerdo con estudios anteriores de GC [23, 30]. Cuando analizamos dos conjuntos de datos previamente comunicados exoma, se encontró que el espectro de la relación de sustitución de nucleótidos fue similar a nuestros datos (véase el archivo adicional 1: Figura S2c, d).
Aunque el espectro de mutaciones de DGC es similar a la de CIG, las mutaciones en los genes individuales afectados eran diferentes. Restando las mutaciones encontradas en los genomas normales de la sangre, se identificaron 922 SNVS no sinónimos (nsSNVs) como mutaciones somáticas en las muestras tumorales 18 (véase la disposición 1: Tabla S7; véase la disposición 2). La tasa media de mutación de los 18 GC (1,97 mutaciones /Mb) fue comparable con la obtenida en otros estudios sobre colon, de páncreas y cáncer de hígado [33-35]. De 847 genes mutados afectados por los 922 nsSNVs, 581 fueron en 14 casos DGC, 288 estaban en 4 casos CIG, y 22 (2,6%) eran comunes a ambos tipos. La muestra MSI, que fue excluido del análisis comparativo, mostró aproximadamente seis veces más SNVS y indeles que hizo las otras muestras; Este resultado está de acuerdo con un informe anterior [22]. Cuando se combinaron los dos conjuntos de datos previamente comunicados exoma, se identificaron 967 y 2.077 nsSNVs somáticas en 19 PED y 28 CIG, respectivamente. La tasa de mutación somática de la CIG (3,71 Mb /mutaciones en las 28 muestras) fue mayor que la de los PED (2,29 mutaciones /Mb en las 19 muestras) (véase la disposición 1: Tabla S8). Anteriormente investigación publicada sugiere que el melanoma y el cáncer de pulmón tienen altos índices de mutación, debido a la participación de los mutágenos potentes [36]. Del mismo modo, es posible que el CIG tiene esta alta tasa de mutación debido a su mecanismo tumorigénico puede asociarse más con y /o mutágenos parasitarias del medio ambiente en comparación con DGC. Opiniones de variaciones individuales, los genes causantes del cáncer-putativos fueron predichas por cálculo del puntaje gen controlador (véase la disposición 1: Tabla 1 y la Tabla S9). Se encontró que el gen CDH1
a mutar en abundancia en DGC (P = 1,29
× 10
-2), incluyendo seis mutaciones somáticas (tres de sentido erróneo, uno sin sentido, uno de desplazamiento de marco, y uno mutaciones del sitio de empalme) que no se ha informado anteriormente, mientras que sólo una mutación sin sentido se encontró en las muestras de la CIG (Tabla 2). Los siete CDH1
mutaciones somáticas se verificaron mediante secuenciación de Sanger (ver archivo adicional 1: Cuadro S10 y S11 Tabla). En nuestras muestras DGC, 35,7% (5/14) tenía CDH1
mutaciones somáticas, y se ha informado de que las frecuencias de CDH1
mutaciones somáticas en los PED esporádicos pueden variar de 3% a más del 50% [19 , 37-40]. Se verificó que en los países con una alta incidencia de CG esporádica (como Japón y Corea), la frecuencia de mutaciones germinales en los GC familiar es baja en comparación con la de los países de baja incidencia [41, 42]. Por lo tanto, se especula que la incidencia global GC también está relacionada con la frecuencia de CDH1
mutaciones somáticas. Además, se encontró una mutación de línea germinal (T340A) en CDH1 Hoteles en ambos genomas tumorales y las correspondientes muestras de sangre de dos (D-14, M-DGC; 01, MSI-tipo). Aunque T340A es una mutación causal en CGDH [43], estos dos pacientes no tenían ninguna historia familiar tal como GC o cáncer de mama lobular. Dos informes anteriores que analizan los datos exoma de GC no se identificaron CDH1
como un gen altamente clasificado (sólo una mutación sin sentido en una muestra de MSI CIG) [22, 23]. Esta discrepancia puede ser debido al pequeño número de muestras de DGC en esos estudios (2 de 22 y 3 de cada 15 muestras eran PED, respectivamente). En el presente trabajo, PIK3CA Opiniones y TP53
, bien conocidos los genes asociados con el cáncer, eran los genes más frecuentemente mutado en tanto DGC y CIG ver Tabla 1 y la Tabla S9 en el archivo adicional 1. Las mutaciones en dos PIK3CA conocida se han encontrado
puntos de acceso (E545K y H1047L) en cuatro muestras de la DGC. Además, se encontró una mutación nsSNV (Q546K) adyacente a la mutación E545K en una muestra DGC. En total, 5 de cada 14 muestras DGC (aproximadamente 30%) albergaban nsSNVs en PIK3CA
, que es un oncogén cuya forma exposiciones mutados aumento de la actividad quinasa, haciendo que la proliferación de células del cáncer [44]. Por último, comparamos la frecuencia baja (16-17%) de los nsSNVs en PIK3CA
en los informes de otros [22, 23, 44] (que muestras CIG más utilizados) y los resultados de nuestro análisis combinado (31,5% para DGC , el 14,3% de CIG) (véase la disposición 1: Tabla S9). Parece que las tasas relativamente altas de mutación de PIK3CA
en DGC pueden reflejar la especificidad de las mutaciones en este gen para este tipo de cáncer. Además, tres muestras (dos DGC y uno CIG) contenían tanto nsSNV y una pérdida copia del TP53
, lo que indica una pérdida de la función homocigotos en TP53
, como se informó anteriormente [45]. Un SNP en el gen de PSCA gratis (rs2976329) se ha informado de que se asocia con un mayor riesgo de DGC en las poblaciones japonesas y coreanas [21]. Este SNP también se enriqueció en la mayoría de las muestras de la DGC en nuestro estudio, (9 de cada 14 pacientes), lo que indica que nuestras muestras analizadas representan los pacientes típicos con DGC en Asia Oriental. Además, una mutación sin sentido (R1446 *) en el ARID1A
gen, se encontró en una muestra DGC (D-08). Aunque las mutaciones en ARID1A
se detectan con frecuencia en MSI y en los GC EBV positivo [22, 23], la muestra D-08 no mostró infección por VEB, y una muestra de MSI (M-01) no tuvo ningún ARID1A
mutaciones genéticas tampoco. A partir de variaciones en los genes candidatos de controladores, 88 nsSNVs, 4 pequeños indeles, y 2 SNVS en un sitio de empalme se verificaron mediante secuenciación de Sanger convencional. Siete de estas mutaciones no puede ser probado debido a la falta de PCR, y de las 87 mutaciones restantes, el 96,6% fueron confirmados como verdaderas mutaciones somáticas (ver archivo adicional 1: Cuadro S10 y S11 Tabla) .Tabla 1 Top genes candidatos en 14 de controlador difuso cánceres gástricos de tipo
génica
muestras, n
nsSNVs, n
SNVS en sitio de empalme, n
Indeles, n
P-valor
conductor puntuación gen PIK3CA
5 página 5
0 0
3,63 × 10 -12
9,83
CDH1
4 de 5 1