gástrico humano de los cambios de metilación del ADN asociados con el cáncer gástrico humano
Abstract
Antecedentes
epigenética alteración de la expresión génica es un evento común en el cáncer humano. La metilación del ADN es un proceso epigenética bien conocido, pero la verificación de la naturaleza exacta de los cambios epigenéticos asociados con el cáncer sigue siendo difícil.
Métodos
Nos perfilado el metiloma de tejido de cáncer gástrico humano a una resolución de 50-bp utilizando un enriquecimiento de ADN metilado técnica (ensayo de recuperación de la isla CpG metilado) en combinación con un analizador del genoma y un nuevo algoritmo de normalización.
: resultados de la fuimos capaces de tener una visión completa de los promotores con distintas densidades de CpG, incluyendo las islas CpG (CGIs), transcripción cuerpos, y varias clases de repetición. Hemos encontrado que el cáncer gástrico se asoció con la hipermetilación de 5 'CGIs y el extremo 5' de los exones de codificación, así como hipometilación de repetición de elementos, tales como elementos nucleares intercalados cortas y la SVA elemento compuesto. Hipermetilación de 5 'CGI se correlacionó significativamente con la regulación a la baja de los genes asociados, tales como aquellos en los HOX
y familias de genes histona. También descubrimos silenciamiento epigenético (LRES) regiones de largo alcance en el tejido de cáncer gástrico y se identificaron varios genes MDM2 (hypermethylated
, DYRK2
, y LYZ
) dentro de estas regiones. El estado de metilación de elementos CGIs y anotación de genes en los ganglios linfáticos metastáticos fue intermedia entre el tejido normal y canceroso, lo que indica que la metilación de genes específicos se aumenta gradualmente en el tejido canceroso.
Conclusiones Nuestros resultados
proporcionarán datos valiosos para el análisis futuro de los patrones de metilación de CpG, marcadores útiles para el diagnóstico de cáncer de estómago, así como un nuevo método de análisis de investigaciones clínicas epigenómicos.
Antecedentes
el cáncer gástrico es la segunda causa principal de muerte por cáncer en todo el mundo después del cáncer de pulmón, dando lugar a más de 800.000 muertes cada año en todo el mundo [1]. La tasa de supervivencia a 5 años actual de los individuos diagnosticados con cáncer gástrico es sólo el 20-30%, con esta tasa baja es atribuible al hecho de que la mayoría de los casos ya están en una etapa avanzada cuando se diagnostica. Como en todos los tipos de cáncer, la detección temprana sigue siendo el enfoque más prometedor para mejorar la tasa de supervivencia. Por lo tanto, la comprensión de la causa de la tumorigénesis en tejido gástrico humano es esencial.
La infección con H. pylori
es una causa bien establecida y común de cáncer gástrico. Sin embargo, las alteraciones en diversos factores genéticos también son importantes en el aumento de riesgo de cáncer gástrico. Es bien sabido que la inestabilidad cromosómica procedente de factores genéticos tales como la inestabilidad de microsatélites, así como KRAS
y p53
mutaciones resultar en el desarrollo de tumores. Varios estudios genómicos han identificado mutaciones germinales en los genes específicos [2-4] y la enfermedad loci susceptibles [5, 6] para el cáncer gástrico. Estudios recientes que comparan el cáncer gástrico y el tejido normal se han identificado una serie de marcadores genéticos, incluyendo marcadores de diagnóstico [NF2
[7], INHBA
[8], [9 sFRP4
]], marcadores de pronóstico [CD9
[10], CDH17
[11], PDCD6
[12]], y los genes asociados con el cáncer gástrico [MUC13
[9], CLDN1
[13], Ki67
y CD34
[14]]. Además, se han encontrado los mecanismos epigenéticos como la metilación del ADN y las histonas modificaciones a ser importante en la regulación de la expresión de genes implicados en la biología y la enfermedad del tracto gastrointestinal [15].
Metilación del ADN juega un papel esencial en eucariotas y se asocia con una serie de mecanismos clave, incluyendo la impronta genómica, inactivación del cromosoma X, el envejecimiento, y la carcinogénesis. La alteración de la metilación del ADN en el genoma se encuentra en casi todos los tipos de cáncer y puede conducir a cambios en la expresión génica, tales como la sobre expresión de oncogenes y silenciamiento de genes supresores de tumores durante el desarrollo del cáncer [16]. Varios estudios han demostrado que la acumulación de alteraciones genéticas y epigenéticas en lesiones precancerosas gástrico puede afectar a un gran número de objetivos, tales como componentes del sistema de reparación del ADN, supresores de tumores, oncogenes, reguladores del ciclo celular, factores de crecimiento y moléculas de adhesión [17-20] . Sin embargo, estos estudios se han centrado principalmente en unos pocos genes candidatos o cubierto sólo una parte de todo el genoma. Por lo tanto, el acceso a una visión global de los cambios epigenéticos asociados con el desarrollo del cáncer ha sido difícil. En particular, comprender los cambios de metilación del ADN en las regiones intragenic, islas CpG, regiones intergénicas, y repetir secuencias sigue siendo limitada. En consecuencia, existe un gran interés en todo el genoma análisis de la metilación aberrante del ADN en estas regiones.
Para perfiles escala del genoma completo de la metilación del ADN en la embriogénesis y la carcinogénesis, enteros de alta resolución métodos de secuenciación del genoma, tales como BS-ss [21 -24], MeDIP-ss [25, 26], y MethylCap-ss [27-29] se han desarrollado. A pesar del rápido desarrollo de la tecnología de mapeo basado en la secuenciación, todavía hay una falta de investigación comparativa, que es fundamental para los estudios clínicos epigenómicos, incluidos los que se centran en el cáncer. A diferencia de los enfoques basados en microarrays, los datos de secuenciación se producen en un formato que no es susceptible de análisis diferencial, y el flujo de trabajo de análisis no ha sido estandarizada. Por lo tanto, se necesitan métodos de normalización de cómputo de bajo costo para manejar la carga computacional de procesamiento de gran tamaño, los datos de secuenciación de alta resolución.
Aquí, presentamos un algoritmo de normalización, que tiene en cuenta la densidad total de lectura y muestra específica, lo espacial distribución de loci CpG, y el sesgo de fondo secuenciación. Entonces creamos un metiloma integral de todo el genoma de tejido normal gástrico, cáncer gástrico tejidos y ganglios linfáticos metastásicos utilizando el método MethylCap-ss y se obtuvo información detallada sobre su perturbación durante la carcinogénesis y metástasis. Esto es fácilmente aplicable a un análisis comparativo de methylomes y otros tipos de datos epigenómicos, y tiene implicaciones particulares para epigenomics clínicos.
Métodos
muestras de tejido gástrico
Obtuvimos tres tumores gástricos se congelaron y emparejados normales tejido gástrico de Seúl Escuela Nacional de Medicina de la Universidad para el estudio metiloma. Además, se obtuvieron veintiocho parejas de tejidos normales y tumorales de estómago para confirmación adicional. Todas las muestras se obtuvieron por resección endoscópica durante el examen de los pacientes que dieron su consentimiento informado ensayo de recuperación de ADN metilado
(MIRA)
ADN genómico de 25 mg de tejido gástrico se purificó mediante el uso de DNeasy Blood &.; Tissue Kit (Qiagen, Valencia, CA). muestras de ADN genómico a partir de 3 individuos se agruparon en la misma concentración. MIRA se llevó a cabo como se describe anteriormente [30 a 32]. En pocas palabras, marcada con GST MBD2b y con cola de histidina proteínas MBD3L1 se prepararon como se ha descrito. 15 ug de ADN genómico se fragmentó a 100 ~ 500 pb por sonicación y se incubó con 28 ug de la proteína GST-MBD2b purificada, 28 ug de Su-MBD3L1 proteínas y 7 ug de ADN bacteriano JM110 durante 6 horas. se añadieron 30 ul de perlas MagneGST (Promega, Madison, WI) prebloqueda con 7 ug de ARN bacteriana JM110 y se incubaron a 4 ° C con rotación durante 45 minutos en definitiva 600 ul de MIRA mezcla de reacción de unión. Las perlas se lavaron tres veces con 1 ml de tampón de lavado, y los fragmentos metiladas se eluyeron mediante incubación a temperatura ambiente durante 5 minutos y luego 56 ° C durante 30 minutos con 30 ul de TE que contiene RNasa A (100 ug, Qiagen) y proteinasa K ( 15 ug, Qiagen). Los fragmentos de ADN eluidos se purificaron adicionalmente mediante el uso de kits de purificación de PCR Qiaquick (Qiagen).
secuenciación Illumina Genoma Analizador de
Utilizamos 10 ng de ADN eluido para la secuenciación de Illumina Genome Analyzer. Después de la ligación de un par de adaptadores de Solexa, productos de ligación con el tamaño máximo de inserto de 200 pb se purificaron en gel en 2% de agarosa y se sometió a amplificación por PCR. generación Cluster y 36 ciclos de secuenciación se llevaron a cabo siguiendo las instrucciones del fabricante. Hemos secuenciado 120 ul de ADN de tamaño fraccionado ligado al adaptador (2 ~ 4 pm) en el Analizador de Illumina Genoma. etiquetas de secuencias fueron asignadas a las del genoma humano (base de datos UCSC hg18 basado en NCBI Build 36.1 montaje) mediante el análisis Solexa Pipeline (versión 0.3.0). Secuenciado lee de 34 pb (excluyendo el primer y último nucleótido) que pasaban se utilizaron filtros de control de calidad.
Procesamiento de datos y cálculo MES
Hemos ampliado el extremo 3 'del 34-bp lee por 200 pb de ADN para cubrir fragmentos cosidos por las proteínas MBD. La lectura fue convertido a los archivos de datos del navegador extensibles (BED) para la visualización de la UCSC genoma navegador http:. //Genoma UCSC edu /.. Contamos con etiquetas de secuencias superpuestas en 50 pb resolución. Para encontrar regiones genómicas enriquecidas, el número de mapeado lee en una ventana deslizante de 1 kb se comparó con el número total de lee o el número de fondo de lee en el genoma. Como tal, MES se calculó de dos maneras; uno es como el log2 de (meta leer tamaño recuento /destino) /(recuento total de lectura /tamaño del genoma) y redondea hacia cero, el otro es como el log2 de (meta leer tamaño recuento /destino) /(lea fondo conteo /fondo tamaño) y con piso a cero. Para ajustar el sesgo de fondo secuenciación, MESbg se calculó de la misma manera para la secuenciación de entrada sin purificación por afinidad y se resta de MES.
Posiciones genómicas de los CGI, los promotores, los cuerpos de transcripción, los CDS, y elementos repetitivos
Todas las posiciones genómicas de CGI, transcripciones y elementos de repetición fueron descargados de la UCSC genoma navegador. Un total de 27.639 CGIs (excepto situado azar CGIs) fueron predichas por los siguientes criterios: contenido de GC de 50% o mayor, la longitud mayor que 200 pb, y la relación mayor que 0,6 de número observado de dinucleótidos CpG para el número esperado [33] . se utilizó para la identificación de las unidades de transcripción con el inicio de la transcripción definido, sitios finales y comienzan CDS, los sitios finales; la colección de secuencias de referencia NCBI ARNm (11 de marzo, 2011 RefSeq de versión 46). Para los promotores, se utilizó el pb región de 500 pb aguas arriba ~ 500 aguas abajo del sitio de inicio de la transcripción. Obtuvimos ~ 5 millones de lugares de repetición que habían sido determinados por el programa RepeatMasker basado en la biblioteca RepBase de repeticiones. Nivel de metilación Red de elementos genómicos Francia El nivel de metilación de un CGI, promotor, gen-cuerpo, y el elemento de repetición se estimó por medio de la superposición de MES cada elemento. MES = 0 se utilizan para definir elementos no metilados. Para medir la hipermetilación o hipometilación en el cáncer, se calculó la diferencia de las ETM como (cáncer MES - Normal MES). Diferencial MES > 1,0 se utilizó como umbral. Para entender las funciones de los genes seleccionados, utilizamos la clasificación ontología de genes a través de la herramienta de anotación funcional Clustering DAVID http:.... //David ABCC ncifcrf gov /
análisis de la expresión génica Francia El producto de microensayo utilizado en este estudio fue Codelink Whole Genoma humano 55 K chip (GE Healthcare, EE.UU.). Todos los procedimientos experimentales, incluyendo la preparación de destino cRNA, hibridación, tinte de acoplamiento posterior a la hibridación se realizaron usando protocolos vendedor recomendado. Los archivos de resultados se importaron en GeneSpring GX 7.3 (Agilent Technologies, EE.UU.) para el filtrado y el análisis estadístico básico. Entre 55 K genes en el microarray, sólo los genes con los indicadores presentes en al menos 50% de las muestras fueron seleccionados para análisis posterior. Los datos de microarrays fueron depositados en el GEO http:.. //Www NCBI NLM NIH (número de acceso GSE33651) gov /geo /
MIRA y en tiempo real qPCR
MIRA... se llevó a cabo en cuatro muestras individuales adicionales. ADN se purificó a partir del sobrenadante y se controló mediante qPCR en tiempo real utilizando la máquina 480 de Roche. Las secuencias de los cebadores utilizados se presentan en el archivo adicional 1:. Tabla S1
tratamiento bisulfito, PCR específica de metilación y pirosecuenciación
Se aisló el ADN genómico de las muestras individuales usando un Qiagen DNeasy Tissue Kit (Qiagen). tratamiento con bisulfito se realizó usando el kit de la metilación de ADN oro EZ (investigación Zymo) según las instrucciones del fabricante. ADN tratado con bisulfito se almacenó a -80 ° C hasta su uso posterior. Los cebadores utilizados para MSP fueron diseñados utilizando Methprimer [34], y se muestran en el archivo adicional 1: Tabla S1. PCR se realizó con HotStarTaq de la polimerasa (Qiagen) y se incluyó una incubación inicial a 95 ° C durante 15 min, seguido de 40 ciclos de 95 ° C durante 1 min, 59 ° C durante 1 min y 72 ° C durante 40 seg, seguido de un ciclo de 72 ° C durante 10 minutos. productos MSP se separaron en geles de agarosa al 2% y se visualizaron por tinción ETBR. Las reacciones de pirosecuenciación se realizaron automáticamente con un sistema de PSQ 96 (pirosecuenciación AB) de acuerdo con las instrucciones del fabricante. Brevemente, el producto de PCR biotinilado (50 ul) se purificó mediante el uso de perlas de estreptavidina-Sepharose (Amersham Biosciences). El producto purificado se carga en el cartucho de reactivo con la enzima, el sustrato y dNTP incluido en el Kit Reactivo PSQ96 SNP (pirosecuenciación AB). Los cebadores de secuenciación para la pirosecuenciación se muestran en archivo adicional 1:. Tabla S1
Resultados
Procesamiento de MIRA-ss datos metiloma
Se purificó el ADN metilado enriquecida a través MIRA (ensayo de recuperación isla CpG metilado) y secuenciado el ADN mediante secuenciación de próxima generación. los niveles de metilación de ADN se determinaron usando la secuenciación de leer el recuento de las regiones correspondientes, en intervalos de 50 pb, como se describe en Métodos. Hemos creado mapas de metilación del ADN de ambos tejidos gástricos normales y cancerosas. Para cada muestra, se obtuvieron alrededor de 10 millones secuencia lee (archivo adicional 1: Cuadro S2). Cada metiloma contenía ~ 140 millones de CpG lee, que abarca ~ 48% de todos los sitios CpG genómicos con exclusión de los centrómeros (archivo adicional 1: Tabla S3). La cobertura promedio de CpG lee en cada metiloma era 4.5X. En apoyo de la alta sensibilidad de MIRA, los segmentos genómicos que contienen solamente un CpG tenían recuentos de alto nivel de lectura que los que no (valor de p = 0
) CpG, lo que sugiere que los cambios individuales CpG podrían resolverse mediante MIRA. La secuencia promedio lee aumentó en proporción al número de CpG dentro de un intervalo de 50 pb, y de hecho, la cobertura MIRA no era bajo, incluso para las regiones de baja densidad de CpG (archivo adicional 2: Figura S1). Tomados en conjunto, estos resultados muestran que MIRA tuvo éxito en la recuperación de una fracción suficiente de las regiones metiladas. En cuanto a la exactitud de MIRA, ~ 99% de los fragmentos capturados-MIRA tenía al menos un sitio CpG dentro de su secuencia, lo que indica una tasa de detección de falsos baja.
Para medir el enriquecimiento de las señales de metilación locales, se calcularon las puntuaciones de metilación de enriquecimiento (ETM ) mediante la obtención de un recuento de leer en una región determinada y luego realizar la normalización de controlar para el recuento total de lectura (MEST) en la muestra (normalización global) o el recuento de lecturas local (mesl) en una región que rodea definida por el usuario (normalización local) (ver Métodos). Esto permite una comparación directa de las muestras independientes con diferente densidad de lectura. A continuación, llevó a cabo una transformación logarítmica de la puntuación derivada. Además de tener otros méritos matemáticos, esto proporciona la ventaja de varianza de estabilización, en particular para los recuentos de lectura es alto, que a menudo se combinan con una elevada variaciones técnicas que pueden introducir un sesgo significativo en los datos.
Se evaluó la significación estadística de la economía de mercado en dos caminos. ETM al azar se generaron numéricamente permutando las posiciones genómicas de nuestra secuencia lee. Los MES fondo (MESbg) fue experimentalmente obtenidos por la secuenciación del genoma normal sin purificación por afinidad. Como era de esperar, los datos reales produjeron puntajes más altos de enriquecimiento (notablemente la disposición 2: Figura S2). Notablemente, MESbg fue superior a MES de genomas aleatorios, una indicación de que las secuencias de fondo solo pueden crear enriquecimiento, probablemente debido a la accesibilidad de la cromatina y el sesgo de amplificación. De acuerdo con informes recientes [35], esto pone de manifiesto la necesidad de una calibración adecuada para el sesgo inherente a la secuenciación. Por lo tanto, que normalizó nuestros MES con MESbg.
Para encontrar las condiciones óptimas para la normalización, se comparó la aptitud estadística de diversos métodos de normalización. distribución Tag a lo largo del genoma puede ser modelado por la distribución de Poisson [36, 37]. La bondad de ajuste se evaluó mediante la prueba de Kolmogorov-Smirnov. En esta prueba, una estadística baja D indica un buen ajuste. Mientras que el modelo de Poisson superó al conjunto de Gauss, el SEM mostraron un mejor ajuste que los recuentos de lectura primas (archivo adicional 2: Figura S3), que ilustra la naturaleza raro caso de la medida de recuento leer reducido registro. Los mesl normalizados calibrados mediante secuenciación de control (MESbg) produjeron resultados aún mejores que Mest normalizado calibrada mediante secuenciación de control (MESbg).
Global y puntos de vista de la metilación del ADN cromosómico
después de confirmar el mejor método para los niveles de metilación de todo el genoma de puntuación a 50-bp intervalos, lo primero que examinó los patrones de metilación cromosómica de las muestras normales. Los MES medios calculados para cada cromosoma sugirieron que los cromosomas ricas en CpG y ricos en genes tienden a estar altamente metilada (Figura 1A). Los niveles de metilación de los cromosomas con grandes cantidades de elementos nucleares largos períodos de actividad (líneas) fueron relativamente bajos (por ejemplo, el cromosoma 4). Curiosamente, la cantidad de elementos nucleares cortos intercalados (Sines) era proporcional al patrón cromosoma metilación. Esto es causado probablemente por el hecho de que SINE están típicamente agrupados en regiones ricas en genes. Los cromosomas sexuales se hypomethylated a nivel mundial con una menor densidad de CpG y un mayor contenido de repetición de autosomas. Ya que utilizamos los tejidos tomados de un macho en este experimento, la hipometilación global del cromosoma X observado no está asociado con X inactivación. vistas de todo el recapitulan cromosómicos de alta densidad y alto CpG metilación en torno a las regiones ricas en genes (véase barras negras en la parte inferior) y CGI-rica (véase barras azules en la parte superior) (Figura 1B). Por el contrario, se observaron baja densidad y baja metilación CpG en torno a las regiones pobres en genes que eran ricas en repeticiones de largo alcance (> 1 kb) (ver barras de color rojo en la parte superior). Los MES promedio sugiere que el nivel de metilación de CGI es considerablemente mayor que la de las regiones génicas o repeticiones (Figura 1B). Figura 1 Los patrones de metilación de tejido gástrico normal. (A) MES promedio de todo el cromosoma se muestran como una función de la densidad media CpG, la densidad de genes (el número de genes por Mb), cantidad LINE (la longitud de la línea por Mb), y la cantidad SINE (la longitud de SINE por Mb) para cada cromosoma. (B) Para el cromosoma 22, la densidad media de CpG (sombreado en gris) y MES (curva negro) se obtuvieron en 1-Mb ventanas correderas. Las posiciones de los genes transcritos (barras negras en la parte inferior), islas CG (barras de color azul en la parte superior), y repeticiones largas (> 1 kb; barras rojas en la parte superior) se comparan con el trasfondo de la metilación del ADN y la densidad de CpG ( izquierda). El MES medias para los CGI, los órganos de genes, y repeticiones (derecha). (C) La distribución de los cuerpos de genes y MES CGI (izquierda). El MES promedio de promotor asociado y promotor independiente de CGI se muestra a la derecha. (D) El MES promedio de los subgrupos de promotor, basado en la existencia de CGI (izquierda). (E) Información básica sobre intergénica, exonic y intronic regiones, de acuerdo con la longitud, el número de CpG, y se asigna lee (izquierda). La distribución de intergénica, exonic, y ETM intrónica se muestra a la derecha. (F) La información básica sobre la región 1 kb aguas arriba, 5 'UTR exones, los exones de codificación, 3' UTR exones, y aguas abajo de la región 1 kb de acuerdo con la longitud, el número de CpG, y mapeadas lee (izquierda). La distribución de la ETM para cada elemento se muestra a la derecha.
En general, los CGI tienden a permanecer libre de metilación en el tejido normal. Para analizar los patrones de metilación de alta CGI, se comprobó la distribución media de MES y encontramos un patrón ligeramente bimodal (Figura 1C). Alrededor del 66% (11.376 /17.284) de CGI en el pico de la izquierda se superponía con un promotor (1 kb por nuestra definición). En contraste, el 13% (1.386 /10.357) de CGI en el pico de la derecha se superponía con un promotor, lo que sugiere que la mayoría de los CGI-promotor asociado son metilado. relacionadas con el promotor en contraste con los CGI, promotor independiente de CGI fueron muy metilado (Figura 1C). Aunque la mayoría de los promotores CGI-positivo no se metilado, promotores CGI-negativos mostraron niveles relativamente altos de metilación (Figura 1D). También se verificaron el nivel de metilación de los promotores por la densidad de CpG como se define anteriormente [38] (archivo adicional 3: Tabla S4). El patrón de metilación de los promotores era inversamente proporcional a la densidad de CpG (archivo adicional 2: Figura S4). Por otro lado, los cuerpos de genes que contiene CGI-tuvieron niveles de metilación más altos que los que no tienen CGI (Figura 1D).
A continuación, analizamos los patrones de metilación de enriquecimiento en varios elementos genómicos anotados para explorar las regiones que fueron metilados preferentemente. génica regiones ocupan alrededor del 40% del genoma humano, pero alrededor del 53% del total es lee dentro de esta región, con la mayoría de las lecturas de estar situado en la región intrónica (Tabla 1). Aunque una proporción significativa de fragmentos metiladas caer dentro de las regiones intrónicas, la relación de mapeado lee a la longitud de los exones es considerablemente mayor que la de intrones, lo que sugiere que los exones son más altamente metilado de intrones (Figura 1E). Dentro de las regiones génicas asociadas a, el enriquecimiento de los exones de codificación es incluso superior a la de otras regiones como se informó anteriormente (Figura 1F y en la Tabla 2) [39]. Esto sugiere fuertemente que la metilación juega un papel en el exón 1 regulation.Table genoma humano y la información de la muestra normal de la región génica y intergénica
Información del Genoma humano
Información muestra normal
Relación de enriquecimiento relativo
Categoría funcional
Longitud (pb) guía empresas relación de
# de CpG
relación
Lee
relación
vs. longitud
vs. CpG Count
Genic
1,184,139,094
39.46
13,262,253
47.09
20,854,434
53.25
1.35
1.13
Exon
68,035,894
2.27
1,808,089
6.42
4,350,405
11.11
4.90
1.73
Intron
1,122,817,725
37.41
11,613,113
41.23
17,358,273
44.32
1.18
1.07
Intergenic
1,816,976,186
60.54
14,901,610
52.91
18,310,273
46.75
0.77
0.88
Human Genoma
3001115280
100
28163863
100
39164707
100
1.00 1.00
sobre Table 2 genoma humano y la información de la muestra normal de las regiones de genes anotados
Genoma humano Información
Información muestra normal
Relación de enriquecimiento relativo
Categoría funcional
Longitud (pb) guía empresas Relación
# de CpG
Relación
Lee
Relación
vs. longitud
vs. CpG Conde
Upstream 1 kb
24468069
0,82
937.748
3.33
535.593
1,37 1,68
0.41
5'UTR Los exones
8436529
0,28
411.563
1,46
292.654
0,75
Los exones 2.66 0.51
codificación
33384619
1.11
1077913
3,83
3448755
8,81 7,92
2.30
3'UTR Los exones
28387978
0.95
378.012
1,34
806.832
2,06
2,18 1,53
Aguas abajo 1 kb
23136263
0,77
340.866
1,21
551.071
1,41
1.83 1.16
humano genoma
3001115280
100
28163863
100
39164707
100
1.00 1.00
los cambios en los patrones de metilación de ADN asociadas con el cáncer gástrico
Cuando el MES cromosómicas medios de la metiloma cáncer se comparó con la de tejido de control, se encontró que todos los cromosomas en el tejido de cáncer tienden a ser hypomethylated (archivo adicional 2: Figura S5). Con vistas a nivel de cromosomas, se encontró que las regiones ricas en CGI que se hypermethylated específicamente, mientras que repetir las regiones ricas fueron ampliamente hypomethylated (Figura 2A; la disposición 2: Figura S6). Para analizar los cambios en la metilación genómica elementos, que se suman cada elemento en los lugares de inicio y final y luego obtuvimos el MES promedio en cada posición respectiva. Sorprendentemente, se detectó hipermetilación en la región aguas arriba, en particular de 500 pb aguas arriba al sitio de inicio de transcripción (Figura 2B). Esto está de acuerdo con la hipermetilación del promotor regiones observado con frecuencia en el cáncer. Figura 2 Comparación de los patrones de metilación en el tejido normal y canceroso. La curva (a) Promedio MES para el normal (negro) y el tejido canceroso (rojo) en el cromosoma 19 (a la izquierda). El MES medias para los CGI, los órganos de genes, y repeticiones (derecha). (B) la metilación del ADN de los elementos de genes anotada. Cada elemento (1 kb aguas arriba, el exón, intrón, y aguas abajo 1 kb) se dividieron en 20 contenedores y la economía de mercado promedio se obtuvo para cada bin de todos los elementos correspondientes. (C) la metilación del ADN en los extremos de transcripción y codificación extremos región. El MES promedio se obtuvo en una ventana deslizante de 50 pb en función de su distancia desde el inicio de transcripción (primero) y el final (segundo) para los promotores CGI-positivas, así como el inicio de transcripción (tercero) y al final (cuarto) de CGI- promotores positivos. (D) la metilación del ADN de un total de 5 'UTR exones (izquierda) y 5' UTR exones de codificación (derecha). Francia El región centrada en el sitio de inicio de transcripción mostró completamente diferentes patrones dependiendo de la presencia de un CGI, lo que refleja la baja estado de metilación de promotores que contiene CGI-(Figura 2C). También se encontró que, en el tejido canceroso, notable hipermetilación de promotores que contienen CGI-se produce y que la densidad de CpG es crucial para el aumento de la metilación del ADN (Figura 2C). A fin de analizar si las regiones 5 'de genes se hypermethylated de manera similar a los promotores de genes, se comprobó el patrón de metilación de los primeros exones. Curiosamente, se encontró que el primer exón se hypermethylated sólo cuando era el extremo 5 'de un exón de codificación, pero no cuando se trataba de un' UTR exón 5 (Figura 2D). Estas regiones también contenían alta densidad de CpG. Por lo tanto, los CGI en las regiones aguas arriba de los genes, el promotor y el inicio de codificación parecen ser los principales objetivos de la hipermetilación del ADN en el cáncer. Patrón de metilación CpG Red de Islands of Para explorar la correlación entre la localización de CGI y la metilación del ADN, se dividió en subgrupos CGI en función de su posición dentro del genoma. En concreto, se clasificaron en 5 '(que se encuentra entre 1 kb aguas arriba y el sitio de inicio de la codificación de un gen), intragenic (intragenic CGIs fuera del extremo 5'), y intergénica (que se encuentra en la región no génica) (archivo adicional 1: S5 Tabla). Aunque la densidad de CpG fue similar entre los tres grupos, no 5 'CGI (intragenic y intergénica CGI) fueron significativamente más metilado del 5' CGI (archivo adicional 2: Figura S7). Asimismo, comparó la economía de mercado promedio de las CGI dividieron en subgrupos y encontramos que la metilación de todos los CGI se incrementó en general. Sin embargo, el diferencial relativo MES sugirió que el cambio en la metilación en 5 'CGIs fue significativamente mayor que la de otros CGIs (Figura 3A), lo que refleja las importantes funciones de 5' CGIs en el cáncer. La extensión de 5 'CGI hipermetilación correlacionó significativamente con la superposición del sitio de inicio de transcripción (Figura 3B). Figura 3 metilación del ADN de las islas CpG. (A) MES diferenciales relativos de las CGI dividieron en subgrupos. (B) Correlación entre la metilación diferencial de CGI y la distancia al sitio de inicio de transcripción. (C) La correlación entre el nivel de la expresión génica y la hipermetilación de los CGI. (D) PCR específica de metilación de los genes de las histonas que muestran los más altos valores de MES diferenciales. . M1 y U1 corresponden a HIST3H2A, mientras que M2 y U2 corresponden a HIST3H2B
a explorar las funciones de los genes sometidos a metilación diferencial a 5 'CGI, se seleccionaron los genes con las ETM CGI altamente diferencial (diferencial MES > 1). A continuación realizó el análisis de genes ontología (GO) para profundizar en los mecanismos responsables de cáncer (Tabla 3). Cuando los genes se agruparon en varias categorías GO, se encontró que HOX
grupos de genes y grupos de genes relacionados con el montaje-nucleosomas eran dianas para la hipermetilación, mientras que los grupos de genes relacionados con la apoptosis eran dianas para la hipometilación. Curiosamente, nuestro hallazgo de que HOX
grupos de genes eran objetivos preferentes para la metilación del ADN es coherente con un informe anterior [40]. Además, las parcelas de genes confirmaron que la hipermetilación era CGI-específica en el cáncer (archivo adicional 2: Figura S8). Para estimar los cambios en los patrones de expresión causadas por hipermetilación de 5 'CGI, se realizó un análisis funcional de la expresión génica de datos obtenidos a partir de experimentos de microarrays de ADNc. Hipermetilación de 5 'CGI se correlacionó significativamente con la regulación a la baja de los genes (p = 0,03
) (Figura 3C; la disposición 3: Tabla S6 y S7). Esto indica que el silenciamiento de genes por metilación puede ser afectada directamente por el grado de densidad de CpG y 5 'hipermetilación CGI. Se analizó el estado de metilación del ADN de los genes con hypermethylated 'CGI 5 y Downregulated patrones de expresión. Entre ellos estaba el gen que codifica la histona H2B tipo 3-B (HIST3H2BB
). Análisis de HIST3H2BB
metilación promotor usando metilación específica de PCR reveló que la mayoría de los pacientes con cáncer (8/10, 80%) mostraron aumento de la metilación en la región promotora (Figura 3D) .Tabla 3 funcional agrupación anotación de los genes con 5'CGIs hypermethylated
Cluster Anotación 1
enriquecimiento Resultado: 3.27
Conde
p_value
GOTERM_BP_FAT
nucleosoma asamblea página 11
3.90E-04
GOTERM_BP_FAT
cromatina montaje página 11
5.20E-04
GOTERM_BP_FAT
proteína-ADN complejo montaje
11
7.40E-04
Anotación Grupo 2
enriquecimiento Resultado: 2.92
Conde
p_value
InterPro
núcleo de histona página 8
6.80E-04
SP_PIR_KEYWORDS
nucleosoma página 8
8.60E-04
GOTERM_CC_FAT
nucleosoma página 8
3.10E-03
Anotación Grupo 3
enriquecimiento Resultado: site
17
5.10E-03
INTERPRO
Homeobox
17
5.70E-03
SP_PIR_KEYWORDS
Homeobox
17
5.80E-03
INTERPRO
Homeodomain-related
17
6.40E-03
SMART
HOX
17
1.40E-02
D4
3
9.10E-03
SP_PIR_KEYWORDS
embryo
3
3.30E-02
PIR_SUPERFAMILY
PIRSF002612:homeotic