gástrico humano de mudanças de metilação de DNA associados ao câncer gástrico humano da arte abstracta
Fundo
epigenética alteração da expressão do gene é um evento comum no câncer humano. A metilação do DNA é um processo epigenético bem conhecido, mas verificar a natureza exata das mudanças epigenéticas associadas ao câncer continua difícil.
Métodos
Nós perfilados a methylome de tecido de câncer gástrico humano com resolução de 50-bp usando um enriquecimento de DNA metilado técnica (CPG ensaio de recuperação ilha metilado), em combinação com um analisador do genoma e um novo algoritmo de normalização.
resultados
Nós fomos capazes de obter uma visão abrangente de promotores com várias densidades CpG, incluindo CpG Islands (CGI), transcrito corpos, e várias classes de repetição. Descobrimos que o cancro gástrico foi associada a hipermetilação do 5 'CGI e a extremidade 5' dos exões de codificação, bem como hipometilação de elementos repetidos, tais como elementos nucleares intercaladas curtas e o elemento de SVA compósito. Hipermetilação de 5 'CGIs foi significativamente correlacionada com a regulação negativa de genes associados, tais como aqueles nos HOX Comprar e gene histona famílias. Nós também descobrimos silenciamento epigenético (Lres) regiões de longo alcance em tecido de câncer gástrico e identificaram vários genes hypermethylated (MDM2
, DYRK2
e LYZ
) dentro dessas regiões. O estado de metilação de elementos CGIs e anotação gene em linfonodos metastáticos foi intermediária entre o tecido normal e canceroso, indicando que a metilação de genes específicos é gradualmente aumentada no tecido canceroso.
Conclusões
Nossas descobertas irá fornecer dados valiosos para análise futura de padrões de metilação CpG, marcadores úteis para o diagnóstico de câncer de estômago, bem como um novo método de análise para epigenomics clínicos investigações.
Fundo
o câncer gástrico é a segunda principal causa de mortes por câncer em todo o mundo depois do câncer de pulmão, resultando em mais de 800.000 mortes no mundo a cada ano [1]. A taxa de sobrevida em 5 anos atual de indivíduos diagnosticados com câncer gástrico é apenas 20-30%, com esta baixa taxa de ser atribuído ao fato de que a maioria dos casos já estão em um estágio avançado no momento do diagnóstico. Como em todos os cancros, a detecção precoce continua a ser a mais promissora abordagem para melhorar a taxa de sobrevivência. Assim, compreender a causa de desenvolvimento de neoplasias no tecido gástrico humano é essencial.
Infecção por H. pylori
é um bem estabelecido e comum causa de câncer gástrico. No entanto, as alterações em vários fatores genéticos também são importantes no aumento do risco de câncer gástrico. É bem conhecido que a instabilidade cromossómica proveniente de factores genéticos, tais como instabilidade microssatélite, bem como KRAS
e p53
mutações resultam no desenvolvimento de tumores. Vários estudos genômicos identificaram mutações germinativas em genes específicos [2-4] e doença loci suscetíveis [5, 6] para o câncer gástrico. Estudos recentes comparando câncer gástrico e tecido normal ter identificado uma série de marcadores genéticos, incluindo marcadores de diagnóstico [NF2
[7], INHBA
[8], SFRP4
[9]], marcadores prognósticos [CD9
[10], CDH17
[11], PDCD6
[12]], e genes associados ao câncer gástrico [MUC13
[9], CLDN1
[13], Ki67
e CD34
[14]]. Além disso, os mecanismos epigenética como a metilação do DNA e histonas modificações têm sido encontrados como sendo importantes na regulação da expressão de genes envolvidos na biologia e doença do tracto gastrointestinal [15]. Metilação do DNA
desempenha um papel essencial em eucariotas e está associado a um certo número de mecanismos de chave, incluindo impressão genômica, X inactivação cromossoma, envelhecimento e carcinogénese. A alteração de metilação de ADN no genoma é encontrado em quase todos os tipos de cancro e pode conduzir a alterações na expressão de genes, tais como sobre-expressão de oncogenes e silenciamento de genes supressores de tumores durante o desenvolvimento do cancro [16]. Vários estudos têm mostrado que a acumulação de alterações genéticas e epigenética em lesões pré-cancerosas gástricas pode afectar um grande número de alvos, tais como os componentes do sistema de reparação do ADN, os supressores de tumores, oncogenes, reguladores do ciclo celular, factores de crescimento e moléculas de adesão [17-20] . No entanto, estes estudos têm sido focado principalmente em alguns genes candidatos ou cobertos apenas uma parte de todo o genoma. Assim, o acesso a uma visão global das mudanças epigenéticas associadas ao desenvolvimento do câncer tem sido difícil. Em particular, compreensão mudanças de metilação do DNA nas regiões intragênicos, ilhas CpG, regiões intergênicas e sequências de repetição permanece limitada. Consequentemente, há um grande interesse na análise de todo o genoma de metilação do DNA aberrante nessas regiões. Compra de perfis escala genoma completo de metilação do DNA na embriogênese e carcinogênese, métodos de sequenciamento de genomas inteiros de alta resolução, tais como BS-seq [21 -24], MEDIP-seq [25, 26], e MethylCap-seq [27-29] têm sido desenvolvidos. Apesar do rápido desenvolvimento da tecnologia de mapeamento baseado em seqüenciamento, ainda há uma falta de pesquisa comparativa, o que é fundamental para estudos epigenomics clínicos, incluindo aqueles focados em câncer. Ao contrário de abordagens baseadas em microarrays, os dados de sequenciação são produzidos com um formato que não é passível de análise diferencial, e o fluxo de trabalho de análise não foi padronizado. Assim, métodos de normalização computacionalmente barato são necessários para lidar com a carga computacional de processamento de grande porte, os dados de sequenciamento de alta resolução.
Aqui, nós introduzimos um algoritmo de normalização, que leva em conta a densidade leitura total do específico da amostra, o espacial distribuição de CpG loci, e viés fundo sequenciamento. Em seguida, criou um methylome todo o genoma completo de tecido normal gástrica, tecido de câncer gástrico, e gânglios linfáticos metastáticos, utilizando o método MethylCap-seq e obteve informações detalhadas sobre sua perturbação durante a carcinogênese e metástase. Isto é facilmente aplicável a uma análise comparativa dos methylomes e outros tipos de dados epigenômicos, e tem implicações particulares para epigenomics clínicos.
Métodos
amostras de tecido gástrico
obtivemos três tumores gástricos snap-congelados e combinados normais tecido gástrico de Seoul National University College of Medicine para o estudo methylome. Além disso, vinte e oito pares combinados de tecidos normais e tumorais do estômago foram obtidos para posterior confirmação. Todas as amostras foram obtidas por ressecção endoscópica durante o exame dos pacientes que deram consentimento informado ensaio de recuperação do DNA
desnaturado (Mira)
O ADN genómico a partir de 25 mg de tecido gástrico foi purificado usando DNeasy Blood &.; Kit de tecido (Qiagen, Valencia, CA). As amostras de DNA genómico a partir de 3 indivíduos foram reunidas na mesma concentração. MIRA foi realizada como previamente descrito [30-32]. Resumidamente, GST-marcado MBD2b e marcadas com His proteínas MBD3L1 foram preparadas como descrito. 15 ug de ADN genómico foi fragmentado para 100 ~ 500 pb por sonicação e incubadas com 28 ug de proteína GST-MBD2b purificada, 28 ug de proteína His-MBD3L1 e 7 ug de ADN bacteriana JM110 durante 6 horas. 30 ul de pérolas de MagneGST (Promega, Madison, WI) com preblocked 7 ug de ARN bacteriana JM110 foram adicionados e incubados a 4 ° C com rotação durante 45 minutos no final de 600 ul de mistura reaccional de ligação MIRA. As esferas foram lavadas três vezes com 1 ml de tampão de lavagem, e fragmentos metilados foram eluídos por incubação à temperatura ambiente durante 5 minutos e depois 56 ° C durante 30 minutos com 30 ul de TE contendo RNase A (100 ug, Qiagen) e proteinase K ( 15 ug, Qiagen). Os fragmentos de DNA eluídos foram ainda purificadas utilizando kits de purificação de PCR QIAquick (Qiagen).
Illumina Genome Analyzer sequenciação
Utilizou-se 10 ng de ADN eluído para Illumina Genome Analyzer sequenciação. Após a ligação de um par de adaptadores Solexa, produtos de ligação com o tamanho máximo da inserção de 200 pb foram purificados em gel em 2% de agarose e sujeito a amplificação por PCR. geração de Cluster e 36 ciclos de sequenciação foram realizadas seguindo as instruções do fabricante. Nós sequenciado 120 ul de, DNA fraccionado-size ligado adaptador (2 ~ 16:00) sobre a Illumina Genome Analyzer. etiquetas de seqüências foram mapeados para o genoma humano (banco de dados hg18 UCSC baseado em NCBI Construir 36,1 assembly) usando o Solexa Análise Pipeline (versão 0.3.0). Sequenciado lê de 34 bp (excluindo o primeiro eo último nucleotídeo) que passou foram usados filtros de controle de qualidade. Processamento
dados e cálculo MES
Nós estendemos a extremidade 3 'do 34-bp lê em 200 pb para cobrir DNA fragmentos ligados pelas proteínas MBD. A leitura foi convertido para arquivos extensíveis navegador dados (TCAP) para visualização na UCSC http navegador genoma:. //Genoma UCSC edu /.. Contamos etiquetas de sequências sobrepostas com uma resolução de 50 pb. Para encontrar regiões genómicas enriquecidos, o número de leituras mapeado numa janela deslizante de 1 kb foi comparada com o número total de leituras ou o número de fundo lê no genoma. Como tal, MES foi calculada de dois modos; um é como o log2 de (meta tamanho contagem /target ler) /(contagem total de leitura /tamanho do genoma) e pavimentado a zero, o outro é como o log2 de (meta tamanho contagem /target ler) /(fundo leia contagem /fundo tamanho) e pavimentado a zero. Para ajustar o viés de fundo sequenciamento, MESbg foi calculado da mesma forma para a sequenciação de entrada sem purificação por afinidade e subtraído do MES.
Posições genômicas de CGIs, promotores, organismos de transcrição, CDSs e elementos repetitivos
Todas as posições genômicas de CGIs, transcrições e elementos repetitivos foram baixadas a partir do navegador do genoma UCSC. Um total de 27.639 CGI (excepto localizados aleatoriamente CGI) foram previstos pelos seguintes critérios: teor de GC de 50% ou mais, de comprimento maior do que 200 pb, e proporção superior a 0,6 do número observado de dinucleótidos CpG para o número esperado [33] . A coleção de sequências de referência mRNA NCBI (RefSeq de lançamento da versão 46; 11 de março de 2011) foi utilizado para a identificação de unidades de transcrição com o início da transcrição definido, os locais finais e CDS começar, locais finais. Para os promotores, utilizou-se a região 500 pb a montante ~ 500 pb a jusante do local de início da transcrição. Obtivemos ~ 5 milhões de locais de repetição que haviam sido determinadas pelo programa RepeatMasker baseado na biblioteca RepBase de repetições. Nível de metilação
de elementos genômicos
O nível de metilação de um CGI, promotor, gene-corpo e elemento repetir foi estimado por meio do MES sobrepostos cada elemento. MES = 0 foi utilizado para definir elementos não metiladas. Para medir hipermetilação ou hipometilação em câncer, foi calculado o MESs diferencial, (Cancer MES - Normal MES). MES >diferencial; 1.0 foi usada como um limite. Para entender as funções dos genes selecionados, foi utilizada a classificação ontologia de genes através da ferramenta de anotação funcional Clustering http DAVID:.... //David ABCC ncifcrf gov /Tablet Gene análise de expressão in the produto microarray usado neste estudo foi CodeLink Whole Human Genome 55 K chip (GE Healthcare, EUA). Todos os procedimentos experimentais, incluindo a preparação de ARNc alvo, a hibridação, o acoplamento de corante pós-hibridação foram realizadas utilizando protocolos de fornecedores recomendados. Os arquivos de resultados foram importados para GeneSpring GX 7,3 (Agilent Technologies, EUA) para filtragem e análise estatística básica. Entre 55 K genes no microarray, apenas os genes com bandeiras presente em pelo menos 50% das amostras foram seleccionados para análise subsequente. Os dados de microarranjos foram depositados no http GEO:.. //Www NCBI NLM NIH (número de acesso GSE33651) gov /geo /Tablet MIRA e em tempo real qPCR
MIRA... foi realizado em quatro amostras individuais adicionais. O ADN foi purificado a partir do sobrenadante e monitorizada por qPCR em tempo real utilizando Roche 480 da máquina. As sequências dos iniciadores utilizados são apresentados em arquivo adicional 1:. Tabela S1
tratamento com bissulfito, PCR específica para o metilação e pyrosequencing
Isolamos o ADN genómico a partir de amostras individuais, utilizando um Kit Qiagen Tissue DNeasy (Qiagen). tratamento com bissulfito foi efectuado utilizando o kit de metilação de ADN EZ ouro (investigação Zymo) de acordo com as instruções do fabricante. ADN tratado com bissulfito foi armazenado a -80 ° C até à sua utilização. Os iniciadores utilizados para MSP foram projetados usando Methprimer [34], e são mostrados na arquivo adicionais 1: Tabela S1. A PCR foi realizada com HotStarTaq Polimerase (Qiagen) e incluiu uma incubação inicial a 95 ° C durante 15 min, seguido de 40 ciclos de 95 ° C durante 1 min, 59 ° C durante 1 min e 72 ° C durante 40 seg, seguido de um ciclo de 72 ° C durante 10 minutos. MSP produtos foram separados em géis de agarose a 2% e visualizados por coloração com EtBr. As reacções foram pyrosequencing automaticamente realizado com um sistema de PSQ 96 (pirossequenciao AB) de acordo com as instruções do fabricante. Resumidamente, o produto de PCR biotinilado (50 ul) foi purificado usando esferas de estreptavidina-Sepharose (Amersham Biosciences). O produto purificado foi carregado no cartucho de reagente com a enzima, substrato e dNTP incluídos no kit PSQ96 SNP Reagente (pirossequenciao AB). Os iniciadores de sequenciação para pyrosequencing são mostrados no arquivo adicionais. 1: Tabela S1
Resultados
Processamento de MIRA-seq dados methylome
Nós purificado o DNA metilado enriquecida pela MIRA (ensaio de recuperação ilha CpG metilado) e sequenciaram o DNA usando a próxima geração de sequenciamento. níveis de metilação do DNA foram determinados utilizando sequenciamento ler as contagens das regiões correspondentes, em intervalos de 50 pb, conforme descrito em Métodos. Criamos mapas de metilação do DNA de ambos os tecidos gástricos normais e cancerosos. Para cada amostra, obtivemos cerca de 10 milhões sequência lê (arquivo adicionais 1: Tabela S2). Cada methylome continha ~ 140 milhões de CpG lê, cobrindo ~ 48% de todos os locais CpG genômicas excluindo centrômeros (arquivo adicional 1: Tabela S3). A cobertura média de CpG lê em cada methylome foi 4,5X. Em apoio da alta sensibilidade da MIRA, segmentos genômicos contendo apenas um CpG tiveram maior ler as contagens do que aqueles sem (valor p
= 0) CpG, sugerindo que mudanças CpG individuais poderiam ser resolvidos usando MIRA. A sequência média lê aumentado em proporção ao número de CpG dentro de um intervalo de 50 pb, e, de fato, a cobertura MIRA não era baixa, mesmo para regiões de baixa densidade CpG (arquivo adicionais 2: Figura S1). Tomados em conjunto, estes resultados mostram que MIRA foi bem sucedida na recuperação de uma fracção suficiente de regiões metiladas. Quanto à precisão da MIRA, ~ 99% de fragmentos MIRA-capturados tinham pelo menos um local de CpG dentro de sua sequência, indicando uma taxa de detecção falsa baixa.
Para medir o enriquecimento de sinais de metilação locais, calculamos escores de enriquecimento de metilação (MES ) através da obtenção de uma contagem de ler em uma determinada região e, em seguida, realizar a normalização para controlar a contagem total de ler (MEST) na amostra (normalização global) ou a contagem de leitura local (MESl) em uma região envolvente definido pelo usuário (normalização local) (ver Métodos). Isto permite uma comparação directa de amostras independentes com diferentes densidades de leitura. Foi realizada então uma transformação logarítmica da pontuação derivada. Além de ter outros méritos matemáticos, este fornece o benefício de estabilização de variância, particularmente para contagens elevadas de leitura, que são muitas vezes juntamente com variações técnicas elevadas que podem introduzir importante viés nos dados.
Nós avaliamos a significância estatística dos MES em dois caminhos. MESs randomizados foram gerados numericamente permutando as posições genômicas da nossa sequência lê. Os MES fundo (MESbg) foi obtida experimentalmente por sequenciação do genoma normal sem purificação por afinidade. Como esperado, os dados reais rendeu pontuações significativamente mais elevados de enriquecimento (de arquivo adicionais 2: Figura S2). Notavelmente, MESbg foi maior do MES de genomas randomizados, uma indicação de que sequências de fundo só pode criar o enriquecimento, provavelmente devido à acessibilidade da cromatina e viés de amplificação. Consistente com relatórios recentes [35], esta ilustra a necessidade de uma calibração adequada para a polarização sequenciação inerente. Portanto, normalizamos nossas MES com MESbg.
Para encontrar a condição ideal para a normalização, comparou-se a aptidão estatística de vários métodos de normalização. Tag distribuição ao longo do genoma podem ser modeladas pela distribuição de Poisson [36, 37]. A qualidade do ajuste foi testada usando o teste de Kolmogorov-Smirnov. Neste teste, uma estatística baixa D indica um bom ajuste. Enquanto o modelo de Poisson superou o total de Gauss, o MES mostrou um ajuste melhor do que as contagens de leitura em bruto (arquivo adicionais 2: Figura S3), ilustrando a natureza evento raro da medida de contagem lida em escala log. Os MESl normalizados calibrados por sequenciamento de controle (MESbg) produziu resultados ainda melhores do que měst normalizada calibrado pelo sequenciamento de controle (MESbg).
Global e vistas cromossômicos de DNA metilação
Depois de confirmar o melhor método para níveis de metilação do genoma de pontuação em intervalos de 50 pb, primeiro analisou os padrões de metilação cromossômica de amostras normais. Os MES média calculada para cada cromossoma sugeriu que os cromossomas ricos em CpG e rico em genes tendem a ser altamente metilada (Figura 1A). Os níveis de metilação de cromossomos com grandes quantidades de elementos nucleares de longo intercalados (linhas) foram relativamente baixos (por exemplo, cromossoma 4). Curiosamente, a quantidade de elementos nucleares intercaladas curtas (SINEs) foi proporcional ao padrão de metilação do cromossoma. Este é provavelmente causada pelo facto de SINEs são geralmente agrupados em regiões ricas em genes. Os cromossomos sexuais foram globalmente hypomethylated com menor densidade CpG e maior teor de repetição do que autossomos. Uma vez que foram utilizados os tecidos retirados de um macho nesta experiência, a hipometilação global do cromossoma X observada não está associado com X inactivação. vista ampla do cromossomo recapitulou alta densidade CpG e de alta metilação em torno de regiões ricas em genes (ver barras pretas na parte inferior) e rico em CGI (ver barras azul na parte superior) (Figura 1B). Em contraste, baixa densidade CpG e baixa metilação foram observados em torno das regiões de genes dos pobres que eram ricas em repetições de longo alcance (> 1 Kb) (ver barras vermelhas na parte superior). Os MES médios sugere que o nível de metilação de CGI é consideravelmente mais elevada do que a das regiões genicas ou repetições (Figura 1B). A Figura 1 padrões de metilação do tecido gástrico normal. (A) MES médios ampla cromossoma é mostrado como uma função da densidade média de CpG, densidade de genes (o número de genes por MB), a quantidade LINHA (o comprimento da linha por Mb), e a quantidade SINE (o comprimento de seno por Mb) para cada cromossomo. (B) Para cromossomo 22, a densidade média CpG (cinza sombreado) e MES (curva preta) foram obtidos em janelas de correr de 1 MB. As posições dos genes transcritos (barras pretas na parte inferior), ilhas CG (barras azul na parte superior), e repete longos (> 1 kb; barras vermelhas na parte superior) são comparados contra o pano de fundo de metilação do DNA e densidade CpG ( esquerda). Os MES médios para CGIs, órgãos de genes, e repetições (direita). (C) A distribuição dos corpos de genes e MES CGI (esquerda). Os MES médios para associados-promotor e independente de promotor CGIs é mostrado à direita. (D) Os MES média para um subgrupo de promotor, com base na existência de CGI (esquerda). (E) de base em informações intergénica, exônico, e regiões intrónicas, de acordo com o comprimento, o número de CpG, e mapeada lê (esquerda). A distribuição de intergênico, exônico e MESs intrônica é mostrado à direita. (F) Informações básicas sobre o montante região 1-kb, 5 'UTR exons, exons codificantes, 3' UTR exons, e a jusante da região 1-kb de acordo com comprimento, número de CpG e mapeados lê (esquerda). A distribuição do MES para cada elemento é mostrado à direita.
Geralmente, CGI tendem a permanecer livre de metilação no tecido normal. Para analisar os padrões de metilação alta de CGIs, fizemos a distribuição média MES e descobriu um padrão ligeiramente bimodal (Figura 1C). Cerca de 66% (11.376 /17.284) das CGIs no pico deixou sobreposto com um promotor (1 kb por nossa definição). Em contraste, 13% (1.386 /10.357) de CGI no pico direito sobreposto com um promotor, sugerindo que a maioria associada CGI-promotor é não metilado. Em contraste com o promotor relacionada-CGI, promotor independente CGI foram pesadamente metilado (Figura 1C). Embora a maioria dos promotores CGI-positivos não foram metilados, promotores CGI-negativo apresentaram níveis relativamente elevados de metilação (Figura 1D). Nós também verificamos o nível de metilação de promotores por CpG densidade como previamente definido [38] (arquivo adicionais 3: Tabela S4). O padrão de metilação dos promotores foi inversamente relacionada com CpG densidade (arquivo adicionais 2: Figura S4). Por outro lado, os órgãos de genes contendo CGI tinham níveis de metilação mais elevados do que aqueles sem CGI (Figura 1D).
Em seguida, analisou-se os padrões de metilação de enriquecimento em vários elementos genómicos anotados para explorar regiões que foram preferencialmente metilados. regiões gênica ocupam cerca de 40% do genoma humano, mas cerca de 53% do total lê está dentro desta região, com a maioria das leituras estar localizado na região intrónica (Tabela 1). Embora uma proporção significativa de fragmentos metilados cair dentro de regiões intrónicas, a proporção de mapeado lê ao comprimento de exões é consideravelmente mais elevado do que para intrões, o que sugere que os exões estão mais altamente metilada de intrões (Figura 1E). Dentro de regiões associadas ao gene, o enriquecimento dos exões codificantes é ainda mais elevada do que a de outras regiões, como relatado anteriormente (Figura 1F e Tabela 2) [39]. Isto sugere fortemente que a metilação desempenha um papel no exão regulation.Table 1 Genoma Humano e informações normais amostra da região gênica e intergênico
Human Genome Informação
Informação amostra normal
Rácio de enriquecimento relativo
Categoria funcional
Comprimento (pb)
rácio
# de CpG
rácio
Lê
rácio
vs. comprimento
vs. CpG Count
Genic
1,184,139,094
39.46
13,262,253
47.09
20,854,434
53.25
1.35
1.13
Exon
68,035,894
2.27
1,808,089
6.42
4,350,405
11.11
4.90
1.73
Intron
1,122,817,725
37.41
11,613,113
41.23
17,358,273
44.32
1.18
1.07
Intergenic
1,816,976,186
60.54
14,901,610
52.91
18,310,273
46.75
0.77
0.88
Human Genoma
3001115280
100
28.163.863
100
39.164.707
100
1,00
1,00
Tabela 2 Genoma Humano e informações amostra normal das regiões anotados gene
Genoma Humano Informação
Informação amostra normal
Rácio de enriquecimento relativo
Categoria funcional
Comprimento (pb)
Rácio
# de CpG
Rácio
Lê
Rácio
vs. comprimento
vs. CpG Conde
Upstream 1 kb
24.468.069
0,82
937.748
3,33
535.593
1,37
1,68
0,41
5'UTR Éxons
8.436.529
0,28
411.563
1,46
292.654
0,75
Éxons 2,66
0,51
Codificação
33.384.619
1,11
1.077.913
3,83
3.448.755
8,81
7,92
2,30
3'UTR Éxons
28.387.978
0,95
378.012
1,34
806.832
2,06
2,18
1,53
Downstream 1 kb
23.136.263
0,77
340.866
1,21
551.071
1,41
1,83
1,16
Humano genoma
3001115280
100
28.163.863
100
39.164.707
100
1,00
1,00
Alterações nos padrões de metilação do DNA associados ao câncer gástrico
Quando o MES média cromossômicas do methylome câncer foi comparada com a de tecido de controlo, verificou-se que todos os cromossomos no tecido de câncer tendem a ser hypomethylated (arquivo adicionais 2: Figura S5). Com uma vista ampla do cromossomo, foram encontradas regiões ricas em CGI para ser especificamente hipermetilado, enquanto as regiões ricas em repetição foram amplamente hypomethylated (Figura 2A; arquivo adicionais 2: Figura S6). Para analisar as mudanças de metilação em elementos genômicos, nós alinhadas cada elemento nos locais de início e fim e, em seguida, obteve os MES médias em cada posição respectiva. Surpreendentemente, verificou-hipermetilação da região a montante, particularmente a partir de 500 pb a montante do local de início da transcrição (Figura 2B). Isto está de acordo com a hipermetilação do promotor de regiões frequentemente observada no cancro. Figura 2 Comparação dos padrões de metilação em tecido normal e canceroso. curva (A) Média MES para normal (preta) e tecido canceroso (vermelho) no cromossomo 19 (esquerda). Os MES médios para CGIs, órgãos de genes, e repetições (direita). (B) a metilação do DNA de elementos de genes anotados. Cada elemento (1 kb a montante, o exão, o intrão, e a jusante de 1 kb) foram divididos em 20 lixeiras e os MES médio foi obtido para cada posição de todos os elementos correspondentes. (C) metilação do DNA em extremos de transcrição e de codificação extremidades região. Os MES média foi obtido em uma janela de 50-pb deslizante de acordo com a sua distância a partir do início de transcrição (em primeiro lugar) e final (segundo) para CGI-positivas, bem como promotores da transcrição de início (terceira) e final (quarta) para cgi promotores positivos. (D) a metilação do DNA do total de 5 'UTR exões (esquerda) e 5' UTR exões codificantes (à direita). A região
centrada no local de início da transcrição apresentaram padrões completamente diferentes, dependendo da presença de um CGI, o que reflecte a baixa estado de metilação de promotores contendo CGI (Figura 2C). Também descobrimos que, no tecido canceroso, notável hipermetilação dos promotores contendo CGI ocorre e que a densidade de CpG é crucial para o aumento da metilação de ADN (Figura 2C). Para analisar melhor se as regiões 5 'dos genes foram hipermetilado semelhante aos promotores de genes, que verificou o padrão de metilação dos primeiros exons. Curiosamente, verificou-se que o primeiro exão foi hipermetilado apenas quando era a extremidade 5 'de um exão de codificação, mas não quando ele era um' UTR exão 5 (Figura 2D). Estas regiões também continha alta densidade CpG. Portanto, CGIs nas regiões a montante de genes, o promotor e o início de codificação parecem ser os principais alvos da hipermetilação do DNA no câncer. Padrão de metilação
do CPG Islands of Para explorar a correlação entre a localização de CGIs e a metilação do DNA, que subagrupados CGI de acordo com a sua posição dentro do genoma. Especificamente, eles foram classificados como 5 '(localizado entre 1 kb a montante e o local de início da codificação de um gene), intragénica (intragénica CGI do lado de fora da extremidade 5'), e intergénica (localizado na região não-gênica) (ficheiro adicional 1: tabela S5). Embora CpG densidade foi semelhante entre os três grupos, não-5 'CGIs (intragenic e intergênico CGIs) foram significativamente mais metilado que 5' CGIs (arquivo adicionais 2: Figura S7). Nós ainda comparou os MES médios de CGIs subagrupados e encontrou a metilação de todos os CGIs foi geralmente aumentado. No entanto, o diferencial em relação MES sugeriu que a alteração da metilação em 5 'CGI foi significativamente maior do que para a outra CGI (Figura 3A), o que reflecte os papéis importantes de 5' CGI no cancro. A extensão de 5 'hipermetilação CGI significativamente correlacionada com a sobreposição do local de início da transcrição (Figura 3B). Figura 3 metilação de ADN de ilhas CpG. (A) MES diferencial relativo de CGIs subagrupados. (B) A correlação entre a metilação CGI diferencial e distância ao local de início da transcrição. (C) Correlação entre o nível de expressão do gene e da hipermetilação do CGIs. (D) de PCR de genes de histona que mostram os valores mais elevados diferenciais específica MES-metilação. . M1 e U1 correspondem a HIST3H2A, enquanto que M2 e U2 correspondem a HIST3H2B
Para explorar as funções dos genes submetidos a metilação diferencial no 5 'CGIs, foram selecionados genes com MESs CGI altamente diferencial (diferencial MES > 1). Nós, então, realizada análise do gene ontologia (GO) para obter insights sobre os mecanismos responsáveis em câncer (Tabela 3). Quando os genes foram agrupados em várias categorias, GO, descobrimos que HOX
agrupamentos de genes e agrupamentos de genes relacionados com a montagem de nucleossomos foram alvos de hipermetilação, enquanto grupos de genes relacionados com a apoptose foram alvos de hipometilação. Curiosamente, a nossa conclusão de que HOX
agrupamentos de genes eram alvos preferenciais para a metilação do DNA é consistente com um relatório anterior [40]. Além disso, parcelas de genes confirmou que hipermetilação estava em câncer (arquivo adicionais 2: Figura S8) específico do CGI. Para estimar as mudanças nos padrões de expressão causadas por hipermetilação de 5 'CGIs, foi realizada uma análise funcional de dados de expressão de genes obtidos a partir de experimentos cDNA microarray. Hipermetilação de 5 'CGIs foi significativamente correlacionada com desativação de genes (p
= 0,03) (Figura 3C; arquivo adicionais 3: Tabela S6 e S7). Isto indica que o silenciamento de genes por metilação pode ser directamente afectada pelo grau de densidade de CpG e 5 'hipermetilação CGI. Analisamos o estado de metilação de DNA de genes com hypermethylated 'CGIs 5 e reprimidos padrões de expressão. Entre estes estava o gene que codifica tipo histona H2B 3-B (HIST3H2BB
). Análise de metilação do promotor HIST3H2BB
utilizando-metilação específica de PCR revelou que a maioria dos doentes com cancro (10/08, 80%) apresentaram aumento de metilação da região promotora (Figura 3D) .table 3 agrupamento funcional anotação de genes com 5'CGIs hipermetilado
Anotação Cluster 1
Score enriquecimento: 3,27
Conde
P_Value
GOTERM_BP_FAT
montagem nucleossomo
11
3.90E-04
GOTERM_BP_FAT
cromatina montagem
11
5.20E-04
GOTERM_BP_FAT
proteína-DNA montagem complexa
11
7.40E-04
Anotação Cluster 2
Score enriquecimento: 2,92
Conde
P_Value
Interpro
grupo de histonas
8
6.80E-04
SP_PIR_KEYWORDS
núcleo nucleossomo
8
8.60E-04
GOTERM_CC_FAT
nucleossomo 8
3.10E-03
Anotação Cluster 3
Score Enriquecimento: site
17
5.10E-03
INTERPRO
Homeobox
17
5.70E-03
SP_PIR_KEYWORDS
Homeobox
17
5.80E-03
INTERPRO
Homeodomain-related
17
6.40E-03
SMART
HOX
17
1.40E-02
D4
3
9.10E-03
SP_PIR_KEYWORDS
embryo
3
3.30E-02
PIR_SUPERFAMILY
PIRSF002612:homeotic