Stomach Health > Saúde estômago >  > Stomach Knowledges > pesquisas

A análise in silico da gástrica carcinoma Análise de série de bibliotecas de expressão de genes revela perfis diferentes associados com a etnia

A análise in silico da gástrica carcinoma Análise de série de bibliotecas de expressão de genes revela perfis diferentes associados com a etnia
carcinoma gástrico Worldwide Abstract
marcou variações geográficas e pior evolução em pacientes do Ocidente em relação ao Oriente. Embora essas diferenças tem sido explicada por melhores critérios de diagnóstico, melhores métodos de paragem e uma cirurgia mais radical, evidências emergentes apoia o conceito de que as diferenças de expressão de genes associados à etnia pode contribuir para este resultado díspares. Aqui, nós recolhidos conjuntos de dados de Análise (SAGE) bibliotecas 4 normal e 11 gástrica carcinoma Serial de Expressão Gênica de duas etnias diferentes. Todas as bibliotecas SAGE normais, bem como 7 bibliotecas tumor eram do Ocidente e 4 bibliotecas de tumores eram do Oriente. Estes conjuntos de dados que comparam por diferenças de análise e específicos Análise de Correspondência e árvore de Suporte na expressão marcas foram identificadas por análise de significância para Microarray. Etiquetas para atribuições de genes foram realizadas por CGAP-SAGE Genie ou TAGmapper. A análise do transcriptoma global, mostra uma clara separação entre bibliotecas normais e tumorais com 90 marcas diferencialmente expressos. A separação clara também foi encontrada entre o Ocidente e as bibliotecas tumorais leste, com 54 marcas diferencialmente expressos. Etiquetas para atribuições de genes identificados 15 genes, 5 deles com maior expressão significativa nas bibliotecas Oeste em comparação com as bibliotecas do Leste. qRT-PCR em linhas celulares de origem oeste e leste confirmou essas diferenças. Curiosamente, dois destes genes foram associados a agressividade (COL1A1 e KLK10). Em conclusão, descobrimos que a análise in silico de bibliotecas SAGE de duas etnias diferentes revelam diferenças no perfil de expressão gênica. Estas diferenças de expressão pode contribuir para explicar o resultado díspar entre o Ocidente eo Oriente.
Introdução
carcinoma gástrico é a segunda principal causa de morte relacionada ao câncer em todo o mundo e tem marcado as variações geográficas [1-3]. A vantagem observada na taxa de sobrevida em 5 anos de pacientes do Oriente do que no Ocidente podem refletir diferenças nos critérios de diagnóstico, melhores métodos de paragem e uma cirurgia mais radical [4]. No entanto novas evidências suporta o conceito de que a etnia pode contribuir para os diferentes resultados carcinoma gástrico entre o Oriente eo Ocidente [4, 5]. Análise Serial de Expressão Gênica (SAGE) é um método de criação de perfil abrangente que permite a caracterização global, imparcial e quantitativa dos transcriptomes [6]. Uma grande vantagem de SAGE uma vez que é normalizado é possível comparar directamente os níveis de marcações geradas por uma única experiência com qualquer outra disposição [7]. Para obter uma visão das diferenças entre transcriptomes carcinoma gástrico que podem explicar os resultados díspares entre o Oriente eo Ocidente aqui vamos comparar conjuntos de dados de quinze bibliotecas SAGE derivadas de tecidos normais e gástricas tumorais de pacientes com câncer gástrico japoneses e americanos por Análise de Correspondência, Suporte árvore e Significado Análise para Microarray para tags significativas e seleção de genes. Encontramos genes específicos diferencialmente expressos entre as bibliotecas normais e sálvia tumor, bem como bibliotecas de tumor do Oriente e do Ocidente. Estes genes diferencialmente expressos poderia explicar a taxa de sobrevivência piores no Ocidente em relação ao Oriente.
Métodos
análises em série de dados Gene Expression
Quinze bibliotecas SAGE gástricas (4 normais e 11 tumorais) do Cancer Genome Anatomy projeto (CGAP) [7] foram combinados para a análise. Somente bibliotecas com 10 marcas pb e as mesmas enzimas de corte (BsmFI e NlaIII) foram incluídos neste estudo. bibliotecas normais consistem em uma piscina de tecido (GSM784 e GSM14780) ou amostras microdissecadas (CGAP_MD_13S e CGAP_MD_14S) e foram produzidos por El-Rifai et [8] al na Virgínia, EUA. bibliotecas tumorais gástricas consistem em cinco bibliotecas, três microdissecção (CGAP_MD_HG7, CGAP_MD_HS29, CGAP_MD_G329), dois tumores primários (GSM757 e GSM2385) e dois enxertos (GSM758 e GSM14760), todos de pacientes ocidentais e produzido por El-Rifai et al [8] também na Virginia, EUA ( "bibliotecas tumorais Oeste") e 4 bibliotecas (GSM7800, GSM8505, GSM8867 e GSM9103), todos de pacientes japoneses produzidos por Oue et al [9] em Hiroshima, Japão ( "bibliotecas de tumor do leste"). Um banco de dados contendo 121,409 marcas diferentes foi gerado a partir de bibliotecas que têm entre 9.000 e 34.000 tags únicas. Assim, apenas GSM9103 biblioteca foi removido porque a sua contagem de tag única foi muito baixa (cerca de 6.000 marcas exclusivas). A frequência de cada marcador foi normalizada dividindo-o com o número total de marcação a biblioteca correspondente e multiplicando por 200.000 etiquetas (formato de normalização CGAP). Um processo de seleção para reduzir o ruído de uma enorme quantidade de marcas coletados foi feita. Este critério de seleção foi i) "tag encontrada em todas as bibliotecas normais
" versus "tag encontrada em todas as bibliotecas de tumor
" e ii) "tag encontrada em todos os tumores bibliotecas West
" versus tags "encontrados em todos os tumores leste bibliotecas
". O Instituto de software Genomic Research MultiExperiment Visualizador [10] foi utilizado para realizar a seguinte análise: i) Análise de Correspondência (COA) para explorar as associações entre as amostras que tendem a ter perfis semelhantes ii) Árvore de Apoio à mostra o suporte estatístico depois de repetir, pelo menos, 1000 vezes a análise redefinindo com a substituição (método Bootstrap) para amostras com perfis semelhantes e iii) Análise significado para Microarray (SAM) para selecionar marcas cuja expressão foi significativamente diferente entre as amostras. A associação de marcas de genes foi realizar pela SAGE Genie [11] ou TAGmapper [12], quando não foi encontrada associação por SAGE Genie. Para prever classes funcionais de genes anotados a ferramenta Fatigo + de Babelomics [13, 14] foi aplicado. O p-valor não ajustado dada pelo Babelomics foi usado porque o pequeno número de genes analisados ​​tornou mais apropriado do que o valor ajustado ao Falso Descoberta Rate (FDR).
Quantitativa em tempo real transcrição reversa PCR
real Quantitative PCR em tempo transcrição reversa (qRT-PCR) foi realizada em duas linhas celulares ocidentais (AGS, N87) e uma linha celular oriental (MKN45). O ARN total foi extraído utilizando Trizol (Invitrogen Life Technologies, Carlsbad, CA) de acordo com as recomendações do fabricante. A concentração de RNA foi determinada medindo a absorvância a 260 nm, e a qualidade foi verificada por meio da integridade do rRNA 28S e 18S após coloração com brometo de etídio do ARN total de amostras submetidas a electroforese em gel de agarose a 0,8%. ADNc foi sintetizado com total de MMLV (Moloney Murine Leukemia Virus) transcriptase reversa (RT ThermoScript; Invitrogen Life Technologies, Carlsbad, CA). A transcrição reversa-PCR foi realizada utilizando um ug de RNA celular total para gerar ADNc. qRT-PCR foi realizada utilizando um kit LightCycler FastStart DNA-Mestre SYBR Green I (Roche Molecular Biochemicals, Mannheim, Alemanha). Nós concebidos primers específicos para o gene humano para PDFGR (5 'AGCTGATCCGTGCTAAGGAA 3' e 5 'CGACCAAGTCCAGAATGGAT 3') e RPL13 (5 'GAGGAGGCGGAACAAGTCC 3' e 5 'TCAGCAGAACTGTCTCCCTTC 3') e as condições de amplificação estão disponíveis a pedido. Uma curva de fusão único pico foi observada para cada produto, confirmando, assim, a pureza de todos os produtos de ADNc amplificados. Os resultados qRT-PCR foram normalizados para GADPH (5 'CGGGAAGCTTGTCATCAATGG 3' e 5 'CATGGTTCACACCCATGACG 3'), que tinha uma variação mínima em todas as linhas celulares testadas. Análise estava realizando por software LightCycler 3.0. pontos de passagem (início da fase exponencial PCR) foram avaliadas pelo segundo método de máxima Derivados e plotados contra as concentrações dos padrões.
Resultados
Tags com expressão consistente em bibliotecas normais e tumorais SAGE
O processo de seleção para encontrar as tags SAGE que foram consistentemente expressos em "todas as bibliotecas normais
" versus "todas as bibliotecas de tumor
" resultou em 2.437 tags. Como mostrado na Fig. 1, COA mostra uma clara separação entre as bibliotecas normais e tumorais bibliotecas leste e oeste. O mesmo COA em um gráfico tridimensional (responsável por 56% da inércia total) mostra mais detalhes na posição de cada biblioteca (ver Arquivo adicional 1). Estes resultados foram confirmados por uma árvore de suporte usando a correlação de Pearson e ligação média (ver Arquivo adicional 2). Em seguida, para identificar marcas de SAGE diferencialmente expressos entre as amostras normais e tumorais, realizou-SAM, com um valor de delta de 1,38 calculado para manter a FDR próximo a 0 (probabilidade de encontrar etiquetas significativas meramente por acaso), 1001 permutações únicas e uma mudança dobra = 10. Esta abordagem revelou 90 marcas diferencialmente expressos entre as bibliotecas normais e tumorais com um comportamento semelhante para ambos os grupos de tumor (Fig. 2). Entre estas 90 marcas, 78 foram regulados negativamente e 12 marcas foram up-regulada. Figura 1 Análise de Correspondência de bibliotecas normais e tumorais sábio do estômago. Um gráfico bidimensional é mostrado onde os pontos verdes representam todas as bibliotecas normais, os pontos azuis são as bibliotecas tumorais leste, eo vermelho, laranja e pontos amarelos são Ocidente bibliotecas tumorais, microdissecção, xenotransplante e volume, respectivamente.
Figura 2 Análise de série para Microarray de bibliotecas normais e tumorais sábio do estômago. Para a esquerda e mostrado na cor verde, as marcas significativas com maior expressão nas bibliotecas normais; para a direita e mostrado na cor vermelha, as marcas significativas com maior expressão nas bibliotecas tumorais.
Seleção de marcas discriminatórias entre bibliotecas leste e oeste SAGE
Desde lado do tumor do COA mostra 2 grupos, um contendo todas as bibliotecas Oriental e os outros contendo todas as bibliotecas Oeste, buscamos elementos discriminatórios entre os dois tumores bibliotecas. Assim, um novo processo de seleção para encontrar marcas que foram consistentemente expressos em "todos os tumores Leste
" versus "todos os tumores Oeste
" resultaram em 3.952 tags. Outra árvore de Suporte usando a correlação de Pearson e Média Linkage foi realizada. Como mostrado na Fig. 3, a árvore mostra uma estrutura organizada com um alto grau de confiança nas suas filiais (90% de apoio -100%), dada pelo grande número de elementos discriminatórios (tags) com as famílias e subfamílias distintas (o arquivo adicional 3 mostra o dendrograma completa ). Há dois grupos principais, um contém todas as bibliotecas Oeste e o outro contém todas as bibliotecas do Leste. O cluster ocidental contém dois subgrupos distintos, o primeiro contém os 3 bibliotecas microdissecadas (CGAP_MD_HG7, CGAP_MD_HS29 e CGAP_MD_G329) ea segunda inclui tumores primários (GSM757 e GSM2385) e xenotransplantes (GSM758 e GSM14760). O cluster de Leste contém um par central (GSM8505 e GSM8867 bibliotecas) que vem do histológico, tumores bem diferenciados e uma terceira biblioteca (GSM7800) que vem de um tumor histológico fracamente diferenciado. Em seguida, identificar marcas SAGE diferencialmente expressos entre o Ocidente e as bibliotecas de tumor do Leste, foi realizada uma SAM utilizando os mesmos critérios acima mencionados. Esta abordagem revelou 54 etiquetas diferencialmente expressos (Fig. 4). Entre estes, 8 etiquetas eram up-regulada nos tumores Oeste e 46 marcas foram up-regulada nos tumores Leste. Figura 3 Árvore Suporte de bibliotecas normais e tumorais sábio do estômago. As pistas 1-4 bibliotecas normais (CGAP_MD_13S, GSM784, CGAP_MD_14S, GSM14780), pistas 5-11 Oeste bibliotecas tumorais (CGAP_MD_HG7, CGAP_MD_HS29, CGAP_MD_G329, GSM757, GSM758, GSM14760, GSM2385) e pistas 12-14 bibliotecas tumorais Leste (GSM7800, GSM8505 , e GSM8867). Apenas a parte superior do dendrograma é mostrada aqui. O dendrograma completo aparecem em Arquivo 3.
Figura 4 Análise de série adicional para Microarray do Oriente e bibliotecas carcinoma gástrico SAGE Oeste. Para a esquerda e mostrado na cor laranja, as marcas significativas com maior expressão nas bibliotecas tumorais Ocidental; para a direita e mostrado na cor azul, as marcas significativas com maior expressão nas bibliotecas tumorais Leste.
mapeamento de marcas SAGE para genes Compra de mapeamento diferencialmente expressos marcas SAGE para genes foi utilizado o CGAP-SAGE Genie e /ou recursos TAGmapper. Entre as 90 marcas diferencialmente expressos entre as bibliotecas normais e tumorais, apenas 53 marcas foram sucesso atribuição para genes específicos (Tabela S1 e S2 Tabela [arquivos adicionais 4 & 5]). Genes como GIF, CPA2, DRD5, CLIC6, ATP4A, LipF, GKN1 e PGA5 aparecem entre os genes mais reprimidos, enquanto os genes TRAPPC5, KRT7, MTHFD1, TMBIM1, PDIA3 e PPGB aparecem entre os genes sobre-expressos. Por outro lado, entre as 54 marcas diferencialmente expressos entre o Ocidente e as bibliotecas de tumor Leste apenas 15 etiquetas onde associadas com sucesso a genes específicos (Tabela 1). Fatigo + análise mostrou que as bibliotecas tumor tinha genes significativamente mais expressos relacionados com a "organização celular e biogênese" (GO: 0.016.043), KRT7, PDIA3, PPGB e TRAPPC5 (p = 0,005); e "atividade ligase" (GO: 0.016.874), UBE2S e MTHFD1 (p = 0,028) do que bibliotecas normais ,. A mesma comparação revelou genes significativamente menos expressas relacionadas com "integral à membrana" (GO: 0.016.021), ADORA1, UGT2B15, DRD5, SYNE2, ATP5J2, KCNE2, ATP4A, KDR, PTGER3 e PPAP2B (p = 0,016). Por outro lado, a comparação de genes diferencialmente expressos entre o Ocidente e as bibliotecas de tumor Leste mostraram que os tumores Oeste tinha genes significativamente mais expressas relacionadas com "desenvolvimento ectoderma" (GO: 0.007.398). (COL1A1 mostrado na Figura 5, também KLK10, KRT17, emp1, e CCDC12) (p = 0,018). No entanto, os tumores Leste tinha perto de importantes genes mais expressos relacionadas com "metabolismo celular" (GO: 0.044.237) PDGFRA, MAPK13, MECR, AKR1C2, RPL13, HLX1 ​​e ADH4 (p = 0,066). Uma vez que, pelo menos, dois destes "genes" de desenvolvimento ectoderme (COL1A1 e KLK10) ter sido encontrado sobre-regulada no carcinoma gástrico avançado [9, 15] nossos resultados podem sugerir mais agressividade dos tumores Oeste. Figura 5 os níveis de expressão de COL1A1 etiqueta associada (TGGAAATGAC) em bibliotecas de tumor. Bares 1-7 correspondem a todas as bibliotecas de tumor Oeste (CGAP_MD_HG7, CGAP_MD_HS29, CGAP_MD_G329, GSM757, GSM758, GSM14760, GSM2385 e bares 8-10 correspondem a todas as bibliotecas de tumor Oriente (GSM7800, GSM8505, GSM8867). O nível de expressão normalizada tag aparece em o valor formato CGAP (Tags por 200.000) plotados em uma escala logarítmica.
Tabela 1 as marcas significativas com maior expressão de Análise significativo para Microarray entre o Ocidente e as bibliotecas SAGE tumor Oriente. Somente as tags que foram associados com sucesso com um gene específico são mostrados. as marcas são classificadas em ordem decrescente de significância, em primeiro lugar as marcas altamente expressos no Oriente e, em seguida, aqueles altamente expressa no Ocidente.
Etiquetas
Gene Símbolo
Protein Nome
N ° de bibliotecas oeste, onde presente
média tumor Oeste (Tags por 200.000)
N ° de bibliotecas leste, onde presente
média tumor Oriente (Tags por 200.000)
TGATTGGTGG
PDGFRA
derivado de plaquetas receptor do factor de crescimento, polipeptídeo alpha Sims 3
1,88 Sims 3
115.05
GGCTGGGTTT
HLX1 ​​
H2.0-como a caixa homeo 1 (Drosophila) Página 2
1,04 Sims 3
59,13
TCCGTCCGGA
RPL13
Ribossômico proteína L13
3
1,36 Sims 3
39,56
ATCTGGAGCA
ADH1C
álcool desidrogenase 1C (classe I), polipeptídeo gamma Sims 3
5,99 Sims 3
294,91 proteína
TGCTCCTACC
FCGBP
fragmento Fc de IgG de ligação 4
4,91 Sims 3
111.10
TACCCTGGAA
ADH4
álcool desidrogenase 4 (classe II), polipeptídeo pi Sims 3
3,35 Sims 3
56.30
AGGTCTGCCA
AKR1C2
Aldo-ceto redutase a família 1, membro do C2 (diidrodiol desidrogenase 2; ácido biliar proteína de ligação; 3-alfa desidrogenase, tipo III) Sims 3
1,53 Sims 3
38,50
GCACCACCGG
MAPK13
Mitógeno-proteína quinase ativada 13
0
0 Sims 3
10,62
GGAGGGGAGG
MECR
mitocondrial trans-2-eno�-CoA redutase
1

Other Languages