In Silico analyse van Maagcarcinoom Serial Analysis of Gene Expression bibliotheken onthult verschillende profielen geassocieerd met etniciteit
De abstracte Worldwide maagcarcinoom geografische verschillen en slechtere uitkomst heeft gemerkt bij patiënten uit het Westen ten opzichte van het Oosten. Hoewel deze verschillen is uiteengezet door betere diagnostische criteria, verbeterde werkwijzen staging en meer radicale chirurgie opkomende bewijs ondersteunt het concept dat genexpressie verschillen geassocieerd etniciteit kunnen bijdragen uiteenlopende resultaten. Hier hebben we verzamelde datasets van 4 normale en 11 maagcarcinoom seriële analyse van genexpressie (SAGE) bibliotheken uit twee verschillende etniciteiten. Alle normale SAGE bibliotheken en 7 tumor bibliotheken waren uit het westen en 4 tumor bibliotheken waren uit het Oosten. Deze datasets we vergelijken door Correspondentie Analyse en Ondersteuning Boom analyse en specifieke verschillen in tags expressie werden geïdentificeerd door Belang Analyse voor Microarray. Tags om gen opdrachten werden uitgevoerd door CGAP-SAGE Genie of TAGmapper. De analyse van de wereldwijde transcriptoom toont een duidelijke scheiding tussen normaal en tumor bibliotheken met 90 labels differentieel tot expressie gebracht. Een duidelijke scheiding werd ook gevonden tussen het Westen en het Oosten tumor bibliotheken met 54 labels differentieel tot expressie gebracht. Labels om opdrachten gen geïdentificeerd 15 genen, 5 ervan met significant hogere expressie in het Westen bibliotheken in vergelijking met de Oost bibliotheken. qRT-PCR in cellijnen van west en oost herkomst bevestigde deze verschillen. Interessant is dat twee van deze genen geassocieerd agressiviteit (COL1A1 en KLK10). Tot slot vonden we dat in silico analyse van SAGE bibliotheken uit twee verschillende etnische groepen onthullen verschillen in genexpressie profiel. Deze uitdrukking verschillen kunnen bijdragen aan de uiteenlopende uitkomsten tussen het Westen en het Oosten.
Introductie
Maagcarcinoom uit te leggen is de tweede belangrijke oorzaak van kanker-gerelateerde sterfgevallen wereldwijd en heeft geografische verschillen [1-3] gemarkeerd. De waargenomen voordeel in 5-jaarsoverleving van patiënten uit het Oosten dan uit het Westen kunnen verschillen zijn in de diagnostische criteria, beter enscenering methoden en meer radicale chirurgie weerspiegelen [4]. Maar opkomende bewijs ondersteunt het concept dat etniciteit kunnen bijdragen aan de uiteenlopende maagcarcinoom uitkomsten tussen het Oosten en het Westen [4, 5]. Seriële analyse van genexpressie (SAGE) is een uitgebreide profilering methode die het mogelijk maakt voor de wereldwijde, onpartijdige en kwantitatieve karakterisering van transcriptomen [6]. Een groot voordeel van SAGE is dat zodra genormaliseerd mogelijk om de niveaus van markeringen die door een enkel experiment direct vergelijken met andere beschikbare [7]. Om inzicht te krijgen van de verschillen tussen maagcarcinoom transcriptomes dat de uiteenlopende uitkomsten tussen het Oosten en het Westen hier vergelijken we datasets van vijftien SAGE bibliotheken afgeleid van normale en maag tumor weefsel van Japanse en Amerikaanse maagkanker patiënten door het Correspondentie Analyse zou kunnen verklaren winnen, Ondersteuning boom en betekenis Analyse voor Microarray voor significatieve labels en gen selectie. We hebben specifieke genen verschillend tot expressie tussen normaal en tumor SAGE bibliotheken alsmede tumor bibliotheken uit het Oosten en het Westen. Deze differentieel tot expressie van genen kon de slechtere overleving in het Westen ten opzichte van het Oosten uit te leggen.
Methods
Serial Analyses van genexpressie data
Vijftien gastric SAGE bibliotheken (4 normale en 11 tumor) van Cancer Genome Anatomie project (CGAP) [7] werden samengevoegd voor de analyse. Slechts bibliotheken met 10 bp labels en dezelfde enzymen snijden (BsmFI en NlaIII) werden in deze studie. Normaal bibliotheken bestaan uit een tissue zwembad (GSM784 en GSM14780) of gemicrodissecteerde monsters (CGAP_MD_13S en CGAP_MD_14S) en werden geproduceerd door El-Rifai et al [8] in Virginia, USA. Maagtumor bibliotheken bestaat uit vijf bibliotheken, drie gemicrodissecteerde (CGAP_MD_HG7, CGAP_MD_HS29, CGAP_MD_G329), twee primaire tumoren (GSM757 en GSM2385) en twee xenotransplantaten (GSM758 en GSM14760) alle uit het westen van patiënten en geproduceerd door El-Rifai et al [8] ook in Virginia, USA ( "West tumor libraries") en 4 bibliotheken (GSM7800, GSM8505, GSM8867 en GSM9103) allemaal uit de Japanse patiënten geproduceerd door Oue et al [9] in Hiroshima, Japan ( "Oost tumor libraries"). Een database met 121.409 verschillende labels werd gegenereerd uit bibliotheken die hebben tussen de 9.000 en 34.000 unieke codes. Zo werd alleen bibliotheek GSM9103 verwijderd vanwege zijn unieke tag telling te laag was (ongeveer 6.000 unieke labels). De frequentie van elke tag werd genormaliseerd door deze te delen met het totale tag nummer van de corresponderende bibliotheek en te vermenigvuldigen met 200.000-tags (CGAP normalisatie-formaat). Een selectie proces om ruis van een enorme hoeveelheid labels verzameld werd uitgevoerd. Dit selectiecriterium was i) "tags gevonden in alle normale bibliotheken
" versus "tags gevonden in alle tumor bibliotheken
" en ii) "tags gevonden in alle West tumoren bibliotheken
" versus "tags gevonden in alle Oost-tumoren bibliotheken
". Het Institute for Genomic Research software MultiExperiment Viewer [10] werd gebruikt voor de volgende analyses uitgevoerd: i) Correspondence Analysis (COA) associaties tussen monsters die de neiging hebben soortgelijke profielen staand ii) Steun Tree de statistische ondersteuning na herhaling tenminste toont 1000 keer de analyse door resampling met vervanging (Bootstrap methode) voor monsters met soortgelijke profielen en iii) Betekenis analyse voor Microarray (SAM) om tags waarvan de expressie was significant verschillend tussen de monsters te selecteren. De associatie van tags om genen was te voeren door SAGE Genie [11] of TAGmapper [12] wanneer er geen verband werd gevonden door SAGE Genie. Om functionele klassen van geannoteerde genen de FatiGO + instrument van Babelomics voorspellen [13, 14] werd toegepast. De ongecorrigeerde gegeven door Babelomics p-waarde werd gebruikt omdat het kleine aantal genen geanalyseerd het beter dan de aangepaste-False Discovery Rate (FDR) waarde gemaakt.
Kwantitatieve Real-Time Reverse-transcriptie PCR
Kwantitatieve real tijd reverse-transcriptie PCR (qRT-PCR) werd uitgevoerd op twee westerse cellijnen (AGS, N87) en een Oost-cellijn (MKN45). Totaal RNA werd geëxtraheerd met behulp van Trizol (Invitrogen Life Technologies, Carlsbad, CA) volgens de aanbevelingen van de fabrikant. RNA-concentratie werd bepaald door absorptie bij 260 nm, en kwaliteit werd gecontroleerd door de integriteit van de 28S en 18S rRNA na ethidiumbromide kleuring totaal RNA monsters onderworpen aan 0,8% agarosegelelektroforese. Totaal cDNA werd gesynthetiseerd met MMLV (Moloney Murine Leukemia Virus) reverse transcriptase (RT Thermoscript; Invitrogen Life Technologies, Carlsbad, CA). Reverse transcriptie-PCR werd uitgevoerd met 1 ug totaal cellulair RNA in cDNA te genereren. qRT-PCR werd uitgevoerd met een LightCycler-FastStart DNA Master SYBR Green I kit (Roche Molecular Biochemicals, Mannheim, Duitsland). We ontwierpen gen-specifieke primers voor menselijke PDFGR (5 'AGCTGATCCGTGCTAAGGAA 3' en 5 'CGACCAAGTCCAGAATGGAT 3') en RPL13 (5 'GAGGAGGCGGAACAAGTCC 3' en 5 'TCAGCAGAACTGTCTCCCTTC 3') en de voorwaarden van de versterking zijn beschikbaar op aanvraag. Eén smelt curve piek werd waargenomen voor elk product, waardoor de zuiverheid van geamplificeerde cDNA producten bevestigd. De qRT-PCR-resultaten werden genormaliseerd op GADPH (5 'CGGGAAGCTTGTCATCAATGG 3' en 5 'CATGGTTCACACCCATGACG 3'), die minimale variatie in alle geteste cellijnen had. Analyse werd uitvoeren door LightCycler software 3.0. Crossing punten (begin van de PCR-exponentiële fase) werden beoordeeld door de tweede gederivatiseerd maximale werkwijze en uitgezet tegen de concentraties van de normen.
Resultaten
Tags met consistente expressie in normale en tumor SAGE bibliotheken Ondernemingen De selectieprocedure om SAGE-tags die consequent werden uitgedrukt in "alle normale bibliotheken
" versus "all tumor bibliotheken
" resulteerde in 2437-tags te vinden. Zoals getoond in Fig. 1, COA toont duidelijke scheiding tussen de normale bibliotheken en Oost- en West-tumor bibliotheken. Hetzelfde COA in een drie-dimensionale grafiek (goed voor 56% van de totale traagheid) geeft meer details in de positie van elke bibliotheek (zie Extra File 1). Deze resultaten werden bevestigd door een ondersteuning van bomen met behulp van de Pearson Correlation en gemiddelde Linkage (zie Extra File 2). Om vervolgens SAGE-tags differentieel tot expressie tussen normale en tumormonsters identificeren, voerden we SAM, met een deltawaarde van 1,38 berekend om het FDR behouden nabij 0 (waarschijnlijkheid significant-tags louter toeval), 1001 unieke permutaties en een veelvoudverandering = 10. Deze benadering bleek 90 markeringen differentieel tot expressie tussen normaal en tumor bibliotheken met een soortgelijk gedrag zowel tumor groepen (fig. 2). Onder deze 90 labels, 78 werden down-gereguleerd en 12 labels werden up-gereguleerd. Figuur 1 Correspondentie Analyse van normale en tumor SAGE bibliotheken van de maag. Een twee-dimensionale grafiek wordt getoond waar de groene stippen vertegenwoordigen alle normale bibliotheken, de blauwe stippen zijn de Oost-tumor bibliotheken, en de rode, oranje en gele stippen zijn West tumor bibliotheken, gemicrodissecteerde, xenograft en bulk respectievelijk.
Figuur 2 Seriële Analyse voor Microarray van normale en tumor SAGE bibliotheken van de maag. Links en getoond in groene kleur, de aanzienlijke tags met hogere expressie in de normale bibliotheken; naar rechts en getoond in rode kleur, de aanzienlijke tags met hogere expressie in de tumor bibliotheken.
Selectie discriminerende markeringen tussen oost en west SAGE bibliotheken
Aangezien de tumor van het COA laat 2 groepen, één die alle de Oost-bibliotheken en de andere met alle West-bibliotheken, hebben we gezocht naar discriminerende elementen tussen beide tumoren bibliotheken. Zo, een nieuwe selectieprocedure om tags die consequent werden uitgedrukt in "all-Oosten tumoren
" versus "all West tumoren
" resulteerde in 3952-tags te vinden. Een ander Ondersteuning Boom met behulp van de Pearson Correlation en Gemiddeld Linkage werd uitgevoerd. Zoals getoond in Fig. 3, de boom toont een georganiseerde structuur met een hoge mate vertrouwen in hun filialen (90% -100% ondersteuning), die door het grote aantal discriminerende elementen (labels) met opvallende families en subfamilies (het aanvullend File 3 toont de volledige dendrogram ). Er zijn twee belangrijke clusters, één bevat alle West-bibliotheken en de andere bevat alle Oost-bibliotheken. De West-cluster bestaat uit twee verschillende subclusters, de eerste bevat de 3 gemicrodissecteerde bibliotheken (CGAP_MD_HG7, CGAP_MD_HS29 en CGAP_MD_G329) en de tweede omvat primaire tumoren (GSM757 en GSM2385) en xenotransplantaten (GSM758 en GSM14760). De Oost-cluster bestaat uit een centrale pair (GSM8505 en GSM8867 bibliotheken) dat afkomstig is van histologische goed gedifferentieerde tumoren en een derde bibliotheek (GSM7800) dat afkomstig is van een histologische slecht gedifferentieerde tumor. Vervolgens naar SAGE-tags verschillend tot expressie tussen het Westen en het Oosten tumor bibliotheken te identificeren, voerden we een SAM met behulp van de bovengenoemde dezelfde criteria. Deze aanpak bleek 54 labels differentieel tot expressie (Fig. 4). Onder deze, 8 labels waren up-gereguleerd in het Westen tumoren en 46 labels waren up-gereguleerd in het oosten tumoren. Figuur 3 Steun Boom van normale en tumor SAGE bibliotheken van de maag. Lanen 1-4 normaal bibliotheken (CGAP_MD_13S, GSM784, CGAP_MD_14S, GSM14780), lanen 5-11 West tumor bibliotheken (CGAP_MD_HG7, CGAP_MD_HS29, CGAP_MD_G329, GSM757, GSM758, GSM14760, GSM2385) en lanen 12-14 East tumor bibliotheken (GSM7800, GSM8505 en GSM8867). Slechts bovenkant wordt dendrogram zijn. De volledige dendrogram verschijnen in Extra File 3.
Figuur 4 Seriële Analyse van Microarray van Oost en West maagcarcinoom SAGE bibliotheken. Links en getoond in oranje kleur, de aanzienlijke tags met hogere expressie in het Westen tumor bibliotheken; naar rechts en blauw weergegeven, de aanzienlijke tags met hogere expressie in de East tumor bibliotheken.
Mapping SAGE-tags genen
voor mapping differentieel tot expressie SAGE-tags genen gebruikten we de CGAP SAGE-Genie en /of TAGmapper middelen. Onder de 90-tags verschillend tot expressie tussen normaal en tumor bibliotheken, slechts 53-tags waren succesvol opdracht om specifieke genen (tabel S1 en S2 Table [Extra bestanden 4 & 5]). Genen zoals GIF, CPA2, DRD5, CLIC6, ATP4A, LIPF, GKN1 en PGA5 verschijnen onder de meest onderdrukte genen, terwijl TRAPPC5, KRT7, MTHFD1, TMBIM1, PDIA3 en PPGB genen verschijnen onder de tot overexpressie gebrachte genen. Aan de andere kant, een van de 54 labels verschillend tot expressie tussen het Westen en het Oosten tumor bibliotheken slechts 15 labels, waar met succes gekoppeld aan specifieke genen (tabel 1). FatiGO + analyse toonde aan dat de tumor bibliotheken hadden significant meer tot expressie van genen die verband houden met "cell organisatie en biogenese" (GO: 0.016.043), KRT7, PDIA3, PPGB en TRAPPC5 (p = 0,005); en "ligase activiteit '(GO: 0.016.874), UBE2S en MTHFD1 (p = 0,028) dan normaal bibliotheken ,. Dezelfde vergelijking bleek beduidend minder uitgedrukt genen die verband houden met "een integraal onderdeel van het membraan" (GO: 0.016.021), ADORA1, UGT2B15, DRD5, SYNE2, ATP5J2, KCNE2, ATP4A, KDR, PTGER3 en PPAP2B (p = 0,016). Anderzijds vergelijking van genen die differentieel tot expressie tussen oost en west tumor bibliotheken toonde dat het westen tumoren hadden significant meer tot expressie gebrachte genen gerelateerd aan "ectoderm ontwikkeling" (GO: 0.007.398). (COL1A1 getoond op figuur 5, ook KLK10, KRT17, EMP1 en CCDC12) (p = 0,018). Echter, de Oost-tumoren had in de buurt van significant meer tot expressie van genen die verband houden met "de celstofwisseling" (GO: 0.044.237) PDGFRA, MAPK13, MECR, AKR1C2, RPL13, HLX1 en ADH4 (p = 0,066). Aangezien ten minste twee van deze "ectoderm ontwikkeling" genen (COL1A1 en KLK10) gevonden opgereguleerd in gevorderde maagcarcinoom [9, 15] onze bevindingen kunnen suggereren meer agressiviteit van de West tumoren. Figuur 5 Expressie niveaus van COL1A1 bijbehorende tag (TGGAAATGAC) in tumor bibliotheken. Bars 1-7 corresponderen met alle West tumor bibliotheken (CGAP_MD_HG7, CGAP_MD_HS29, CGAP_MD_G329, GSM757, GSM758, GSM14760, GSM2385 en bars 8-10 corresponderen met alle East tumor bibliotheken (GSM7800, GSM8505, GSM8867). De tag genormaliseerde expressie niveau verschijnt in de CGAP formaat waarde (Tags per 200.000) uitgezet in een logaritmische schaal.
Tabel 1 de aanzienlijke tags met hogere expressie door significant Analyse voor Microarray tussen het Westen en het Oosten tumor SAGE bibliotheken. Alleen de labels die met succes werden geassocieerd met een specifiek gen worden getoond. de tags zijn gesorteerd in een betekenis aflopende volgorde, eerst de labels hoog tot expressie in het oosten en dan die hoog tot expressie in het Westen.
Tags
Gene Symbol
Protein Naam
N ° van West bibliotheken indien aanwezig
West tumor gemiddelde (Tags per 200.000)
N ° Oost bibliotheken indien aanwezig
Oost tumor gemiddelde (Tags per 200.000)
TGATTGGTGG
PDGFRA
bloedplaatjes-afgeleide groeifactor receptor, alpha polypeptide
3
1,88
3
115,05
GGCTGGGTTT
HLX1
H2.0-achtige homeo box 1 (Drosophila) 2
1.04
3
59.13
TCCGTCCGGA
RPL13
ribosomale eiwit L13
3
1.36
3
39.56
ATCTGGAGCA
ADH1C
Alcohol dehydrogenase 1C (klasse I), gamma polypeptide
3
5.99
3
294,91
TGCTCCTACC
FCGBP
Fc-fragment van IgG-bindend eiwit verhuur 4
4,91
3
111,10
TACCCTGGAA
ADH4
Alcohol dehydrogenase 4 (klasse II), pi polypeptide
3
3,35
3
56,30
AGGTCTGCCA
AKR1C2
familie Aldo-keto reductase 1, lid C2 (dihydrodiol dehydrogenase 2; galzuur bindend eiwit; 3-alpha hydroxysteroïddehydrogenase, type III)
3
1,53
3
38.50
GCACCACCGG
MAPK13
Mitogen-activated protein kinase 13
0
0
3
10.62
GGAGGGGAGG
MECR
mitochondriale trans-2-enoyl-CoA reductase 1
0.55
3
15.72
CTTCCTTGCC
KRT17
Keratin 17
7
220,64
0
0
TAATTTGCAT
EMP1
Epitheliale membraaneiwit 1
7
43.26
0
0
TAAGGCTTAA
KLK10
Kallikrein 10