Genomisk profilanalys av diffus typ gastric cancer Bild Sammanfattning
Bakgrund
Stomachcancer är den tredje dödligaste bland alla cancerformer i världen. Även förekomsten av magsäckscancer tarmen-typ har minskat, ökar förekomsten av diffusa-typ ökar fortfarande och dess utveckling är notoriskt aggressiv. Det finns tillräcklig information om genom varianter av diffus typ magcancer eftersom dess celler är oftast blandas med normala celler, och denna låga cellularitet har gjort det svårt att analysera arvsmassan.
Resultat
Vi analyserar hela genom och motsvarande exomes diffusa-typ magcancer, använder matchade tumör och normala prover från 14 diffus-typ och intestinal typ patienter magcancer fem. Somatiska varianter som finns i magcancer diffusa-typ jämfört med de av tarm-typ och tidigare rapporterade varianter. Vi bestämmer den genomsnittliga exonic somatisk mutationshastighet för de två typerna. Vi finner tillhörande förar kandidat gener och identifiera sju nya somatiska mutationer i CDH1
, som är en välkänd magcancer associerade genen. Tredimensionell struktur analys av den muterade E-cadherin-proteinet tyder på att dessa nya somatiska mutationer kan orsaka signifikanta funktionella störningar av kritiska kalciumbindande ställen i EC1-2 korsning. Kromosomal instabilitet analys visar att MDM2
genen amplifieras. Efter grundlig strukturanalys, en ny fusionsgenen TSC2
-RNF216
identifieras, som samtidigt kan störa tumör undertryckande vägar och aktivera tumörbildning.
Slutsatser
Vi rapporterar iska profilen för diffus typ gastric cancer, inklusive nya somatiska varianter, en ny fusionsgenen, och förstärkning och radering av vissa kromosomregioner som innehåller onkogener och tumörsuppressorer.
bakgrund
Magsäckscancer cancer~~POS=HEADCOMP rankas som den tredje viktigaste orsaken till den globala cancerdödlighet [1]. Histopatologiskt kan magcancer (GC) delas in i två kategorier baserat på morfologiska skillnader: intestinal typ GC (IGC) och diffus typ GC (DGC) [2, 3]. IGC är vanligtvis förknippas med Helicobacter pylori
infektion, och är särskilt vanligt i Japan och Korea [4-6]. DGC är likformigt fördelad geografiskt, och inkluderar aggressiva kliniska former, såsom linitis plastica, som har dålig prognos, speciellt hos unga patienter [7, 8]. Genomiska DNA-förändringar som leder till GC kan hända som ett resultat av flera miljö riskfaktorer såsom hög saltfattig kost och tobaksrökning [9]. Även förekomsten av IGC har minskat stadigt under flera decennier (44% minskning från 1978 till 2005), ökade DGC snabbt (med 62%) från 1978 fram till 2000, för att sedan minska något under 2001-2005 [10]. Trots den kumulativa belägg för att regeringskonferensen och DGC utvecklas via olika cancerframkallande vägar [11, 12], detaljerad genomisk skala data för DGC saknas på grund av begränsad tillgång till kliniska prov och en låg nivå av renhet av cancercellpopulationen.
Till Hittills har mycket få gener som associeras med GC subtyper identifierats. Den CDH1
genen, som kodar för E-cadherin-proteinet, är de mest kända gener associerade med ärftlig DGC (HDGC) [13-16]. Genetisk screening för dessa mutationer har föreslagits för att diagnostisera tidig debut GC [17]. E-cadherin dysfunktion, orsakas av mutationer, förlust av heterozygositet, och promotor hypermethylation, är den mest väletablerade defekt i GC initiering och utveckling [18-20]. En genomet hela föreningen studie visade att polymorfism i prostatastamcellantigen-gen (PSCA
) är starkt associerade med känslighet för DGC [21]. Microarray-baserad metod är dock begränsad till single nucleotide variationer, och kan inte detektera kopieringsneutrala strukturella variationer (SVS). Två färska studier rapporterade om GC exomes, och visade att mutationer i ARID1A
genen ofta detekteras i GC med mikrosatellit instabilitet, och i Epstein-Barr-virus (EBV) -positiv GC [22, 23]. Ingen analys av GC subtyper utfördes och majoriteten av de analyserade proverna i studierna var från patienter med IGC.
Nästa generations sekvensering (NGS) har gjort det möjligt för forskare att upptäcka sjukdomsassocierade variationer, och hjälpte avslöja de bakomliggande mekanismerna av sjukdomsutvecklingen. Framför allt kan hela genomet sekvensering (WGS) identifiera de flesta genomiska variationer, inklusive SVS, såsom intrachromosomal och interchromosomal omflyttningar. Alternativt, hel exome sekvensering (WES), en fångad-mål-sekvenseringsmetod, kan användas för högt djupgående sekvensering av ett stort antal prover på en relativt låg kostnad [24], även om endast single nucleotide variationer (SNVs) och små infogningar eller deletioner (InDels) kan identifieras med hjälp av denna metod. WGS och WES vardera har fördelar och nackdelar, och ett antal nya studier har använt båda metoderna [25-27].
Här presenterar vi detaljerad beskrivning av DGC genomen från matchade tumör och normala prover genom att generera hela iska profiler följt av WES . Vi använde blodprov som en normal kontroll, som i tidigare studier [28-31]. För att hitta DGC specifika variationer, var IGC genomen också analyseras och jämföras med variationer identifierats i genomen av DGCs. Tredimensionella proteinstrukturen analys utfördes för nya somatiska mutationer av CDH1
genen, och denna identifierade kritiska regioner som var funktionellt förändras av mutationerna. Dessutom fann vi en ny fusionsgen som kan vara involverade i tumörbildning.
Resultat och diskussion
hela genomet och exome sekvense
tumör- och matchade normala (blod) prover från 14 patienter med DGC (de kliniskt patologiska egenskaper av dessa patienter visas i tabell S1 i kompletterande fil 1), som var alla relativt unga (medianålder 38 år) koreanska kvinnor, sekvenserades med hjälp av en Illumina HiSeq 2000, som producerade parade slut 90-bas och 101-bas DNA läsningar. Dessutom har fem par tumör och matchade normala prover från patienter med IGC (medianålder 42 år) utsätts för DNA-sekvensering; ett av dessa prover identifierades senare som ett fall av mikrosatellitinstabilitet (MSI) och därmed uteslöts från mutationsanalys. Inget av proverna hade någon familjehistoria av cancer, och de subtyper histopatologiskt bekräftad. Endast tumörceller samlades genom macrodissection efter hematoxylin färgning. Idéer för hela genomet analys, i genomsnitt, 92 gigabases (Gb) per prov framställdes på ungefär 32 gånger sekvense djup och nådde 3,5 terabases (TB) totalt, och var mappas till referens genomet (NCBI bygga 37, hg19) vid en kartläggning hastighet större än 94,5% (för sekvense statistik, se Ytterligare fil 1: Tabell S2). Använda den slutliga 3,3 Tb avbildas läser, en genomisk profildatabas konstruerades för att detektera SNVs kopierar antal variationer (CNVs), och SVS. Eftersom den cellulära renheten hos en tumörprov är en kritisk funktion i cancer genomanalys, var det utvärderas med hjälp av en intern beräkningsmetoden (se Material och metoder, se Ytterligare fil 1: Tabell S3 och figur S1). Även om vi försökte samla endast tumörceller, våra prover uppvisade fortfarande en hög nivå av stromal inblandning. För att öka noggrannheten hos mutationsdetektion i gena regioner även i låg renhetsprov, var ytterligare WES utföras vid ungefär 103 gånger sekvense djup i genomsnitt vilket gav totalt 17 Gb sekvensdata. Den infångade WES täckte 93,1% av den framkallande regionen på 10 gånger eller större djup, och denna täckning liknar den tidigare rapporterade exome uppgifter om GC [22, 23].
Kombinera data WGS och WES, upptäckte vi somatisk förändringar i DGC prover, och jämförde dem med IGC förändringar (data är sammanfattade i figur 1 som en cirkus diagram). För att verifiera våra data, vi kombinerat och analyserade dem med tidigare rapporterade exome data från två olika studier (24 IGC och 5 DGC prover, exklusive MSI och blandade prover) [22 23,] och från array jämförande genomet hybridisering data (CGH) ( 16 IGC och 14 DGC prover) [32]. Även om dessa studier använde huvudsakligen regeringskonferenser och ingår endast ett litet antal DGC prover, kan de vara komplementära till våra data som en kontroll (genom att tillhandahålla ett ökat antal IGC data och eliminering av vävnadsspecificitet). I den kombinerade datamängden, vi jämförde skillnader i förändringar mellan DGC och IGC prover. Figur 1 hela genomet distribution av somatiska mutationer och dubbelarbete eller borttagning händelser diffus typ gastric cancer (DGCs). Alla somatiska mutationer, inklusive dubbel /radering händelser, som konstaterades i de 14 DGC genomen, slås samman i cirkus tomt. Från utsidan till insidan, presenterar tomten följande egenskaper: kromosomideogram, frekvens av kumulativa förstärkning eller radering händelser (svart, förstärkning, röd, radering) och antalet somatiska icke-synonyma single nucleotide variationer (nsSNVs), InDels, och SNVs i splitsningsställen för varje gen. Svarta trianglar indikerar höggradigt muterade gener. Orange trianglar betecknar onkogener och blå trianglarna anger tumörsuppressorer.
Identifiering av diffus-typspecifika SNVs och InDels
I varje provpar, vi identifierat cirka 3,7 miljoner SNVs, som verifieras med single nucleotide polymorphism (SNP ) chips (genomsnittlig konkordans ränta: 99,2%; se Ytterligare fil 1: Tabell S4), och cirka 0.690.000 InDels (för detaljer, se Ytterligare fil 1: Tabell S5 och Tabell S6). Vi bedömde första mutationsfrekvens av båda typerna av GC på enda nukleotid nivå (se Ytterligare fil 1: Figur S2 a, b). Den somatisk mutation spektrum dominerades av C > T (G > A) övergångar i både DGC och IGC prover, och det fanns inga signifikanta skillnader i mutations sammanhang mellan de två GC typer, i enlighet med tidigare studier av GC [23, 30]. När vi analyserade två tidigare rapporterade exome dataset, fann vi att spektrumet av nukleotidsubstitution förhållandet liknade våra data (se Ytterligare fil 1: Figur S2c, d).
Även mutationen spektrum av DGC är liknande den i IGC, enskilda mutationer i drabbade gener var annorlunda. Genom att subtrahera mutationer som finns i normala blod genom, identifierade vi 922 icke-synonyma SNVs (nsSNVs) som somatiska mutationer i 18 tumörprover (se Ytterligare fil 1: Tabell S7, se Ytterligare fil 2). Den genomsnittliga mutationshastighet av 18 GC (1,97 mutationer /Mb) var jämförbar med vad som rapporterats i andra studier på kolon, bukspottkörtel och lever cancer [33-35]. Av 847 muterade gener som påverkas av de 922 nsSNVs, 581 var i 14 DGC fall, 288 var 4 IGC fall, och 22 (2,6%) var gemensam för båda typerna. MSI provet som uteslöts från jämförande analys visade ungefär sex gånger mer SNVs och InDels än gjorde de andra proverna; detta resultat är i överensstämmelse med en tidigare rapport [22]. När vi kombinerat de två tidigare redovisade exome dataset, identifierade vi 967 och 2,077 somatiska nsSNVs i 19 DGCs och 28 regeringskonferenserna, respektive. Den somatiska mutationshastighet av regeringskonferenser (3,71 mutationer /Mb i 28 prover) var högre än den för DGCs (2,29 mutationer /Mb i de 19 proverna) (se Ytterligare fil 1: Tabell S8). Tidigare publicerad forskning visar att melanom och lungcancer har höga mutationshastigheter på grund av inblandning av potenta mutagener [36]. Likaså är det möjligt att regeringskonferensen har denna höga mutationshastighet eftersom dess tumörframkallande mekanism kan associeras mer med miljö- och /eller parasitmutagener jämfört med DGC. Idéer för individuella variationer, var förmodade cancerorsakande gener som förutsägs av förare gen poäng beräkning (se Ytterligare fil 1: Tabell 1 och Tabell S9). Den CDH1
genen befanns vara rikligt muterad i DGC (P
= 1,29 × 10
-2), varav sex somatiska mutationer (tre missense, en nonsens, en ramförskjutning och en skarvstället mutationer) som inte har rapporterats tidigare, medan endast en missense-mutation påträffades i IGC prover (tabell 2). Alla sju CDH1
somatiska mutationer verifierades genom Sanger-sekvensering (se Ytterligare fil 1: Tabell S10 och tabell S11). I våra DGC prover, 35,7% (5/14) hade CDH1
somatiska mutationer, och det har rapporterats att frekvenser CDH1
somatiska mutationer i sporadiska DGCs kan variera från 3% till mer än 50% [19 , 37-40]. Det bekräftades att i länder med en hög förekomst av sporadisk GC (såsom Japan och Korea), frekvensen av nedärvda mutationer i familjär GC är låg jämfört med den i låg förekomst länder [41, 42]. Därför vi spekulera i att den totala incidensen GC är också relaterad till frekvensen av CDH1
somatiska mutationer. Dessutom var en könsceller mutation (T340A) i CDH1
finns i både tumör och motsvarande blod genomen från två prover (D-14, DGC, M-01, MSI-typ). Även T340A är en orsakande mutation i HDGC [43], har dessa två patienter inte har någon familjehistoria såsom GC eller lobulär bröstcancer. Två tidigare rapporter analyserar exome data för GC inte identifiera CDH1
som en högt rankad gen (endast en missense-mutation i en MSI IGC prov) [22, 23]. Denna diskrepans kan bero på det lilla antal prov av DGC i dessa studier (2 av 22 och 3 av 15 prover var DGCs respektive). I detta arbete, PIK3CA Mössor och TP53
välkända cancerassocierade gener, var de mest frekvent muterade gener i både DGC och IGC se tabell 1 och tabell S9 i ytterligare fil 1. Mutationer i två kända PIK3CA
hotspots (E545K och H1047L) hittades i fyra DGC prover. Dessutom var en nsSNV mutation (Q546K) i anslutning till E545K-mutationen finns i en DGC prov. Totalt 5 av 14 DGC prover (ca 30%) hyste nsSNVs i PIK3CA
, som är en onkogen vars muterade uppvisar formulär ökad kinasaktivitet, orsaka cancer cellproliferation [44]. Vi jämförde sedan den lågfrekventa (16-17%) av de nsSNVs i PIK3CA
i rapporter från andra [22, 23, 44] (som oftast används IGC prover) och resultaten av vår kombinerad analys (31,5% för DGC , 14,3% för IGC) (se Ytterligare fil 1: Tabell S9). Det förefaller som om de relativt höga mutationshastigheter på PIK3CA
i DGC kan återspegla specificiteten av mutationer i denna gen till denna typ av cancer. Dessutom, tre prover (två DGC och ett IGC) innehöll både nsSNV och en kopia förlust av TP53
, vilket tyder på en homozygot funktionsförlust i TP53
, som tidigare rapporterats [45]. En SNP i PSCA
genen (rs2976329) har rapporterats vara associerade med ökad risk för DGC i japanska och koreanska populationer [21]. Denna SNP också berikas i de flesta DGC prover i vår studie, (9 av 14 patienter), vilket indikerar att våra analyserade proverna representerar typiska patienter med DGC i Östasien. Dessutom, en nonsensmutation (R1446 *) i ARID1A
genen, konstaterades i en DGC prov (D-08). Även mutationer i ARID1A
ofta upptäcks i MSI och EBV-positiva GC [22, 23], D-08 prov visade ingen EBV-infektion, och en MSI prov (M-01) har inte någon ARID1A
genmutationer heller. Från variationer i kandidatförar gener, 88 nsSNVs, 4 små InDels och 2 SNVs i en splitsningsställe verifierades med användning av konventionell Sanger-sekvensering. Sju av dessa mutationer kunde inte testas på grund av PCR-fel, och de återstående 87 mutationer var 96,6% bekräftades som sanna somatiska mutationer (se Ytterligare fil 1: Tabell S10 och tabell S11) .table en toppkandidat förar gener i 14 diffusa -typ gastric cancer
Gene
Prover, n
nsSNVs, n
SNVs i splitsstället, n
InDels, n
P
-värde
Driver gen poäng
PIK3CA
5
5
0
0
3,63 × 10 -12
9,83
CDH1
5 4
en 1
4,64 × 10-10
8,02
SNRPN
2 2
0
0
1,86 × 10-07
5,60
TP53
2 2
0
0
4,88 × 10-07
5,36
CMKLR1
2 2
0
0
5,33 × 10-07
5,36
CYP2A7
2 2
0
0
1,53 × 10-06
4,99
GUCY1B3
2 2
0
0
1,97 × 10-06
4,99
PAPOLB
2 2
0
0
2,15 × 10-06
4.99
MYH9
3
3
0
0
2,27 × 10-06
4,99
FAM71B
en
2 Review 0
0
2,51 × 10-06
4,99
C10orf90
2 2
0
0
3,76 × 10 -06
4,86
AKAP8
2 2
0
0
4,59 × 10-06
4,81
ZC3H12B
2 2
0
0
5,87 × 10-06
4,74
SFTA3
en 1
0
0
6,86 × 10-06
4,70
SENP7
2 2
0
0
7,65 × 10-06
4,68
TMPRSS6
2 2
0
0
8,38 × 10-06
4,67
PAGE2
en 1
0
0
9,94 × 10-06
4,62 Idéer för extra förare gen listor finns ytterligare en fil 1. Tabell S9
Tabell 2 CDH1 förändringar i 18 gastric cancer
Prov
vid Skriv
Ändring
CDH1
region
D-01 T
CNV
Förlust
Exonerna 1-16
D-02 T
SNV
N256S
exon 6
CNV
Förlust
Exonerna 1-16
D-03 T
SNV
Skarv webbplats
tagstället av intron 4
D-04 T
CNV
Förlust
Exonerna 1-16
D-05 T
SNV
D257N
exon 6
INS
S829fs
Exon 16
D-09 T
SNV
V252G
exon 6
SV
Brytpunkt
Intron 2 Review D -10 T
CNV
Förlust
Exonerna 1-16
D-11 T
CNV
Förlust
Exonerna 1-16
D12 T
SNV
Q23 *
Exon 2 Review D-13 T
CNV
Förlust
Exonerna 1-16
SV
Brytningspunkt punkt~~POS=HEADCOMP
Introner 2 och 10
D-14 T
SV
Brytpunkt
Introner 2, 5 och 9
I-01 T
CNV
Förlust
Exonerna 1-16
jag -02 T
CNV
Förlust
Exonerna 1-16
I-03 T
SNV
D221G
Exon 5
SV
Brytningspunkt punkt~~POS=HEADCOMP
introner 10 och 13
I-04 T
CNV
Förlust
Exonerna 1-16
CNV, kopienummer variation; INS, liten insättning; SNV, enda nukleotid variation; SV, strukturell variation. Sälja The somatiska variationer sedan avbildas på Kyoto Encyclopedia of gener och genom (Kegg) vägar databas. Denna analys visade att de muterade generna av DGCs var signifikant associerade med vägen kalciumsignalering (P
= 7,00 × 10 -5, se Ytterligare fil 1: Tabell S12 och tabell S13). Lågt kalciumintag kan bidra till GC utveckling [46]. Kalcium är viktigt för funktionen av E-cadherin, och en förlust av E-cadherin-medierad adhesion är inblandad i övergången från en godartad lesion till invasiv metastatisk cancer [47]. Dessutom var de somatiska mutationer starkt förknippad med vägar i samband med småcellig lungcancer (P
= 1,00 × 10 -6 i DGC och P
= 4,24 × 10 -2 i IGC). I synnerhet gener som är involverade i fokaladhesion vägar, såsom ITGA
, PIK3CA
och PTEN
ofta var muterad.
SV och CNV analys
SVS upptäcktes baserat på discordantly kartlagt läsa par, och alla SVS som fanns i patienternas nedärvda genomet uteslöts. I genomsnitt har vi hittat 552 somatiska SVS per DGC provpar (211 stora insättningar, 264 stora deletioner, 27 inversioner, 44 intrachromosomal sloka och 6 interchromosomal transloka). Vi hittade 664 somatiska SVS i varje IGC provpar (285 stora insättningar, 283 stora deletioner, 34 inversioner, 38 intrachromosomal transloka och 24 interchromosomal transloka) (för detaljer för varje prov, se Ytterligare fil 1: Tabell S14 och Figur S3). Dessutom fann vi 2.258 gener försämras, och 1736 av dessa konstaterades endast i DGC proven (för data för varje prov, se Ytterligare fil 1: Tabell S15, och se ytterligare en fil 3). Tre tumörsuppressorgener FHIT
, WWOX
och MIPOL1
, som rapporterades i en tidigare GC studie [30], hade nedskrivningar på grund av SVS (FHIT
i 11 prover WWOX
i 5 prover och MIPOL1
i 3 prover) katalog fusions~~POS=TRUNC gener~~POS=HEADCOMP som genereras av en kromosomrearrangemang analyserades också, och 19 fusionsgenen kandidater identifierades (se Ytterligare fil 1: Tabell S16), inklusive en ny fusion genen,
TSC2 -RNF216
, som finns i ett prov (Figur 2a, b). TSC2
kodar för tuberin proteinet tidigare föreslagits som en tumörsuppressorgen inblandad i mammalian target of rapamycin (mTOR) väg [48, 49]. Dessutom är RNF216
, kodning E3 ubiquitin-protein-ligas, som deltar i cytokin-funktion genom att förhindra fördröjd aktivering av nukleär faktor (NF) -κB [50]. Rap GTPas aktiverande protein (Rap-GAP) domänen av TSC2 protein, vilken är relaterad till den inneboende GTPas-aktiviteten hos de Ras-besläktade proteiner RAP1A och RAB5, bröts av denna kromosomala transloka (Figur 2c). Dessutom har de zinkfingerdomäner av RNF216 proteinet inte uttrycks i fusionsgenen, på grund av ett ramskifte som orsakade tidig terminering. Med användning av RT-PCR (RT-PCR) följt av sekvenseringsanalys, var expressionen av denna fusionsgen i patientens vävnad bekräftas. Efter att ha testat en extra uppsättning av 15 GC patientvävnader identifierade vi 2 patienter som uttrycker fusionsgenen (figur 2d, e). Denna kromosomtranslokation kan leda till förändrad cellulär beteende både genom att störa den normala funktionen av genen och orsakar expression av fusionsgenen produkt som kan konkurrera med den normala genen. Fusionsgenen kan konkurrens störa tumörsuppressor vägar och aktivera NF-kB-medierad cytokin signalering. Figur 2 TSC2 - RNF216 fusionsgen brott. (A) Exon struktur TSC2
-RNF216
fusionsgenen. Siffrorna i rutorna är exon nummer varje gen. Röda linjer indikerar fusionspunkterna. (B) Protein domänstruktur av TSC2-RNF216 fusionsprotein. Rap-GAP domän TSC2 bröts, och RNF216 hade en ramskiftsmutation orsaka för tidig uppsägning från interchromosomal ombildning. (C) Strukturen på TSC2 Rap-GAP-domän. Det röda området är den återstående domän regionen Rap-GAP, och grå regionen är Rap-GAP-domän som tas bort i TSC2
-RNF216
fusionsgenen. (D) RNA-sekvens av TSC2
-RNF216
fusionsgenen. Position 136 visas som N. Antingen A eller G bas ger en stoppkodon (TAA eller TAG). (E) Kontroll av TSC2
-RNF216
fusionstranskript i RNA (cDNA) med hjälp av PCR-amplifiering och elektrofores.
I DGCs, kromosomer 16, 17, 19, 20, 21, och 22 innehöll en ökad mängd av block deletioner, medan kromosomer 3, 7, 8, och 13 visade i synnerhet ökande dupliceringar (Figur 1). Många tumörsuppressorgener, såsom CDH1
, PLA2G2A, RUNX3
, Smad2
och TP53
, är belägna i utför borttagna kromosomregioner. Noterbart är somatisk mutation (nsSNV eller splitsstället mutation) och antalet exemplar förlust av CDH1
var exklusiv allmänhet ömsesidigt: fyra av fem DGC prover med somatisk mutation inte har genkopietal förluster, och åtta av nio DGC prover med en CDH1
genkopietalet förlust hade inga somatiska mutationer i CDH1
. Endast ett prov (1/18, 5,6%) hade både förändringar (mutation och antalet exemplar förlust) samtidigt, och denna observation sammanfaller med tidigare studier rapporterar att samtidiga förändringar i CDH1
är sällsynta [19, 40, 51, 52] . När vi ansåg SVS i CDH1
tillsammans, fann vi att andra tre proven hade en mutation /antal kopior förlust samtidigt med SV. Dessutom är antalet kopior av onkogenen MYC
ökade i fem DGC prover (se kompletterande fil 4) och kopiera antal MET
ökades i tre DGC prover [53]. De onkogener MOS
och ZHX2
också visade ett antal kopior vinst i fem och fyra DGC prover, respektive. Mer än hälften av proverna (10 av 18) visade en kopia antal minskning av ARID1A
, vilket är en drivrutin gen för äggstocks klar cellscancer och en kromatin remodeler i GC [22, 54, 55]. Det är känt att de flesta GC med ARID1A
mutationer visar lägre proteinuttryck jämfört med GC utan ARID1A
mutation [22]. Om dosen effekten är viktigt i dessa cancervävnader, kopienummer reduktion av ARID1A
skulle kunna vara en möjlig cancerassocierad faktor Review, en stor region av kromosom 12 amplifierades i tre DGC genom.; av dessa tre genom, prov D-01 T och D-02 T visade tydligt hög förstärkning (figur 3a). De dubbelmönster var något annorlunda: D-01 T hade en tandemduplicering av tre Mbp, medan D-02 T hade en inverterad upprepning av ett MBP (figur 3b, c). En del av denna duplicerade regionen kodar den murina dubbel minut (MDM2
) genen. Det rapporterades att i en liten datamängd, var MDM2
genen ofta förstärks [56], och att denna gen är associerad med flera cancerformer [57]. MDM2
uttryck som orsakas av genförstärkning experimentellt bekräftas med kvantitativ RT-PCR med tumören och angränsande normal vävnad parade prover används för NGS analyser och normala cellinjer inkluderades för jämförelse (figur 3d). MDM2
uttryck positivt korrelerade med analysdata kopieantalet. Även tidigare rapporterats array CGH uppgifter [32] hade relativt låg upplösning för CNV upptäckt, använde vi dessa uppgifter för att söka efter en bias i förändringar av genkopietal i varje histopatologisk typ. En kopia antal vinst på gener som kodar för kalciumkanalproteiner (CACNG6
, CACNG7
och CACNG8
, P
= 4,24 × 10 -2) var betydligt vanligare i DGC prover (se ytterligare fil 1: Tabell S17). Alla integrerade förändring information visas i Ytterligare filer (se Ytterligare fil 1: Tabell S18 och tabell S19, se ytterligare en fil 5). Figur 3 dubbel regionen av MDM2-genen på kromosom 12 i prover D-01 T och D-02 T. (a) Kartläggning djup tomter av de två kromosomer. (B) tunna svarta spikar avlästes vid kartläggning djup 2000-basbredd. Y
-axeln visar relativ djup. Varje enhet motsvarar ungefär 30 gånger sekvense djup. (c) Gene positioner och namn runt de förstärkta regionerna. De svarta banden visar gen platser. (D) MDM2
transkriptnivåer i tumören och angränsande normal vävnad parade prover och normala cellinjer. Kvantitativ RT-PCR användes för att mäta MDM2
mRNA-nivåer i prover D-01 och D-02 (innehållande amplifierad MDM2
regioner), D-04, D-05, D-10, I-03, och I-04 (utan förstärkta MDM2
regioner), och tre normala cellinjer (HDF, HMEC och Hs 738.St/Int~~number=plural). Felstaplar beräknades från två åtskilda experiment av trefaldiga reaktioner. Review, 3D strukturanalys av muterade CDH1
För att förstå hur de detekterade mutationer påverkar proteinstruktur /funktion och aktivering av nedströms biologiska reaktionsvägar påverkar karcinogenes, analyserade vi tre-dimensionell ( 3D) strukturer av mutanten E-cadherin protein som finns i en regeringskonferens och fem DGC prover (se ytterligare en fil 2). Den CDH1
genen kodar för ett kalciumberoende cellvidhäftning glykoprotein och har fem extracellulära cadherin domäner (EC1-EC5) (Figur 4a). Det är känt att interaktionen mellan cadherin och kalcium krävs för dimerisering, strukturell styvhet och skydd mot proteolytisk nedbrytning [58]. Mutationer i EC1-2 och EC2-3 korsningar är kända för att orsaka felaktig cadherin lokalisering och minskad cellvidhäftning [59]. Strukturanalys utfördes på fyra nsSNVs (D221G, V252G, N256S, och D257N), med undantag för en nonsens SNV (Q23 *), en läsramsförskjutning infogning (S829fs), och ett splitsningsställe (chr16: 68842472) mutation. Alla fyra nsSNVs var belägna i övergången mellan EC1 och EC2 (EC1-2 korsning) (figur 4b, c), och tre nsSNVs (D221G, N256S, och D257N) var i proteinregionen som direkt interagerar med en kalciumjon (Figur 4d, e). Denna situation kan leda till onormala interaktioner mellan cadherin domäner. Det har rapporterats att A298t, D231K och D231A mutationer, som har en liknande strukturell position vid EC1-2 korsningen till de somatiska mutationer som finns i denna studie visade en förlust av cellvidhäftningsfunktionen [60, 61]. En annan nsSNV mutation, V252G, ligger i β-sheet struktur cadherin, och dess sidokedja är riktad inåt. Eftersom β-fat strukturer innehåller i allmänhet alternerande polära och hydrofoba aminosyror, med de hydrofoba resterna orienterade mot det inre av cylindern för att bilda en hydrofob kärna, och de polära rester orienterade mot utsidan av cylindern på den lösningsmedels exponerade ytan, den bildandet av den hydrofoba kärnan kan hindras av den V252G mutationen (figur 4e). En tidigare exome studie rapporterade två CDH1
mutationer, P127fs (ramskiftsmutation i en DGC) och V694I (i en MSI IGC) [22]. Dimerisering av två cadherin molekyler i antingen en cis
eller trans
konfiguration inträffade vid förbindelsen mellan EC1-2 och EC1-2 [62], medan mutationer vid EC3-4 och EC4-5 korsningar påverkade inte signifikant celladhesion [59]. Val694 är belägen i en loopregionen mellan EC5 β-fat och en transmembran region på avstånd från EC1-2 och EC2-3 korsningar. Alla författare läst och godkänt den slutliga manuskriptet.