Genomisk profil analyse af diffus-gastriske kræftformer
Abstract
Baggrund
Mavekræft er den tredje mest dødelige blandt alle kræftformer i hele verden. Selvom forekomsten af den intestinale-typen mavekræft er faldet, er forekomsten af diffuse type stadig stigende, og dens progression er notorisk aggressive. Der er utilstrækkelige oplysninger om genom variationer af diffus type mavekræft, fordi dens celler normalt blandes med normale celler, og dette lave cellularitet har gjort det vanskeligt at analysere genomet.
Resultater
Vi analyserer hele genomer og tilsvarende exomes af diffus-typen gastrisk cancer, ved anvendelse af matchede tumor og normale prøver fra 14 diffus-type og fem intestinal-type gastrisk kræftpatienter. Somatiske variationer findes i den diffuse type mavekræft er sammenlignet med dem for den intestinale-typen og til tidligere rapporterede varianter. Vi bestemme den gennemsnitlige exon somatisk mutation på de to typer. Vi finder associeret lokomotivføreraspiranten gener, og identificere syv hidtil ukendte somatiske mutationer i CDH1
, hvilket er en velkendt gastrisk cancer-associerede gen. Tredimensionale struktur-analyse af det muterede E-cadherin-protein tyder på, at disse nye somatiske mutationer kan forårsage signifikante funktionelle forstyrrelser af kritiske calcium-bindende steder i EC1-2 junction. Kromosomalt ustabilitet analyse viser, at MDM2
genet amplificeres. Efter grundig strukturel analyse, en roman fusion gen resten skyldes TSC2
-RNF216
er identificeret, som samtidig kan forstyrre tumor-undertrykkende veje og aktivere tumorigenese.
Konklusioner
Vi rapporterer den genomiske profil diffus type gastrisk kræftformer herunder nye somatiske variationer, en roman fusion gen, og forstærkning og sletning af visse kromosomale regioner, der indeholder onkogener og tumor undertrykkere.
Baggrund
mavekræft rangerer som den tredje vigtigste årsag til global dødelighed af kræft [1]. Histopatologisk kan mavekræft (GC) inddeles i to kategorier, baseret på morfologiske forskelle: tarm-typen GC (IGC) og diffus type GC (DGC) [2, 3]. RK er typisk forbundet med Helicobacter pylori
infektion, og er især udbredt i Japan og Korea [4-6]. DGC er ensartet fordelt geografisk, og omfatter aggressive kliniske former, såsom linitis plastica, som har dårlig prognose, især hos unge patienter [7, 8]. Genomisk DNA ændringer, der fører til GC kan ske som et resultat af flere miljømæssige risikofaktorer, såsom en høj-salt kost og rygning [9]. Selvom forekomsten af regeringskonferencen er faldet støt gennem flere årtier (44% reduktion fra 1978 til 2005), DGC steg hurtigt (med 62%) fra 1978 op til 2000, før den faldt en smule i 2001 til 2005 [10]. På trods af den kumulative beviser for, at regeringskonferencen og DGC udvikle via forskellige kræftfremkaldende veje [11, 12], detaljerede data genomisk skala for DGC mangler på grund af begrænset tilgængelighed af kliniske prøver og et lavt niveau af renhed af kræftcellen befolkning.
Til dato, har meget få gener forbundet med GC undertyper blevet identificeret. Den CDH1
gen, der koder for E-cadherin protein, er de bedst kendte gener forbundet med arvelig DGC (HDGC) [13-16]. Genetisk screening for disse mutationer er blevet foreslået for at diagnosticere tidlig debut GC [17]. E-cadherin dysfunktion forårsaget af mutationer, tab af heterozygositet og promotor-hypermethylering, er den mest veletablerede defekt i GC initiering og udvikling [18-20]. Genom-sammenslutning undersøgelse viste, at polymorfismer i prostata stamcelle antigen-gen (PSCA
) er stærkt forbundet med modtagelighed for DGC [21]. Mikroarrayet-baserede metode er imidlertid begrænset til enkelte nucleotidvariationer, og ikke kan registrere copy-neutral strukturelle variationer (SVS). To nylige undersøgelser rapporteret på GC exomes, og viste, at mutationer i ARID1A
gen ofte detekteres i GC med mikrosatellit ustabilitet, og i Epstein-Barr virus (EBV) -positiv GC'er [22, 23]. Ingen analyse af GC undertyper blev udført, og størstedelen af de analyserede i undersøgelserne prøverne var fra patienter med RK.
Næste generations sekventering (NGS) har tilladt forskere at detektere sygdomsassocierede variationer, og hjalp afdække de underliggende mekanismer af udvikling af sygdom. Især kan hele genomet sekventering (WGS) registrere de fleste genomiske varianter, herunder SV'er, såsom intrakromosomal og interchromosomal omlejringer. Alternativt hel exome sekventering (WES), et indfanget target-sekventering fremgangsmåde kan anvendes til high-dybde sekventering af et stort antal prøver på en relativt lav pris [24], selv om kun single nucleotide variationer (SNVs) og små insertioner eller sletninger (indels) kan identificeres ved hjælp af denne metode. WGS og WES hver har fordele og ulemper, og en række nyere undersøgelser har brugt begge metoder [25-27].
Her præsenterer vi detaljeret karakterisering af DGC genomer fra matchede tumor og normale prøver ved at generere hele genomiske profiler efterfulgt af WES . Vi brugte blodprøver som en normal kontrol, som i tidligere undersøgelser [28-31]. For at finde DGC-specifikke variationer blev IGC genomer også analyseret og sammenlignet med variationer identificeret i genomer DGCs. Tredimensional proteinstruktur analyse blev udført for nye somatiske mutationer af CDH1
genet, og dette identificeres kritiske regioner, der var funktionelt ændret ved mutationerne. Desuden fandt vi en ny fusion gen, der kunne være involveret i tumorigenese.
Resultater og diskussion
hele genomet og exome sekventering
Tumor og matchede normale (blod) prøver fra 14 patienter med DGC (de klinisk-patologiske karakteristika af disse patienter er vist i tabel S1 i supplerende fil 1), der alle var relativt unge (gennemsnitsalder 38 år) koreanske kvinder, blev sekventeret under anvendelse af et Illumina HiSeq 2000, som producerede parret-ende, 90-base og 101-base-DNA læser. Derudover blev fem par tumor og matchede normale prøver fra patienter med IGC (median alder 42 år) underkastet DNA-sekventering; en af disse prøver blev identificeret senere som et tilfælde af mikrosatellit instabilitet (MSI), og derfor blev udelukket fra mutationsanalyse. Ingen af prøverne havde nogen familiær historie af kræft, og undertyper blev histopatologisk bekræftet. Kun tumorceller blev indsamlet af macrodissection efter hæmatoxylin farvning.
For hele genomet analyse, i gennemsnit 92 gigabases (Gb) per prøve blev produceret på ca. 32 gange sekventering dybde og nåede 3,5 terabases (TB) i alt, og var kortlagt til referencen genom (NCBI bygge 37, hg19) ved en kortlægning på over 94,5% (for sekventering statistik, se Yderligere fil 1: tabel S2). Brug den sidste 3,3 TB kortlagt læser, en genomisk profil-database blev bygget til påvisning SNVs, kopiere nummer variationer (CNVs), og SV'er. Fordi den cellulære renhed af en tumor prøve er et afgørende træk kræft genom analyse blev det vurderet ved hjælp af en in-house beregningsmetoden (se materialer og metoder, se Ekstra fil 1: Tabel S3 og figur S1). Selvom vi forsøgte at indsamle kun tumorceller, vores prøver udviste stadig et højt stromal blanding. For at øge nøjagtigheden af mutation opdagelse i fremkaldende regioner selv i prøver med lav renhed, blev yderligere WES udføres på ca. 103 gange sekventering dybde i gennemsnit, hvilket er produceret i alt 17 Gb sekvens data. Den erobrede WES dækkede 93,1% af den gen-regionen på 10 gange eller større dybde, og denne dækning er den samme som i tidligere rapporterede exome data på GC [22, 23].
Kombinere WGS og WES data, vi har registreret somatiske ændringer i DGC prøver, og sammenlignet dem med regeringskonferencens ændringer (data er opsummeret i figur 1 som et cirkus diagram). For at verificere vores data, vi kombineret og analyseret dem med tidligere rapporterede exome data fra to forskellige undersøgelser (24 RK og 5 DGC prøver, undtagen MSI og blandede prøver) [22, 23] og fra matrix sammenlignende genom hybridisering (CGH) data ( 16 RK og 14 DGC prøver) [32]. Selv om disse undersøgelser anvendes hovedsageligt regeringskonferencer og omfattede kun et lille antal DGC prøver, kunne de være et supplement til vores data som en kontrol (ved tilvejebringelse af et øget antal IGC data og fjernelse af vævsspecificitet). I den kombinerede datasæt sammenlignede vi forskellene i ændringer mellem DGC og IGC prøver. Figur 1 Hele genom distribution af somatiske mutationer og kopiering eller sletning begivenheder i diffust-gastriske kræft (DGCs). Alle de somatiske mutationer, herunder overlapning /sletning begivenheder, som blev fundet i de 14 DGC genomer, der fusionerede i cirkus plot. Fra ydersiden til indersiden, plottet præsenterer følgende karakteristika: kromosom ideogrammer, hyppigheden af kumulative forstærkning eller sletning begivenheder (sort, forstærkning, rød, sletning), og antallet af somatiske ikke-synonyme enkelt nukleotid variationer (nsSNVs), indels, og SNVs i splejsningssteder for hvert gen. Sorte trekanter angiver stærkt muterede gener. Orange trekanter betegne onkogener og blå trekanter angiver tumorsuppressorer.
Identifikation af diffus-typespecifikke SNVs og indels Salg In hver prøve par, vi identificeret ca. 3,7 mio SNVs, som blev verificeret ved hjælp af enkelt (SNP ) chips (gennemsnitlig konkordans rate: 99,2%, se Yderligere fil 1: tabel S4), og cirka 0.690.000 indels (for detaljer, se Ekstra fil 1: tabel S5 og tabel S6). Vi først vurderes mutations hyppighed af begge typer af GC på enkelt nukleotid (se Yderligere fil 1: Figur S2 a, b). Den somatiske mutation spektret var domineret af C > T (G > A) overgange i både DGC og IGC prøver, og der var ingen signifikante forskelle i mutationsmønstre sammenhænge mellem de to GC typer, i overensstemmelse med tidligere undersøgelser af GC [23, 30]. Når vi analyserede to tidligere beskrevne exome datasæt, fandt vi, at spektret af nukleotidsubstitutionen forholdet var magen til vores data (se supplerende fil 1: Figur S2C, d).
Skønt mutationen spektrum af DGC er svarende til den i IGC, individuelle mutationer i berørte gener var anderledes. Ved at trække mutationer findes i normale blod genomer, vi identificeret 922 ikke-synonyme SNVs (nsSNVs) som somatiske mutationer i de 18 tumorprøver (se Yderligere fil 1: Tabel S7, se Ekstra fil 2). Den gennemsnitlige mutation rate af de 18 GCS (1,97 mutationer /Mb) var sammenlignelig med det rapporterede i andre undersøgelser af colon, pancreas, og leverkræft [33-35]. Af 847 muterede gener, der berøres af de 922 nsSNVs, 581 var i 14 DGC tilfælde, 288 var i 4 IGC tilfælde, og 22 (2,6%) var fælles for begge typer. MSI prøve, som blev udelukket fra den sammenlignende analyse, viste cirka seks gange flere SNVs og indels end gjorde de andre prøver; dette resultat er i overensstemmelse med en tidligere rapport [22]. Når vi kombinerede de to tidligere indberettede exome datasæt, vi identificeret 967 og 2.077 somatiske nsSNVs i 19 DGCs og 28 regeringskonferencer henholdsvis. Den somatiske mutation satsen for regeringskonferencer (3,71 mutationer /Mb i de 28 prøver) var højere end for de DGCs (2.29 mutationer /Mb i de 19 prøver) (se Yderligere fil 1: Tabel S8). Tidligere offentliggjort forskning tyder på, at melanom og lungekræft har høje mutationsrater på grund af inddragelse af potente mutagener [36]. Ligeledes er det muligt, at regeringskonferencen har denne høje mutation sats, fordi dens tumorigen mekanisme kan være forbundet mere med miljø- og /eller parasitære mutagener i forhold til DGC.
For individuelle variationer blev formodede cancer-forårsagende gener forudsagt af føreren gen score beregning (se Yderligere fil 1: tabel 1 og tabel S9). Den CDH1
genet viste sig at blive rigeligt muteret i DGC (P
= 1,29 × 10
-2), herunder seks somatiske mutationer (tre missense, en nonsens, et rammeskift og én splejsningssted mutationer) der ikke er blevet rapporteret tidligere, hvorimod kun én missense mutation blev fundet i IGC prøver (tabel 2). Alle syv CDH1
somatiske mutationer blev verificeret ved Sanger sekventering (se Yderligere fil 1: Tabel S10 og tabel S11). I vores DGC prøver, 35,7% (5/14) havde CDH1
somatiske mutationer, og det er blevet rapporteret, at frekvenserne af CDH1
somatiske mutationer i sporadiske DGCs kan variere fra 3% til mere end 50% [19 , 37-40]. Det blev bekræftet, at i lande med en høj forekomst af sporadisk GC (såsom Japan og Korea), er hyppigheden af germlinie mutationer i familiær GC'er lav sammenlignet med den i lav forekomst lande [41, 42]. Derfor spekulerer vi, at den samlede GC incidens også er relateret til hyppigheden af CDH1
somatiske mutationer. Derudover blev en germline mutation (T340A) i CDH1 Hej, fundet i både tumor og tilsvarende blod genomer fra to prøver (D-14, DGC, M-01, MSI-type). Selvom T340A er en sygdomsfremkaldende mutation i HDGC [43], har disse to patienter ikke har nogen familiær historie såsom GC eller luftrør brystkræft. To tidligere rapporter analyserer exome data fra GC ikke identificere CDH1
som en højt rangeret gen (kun én missense mutation i en MSI RK prøve) [22, 23]. Denne uoverensstemmelse kan skyldes det lille antal prøver af DGC i disse undersøgelser (2 ud af 22 og 3 ud af 15 prøver var DGCs henholdsvis). I det foreliggende arbejde, PIK3CA
og TP53
, velkendt cancer-associerede gener, var de hyppigst muterede gener i både DGC og IGC se tabel 1 og tabel S9 i Ekstra fil 1. mutationer i to kendte PIK3CA Salg hotspots (E545K og H1047L) blev fundet i fire DGC prøver. Derudover blev en nsSNV mutation (Q546K) støder op til E545K mutation fundet i en DGC prøve. I alt 5 ud af 14 DGC prøver (ca. 30%) nærede nsSNVs i PIK3CA
, som er et onkogen hvis muteret form udviser forøget kinaseaktivitet, der forårsager cancer celleproliferation [44]. Vi derefter sammenlignet den lavfrekvente (16-17%) af de nsSNVs i PIK3CA
i rapporter fra andre [22, 23, 44] (som for det meste brugte RK prøver) og resultaterne af vores kombinerede analyse (31,5% for DGC , 14,3% for IGC) (se Yderligere fil 1: tabel S9). Det fremgår, at de relativt høje mutationsrater af PIK3CA
i DGC kan afspejle specificiteten af mutationer i dette gen til denne form for kræft. Derudover tre prøver (to DGC og en IGC) indeholdt både nsSNV og en kopi tab af TP53
, hvilket indikerer en homozygot tab af funktion i TP53
, som tidligere rapporteret [45]. En SNP i PSCA
genet (rs2976329) er blevet rapporteret at være forbundet med øget risiko for DGC i japanske og koreanske befolkning [21]. Denne SNP blev også beriget i de fleste DGC prøver i vores undersøgelse, (9 ud af 14 patienter), hvilket indikerer, at vores analyserede prøver repræsenterer typiske patienter med DGC i Østasien. Derudover en nonsense mutation (R1446 *) i ARID1A
gen, blev fundet i en DGC prøve (D-08). Selvom mutationer i ARID1A
ofte opdages i MSI og EBV-positive GCS [22, 23], viste D-08 prøve nr EBV infektion, og en MSI prøve (M-01) havde ikke nogen ARID1A
genmutationer enten. Fra variationer i lokomotivføreraspiranten gener, 88 nsSNVs, 4 små indels, og 2 SNVs i en splejsning websted blev verificeret ved anvendelse af traditionel Sanger sekventering. Syv af disse mutationer kunne ikke testes på grund af PCR fiasko, og af de resterende 87 mutationer, blev 96,6% bekræftet som sande somatiske mutationer (se Yderligere fil 1: Tabel S10 og tabel S11) .table en Top lokomotivføreraspiranten gener i 14 diffus -type gastrisk kræft
Gene
prøver, n
nsSNVs, n
SNVs i splejsningssite, n
indels, n
P
-værdi
driver gen score
PIK3CA
5
5
0
0
3,63 × 10 -12
9,83
CDH1
5
4
1
1
4,64 × 10-10
8,02
SNRPN
2
2
0
0
1,86 × 10-07
5,60
TP53
2
2
0
0
4,88 × 10-07
5,36
CMKLR1
2
2
0
0
5,33 × 10-07
5,36
CYP2A7
2
2
0
0
1.53 × 10-06
4.99
GUCY1B3
2
2
0
0
1,97 × 10-06
4.99
PAPOLB
2
2
0
0
2.15 × 10-06
4.99
MYH9
3
3
0
0
2,27 × 10-06
4.99
FAM71B
1
2
0
0
2,51 × 10-06
4.99
C10orf90
2
2
0
0
3,76 × 10 -06
4.86
AKAP8
2
2
0
0
4,59 × 10-06
4,81
ZC3H12B
2
2
0
0
5,87 × 10-06
4,74
SFTA3
1
1
0
0
6,86 × 10-06
4,70
SENP7
2
2
0
0
7,65 × 10-06
4,68
TMPRSS6
2
2
0
0
8,38 × 10-06
4,67
PAGE2
1
1
0
0
9.94 × 10-06
4,62
For yderligere driver gen lister, se yderligere fil 1:. tabel S9
tabel 2 CDH1 ændringer i 18 gastrisk kræft
Sample
Skriv
Ændring
CDH1
region
D-01 T
CNV
Tab
Exon 1 til 16
D-02 T
SNV
N256S
Exon 6
CNV
Tab
Exon 1 til 16
D-03 T
SNV
Splice websted
Donor site af Intron 4
D-04 T
CNV
Tab
Exon 1 til 16
D-05 T
SNV
D257N
Exon 6
INS
S829fs
Exon 16
D-09 T
SNV
V252G
Exon 6
SV
Break point
Intron 2
D -10 T
CNV
Tab
Exon 1 til 16
D-11 T
CNV
Tab
Exon 1 til 16
D-12 T
SNV
Q23 *
exon 2
D-13 T
CNV
Tab
Exon 1 til 16
SV
Break point
Introns 2 og 10
D-14 T
SV
Break point
Introns 2, 5 og 9
I-01 T
CNV
Tab
Exon 1 til 16
jeg -02 T
CNV
Tab
Exon 1 til 16
I-03 T
SNV
D221G
exon 5
SV
Break point
introns 10 og 13
I-04 T
CNV
Tab
Exon 1 til 16
CNV, kopiere nummer variation; INS, lille indsættelse; SNV, enkelt nukleotid variation; SV, strukturel variation.
Den somatiske variationer blev derefter kortlagt på Kyoto Encyclopedia of Gener og genomer (Kegg) veje database. Denne analyse viste, at de muterede gener af DGCs signifikant var forbundet med calcium signalvejen (P
= 7,00 × 10 -5, se Yderligere fil 1: Tabel S12 og Tabel S13). Lav indtagelse af calcium kan bidrage til GC udvikling [46]. Calcium er vigtigt for funktionen af E-cadherin, og et tab af E-cadherin-medieret adhæsion er involveret i overgangen fra en godartet læsion til invasiv metastatisk cancer [47]. Desuden blev de somatiske mutationer stærkt forbundet med veje relateret til småcellet lungecancer (P
= 1,00 × 10 -6 i DGC og P
= 4,24 × 10 -2 i RK). Især gener involveret i fokale vedhæftning veje, såsom ITGA
, PIK3CA
, og PTEN
, blev ofte muteret.
SV og CNV analyse
SV'er blev fundet baseret på discordantly kortlagt læst par, og eventuelle SV'er der var til stede i patienternes kimlinie genomer blev udelukket. I gennemsnit fandt vi 552 somatiske SV'er pr DGC prøve par (211 store indsættelser, 264 store sletninger, 27 inversioner, 44 intrakromosomal translokationer, og 6 interchromosomal translokationer). Vi fandt 664 somatiske SV'er i hvert IGC prøve par (285 store indsættelser, 283 store deletioner, 34 inversioner, 38 intrakromosomal translokationer og 24 interchromosomal translokationer) (for detaljer for hver prøve, se Yderligere fil 1: Tabel S14 og figur S3). Derudover fandt vi 2.258 gener som værdiforringet, og 1736 af disse blev kun fundet i DGC prøver (for data for hver prøve, se Yderligere fil 1: Tabel S15, og se Ekstra fil 3). Tre tumorsuppressorgener FHIT
, WWOX
, og MIPOL1
, der blev rapporteret i en tidligere GC undersøgelse [30], havde nedskrivninger grundet SVS (FHIT
i 11 prøver, WWOX
i 5 prøver, og MIPOL1
i 3 prøver) Salg fusionsgener genereret af en kromosomal omlejring blev også analyseret, og 19 fusionsgenet kandidater blev identificeret (se supplerende fil 1: tabel S16), herunder en hidtil ukendt fusion gen, TSC2
-RNF216
, der findes i en prøve (figur 2a, b). TSC2
koder for tuberin proteinet er tidligere blevet foreslået som et tumorsuppressorgen involveret i mammalian target of rapamycin (mTOR) pathway [48, 49]. Desuden er RNF216
, der koder E3 ubiquitin-protein-ligase, der er involveret i cytokin funktion ved at forhindre langvarig aktivering af nuklear faktor (NF) -κB [50]. Rap GTPase aktiverende protein (Rap-GAP) domæne af TSC2 protein, som er relateret til den iboende GTPase aktivitet af Ras-relaterede proteiner RAP1A og RAB5, blev brudt af denne kromosomale translokation (figur 2c). Desuden blev zinkfinger domæner af RNF216 proteinet ikke udtrykkes i fusionsgenet, på grund af et rammeskift, der forårsagede tidlig terminering. Anvendelse af revers transkription polymerasekædereaktion (RT-PCR) efterfulgt af sekventering analyse blev ekspressionen af dette fusionsgen i patientens væv bekræftes. Efter at have testet et ekstra sæt 15 GC patientens væv identificerede vi 2 patienter udtrykker fusionsgenet (figur 2d, e). Denne kromosomale translokation kan føre til ændrede cellulære adfærd både ved at forstyrre den normale funktion af genet og forårsager ekspression af fusionsgenet produkt, som kan konkurrere mod det normale gen. Fusionsgenet kan kompetitivt forstyrre tumorundertrykkende veje og aktivere NF-KB-medieret cytokin signalering. Figur 2 TSC2 - RNF216 fusionsgenet brud. (A) Exon struktur af TSC2
-RNF216
fusionsgen. Tallene i kasserne er de exon antal hvert gen. Røde linjer angiver fusionspunkterne. (B) Protein domæne struktur TSC2-RNF216 fusionsprotein. Den Rap-GAP domæne TSC2 blev brudt, og RNF216 havde en rammeskiftmutation forårsager for tidlig opsigelse fra interchromosomal omlejring. (C) Struktur af TSC2 Rap-GAP domæne. Den røde region er den resterende Rap-GAP domænet region, og det grå område er Rap-GAP domæne, der slettes i TSC2
-RNF216
fusion gen. (D) RNA sekvens af TSC2
-RNF216
fusionsgen. Position 136 er vist som N. Enten en A eller G basen producerer en termineringskodon (TAA eller TAG). (E) Kontrol af TSC2
-RNF216
fusion udskrift i RNA (cDNA) ved hjælp af PCR-amplifikation og elektroforese.
I DGCs, kromosomer 16, 17, 19, 20, 21, og 22, der er indeholdt en forøget mængde af blok deletioner, mens kromosomer 3, 7, 8, og 13 viste bl.a. øget overlapninger (figur 1). Mange tumorsuppressorgener, såsom CDH1
, PLA2G2A, RUNX3
, SMAD2
, og TP53
, er placeret i udstrakt slettede kromosomale regioner. Især somatisk mutation (nsSNV eller splejsningsstedmutationen) og kopi nummer tab af CDH1
var generelt udelukker hinanden: fire ud af fem DGC prøver med somatisk mutation havde ikke gen kopi nummer tab, og otte ud af ni DGC prøver med en CDH1
genkopitallet tab havde ikke nogen somatiske mutationer i CDH1
. Kun én prøve (1/18, 5,6%) havde både ændringer (mutation og eksemplarnummer tab) samtidigt, og denne observation falder sammen med tidligere undersøgelser rapporterer, at samtidige ændringer i CDH1
er sjældne [19, 40, 51, 52] . Når vi overvejet SV'er i CDH1
sammen, fandt vi, at andre tre prøver havde en mutation /kopiantals tab samtidig med SV. Derudover kopi numre af onkogen MYC
blev forøget i fem DGC prøver (se Ekstra fil 4), og kopiere numre af MET
blev øget i tre DGC prøver [53]. De onkogener MOS
og ZHX2
også viste en kopi nummer gevinst i fem og fire DGC prøver hhv. Mere end halvdelen af prøverne (10 ud af 18) viste en kopiantal reduktion af ARID1A
, hvilket er en driver gen for ovariecancer clear cell carcinoma, og en kromatin Remodeler i GC [22, 54, 55]. Det er kendt, at størstedelen af GCS med ARID1A
mutationer viser lavere proteinekspression sammenlignet med GC'er uden en ARID1A
mutation [22]. Hvis doseringen effekt er vigtig i disse cancervæv, kopiantal reduktion af ARID1A
kunne være en mulig cancerassocieret faktor
En stor region af kromosom 12 blev amplificeret i tre DGC genomer.; af disse tre genomer, prøver D-01 T og D-02 T udviste markant høj amplifikation (figur 3a). Dobbeltarbejde mønstre var lidt anderledes: D-01 T havde en tandem gentagelse af tre Mbp, mens D-02 T havde en inverteret gentagelse af en MBP (figur 3b, c). En del af denne duplikerede region koder for den murine dobbelt minut (MDM2
) genet. Det blev rapporteret, at i en lille datasæt blev MDM2
genet hyppigt amplificeret [56], og at dette gen er forbundet med adskillige cancertyper [57]. MDM2
overekspression forårsaget af genamplifikation blev eksperimentelt bekræftet ved anvendelse kvantitativ RT-PCR med tumoren og tilstødende normalt væv parrede prøver anvendes til NGS analyser, og normale cellelinier blev medtaget til sammenligning (figur 3d). MDM2
overekspression positivt korreleret med kopi nummer analysedata. Selvom tidligere rapporteret array-CGH oplysninger [32] havde relativt lav opløsning for CNV afsløring, brugte vi disse data til at søge efter en skævhed i ændringer af genkopitallet i hvert histopatologisk type. En kopi nummer gevinst på gener, der koder calciumantagonister proteiner (CACNG6
, CACNG7
og CACNG8
, P
= 4,24 × 10 -2) var signifikant mere almindelig i DGC prøver (se Yderligere fil 1: tabel S17). Alle integrerede ændring oplysninger vises i Ekstra filer (se Ekstra fil 1: Tabel S18 og Tabel S19, se Ekstra fil 5). Figur 3 overlapning region af MDM2 genet på kromosom 12 i prøver D-01 T og D-02 T. (a) Kortlægning dybde afbildninger af to kromosomer. (B) Tynde sorte pigge blev aflæst ved kortlægning dybde af 2000-basen bredde. Den y
aksen viser relative dybde. Hver enhed repræsenterer cirka 30 gange sekventering dybde. (c) -gen positioner og navne rundt de forstærkede regioner. De sorte bånd viser gen steder. (D) MDM2
transkriptniveauer i tumor og tilstødende normale væv parrede prøver og normale cellelinier. Kvantitativ RT-PCR blev anvendt til måling MDM2
mRNA-niveauer i prøver D-01 og D-02 (indeholdende amplificeret MDM2
regioner), D-04, D-05, D-10, I-03, og I-04 (uden forstærkede MDM2
regioner), og tre normale cellelinier (HDF, HMEC, og Hs 738.St/Int~~number=plural). Fejl barer blev beregnet ud fra to adskilte forsøg af tredobbelte reaktioner.
3D strukturel analyse af muteret CDH1
For at forstå, hvordan de fundne mutationer påvirker proteinstruktur /funktion og aktivering af downstream biologiske veje påvirker carcinogenese, vi analyserede tre-dimensionelle ( 3D) strukturer af mutant E-cadherin protein, der findes i en regeringskonference og fem DGC prøver (se Ekstra fil 2). Den CDH1
genet koder for et calcium-afhængig celleadhæsion glycoprotein og har fem ekstracellulære domæner cadherin (EC1-EC5) (figur 4a). Det er kendt, at interaktionen mellem cadherin og calcium er nødvendig for dimerisering, strukturelle stivhed og beskyttelse mod proteolytisk nedbrydning [58]. Mutationer i EC1-2 og EC2-3 kryds er kendt for at forårsage ukorrekt cadherin lokalisering og reduceret celleadhæsion [59]. Strukturel analyse blev udført på fire nsSNVs (D221G, V252G, N256S, og D257N), med undtagelse af en nonsens SNV (Q23 *), et rammeskift indsættelse (S829fs), og en splejsning websted (CHR16: 68.842.472) mutation. Alle fire nsSNVs blev placeret i forbindelsen mellem EC1 og EC2 (EC1-2 junction) (figur 4b, c), og tre nsSNVs (D221G, N256S, og D257N) var i proteinet regionen, som direkte interagerer med en calciumion (figur 4d, e). Denne situation kan medføre unormale interaktioner mellem cadherin domæner. Det forlyder, at A298t, D231K og D231A mutationer, som har et lignende strukturel position ved EC1-2 krydset til de somatiske mutationer findes i denne undersøgelse, viste et tab af celleadhæsion funktion [60, 61]. En anden nsSNV mutation, V252G, er placeret i β-sheet struktur cadherin, og dens sidekæde er orienteret mod det indre. Fordi β-barrel strukturer indeholder generelt alternerende polære og hydrofobe aminosyrer, med de hydrofobe rester orienteret mod det indre af cylinderen til dannelse af en hydrofob kerne, og de polære rester orienteret mod ydersiden af cylinderen på opløsningsmiddel-eksponerede overflade, den dannelsen af den hydrofobe kerne kan blive hæmmet af den V252G mutationen (Figur 4e). En tidligere exome undersøgelse rapporteret to CDH1
mutationer, P127fs (rammeskift mutation i et DGC) og V694I (i en MSI IGC) [22]. Dimerisering af to cadherinmolekyler i enten en cis
eller trans
konfiguration skete i krydset mellem EC1-2 og EC1-2 [62], mens mutationer på EC3-4 og EC4-5 vejkryds ikke signifikant indflydelse celleadhæsion [59]. Alle forfattere læst og godkendt den endelige manuskript.