genomica analisi del profilo di diffuso tipo di cancro gastrico
Abstract
sfondo
Il cancro dello stomaco è il terzo più letale tra tutti i tumori in tutto il mondo. Sebbene l'incidenza del tipo intestinale cancro gastrico è diminuita, l'incidenza di diffuso tipo continua a crescere e la sua progressione è notoriamente aggressive. Ci sono informazioni sufficienti sulle variazioni del genoma di diffuso tipo di cancro gastrico, perché le sue cellule sono di solito mescolate con cellule normali, e questo a bassa cellularità ha reso difficile l'analisi del genoma.
Risultati
Analizziamo genomi interi e exomes corrispondenti di diffuso tipo di cancro gastrico, utilizzando cinque intestinale di tipo pazienti affetti da cancro gastrico tumore abbinati e campioni normali da 14 diffusa-tipo e. variazioni somatiche presenti nel diffuso tipo di cancro gastrico sono confrontati con quelli del tipo intestinale e registrati precedentemente varianti. Noi determinare il tasso medio exonic mutazione somatica dei due tipi. Troviamo associati geni macchinista, e identificare sette nuove mutazioni somatiche nel CDH1
, che è un gene del cancro-associata gastrica ben noto. analisi della struttura tridimensionale della proteina E-caderina mutato suggerisce che queste nuove mutazioni somatiche potrebbero causare notevoli perturbazioni funzionali di siti leganti il calcio critici della giunzione EC1-2. analisi instabilità cromosomica mostra che il MDM2
gene è amplificato. Dopo l'analisi strutturale approfondita, un gene TSC2 romanzo fusione
-RNF216
è identificato, che può contemporaneamente distruggere le vie tumore soppressiva e attivare tumorigenesi.
Conclusioni
Riportiamo il profilo genomico di diffusa di tipo gastrico tumori tra cui nuove variazioni somatiche, un gene di fusione romanzo, e l'amplificazione e l'eliminazione di alcune regioni cromosomiche che contengono oncogeni e soppressori tumorali.
Sfondo
ranghi cancro allo stomaco come il terzo più importante causa di mortalità per cancro globale [1]. Istopatologico, cancro gastrico (GC) possono essere classificati in due categorie in base a differenze morfologiche: intestinale-tipo GC (CIG) e diffusa di tipo GC (DGC) [2, 3]. CIG è tipicamente associato con Helicobacter pylori
infezione, ed è particolarmente comune in Giappone e Corea del [4-6]. DGC è uniformemente distribuita geograficamente, e comprende forme aggressive clinici, come linite plastica, che hanno prognosi infausta, soprattutto nei pazienti giovani [7, 8]. modifiche DNA genomico che portano alla GC può accadere a causa di diversi fattori di rischio ambientale come una dieta ad alto contenuto di sale e fumo di tabacco [9]. Sebbene l'incidenza di CIG è diminuita costantemente nel corso diversi decenni (riduzione del 44% dal 1978 al 2005), DGC è aumentato rapidamente (del 62%) dal 1978 fino al 2000, per poi diminuire leggermente nel 2001-2005 [10]. Nonostante le prove cumulativo che CIG e DGC sviluppano attraverso diversi percorsi cancerogeni [11, 12], dati dettagliati in scala genomica per DGC mancano a causa della limitata disponibilità di campioni clinici e un basso livello di purezza della popolazione di cellule di cancro.
data, sono stati identificati pochi geni associati con sottotipi GC. Il CDH1
gene, che codifica per la proteina E-caderina, sono i geni più noti associati ereditaria DGC (HDGC) [13-16]. lo screening genetico per queste mutazioni è stato suggerito al fine di diagnosticare esordio precoce GC [17]. La disfunzione E-caderina, causata da mutazioni, la perdita di eterozigosi, e ipermetilazione del promotore, è il difetto più consolidata nel iniziazione GC e sviluppo [18-20]. Uno studio di associazione genome-wide ha dimostrato che polimorfismi nel staminali antigene prostatico cella gene (PSCA
) sono fortemente associati alla suscettibilità alla DGC [21]. Il metodo microarray, tuttavia, è limitata alle variazioni di singoli nucleotidi, e non può rilevare variazioni strutturali copia neutro (SV). Due recenti studi hanno riportato sulla exomes GC, e ha dimostrato che mutazioni nel gene ARID1A
sono frequentemente rilevati in GC con microsatellite instabilità, e il virus di Epstein-Barr (EBV) -positivo GC [22, 23]. Nessuna analisi sottotipi GC è stata eseguita, e la maggior parte dei campioni analizzati negli studi provenivano da pazienti con CIG.
Sequenziamento di prossima generazione (NGS) ha permesso ai ricercatori di rilevare le variazioni associate alla malattia, e ha contribuito a scoprire i meccanismi alla base di sviluppo della malattia. In particolare, tutto il sequenziamento del genoma (WGS) in grado di rilevare la maggior parte delle varianti genomiche, tra SV, come intrachromosomal e riarrangiamenti interchromosomal. In alternativa, tutto il sequenziamento (WES), un metodo di sequenziamento catturato bersaglio, può essere utilizzato per alta profondità sequenziamento di un gran numero di campioni ad un costo relativamente basso [24], anche se le variazioni solo singolo nucleotide (SNVs) e piccole inserzioni o delezioni (indels) possono essere identificati con questo metodo. WGS e Wes ogni hanno vantaggi e svantaggi, e una serie di studi recenti hanno utilizzato entrambi i metodi [25-27].
Qui vi presentiamo la caratterizzazione dettagliata del DGC genomi da tumore abbinati e campioni normali generando profili genomici interi seguiti da WES . Abbiamo usato campioni di sangue come controllo normale, come negli studi precedenti [28-31]. Al fine di trovare le variazioni DGC-specifica, genomi CIG sono stati analizzati e confrontati con le variazioni identificate nel genoma di DGCS. Tridimensionale analisi della struttura delle proteine è stata effettuata per nuove mutazioni somatiche del CDH1
gene, e questo ha identificato regioni critiche che sono state funzionalmente alterati dalle mutazioni. Inoltre, abbiamo trovato un gene di fusione romanzo che potrebbero essere coinvolti nella tumorigenesi.
Risultati e discussione
campioni misti normali (sangue) dell'intero genoma e sequenziamento
tumorale e da 14 pazienti con DGC (le caratteristiche clinico-patologici di questi pazienti sono riportati nella tabella S1 in file aggiuntive 1), che erano tutti relativamente giovani (età media 38 anni) le donne coreane, sono stati sequenziati usando un Illumina HiSeq 2000 che ha prodotto abbinato-end, 90-base e 101-base del DNA legge. Inoltre, cinque paia di tumore e campioni normali abbinati da pazienti con CIG (età media 42 anni) sono stati sottoposti a sequenziamento del DNA; uno di questi campioni è stato identificato in seguito come un caso di instabilità dei microsatelliti (MSI) e quindi è stato escluso dall'analisi mutazione. Nessuno dei campioni ha avuto una storia familiare di cancro, e sottotipi sono stati istopatologico confermato. Solo le cellule tumorali sono stati raccolti da macrodissection dopo ematossilina colorazione. Compra di tutto il analisi del genoma, in media, 92 gigabasi (Gb) per campione sono stati prodotti in circa 32 volte la profondità di sequenziamento, raggiungendo 3,5 terabasi (TB) in totale, e sono stati mappato il genoma di riferimento (NCBI costruire 37, hg19) ad una velocità di mappatura superiore al 94,5% (per le statistiche di sequenziamento, vedere sui file 1: Tabella S2). Utilizzando la finale 3.3 Tb di mappato legge, un database profilo genomico è stato costruito per SNVs rilevamento, copia variazioni del numero (CNV), e SV. Perché la purezza cellulare di un campione di tumore è una caratteristica fondamentale per l'analisi del genoma del cancro, è stata valutata utilizzando un metodo di calcolo in-house (vedi Materiali e Metodi; vedere sui file 1: Tabella S3 e Figura S1). Anche se abbiamo provato a raccogliere solo le cellule tumorali I campioni mostravano ancora un livello elevato di stromale additivo. Per aumentare la precisione del rilevamento mutazione in regioni geniche anche in campioni a bassa purezza, ulteriore WES è stata eseguita in circa 103 volte la profondità di sequenziamento, in media, che ha prodotto un totale di 17 Gb dati di sequenza. Il WES catturato coperto 93,1% della regione genica a 10 volte o maggiore profondità, e questa copertura è simile a quello dei dati exome precedentemente riportati su GC [22, 23].
Combinando i dati WGS e WES, abbiamo rilevato somatica alterazioni nei campioni DGC, e loro confronto con le alterazioni CIG (i dati sono riassunti nella figura 1 come un diagramma circo). Per verificare i nostri dati, abbiamo combinato e analizzato con precedentemente riportati i dati dell'esoma da due diversi studi (24 CIG e 5 campioni DGC, esclusi i MSI e campioni misti) [22, 23] e da serie genoma comparativa ibridazione dati (CGH) ( 16 CIG e 14 campioni DGC) [32]. Sebbene questi studi utilizzati principalmente CIG incluse soltanto un piccolo numero di campioni DGC, potrebbero essere complementari ai nostri dati come controllo (fornendo un maggior numero di dati IGC e eliminazione di specificità tissutale). Nel set di dati combinato, abbiamo confrontato le differenze di alterazioni tra i campioni DGC e IGC. Figura 1 Distribuzione intero genoma di mutazioni somatiche ed eventi duplicazione o delezione in diffuso tipo di cancro gastrico (DGCS). Tutte le mutazioni somatiche, tra cui eventi di duplicazione /cancellazione, che sono stati trovati nei 14 genomi DGC, si fondono nella trama circo. Dall'esterno verso l'interno, la trama presenta le seguenti caratteristiche: ideogrammi cromosomiche, frequenza di eventi cumulativi di amplificazione o di cancellazione (nero, amplificazione, rosso, cancellazione), e il numero di varianti a singolo nucleotide non-sinonime somatiche (nsSNVs), indels, e SNVs nei siti di splicing per ogni gene. triangoli neri indicano i geni mutati altamente. triangoli arancione denotano oncogeni, e triangoli blu indicano i soppressori tumorali.
Identificazione SNVs-specifici diffuso del tipo e indels
In ogni coppia di esempio, abbiamo identificato a circa 3,7 milioni di SNVs, che sono stati verificati usando polimorfismi a singolo nucleotide (SNP ) chip (tasso medio concordanza: 99,2%; vedere sui file 1: Tabella S4), e circa 0,69 milioni indels (per i dettagli, vedi file aggiuntivo 1: Tabella S5 e S6 tabella). In primo luogo abbiamo valutato la frequenza mutazionale di entrambi i tipi di GC a livello di singolo nucleotide (vedi file aggiuntivo 1: Figura S2 a, b). Lo spettro mutazione somatica è stata dominata da C > T (G > A) le transizioni in entrambi i campioni DGC e IGC, e non vi erano differenze significative nei contesti di mutazione tra i due tipi GC, in accordo con precedenti studi di GC [23, 30]. Quando abbiamo analizzato due insiemi di dati exome precedentemente riportati, abbiamo scoperto che lo spettro del rapporto di sostituzione nucleotidica era simile ai nostri dati (vedi file aggiuntivo 1: Figura S2c, d).
Anche se lo spettro di mutazione del DGC è simile a quella di CIG, singole mutazioni nei geni coinvolti erano diverse. Sottraendo mutazioni trovate nelle normali genomi di sangue, abbiamo identificato 922 SNVs non-sinonime (nsSNVs) come mutazioni somatiche nei campioni tumorali 18 (vedi file aggiuntivo 1: Tabella S7; vedi file supplementare 2). Il tasso medio di mutazione dei 18 CV (1,97 mutazioni /Mb) è stato paragonabile a quello riportato in altri studi sul colon, del pancreas, e tumori del fegato [33-35]. Di 847 geni mutati colpiti dalle 922 nsSNVs, 581 erano in 14 casi DGC, 288 erano in 4 casi CIG, e 22 (2,6%) erano comuni a entrambi i tipi. Il campione MSI, che è stato escluso dall'analisi comparativa, ha mostrato circa sei volte più SNVs e indels che hanno fatto gli altri campioni; Questo risultato è in accordo con un precedente relazione [22]. Quando abbiamo unito le due serie di dati exome precedentemente riportati, abbiamo identificato 967 e 2.077 nsSNVs somatiche in 19 DGCS e 28 CIG, rispettivamente. Il tasso di mutazione somatica del CIG (3,71 mutazioni /Mb nei 28 campioni) è stata superiore a quella della DGCS (2,29 mutazioni /Mb nei 19 campioni) (vedi file aggiuntive 1: Tabella S8). ricerca precedentemente pubblicata suggerisce che il melanoma e il cancro ai polmoni hanno alti tassi di mutazione, a causa del coinvolgimento di agenti mutageni potenti [36]. Allo stesso modo, è possibile che CIG ha questo alto tasso di mutazione, perché il suo meccanismo oncogeno può essere associato più con l'ambiente e /o mutageni parassitarie rispetto alla DGC. Compra di variazioni individuali, putativi geni tumore-causali sono stati previsti dal pilota calcolo del punteggio gene (vedi file aggiuntivo 1: Tabella 1 e Tabella S9). Il CDH1
gene è risultato essere abbondantemente mutato in DGC (P = 1.29
× 10
-2), tra cui sei mutazioni somatiche (tre missense, una sciocchezza, una frameshift e uno sito di splice mutazioni) che non sono state precedentemente riportate, mentre solo una mutazione di senso è stato trovato nei campioni CIG (Tabella 2). Tutti e sette CDH1
mutazioni somatiche sono stati verificati da Sanger sequenziamento (vedi file aggiuntivo 1: Tabella S10 e S11 Tabella). Nei nostri campioni DGC, il 35,7% (5/14) aveva CDH1
mutazioni somatiche, ed è stato riportato che le frequenze di CDH1
mutazioni somatiche in DGCS sporadici può variare dal 3% al superiore al 50% [19 , 37-40]. E 'stato verificato che nei paesi con un'alta incidenza di GC sporadica (come il Giappone e la Corea), la frequenza delle mutazioni della linea germinale in famigliare GC è basso rispetto a quello nei paesi a basso incidenza [41, 42]. Pertanto, ipotizziamo che l'incidenza complessiva GC è anche legato alla frequenza di CDH1
mutazioni somatiche. Inoltre, una mutazione germinale (T340A) in CDH1
è stato trovato in entrambi i tumori e le corrispondenti genomi di sangue da due campioni (D-14, DGC, M-01, MSI-tipo). Anche se T340A è una mutazione causativa in HDGC [43], questi due pazienti non avevano alcuna storia familiare come il GC o il cancro al seno lobulare. Due precedenti relazioni che analizzano i dati dell'esoma di GC non hanno identificato CDH1
come un gene altamente classificato (una sola mutazione missenso in un campione MSI CIG) [22, 23]. Questa discrepanza può essere dovuto al numero limitato di campioni di DGC in quegli studi (2 di 22 e 3 su 15 campioni erano DGCS, rispettivamente). Nel presente lavoro, PIK3CA
e TP53
, ben noti geni del cancro-associata, sono stati i geni più frequentemente mutato sia in DGC e IGC vedi Tabella 1 e Tabella S9 in file di informazioni 1. Le mutazioni in due noti PIK3CA
hotspot (E545K e H1047L) sono stati trovati in quattro campioni DGC. Inoltre, una mutazione nsSNV (Q546K) adiacente alla mutazione E545K è stato trovato in un campione DGC. In totale, 5 su 14 campioni DGC (circa il 30%) nutriva nsSNVs in PIK3CA
, che è un oncogene mutato cui reperti di forma maggiore attività chinasi, provocando la proliferazione delle cellule del cancro [44]. Abbiamo quindi confrontato la frequenza bassa (16-17%) dei nsSNVs in PIK3CA
nelle relazioni con gli altri [22, 23, 44] (che per lo più campioni usati CIG) ed i risultati della nostra analisi combinata (31,5% per la DGC , 14,3% per la CIG) (vedi file aggiuntive 1: Tabella S9). Sembra che relativamente elevati tassi di mutazione di PIK3CA
in DGC possono riflettere la specificità delle mutazioni in questo gene per questo tipo di cancro. Inoltre, tre campioni (due DGC e uno CIG) contenevano sia nsSNV e una perdita copia di TP53
, indicando una perdita omozigote di funzione nella TP53
, come riportato in precedenza [45]. Un SNP nel gene PSCA
(rs2976329) è stato segnalato per essere associato con un aumentato rischio di DGC nelle popolazioni giapponesi e coreani [21]. Questo SNP è stato anche arricchito nella maggior parte dei campioni DGC nel nostro studio, (9 su 14 pazienti), che indica che i nostri campioni analizzati rappresentano i pazienti tipici con DGC in Asia orientale. Inoltre, un nonsense mutazione (R1446 *) nella ARID1A
gene, è stato trovato in un campione DGC (D-08). Anche se mutazioni in ARID1A Quali sono frequentemente rilevati nel MSI e in GC EBV-positivo [22, 23], il campione D-08 non ha mostrato alcuna infezione da EBV, e un campione MSI (M-01) non ha avuto alcun ARID1A
mutazioni del gene sia. Da variazioni nei geni macchinista, 88 nsSNVs, 4 piccoli indels, e 2 SNVs in un sito di splicing sono stati effettuati utilizzando convenzionale sequenziamento Sanger. Sette di queste mutazioni non possono essere testati a causa del fallimento PCR, e dei restanti 87 mutazioni, il 96,6% sono stati confermati come veri mutazioni somatiche (vedi file aggiuntivo 1: Tabella S10 e S11 Tabella) .table 1 Top candidati geni del driver a 14 diffusa tumori di tipo gastrico
Gene
campioni, n
nsSNVs, n
SNVs in sito di splicing, n
indels, n
P
-value
driver punteggio gene
PIK3CA
5
5
0 0
3.63 × 10 -12
9.83
CDH1
5 4
1
1 4,64 × 10-10
8.02
SNRPN
2 2
0 0
1.86 × 10-07
5,60
TP53
2 2
0
0
4,88 × 10-07
5.36
CMKLR1
2 2
0 0
5.33 × 10-07
5.36
CYP2A7
2 2
0 0
1.53 × 10-06
4.99
GUCY1B3
2 2
0
0
1.97 × 10-06
4.99
PAPOLB
2 2
0 0
2.15 × 10-06
4.99
MYH9
3 3
0 0
2.27 × 10-06
4.99
FAM71B
1
2
0 0
2.51 × 10-06
4.99
C10orf90
2 2
0 0
3.76 × 10 -06
4.86
AKAP8
2 2
0 0
4.59 × 10-06
4.81
ZC3H12B
2 2
0 0
5,87 × 10-06
4.74
SFTA3
1
1 0 0
6.86 × 10-06
4,70
SENP7
2 2
0 0
7,65 × 10-06
4,68
TMPRSS6
2 2
0 0
8.38 × 10-06
4.67
PAGE2
1
1 0
0
9.94 × 10-06
4.62 Compra di ulteriori liste di geni driver, vedere sui file. 1: Tabella S9
alterazioni Tabella 2 CDH1 in 18 tumori gastrici
Esempio
Tipo
Alterazione
CDH1
regione
D-01 T
CNV
perdita
esoni da 1 a 16
D-02 T
SNV
N256S
Exon 6
CNV
perdita
esoni da 1 a 16
D-03 T
SNV portale Splice
sito donatore di introni 4
D-04 T
CNV
perdita
esoni da 1 a 16
D-05 T
SNV
D257N
Exon 6
INS
S829fs
Exon 16
punto D-09 T
SNV
V252G
Exon 6
SV
Pausa
Intron 2
D -10 T
CNV
perdita
esoni da 1 a 16
D-11 T
CNV
perdita
esoni da 1 a 16
D-12 T
SNV
Q23 *
Exon 2
D-13 T
CNV
perdita
esoni 1-16
SV
rompere punto
introni 2 e 10
D-14 T
SV
punto di rottura
introni 2, 5 e 9
I-01 T
CNV
perdita
esoni da 1 a 16
I -02 T
CNV
perdita
esoni da 1 a 16
I-03 T
SNV
D221G
Exon 5
SV
break point
introni 10 e 13
I-04 T
CNV
perdita
esoni da 1 a 16
CNV, copiare il numero di variazione; INS, piccolo inserimento; SNV, singolo nucleotide variante; SV, variazione strutturale.
Le variazioni somatici sono stati quindi mappati sul Encyclopedia Kyoto di geni e genomi (KEGG) percorsi di database. Questa analisi ha rivelato che i geni mutati della DGCS sono risultati significativamente associati con la via di segnalazione di calcio (P = 7.00
× 10 -5; vedere sui file 1: Tabella S12 e S13 Tabella). basso apporto di calcio può contribuire allo sviluppo GC [46]. Il calcio è essenziale per la funzione di E-caderina, ed una perdita di adesione E-caderina-mediata è coinvolto nella transizione da una lesione benigna a cancro metastatico invasivo [47]. Inoltre, le mutazioni somatiche sono stati fortemente associati con percorsi legati al cancro del polmone a piccole cellule (P
= 1.00 × 10 -6 in DGC e P
= 4.24 × 10 -2 in CIG). In particolare, i geni coinvolti nei percorsi di adesione focale, come ITGA
, PIK3CA
, e PTEN
, sono stati spesso mutati.
SV e l'analisi CNV
SV sono stati rilevati basate su discordantly mappata leggere sono stati esclusi coppie, e tutte le SV che erano presenti nei genomi linea germinale dei pazienti. In media, abbiamo trovato 552 SV somatiche per coppia campione DGC (211 grandi inserimenti, 264 grandi delezioni, 27 inversioni, traslocazioni 44 intrachromosomal, e 6 traslocazioni interchromosomal). Abbiamo trovato 664 SV somatici in ogni coppia campione CIG (285 grandi inserimenti, 283 grandi delezioni, 34 inversioni, 38 traslocazioni intrachromosomal, e 24 traslocazioni interchromosomal) (per i dettagli per ogni campione, vedi file aggiuntive 1: Tabella S14 e Figura S3). Inoltre, abbiamo trovato 2.258 geni di essere compromessa, e 1.736 di questi sono stati trovati solo nei campioni DGC (per i dati per ogni campione, vedi file aggiuntivo 1: Tabella S15; e vedere sui file 3). Tre geni oncosoppressori FHIT
, WWOX
, e MIPOL1
, che sono stati riportati in uno studio GC precedente [30], hanno menomazioni a causa della SV (FHIT
in 11 campioni, WWOX
in 5 campioni, e MIPOL1
in 3 campioni)
geni di fusione generati da un riarrangiamento cromosomico sono stati anche analizzati, e sono stati individuati 19 candidati gene di fusione (vedi file aggiuntivo 1: Tabella S16), tra cui una fusione romanzo gene, TSC2
-RNF216
, si trovano in un campione (Figura 2a, b). TSC2
codifica per la proteina tuberina è stato precedentemente proposto come un gene soppressore del tumore coinvolti nel bersaglio della rapamicina nei mammiferi (mTOR) percorso [48, 49]. Inoltre, RNF216
, codifica E3 ubiquitina-proteina ligasi, è coinvolta in funzione delle citochine impedendo l'attivazione sostenuta del fattore nucleare (NF) -κB [50]. Il Rap proteina gap (Rap-GAP) dominio della proteina TSC2, che è legato all'attività GTPasica intrinseca dei Ras-correlato proteine RAP1A e Rab5, fu rotto da questo traslocazione cromosomica (Figura 2c). Inoltre, i domini zinc finger della proteina RNF216 non sono stati espressi nel gene di fusione, a causa di un frameshift che ha causato la terminazione prematura. Utilizzando trascrizione polymerase chain reaction inversa (RT-PCR) seguita da analisi di sequenziamento, è stata confermata l'espressione di questo gene di fusione nel tessuto del paziente. Dopo aver testato una serie aggiuntiva di 15 tessuti del paziente GC, sono stati identificati 2 pazienti che esprimono il gene di fusione (Figura 2d, e). Questa traslocazione cromosomica può portare a comportamento cellulare alterato sia interrompendo il normale funzionamento del gene e causando l'espressione del prodotto del gene di fusione, che può competere con il gene normale. Il gene di fusione può competitivo interferire con percorsi oncosoppressori e attivare NF-kB mediata segnalazione di citochine. Figura 2 TSC2 - RNF216 gene di fusione rottura. (A) Exon struttura del TSC2
-RNF216
gene di fusione. I numeri nelle caselle sono i numeri esone di ogni gene. Le linee rosse indicano i punti di fusione. (B) la struttura del dominio proteina della proteina di fusione TSC2-RNF216. Il dominio Rap-GAP di TSC2 era rotto, e RNF216 aveva una mutazione frameshift causando cessazione anticipata dal riarrangiamento interchromosomal. (C) Struttura della dominio Rap-GAP TSC2. La regione rossa è la regione del dominio Rap-GAP restante, e la regione grigia è il dominio Rap-GAP che viene eliminato nel TSC2
-RNF216
gene di fusione. Sequenza (d) RNA del TSC2
-RNF216
gene di fusione. Posizione 136 è mostrato come N. Sia A o G di base produce un codone di terminazione (TAA o TAG). (E) La verifica del TSC2
-RNF216
fusione trascritto in RNA (cDNA) mediante PCR e l'elettroforesi.
In DGCS, i cromosomi 16, 17, 19, 20, 21, 22 e conteneva una quantità di delezioni blocco aumentato, mentre i cromosomi 3, 7, 8, e 13 hanno mostrato particolare aumento duplicazioni (Figura 1). Molti geni oncosoppressori, come CDH1
, PLA2G2A, RUNX3
, SMAD2
, e TP53
, si trovano in regioni cromosomiche ampiamente eliminati. In particolare, la mutazione somatica (nsSNV o sito di splice mutazione) e numero di copie perdita di CDH1
erano generalmente escludono a vicenda: quattro su cinque campioni DGC con mutazione somatica non hanno avuto perdite numero di copie del gene, e otto su nove campioni DGC con un CDH1
di copie del gene perdita di numero non ha avuto mutazioni somatiche nel CDH1
. Solo un campione (1/18, 5,6%) hanno avuto entrambe le alterazioni (mutazioni e copiare la perdita di numero) in concomitanza, e questa osservazione coincide con gli studi precedenti segnalazione che le alterazioni concomitanti in CDH1 Quali sono rari [19, 40, 51, 52] . Quando abbiamo preso in considerazione SV in CDH1
insieme, abbiamo scoperto che altri tre campioni avevano una mutazione /copia perdita numero concomitante con SV. Inoltre, il numero di copia del MYC oncogene
sono state aumentate in cinque campioni DGC (vedi file aggiuntive 4), e copiare i numeri di MET
sono state aumentate in tre campioni DGC [53]. Oncogeni MOS
e ZHX2
anche mostrato un numero di copie di guadagno in cinque e quattro campioni DGC, rispettivamente. Più della metà dei campioni (10 su 18) ha mostrato una copia riduzione del numero di ARID1A
, che è un gene autista per il carcinoma a cellule chiare dell'ovaio, e un remodeler cromatina in GC [22, 54, 55]. E 'noto che la maggior parte dei GC con ARID1A
mutazioni mostrare l'espressione della proteina più bassa rispetto a GC senza ARID1A
mutazione [22]. Se l'effetto dosaggio è importante in questi tessuti tumorali, copiare la riduzione numero di ARID1A
potrebbe essere un possibile fattore di cancro-associata
una grande regione del cromosoma 12 è stato amplificato in tre genomi DGC.; di questi tre genomi, campioni D-01 T e D-02 T mostrato tipicamente elevata amplificazione (Figura 3a). I modelli duplicazione erano leggermente diverso: D-01 T aveva una duplicazione tandem di 3 Mbp, mentre D-02 T aveva una duplicazione invertita di 1 Mbp (Figura 3b, c). Parte di questa regione duplicato codifica il gene murino doppia minuto (MDM2
). E 'stato riferito che in un piccolo insieme di dati, l'MDM2
gene è stato spesso amplificato [56], e che questo gene è associata a diversi tipi di cancro [57]. MDM2
sovraespressione causata dalla amplificazione genica è stata confermata sperimentalmente mediante RT-PCR quantitativa con il tumore e normali campioni di tessuto accoppiato adiacenti utilizzati per NGS analisi, e le normali linee cellulari sono stati inclusi per il confronto (figura 3d). MDM2
sovraespressione positivamente correlata con i dati di analisi del numero di copie. Anche se matrice precedentemente riportato dati CGH [32] hanno avuto relativamente bassa risoluzione per il rilevamento CNV, abbiamo utilizzato questi dati per la ricerca di un bias in alterazioni del numero di copie del gene in ogni tipo istopatologico. Un numero di copie guadagno di geni che codificano per le proteine dei canali del calcio (CACNG6
, CACNG7
e CACNG8
, P = 4.24
× 10 -2) era significativamente più frequente nei campioni DGC (vedi file aggiuntivo 1: Tabella S17). Tutte le informazioni alterazione integrato è mostrato in file aggiuntivi (vedi file aggiuntivo 1: Tabella S18 e S19 Tabella; vedi file supplementare 5). Figura 3 La regione duplicazione del gene MDM2 sul cromosoma 12 in campioni D-01 T e D-02 piazzole T. (a) profondità mappatura dei due cromosomi. (B) i punti neri sottili sono state lette in profondità mappatura di larghezza 2000-base. Il y
-axis mostra profondità relativa. Ogni unità rappresenta circa 30 volte la profondità di sequenziamento. (c) le posizioni Gene e nomi attorno alle regioni amplificate. Le bande nere mostrano posizioni gene. (D) MDM2
livelli di trascrizione di tumore e normali campioni di tessuto accoppiato adiacenti e normali linee cellulari. RT-PCR quantitativa è stata usata per misurare MDM2
livelli di mRNA nei campioni D-01 e D-02 (contenente amplificato MDM2
regioni), D-04, D-05, D-10, I-03, e I-04 (senza amplificati MDM2
regioni), e tre normali linee cellulari (HDF, HMEC, e Hs 738.St/Int~~number=plural). Le barre di errore sono stati calcolati da due esperimenti separati di reazioni triplice copia.
analisi strutturale 3D del mutato CDH1
Per capire come le mutazioni identificate riguardano proteine struttura /funzione e l'attivazione di percorsi biologici a valle influenzare carcinogenesi, abbiamo analizzato tridimensionale ( 3D) strutture della proteina e-caderina mutante trovato in una CIG e cinque campioni DGC (vedi file supplementare 2). Il CDH1
gene codifica per una adesione delle cellule glicoproteina calcio-dipendente e ha cinque domini caderina extracellulari (EC1-EC5) (Figura 4a). È noto che l'interazione tra caderina e calcio è richiesto per dimerizzazione, rigidità strutturale e la protezione dalla degradazione proteolitica [58]. Le mutazioni nel EC1-2 e EC2-3 giunzioni sono noti per causare improprio localizzazione caderina e l'adesione delle cellule diminuita [59]. analisi strutturale è stata effettuata su quattro nsSNVs (D221G, V252G, N256S, e D257N), escludendo una sciocchezza SNV (Q23 *), un inserimento frameshift (S829fs), e un sito di splicing (chr16: 68.842.472) mutazione. Tutti e quattro i nsSNVs erano situati nella giunzione tra EC1 e EC2 (EC1-2 giunzione) (Figura 4b, c), e tre nsSNVs (D221G, N256S, e D257N) erano nella regione proteina che interagisce direttamente con uno ione calcio (Figura 4d, e). Questa situazione potrebbe provocare interazioni anomale tra i domini caderina. È stato riferito che A298t, D231K, e le mutazioni D231A, che hanno una posizione strutturale simile all'incrocio EC1-2 alle mutazioni somatiche trovati in questo studio, ha mostrato una perdita di funzione adesione cellulare [60, 61]. Un'altra mutazione nsSNV, V252G, si trova nella struttura di β-foglio di caderina, e la sua catena laterale è orientato verso l'interno. Poiché strutture β-barile contengono generalmente alternata amminoacidi polari e idrofobi, con i residui idrofobici orientati verso l'interno del cilindro per formare un nucleo idrofobico, ei residui polari orientata verso l'esterno della canna sulla superficie esposta al solvente, il formazione del core idrofobico può essere ostacolato dalla mutazione V252G (figura 4e). Uno studio precedente ha riportato exome due CDH1
mutazioni, P127fs (mutazione frameshift in un DGC) e V694I (in un MSI CIG) [22]. Dimerizzazione di due molecole caderina sia in un
cis o trans configurazione
si è verificato all'incrocio tra la EC1-2 e EC1-2 [62], mentre le mutazioni al EC3-4 e EC4-5 giunzioni non ha influenzato significativamente adesione cellulare [59]. Tutti gli autori hanno letto e approvato il manoscritto finale.