Genomic analyse du profil des cancers gastriques de type diffus profil
Résumé de l'arrière-plan
cancer de l'estomac est la troisième plus meurtrière parmi tous les cancers dans le monde entier. Bien que l'incidence du cancer gastrique de type intestinal a diminué, l'incidence du type diffus augmente encore et sa progression est notoirement agressif. Il n'y a pas suffisamment d'informations sur le génome variations de cancer gastrique de type diffus parce que ses cellules sont généralement mélangés avec des cellules normales, et cette faible cellularité a rendu difficile d'analyser le génome.: Résultats
Nous analysons des génomes entiers et exomes correspondants du cancer gastrique de type diffus, en utilisant la tumeur appariés et des échantillons normaux de 14 diffuse-type et cinq de type intestinal patients atteints de cancer gastrique. les variations somatiques trouvées dans le cancer gastrique de type diffus sont comparés à ceux du type intestinal et à des variantes précédemment rapportées. Nous déterminons le taux exonique somatique mutation moyenne des deux types. Nous trouvons associés gènes du pilote candidat, et d'identifier sept nouvelles mutations somatiques dans CDH1
, qui est un gène associé au cancer gastrique bien connu. Analyse en trois dimensions de la structure de la protéine E-cadhérine mutée suggère que ces nouvelles mutations somatiques peuvent provoquer des perturbations fonctionnelles importantes de sites de liaison au calcium critiques de la jonction EC1-2. l'analyse de l'instabilité chromosomique montre que le gène de la MDM2 est amplifié. Après une analyse structurelle approfondie, les conclusions d'un TSC2 roman de fusion du gène
-RNF216
est identifié, ce qui peut perturber simultanément les voies de tumeur suppressive et activer la tumorigenèse.
Nous rapportons le profil génomique de type diffus gastrique cancers, y compris de nouvelles variations somatiques, un gène de fusion roman, et l'amplification et la suppression de certaines régions chromosomiques qui contiennent des oncogènes et suppresseurs de tumeurs.
Contexte
rangs de cancer de l'estomac comme la troisième cause la plus importante de la mortalité mondiale du cancer [1]. Histopathologique, cancer gastrique (GC) peuvent être classés en deux catégories en fonction des différences morphologiques:-type intestinal GC (CIG) et de type diffus GC (DGC) [2, 3]. IGC est généralement associée à l'infection de Helicobacter pylori, et est particulièrement fréquente au Japon et en Corée [4-6]. DGC est uniformément répartie géographiquement, et comprend des formes agressives cliniques, tels que linite plastique, qui ont un mauvais pronostic, en particulier chez les jeunes patients [7, 8]. modifications de l'ADN génomique conduisant à GC peuvent se produire en raison de plusieurs facteurs de risque environnementaux, comme un régime alimentaire riche en sel et de tabac [9]. Bien que l'incidence de la CIG a diminué régulièrement au cours de plusieurs décennies (réduction 1978-2005 44%), DGC a rapidement augmenté (de 62%) de 1978 à 2000, avant de diminuer légèrement pendant la période 2001-2005 [10]. Malgré la preuve cumulative que CIG et DGC développent via différentes voies cancérigènes [11, 12], des données détaillées à l'échelle génomique pour DGC font défaut en raison de la disponibilité limitée des échantillons cliniques et un niveau de pureté de la population de cellules cancéreuses faible.
Pour a ce jour, très peu de gènes associés à des sous-types de CPG ont été identifiés. le gène de CDH1, qui code pour la protéine E-cadhérine, sont les gènes les plus connus associés à héréditaire DGC (HDGC) [13-16]. Le dépistage génétique de ces mutations a été suggéré afin de diagnostiquer l'apparition précoce GC [17]. dysfonction E-cadhérine, causée par des mutations, perte d'hétérozygotie, et promoteur hypermethylation, est le défaut le plus bien établie dans GC initiation et le développement [18-20]. Une étude d'association pangénomique a montré que les polymorphismes dans le gène de l'antigène des cellules souches de la prostate (PSCA de
) sont fortement associés à la sensibilité à la DGC [21]. Le procédé à base de microréseaux, cependant, est limitée aux variations de nucléotides simples, et ne peut pas détecter des variations structurales copie neutre (SVS). Deux études récentes ont rapporté exomes GC, et a montré que des mutations dans le gène ARID1A
sont fréquemment détectés dans GC avec l'instabilité des microsatellites, et le virus d'Epstein-Barr (EBV) -positif GCS [22, 23]. Aucune analyse de sous-types de GC a été réalisée, et la majorité des échantillons analysés dans les études étaient des patients avec IGC.
Séquençage de nouvelle génération (NGS) a permis aux chercheurs de détecter des variations associées à la maladie, et a aidé à découvrir les mécanismes sous-jacents du développement de la maladie. En particulier, le séquençage du génome entier (WGS) peut détecter la plupart des variations génomiques, y compris SVs, comme intrachromosomique et réarrangements interchromosomiques. Alternativement, le séquençage de l'exome entier (WES), une méthode de séquençage-cible capturée, peut être utilisé pour le séquençage à grande profondeur d'un grand nombre d'échantillons à un coût relativement faible [24], bien que les variations ne nucléotidiques simples (SNVs) et de petites insertions ou des délétions (indels) peuvent être identifiés à l'aide de cette méthode. WGS et WES ont chacun des avantages et des inconvénients, et un certain nombre d'études récentes ont utilisé les deux méthodes [25-27].
Ici, nous présentons une caractérisation détaillée des génomes GCR de tumeur appariés et échantillons normaux en générant des profils génomiques entiers suivis par WES . Nous avons utilisé des échantillons de sang comme un contrôle normal, comme dans les études antérieures [28-31]. Afin de trouver la GCR spécifique variations, les génomes IGC ont également été analysées et comparées aux variations identifiées dans les génomes de DGCS. Tridimensionnelles analyse de la structure des protéines a été réalisée pour de nouvelles mutations somatiques du gène de la CDH1, ce qui a identifié les régions critiques qui ont été modifiés fonctionnellement par les mutations. De plus, nous avons trouvé un nouveau gène de fusion qui pourrait être impliqué dans la tumorigenèse.
Résultats et discussion
Séquençage et le séquençage de l'exome
tumeur et (sang) échantillons normaux appariés à partir de 14 patients atteints de DGC (les caractéristiques clinico de ces patients sont présentés dans le tableau S1 dans le fichier additionnel 1), qui étaient tous relativement jeunes (âge médian 38 ans) femmes coréennes, ont été séquencées en utilisant un Illumina HiSeq 2000, qui a produit apparié-end, l'ADN 90-base et 101-base lit. En outre, cinq paires de tumeurs et des échantillons normaux appariés de patients atteints de IGC (âge médian 42 ans) ont été soumis à un séquençage de l'ADN; l'un de ces échantillons a été identifié plus tard comme un cas d'instabilité des microsatellites (MSI) et, partant, a été exclu de l'analyse de la mutation. Aucun des échantillons avait des antécédents familiaux de cancer, et les sous-types ont été histopathologique a confirmé. les cellules tumorales seulement ont été collectées par macrodissection après hématoxyline coloration.
Pour l'ensemble de l'analyse du génome, en moyenne, 92 gigabases (Gb) par échantillon ont été produits à environ 32 fois la profondeur de séquençage, atteignant 3,5 terabases (Tb) au total, et ont été mappé sur le génome de référence (NCBI construire 37, hg19) à un taux de cartographie supérieure à 94,5% (pour les statistiques de séquençage, voir les fichiers supplémentaires 1: Tableau S2). Utilisation finale 3.3 Tb de mappé lit, une base de données de profil génomique a été construit pour SNVs détection, copie variations du nombre (CNV) et SV. Parce que la pureté cellulaire d'un échantillon de tumeur est une caractéristique essentielle dans l'analyse du génome du cancer, il a été évalué à l'aide d'une méthode de calcul en interne (voir Matériels et méthodes, voir les fichiers supplémentaires 1: Tableau S3 et Figure S1). Bien que nous avons essayé de recueillir des cellules tumorales seulement, nos échantillons ont montré encore un niveau élevé de stroma mélange. Pour augmenter la précision de la détection de mutations dans les régions géniques même dans des échantillons de faible pureté, plus WES a été réalisée à environ 103 fois le séquençage de profondeur en moyenne, qui a produit un total de 17 données de séquence Gb. Le WES capturé couvert 93,1% de la région genic à 10 fois ou plus en profondeur, et cette couverture est similaire à celle des données Exome précédemment rapportées sur GC [22, 23].
En combinant les données WGS et WES, nous avons détecté somatique altérations dans les échantillons de la GCR, et les a comparés avec les modifications IGC (les données sont résumées dans la figure 1 sous forme de diagramme de cirque). Pour vérifier nos données, nous avons combiné et les avons analysés avec précédemment données Exome à partir de deux études différentes (24 IGC et 5 échantillons GCR, non compris MSI et des échantillons mixtes) [22, 23] et du réseau génome comparative hybridation (CGH) données ( 16 CIG et 14 échantillons GCR) [32]. Bien que ces études principalement utilisés CIG et inclus seulement un petit nombre d'échantillons de la GCR, ils pourraient être complémentaires à nos données comme un contrôle (en fournissant un nombre accru de données IGC et l'élimination de la spécificité tissulaire). Dans le jeu de données combinées, nous avons comparé les différences dans les modifications entre les échantillons GCR et IGC. Figure 1 Répartition du génome entier de mutations somatiques et de duplication ou de suppression des événements dans les cancers gastriques de type diffus (DGCS). Toutes les mutations somatiques, y compris les événements duplication /suppression, qui ont été trouvés dans les 14 génomes GCR, sont fusionnés dans la parcelle de cirque. De l'extérieur vers l'intérieur, l'intrigue présente les caractéristiques suivantes: idéogrammes chromosomiques, fréquence d'amplification ou suppression des événements cumulatifs (noir, amplification, rouges, suppression), et le nombre de somatiques non synonymes variations de nucléotides simples (nsSNVs), indels, et SNVs dans des sites d'épissage pour chaque gène. Les triangles noirs indiquent des gènes fortement mutés. triangles orange désignent oncogènes, et triangles bleus indiquent les suppresseurs de tumeurs.
Identification de SNVs diffuse de type spécifique et indels
Dans chaque paire d'échantillons, nous avons identifié environ 3,7 millions de SNVs, qui ont été vérifiées en utilisant seul nucléotide polymorphisme (SNP ) des puces (taux moyen de concordance: 99,2%; voir les fichiers supplémentaires 1: Tableau S4), et environ 0.690.000 indels (pour plus de détails, voir les fichiers supplémentaires 1: Tableau S5 et S6 Table). Nous avons d'abord évalué la fréquence mutationnelle des deux types de GC au niveau d'un seul nucléotide (voir fichier supplémentaire 1: Figure S2 a, b). Le spectre de mutation somatique a été dominée par C > T (G > A) il transitions dans les deux échantillons GCR et IGC, et aucune différence significative dans des contextes mutationnels entre les deux types de GC, en conformité avec les études précédentes de GC [23, 30]. Lorsque nous avons analysé deux ensembles de données Exome signalés précédemment, nous avons constaté que le spectre du rapport de substitution nucléotidique était similaire à nos données (voir fichier supplémentaire 1: Figure S2c, d).
Bien que le spectre de la GCR de mutation est similaire à celle de IGC, mutations individuelles dans les gènes concernés étaient différents. En soustrayant les mutations trouvées dans les génomes sanguins normaux, nous avons identifié 922 SNVs non synonymes (nsSNVs) que des mutations somatiques dans les échantillons 18 tumorales (voir les fichiers supplémentaires 1: Tableau S7, voir fichier supplémentaire 2). Le taux moyen de mutation des 18 glucocorticoïdes (1,97 mutations /Mb) était comparable à celle observée dans d'autres études sur le côlon, du pancréas et les cancers du foie [33-35]. Des 847 gènes mutés touchés par les 922 nsSNVs, 581 étaient dans 14 cas GCR, 288 étaient dans 4 cas IGC, et 22 (2,6%) étaient communs aux deux types. L'échantillon MSI, qui a été exclu de l'analyse comparative, a montré environ six fois plus SNVs et indels que faisait les autres échantillons; ce résultat est en accord avec un précédent rapport [22]. Lorsque nous avons combiné les deux ensembles de données Exome signalés précédemment, nous avons identifié 967 et 2077 nsSNVs somatiques dans 19 DGCS et 28 CIG, respectivement. Le taux de mutation somatique du CIG (3,71 mutations /Mb dans les échantillons 28) était supérieure à celle de la DGCS (2,29 mutations /Mb dans les échantillons 19) (voir les fichiers supplémentaires 1: Tableau S8). la recherche Auparavant publiée suggère que le mélanome et le cancer du poumon ont des taux de mutation élevés, en raison de l'implication des mutagènes puissants [36]. De même, il est possible que la CIG a ce taux élevé de mutation, car son mécanisme tumorigène peut être associé plus avec l'environnement et /mutagène ou parasites par rapport aux DGC.
Pour les variations individuelles, les gènes cancer responsables présumés ont été prédites par le calcul du score de gène pilote (voir les fichiers supplémentaires 1: Tableau 1 et le Tableau S9). Le gène de la CDH1 a été trouvé pour être abondamment muté dans DGC (P = 1,29 ×
10
-2), y compris six mutations somatiques (trois faux-sens, un non-sens, un cadre de lecture, et une mutation du site d'épissage) qui n'ont pas été signalés précédemment, alors qu'une seule mutation faux-sens a été trouvé dans les échantillons IGC (tableau 2). mutations somatiques Tous les sept CDH1 ont été vérifiées par séquençage Sanger (voir les fichiers supplémentaires 1: Tableau S10 et S11 Tableau). Dans nos exemples DGC, 35,7% (14/05) présentaient des mutations somatiques CDH1, et il a été rapporté que les fréquences des mutations somatiques dans CDH1 DGCS sporadiques peuvent varier de 3% à plus de 50% [19 , 37-40]. Il a été vérifié que dans les pays ayant une forte incidence de GC sporadique (comme le Japon et la Corée), la fréquence des mutations germinales dans la forme familiale GCS est faible comparée à celle des pays à faible incidence [41, 42]. Par conséquent, nous pensons que l'incidence globale en GC est également liée à la fréquence des mutations somatiques CDH1. En outre, une mutation germinale (de T340A) dans CDH1
a été trouvé dans les deux tumeurs et correspondant génomes de sang à partir de deux échantillons (D-14, GCR, M-01, MSI-type). Bien que T340A est une mutation causale dans HDGC [43], ces deux patients n'ont pas eu des antécédents familiaux tels que GC ou d'un cancer du sein lobulaire. Deux précédents rapports analysant les données de Exome de GC n'a pas identifié CDH1
comme un gène hautement classé (une seule mutation faux-sens dans un échantillon MSI IGC) [22, 23]. Cet écart peut être dû au petit nombre d'échantillons de DGC dans ces études (2 sur 22 et des échantillons 3 sur 15 étaient DGCS, respectivement). Dans le présent travail, PIK3CA
et TP53
, bien connus des gènes associés au cancer, ont été les gènes les plus fréquemment muté dans les deux DGC et IGC voir le tableau 1 et le tableau S9 dans les fichiers supplémentaires 1. Les mutations en deux PIK3CA connu
hotspots (E545K et H1047L) ont été trouvés dans quatre échantillons de la GCR. En outre, une mutation nsSNV (Q546K) adjacente à la mutation E545K a été trouvée dans un échantillon DGC. Au total, 5 des 14 échantillons DGC (environ 30%) abritaient nsSNVs dans PIK3CA
, qui est un oncogène dont les pièces de forme mutées augmentation de l'activité de la kinase, ce qui provoque la prolifération des cellules cancéreuses [44]. Nous avons ensuite comparé la fréquence basse (16-17%) des nsSNVs en PIK3CA
dans les rapports par d'autres [22, 23, 44] (qui échantillons les plus utilisés CIG) et les résultats de notre analyse combinée (31,5% pour DGC , 14,3% pour la CIG) (voir les fichiers supplémentaires 1: Tableau S9). Il apparaît que les taux de mutation relativement élevés de PIK3CA
en DGC peuvent refléter la spécificité des mutations dans ce gène pour ce type de cancer. De plus, trois échantillons (deux GCR et une CIG) contenaient deux nsSNV et une perte de TP53
de copie, ce qui indique une perte homozygote de fonction dans TP53
, comme indiqué précédemment [45]. Un SNP dans le gène PSCA
(rs2976329) a été signalé à être associé à un risque accru de DGC dans les populations japonaises et coréennes [21]. Ce SNP a également été enrichi dans la majorité des échantillons GCR dans notre étude, (9 sur 14 patients), ce qui indique que nos échantillons analysés représentent les patients typiques avec DGC en Asie de l'Est. En outre, une mutation non-sens (R1446 *) dans le ARID1A
gène, a été trouvé dans un échantillon DGC (D-08). Bien que des mutations dans ARID1A
sont fréquemment détectés dans MSI et EBV positives GCS [22, 23], l'échantillon D-08 n'a montré aucune infection à EBV, et un échantillon MSI (M-01) n'a pas eu d'ARID1A
mutations génétiques soit. De variations dans les gènes du pilote candidats, 88 nsSNVs, 4 petits indels, et 2 SNVs dans un site d'épissage ont été vérifiées en utilisant le séquençage Sanger classique. Sept de ces mutations n'a pas pu être testé en raison de l'échec PCR, et des 87 mutations restantes, 96,6% ont été confirmés comme de véritables mutations somatiques (voir les fichiers supplémentaires 1: Tableau S10 et Tableau S11) .Table 1 Top gènes du pilote candidats dans 14 diffuse cancers gastriques de type
Gene
échantillons, n
nsSNVs, n
SNVs dans le site d'épissage, n
indels, n
P
-value
pilote pointage de gène
PIK3CA
5
5
0
0
3,63 × 10 -12
9,83
CDH1
5 4
1 1
4,64 × 10-10
8.02
SNRPN
2 2
0
0
1,86 × 10-07
5,60
TP53
2 2
0
0
4,88 × 10-07
5,36
CMKLR1
des 2 2
0
0
5,33 × 10-07
5,36
CYP2A7
2 2
0
0
1,53 × 10-06
4.99
GUCY1B3
2 2
0
0
1,97 × 10-06
4.99
PAPOLB
2 2
0
0
2,15 × 10-06
4.99
MYH9
3 3
0
0
2,27 × 10-06
4.99
FAM71B
1
2
0
0
2,51 × 10-06
4.99
C10orf90
2 2
0
0
3,76 × 10 -06
4,86
AKAP8
2 2
0
0
4,59 × 10-06
4,81
ZC3H12B
2 2
0
0
5,87 × 10-06
4,74
SFTA3
1 1
0
0
6,86 × 10-06
4,70
SENP7
2 2
0
0
7,65 × 10-06
4,68
TMPRSS6
2 2
0
0
8,38 × 10-06
4.67
PAGE2
1 1
0
0
9,94 × 10-06
4,62
Pour les listes de gènes de pilote supplémentaires, voir les fichiers supplémentaires 1:. Tableau S9
modifications Tableau 2 CDH1 dans l'échantillon de 18 cancers gastriques
Tapez
Altération
CDH1
région
D-01 T
CNV
Perte
exons 1 à 16
D-02 T
SNV
N256S
Exon 6
CNV
Perte
exons 1 à 16
D-03 T
SNV
site Splice
site donneur d'Intron 4
D-04 T
CNV
Perte
exons 1 à 16
D-05 T
SNV
D257N
Exon 6
INS
S829fs
Exon 16
point D-09 T
SNV
V252G
Exon 6
SV
Pause
Intron 2
D -10 T
CNV
Perte
exons 1 à 16
D-11 T
CNV
Perte
exons 1 à 16
D-12 T
SNV
Q23 *
Exon 2
D-13 T
CNV
Perte
exons 1 à 16
SV
Break Point
introns 2 et 10
D-14 T
SV
Point Break
introns 2, 5 et 9
I-01 T
CNV
Perte
exons 1 à 16
I -02 T
CNV
Perte
exons 1 à 16
I-03 T
SNV
D221G
Exon 5
SV
Break Point
introns 10 et 13
I-04 T
CNV
Perte
exons 1 à 16
CNV, copier variation du nombre; INS, petite insertion; SNV, seule variation nucléotidique; SV, variation structurelle.
Les variations somatiques ont ensuite été cartographiées sur l'Encyclopédie de Kyoto des gènes et génomes (KEGG) Pathways base de données. Cette analyse a révélé que les gènes mutés de DGCS étaient significativement associés à la voie de signalisation de calcium (P
= 7.00 × 10 -5; voir les fichiers supplémentaires 1: Tableau S12 et S13 Tableau). Un faible apport en calcium peut contribuer à GC développement [46]. Le calcium est essentiel pour le fonctionnement de la E-cadhérine, et une perte d'adhésion E-cadhérine à médiation est impliquée dans la transition d'une lésion bénigne à un cancer métastatique invasif [47]. En outre, les mutations somatiques ont été fortement associées à des voies liées au cancer du poumon à petites cellules (P = 1,00 ×
10 -6 en DGC et P
= 4,24 × 10 -2 dans IGC). En particulier, les gènes impliqués dans les voies d'adhésion focale, comme ITGA
, PIK3CA
et PTEN
, ont souvent été mutés.
SV et de l'analyse CNV
SV ont été détectés sur la base discordantly mappées lire et toutes les paires, SVs qui étaient présents dans le génome de la lignée germinale des patients ont été exclus. En moyenne, nous avons trouvé 552 SVs somatiques par DGC paire d'échantillons (211 grandes insertions, 264 grandes délétions, 27 inversions, 44 translocations intrachromosomiques et 6 translocations interchromosomiques). Nous avons trouvé 664 SVs somatiques dans chaque paire d'échantillons IGC (285 grandes insertions, 283 grandes délétions, 34 inversions, 38 translocations intrachromosomiques et 24 translocations interchromosomiques) (pour plus de détails pour chaque échantillon, voir les fichiers supplémentaires 1: Tableau S14 et Figure S3). De plus, nous avons trouvé 2.258 gènes à être altérées, et 1736 d'entre eux ont été trouvés seulement dans les échantillons GCR (pour les données pour chaque échantillon, voir les fichiers supplémentaires 1: Tableau S15, et voir les fichiers supplémentaires 3). Trois gènes suppresseurs de tumeur FHIT de
, WWOX
et MIPOL1
, qui ont été rapportés dans une étude de GC précédente [30], avaient une déficience en raison de la SV (FHIT
dans 11 échantillons, WWOX
dans 5 échantillons, et MIPOL1
dans 3 échantillons)
gènes de fusion générés par un réarrangement chromosomique ont également été analysées, et 19 candidats de gènes de fusion ont été identifiés (voir les fichiers supplémentaires 1: Tableau S16), y compris une nouvelle fusion gène, TSC2
-RNF216
, trouvés dans un échantillon (Figure 2a, b). TSC2
codant pour la protéine tubérine a déjà été suggéré comme étant un gène suppresseur de tumeur impliqué dans la cible mammalienne de la rapamycine (mTOR) de la voie [48, 49]. En outre, RNF216
, codant pour l'E3 ubiquitine-protéine-ligase, est impliquée dans la fonction des cytokines, en empêchant l'activation prolongée du facteur nucléaire (NF) -κB [50]. Rap GTPase activating protein (Rap-GAP) domaine de la protéine TSC2, qui est liée à l'activité GTPase intrinsèque des protéines Ras liée RAP1A et Rab5, a été rompu par la présente translocation chromosomique (figure 2c). En outre, les domaines à doigts de zinc de la protéine RNF216 ne sont pas exprimés dans le gène de fusion, en raison d'un déphasage qui a causé l'arrêt prématuré. En utilisant une transcription inverse en chaîne par polymérase (RT-PCR) suivie d'une analyse par séquençage, l'expression de ce gène de fusion dans le tissu du patient a été confirmée. Après avoir testé un ensemble supplémentaire de 15 GC tissus du patient, nous avons identifié 2 patients exprimant le gène de fusion (figure 2d, e). Cette translocation chromosomique peut conduire à un comportement cellulaire modifié à la fois en perturbant le fonctionnement normal du gène et de provoquer l'expression du produit du gène de fusion qui peut rivaliser avec le gène normal. Le gène de fusion peut compétitive interférer avec la tumeur des voies de suppression et activer la signalisation des cytokines NF-kB à médiation. Figure 2 TSC2 - RNF216 gène de fusion rupture. (A) la structure Exon du TSC2
-RNF216
gène de fusion. Les chiffres dans les cases sont les numéros d'exon de chaque gène. Les lignes rouges indiquent les points de fusion. (B) la structure de domaine protéique de la protéine de fusion TSC2-RNF216. Le domaine Rap-GAP de TSC2 a été brisé, et RNF216 eu une mutation du cadre de lecture provoquant une terminaison prématurée par le réarrangement de interchromosomique. (C) Structure du domaine Rap-GAP TSC2. La région rouge est la région restante de domaine Rap-GAP, et la région grise est le domaine Rap-GAP qui est supprimé dans -RNF216
gène de fusion de la TSC2. la séquence (d) ARN de la TSC2
-RNF216
gène de fusion. Position 136 est montrée comme N. Soit A ou G de base produit un codon de terminaison (TAA ou TAG). (E) Vérification de l'TSC2
-RNF216
fusion transcription ARN (ADNc) au moyen d'amplification par PCR et électrophorèse.
En DGCS, les chromosomes 16, 17, 19, 20, 21, et 22 contenait une quantité de suppressions de blocs a augmenté, tandis que les chromosomes 3, 7, 8, et 13 ont montré notamment une augmentation des duplications (Figure 1). De nombreux gènes suppresseurs de tumeurs, tels que CDH1
, PLA2G2A, RUNX3
, SMAD2
et TP53
, sont situés dans des régions chromosomiques largement supprimées. Notamment, une mutation somatique (nsSNV ou épissage site de mutation) et la copie perte de nombre de CDH1
étaient généralement mutuellement exclusifs: quatre des cinq échantillons GCR avec mutation somatique ne disposaient pas des pertes de nombre de copies du gène, et huit des neuf échantillons GCR avec copie du gène de la perte de numéro d'un CDH1 n'a pas eu de mutations somatiques dans CDH1
. Un seul échantillon (18/01, 5,6%) ont eu les deux modifications (mutation de perte et de copie en nombre) de manière concomitante, et cette observation coïncide avec les études antérieures signalant que des modifications concomitantes CDH1
rares [19, 40, 51, 52] . Lorsque nous avons examiné SVs dans CDH1
ensemble, nous avons constaté que trois autres échantillons avaient une mutation /copie perte de nombre concomitante avec SV. En outre, les nombres de copies du MYC oncogène
ont augmenté dans cinq échantillons GCR (voir fichier complémentaire 4), et le nombre de copies du MET
ont augmenté dans trois échantillons GCR [53]. Les oncogènes MOS
et ZHX2
a également montré un gain de nombre de copies en cinq et quatre échantillons de la GCR, respectivement. Plus de la moitié des échantillons (10 sur 18) ont montré une copie de réduction de nombre de ARID1A
, qui est un gène de pilote pour le carcinome à cellules claires de l'ovaire, et un Remodeler chromatine dans GC [22, 54, 55]. On sait que la majorité des glucocorticoïdes avec ARID1A de les mutations montrent l'expression de protéines inférieure par rapport aux glucocorticoïdes sans ARID1A
mutation [22]. Si l'effet de dosage est important dans ces tissus cancéreux, copier réduction de ARID1A numéro
pourrait être un facteur associé au cancer possible
Une grande région du chromosome 12 a été amplifié en trois génomes DGC. de ces trois génomes, des échantillons D-01 T et D-02 T ont montré distinctement haute amplification (Figure 3a). Les modèles de duplication étaient légèrement différents: D-01 T avait une duplication en tandem de 3 Mbp, tandis que D-02 T avait une duplication inversée de 1 Mbp (Figure 3b, c). Une partie de cette région dupliquée code pour le gène murin à double minute (MDM2
). Il a été rapporté que dans un petit groupe de données, le gène de la MDM2 est fréquemment amplifiée [56] et que ce gène est associé à plusieurs types de cancer [57]. MDM2 de la surexpression provoquée par l'amplification du gène a été confirmée expérimentalement en utilisant RT-PCR quantitative avec la tumeur et des échantillons de tissus normaux adjacents appariés utilisés pour NGS analyses et les lignées cellulaires normales ont été inclus à titre de comparaison (figure 3d). MDM2 de la surexpression corrélation positive avec les données d'analyse du nombre de copies. Bien tableau précédemment données CGH [32] avaient résolution relativement faible pour la détection CNV, nous avons utilisé ces données pour rechercher un biais dans les altérations du gène nombre de copies dans chaque type histopathologique. Un gain de nombre de copies de gènes codant pour des protéines de canaux calciques (CACNG6
, CACNG7
et CACNG8
, P
= 4,24 × 10 -2) était significativement plus fréquente dans les échantillons GCR (voir fichiers supplémentaires 1: Tableau S17). Toutes les informations de modification intégrée est représentée dans des fichiers supplémentaires (voir les fichiers supplémentaires 1: Tableau S18 et S19, voir les fichiers supplémentaires 5). Figure 3 La région de duplication du gène MDM2 sur le chromosome 12 dans les échantillons D-01 T et D-02 parcelles T. (a) de la profondeur de la cartographie des deux chromosomes. (B) des pointes noires minces ont été lues à la cartographie profondeur de largeur 2000 base. Le y
-axis montre la profondeur relative. Chaque unité représente environ 30 fois la profondeur de séquençage. (c) les positions des gènes et des noms autour des régions amplifiées. Les bandes noires montrent l'emplacement des gènes. (D) les niveaux de transcription de MDM2 dans la tumeur et les échantillons de tissus normaux adjacents jumelés et les lignées cellulaires normales. RT-PCR quantitative a été utilisé pour mesurer les niveaux d'ARNm de MDM2 dans des échantillons D-01 et D-02 (contenant amplifié les régions MDM2 de), D-04, D-05, D-10, I-03, et trois lignées cellulaires normales (HDF, HMEC et Hs 738.St/Int~~number=plural) I-04 (sans amplifiés MDM2
régions), et. analyse structurale 3D Les barres d'erreur ont été calculées à partir de deux expériences séparées de réactions en triple. de mutation CDH1
Pour comprendre comment les mutations détectées affectent la structure des protéines /fonction et l'activation des voies biologiques en aval influencer la carcinogenèse, nous avons analysé trois dimensions ( 3D) des structures de la protéine mutante E-cadhérine trouvé dans une CIG et cinq échantillons GCR (voir fichier supplémentaire 2). le gène de CDH1 code pour une glycoprotéine de l'adhésion cellulaire dépendante du calcium et a cinq domaines extracellulaires de cadhérine (EC1-EC5) (figure 4a). Il est connu que l'interaction entre la cadhérine et le calcium est nécessaire pour la dimérisation, la rigidité structurelle et la protection contre la dégradation protéolytique [58]. Des mutations dans le EC1-2 et EC2-3 jonctions sont connus pour provoquer une mauvaise localisation des cadhérines et une diminution de l'adhésion cellulaire [59]. L'analyse structurale a été réalisée sur quatre nsSNVs (D221G, V252G, N256S et D257N), à l'exclusion d'un non-sens SNV (Q23 *), une insertion frameshift (S829fs), et un site d'épissage (chr16: 68842472) mutation. Les quatre nsSNVs étaient situés dans la jonction entre CE1 et CE2 (EC1-2 jonction) (figure 4b, c) et trois nsSNVs (D221G, N256S et D257N) se trouvaient dans la région de la protéine qui interagit directement avec un ion calcium (Figure 4d, e). Cette situation peut entraîner des interactions anormales entre les domaines de cadhérine. Il est rapporté que A298t, D231K, D231A et des mutations qui ont une position analogue à la structure EC1-2 jonction des mutations somatiques trouvée dans cette étude, a montré une perte de la fonction d'adhésion cellulaire [60, 61]. Une autre mutation nsSNV, V252G, est situé dans la structure de la β-cadhérine feuille et sa chaîne latérale est orientée vers l'intérieur. Étant donné que les structures β-baril contiennent généralement alternée d'acides aminés polaires et hydrophobes, avec des résidus hydrophobes orientées vers l'intérieur du cylindre pour former un noyau hydrophobe, et les résidus polaires orientées vers l'extérieur du cylindre sur la surface exposée au solvant, la la formation du noyau hydrophobe peut être entravée par la mutation V252G (figure 4E). Une étude de exome précédente a rapporté deux mutations CDH1
, P127fs (mutation de déphasage dans un DGC) et V694I (dans une CIG MSI) [22]. Dimérisation de deux molécules de cadhérine soit dans un
configuration cis ou trans de
a eu lieu à la jonction entre EC1-2 et EC1-2 [62], alors que des mutations au niveau du EC3-4 et EC4-5 jonctions n'a pas affecté de façon significative l'adhésion cellulaire [59]. Tous les auteurs ont lu et approuvé le manuscrit final.