Stomach Health > mave Sundhed >  > Stomach Knowledges > undersøgelser

Identifikation af DNA methylering ændringer forbundet med human gastrisk cancer

Identifikation af DNA methylering ændringer forbundet med human mavekræft
Abstract
Baggrund
Epigenetisk ændring af genekspression er en almindelig begivenhed i human cancer. DNA methylering er en velkendt epigenetiske proces, men at kontrollere den nøjagtige karakter af epigenetiske ændringer i forbindelse med kræft fortsat vanskelig.
Metoder
Vi profilerede den methylome af human mavekræft væv ved 50-bp opløsning ved hjælp af en methyleret DNA berigelse teknik (methylerede CpG ø opsving assay) i kombination med et genom analysator og en ny normalisering algoritme.
Resultater
Vi var i stand til at få et overblik over initiativtagere med forskellige CpG tætheder, herunder CpG Islands (CGI'er), udskrift organer og forskellige gentage klasser. Vi fandt, at gastrisk cancer var forbundet med hypermethylering af 5'CGI'er og 5'-enden af ​​kodende exoner samt hypometylering af gentagne elementer, såsom korte indflettede nukleare elementer og det sammensatte element SVA. Hypermethylering af 5'CGI'er var signifikant korreleret med nedregulering af forbundne gener, såsom de i HOX Salg og histon genfamilier. Vi opdagede også langtrækkende epigenetisk inaktivering (LRES) regioner i mavekræft væv og identificeret flere hypermethyleret gener (MDM2
, DYRK2
, og LYZ
) inden for disse områder. status methylering af CGI'er og gen annotation elementer i metastatiske lymfeknuder var mellemliggende mellem normal og kræft væv, hvilket indikerer, at methylering af specifikke gener gradvist øges i kræft væv.
Konklusioner
Vores resultater vil give værdifulde data til fremtidig analyse af CpG methylering mønstre, nyttige markører for diagnosticering af mavekræft, samt en ny analysemetode til kliniske Epigenomics undersøgelser.
Baggrund
mavekræft er den anden hyppigste årsag til kræftdødsfald i verden efter lungekræft, hvilket resulterer i mere end 800.000 dødsfald på verdensplan hvert år [1]. Den nuværende 5-års overlevelsesraten for personer diagnosticeret med mavekræft er kun 20-30%, med denne lave sats kan tilskrives det faktum, at de fleste tilfælde allerede er i et fremskredent stadie, når diagnosticeret. Som i alle kræftformer, tidlig påvisning fortsat den mest lovende fremgangsmåde til forbedring af overlevelsesraten. Derfor forstå årsagen til tumorigenese i humant gastrisk væv er afgørende.
Infektion med H. pylori
er en veletableret og almindelig årsag til mavekræft. Men ændringer i forskellige genetiske faktorer er også vigtige i at øge gastrisk cancer risiko. Det er velkendt, at kromosomal ustabilitet stammer fra genetiske faktorer såsom mikrosatellit ustabilitet samt KRAS
og p53
mutationer resulterer i udviklingen af ​​tumorer. Adskillige genomiske studier har identificeret germlinie mutationer i bestemte gener [2-4] og sygdomme modtagelige loci [5, 6] for mavekræft. Nylige undersøgelser, der sammenligner mavekræft og normalt væv har identificeret en række genetiske markører, herunder diagnostiske markører [NF2
[7], INHBA
[8], SFRP4
[9]], prognostiske markører [CD9
[10], CDH17
[11], PDCD6
[12]], og mavekræft-associerede gener [MUC13
[9], CLDN1
[13], Ki67
og CD34
[14]]. Desuden har epigenetiske mekanismer såsom DNA methylering og histon modifikationer vist sig at være vigtige ved regulering af ekspressionen af ​​gener involveret i biologi og sygdom i mave-tarmkanalen [15].
DNA-methylering spiller en væsentlig rolle i eukaryoter og er forbundet med en række centrale mekanismer, herunder genomisk prægning, X-kromosom inaktivering, aldring, og carcinogenese. Ændring af DNA-methylering i genomet findes i næsten alle typer af cancer og kan føre til ændringer i genekspression, såsom over-ekspression af onkogener og dæmpning af tumorsuppressorgener under cancerudvikling [16]. Adskillige undersøgelser har vist, at akkumulering af genetiske og epigenetiske ændringer i gastriske præcancerøse læsioner kan påvirke en lang række mål, såsom DNA reparation systemkomponenter, tumorsuppressorer, onkogener, cellecyklus-regulatorer, vækstfaktorer og adhæsionsmolekyler [17-20] . Imidlertid har disse undersøgelser primært været fokuseret på et par kandidatgener eller belagt kun en del af hele genomet. Således adgang et samlet overblik over de epigenetiske ændringer i forbindelse med udvikling af kræft har været vanskeligt. Især forståelse DNA methylering ændringer i intrageniske regioner, CpG øer, intergeniske regioner og gentage sekvenser fortsat begrænset. Der er derfor stor interesse for hele genomet analyse af afvigende DNA-methylering i disse regioner. Hus Til omfattende genom-skala profilering af DNA-methylering i embryogenese og carcinogenese, høj opløsning hele genomet sekventering metoder såsom BS-seq [21 -24], har MeDIP-seq [25, 26], og MethylCap-seq [27-29] blevet udviklet. På trods af den hurtige udvikling af sekventering-baserede kortlægning teknologi, er der stadig mangel på sammenlignende forskning, som er afgørende for kliniske Epigenomics undersøgelser, herunder dem, der fokuserer på cancer. I modsætning til microarray tilgange, er sekventering data produceres i et format, der ikke er modtagelig for differential analyse, og analysen arbejdsgang ikke er blevet standardiseret. Derfor er der behov beregningsmæssigt billige normaliserings- metoder til at håndtere den beregningsmæssige byrde forarbejdning i stor størrelse, høj opløsning sekventering data.
Her indførte vi en normalisering algoritme, der tager hensyn til sample-specifik samlet læsning densitet, den rumlige distribution af CpG loci, og baggrunden sekventering bias. Vi derefter skabt en omfattende hel-genom methylome af normalt gastrisk væv, mavekræft væv, og metastatiske lymfeknuder ved hjælp af MethylCap-seq metode og indhentes detaljerede oplysninger om dens forstyrrelse under carcinogenese og metastase. Dette er let anvendelig til en sammenlignende analyse af methylomes og andre typer epigenomic data, og det har særlige konsekvenser for kliniske Epigenomics.
Metoder
Gastric vævsprøver
Vi opnåede tre snap-frosne gastriske tumorer og matchede normal gastriske væv fra Seoul National University College of Medicine for methylome undersøgelse. Derudover blev otte og tyve matchede par af normale og tumor mave væv opnået for yderligere bekræftelse. Alle prøver blev opnået ved endoskopisk resektion under behandlingen af ​​de patienter, der gav informeret samtykke
Methyleret DNA recovery assay (MIRA)
Genomisk DNA fra 25 mg af gastrisk væv blev oprenset ved hjælp DNeasy Blood &.; Tissue Kit (Qiagen, Valencia, CA). Genomiske DNA-prøver fra 3 individer blev samlet ved den samme koncentration. MIRA blev udført som beskrevet tidligere [30-32]. Kort fortalt, GST-mærket MBD2b og His-mærkede MBD3L1 proteiner blev fremstillet som beskrevet. 15 ug af genomisk DNA blev fragmenteret til 100 ~ 500 bp ved sonikering og inkuberet med 28 ug af oprenset GST-MBD2b protein, 28 ug His-MBD3L1 protein og 7 ug JM110 bakterielt DNA i 6 timer. 30 ul af MagneGST perler (Promega, Madison, WI) præblokeret med 7 ug JM110 bakterie-RNA blev tilsat og inkuberet ved 4 ° C med rotation i 45 minutter i endelig 600 ul MIRA bindende reaktionsblanding. Perlerne blev vasket tre gange med 1 ml vaskebuffer, og methylerede fragmenter blev elueret ved inkubation ved stuetemperatur i 5 minutter og derefter 56 ° C i 30 minutter med 30 ul af TE indeholdende RNase A (100 ug, Qiagen) og proteinase K ( 15 ug, Qiagen). Eluerede DNA-fragmenter blev yderligere oprenset ved hjælp af Qiaquick PCR Purification kit (Qiagen).
Illumina Genome Analyzer sekventering
Vi anvendte 10 ng af elueret DNA for Illumina Genome Analyzer sekventering. Efter ligering af et par Solexa adaptere, ligeringsprodukter med den maksimale insert størrelse på 200 bp blev geloprenset på 2% agarose og underkastet PCR-amplifikation. Cluster generation og 36 cyklusser af sekventering blev udført ved at følge producentens instruktioner. Vi sekventeret 120 ul af adapter-ligeret, størrelse-fraktioneret DNA (2 ~ 04:00) på Illumina Genome Analyzer. Sequence tags blev kortlagt til det humane genom (UCSC hg18 database baseret på NCBI Build 36,1 samling) ved hjælp af Solexa Analyse Pipeline (version 0.3.0). Sekventeret læser af 34 bp (eksklusive den første og sidste nukleotid), der gik kvalitetskontrol filtre blev anvendt.
Databehandling og MES beregning
Vi udvidede 3 'enden af ​​34-bp læser ved 200 bp til dækning DNA fragmenter bundet af MBD proteiner. Den udlæsning blev omdannet til browser strækbare data (BED) filer til visualisering i UCSC genom browser http:. //Genom UCSC edu /.. Vi tælles overlappende sekvens tags på 50 bp opløsning. At finde berigede genomiske regioner, blev antallet af kortlagt læser i en glidende vindue på 1 kb i forhold til det samlede antal læser eller baggrunden antal læser i genomet. Som sådan blev MES beregnes på to måder; den ene er som log2 af (mål læse tælle /målstørrelse) /(total Læs count /genom størrelse) og floored til nul, den anden er som log2 af (mål læse tælle /målstørrelse) /(baggrund læse tælle /baggrund størrelse) og floored til nul. For at justere for baggrunden sekventering bias, blev MESbg beregnet på samme måde for input sekventering uden affinitetsoprensning og trækkes fra MES.
Genomisk positioner CGI'er, initiativtagere, udskrift organer, CDS'er, og repetitive elementer
Alle genomiske positioner CGI'er, udskrifter og gentagne elementer blev hentet fra UCSC genom browser. I alt 27.639 CGI'er (undtagen tilfældigt placeret CGI'er) blev forudsagt ud fra følgende kriterier: GC-indhold på 50% eller mere, længde større end 200 bp, og forhold på over 0,6 af observerede antal CpG-dinukleotider til det forventede antal [33] . Den NCBI mRNA reference- sekvenser samling (RefSeq fra release-version 46, 11 marts 2011) blev anvendt til at identificere transskription enheder med den definerede transskription start, slut steder og CDS starter, end sites. For promotorer, anvendte vi regionen 500 bp opstrøms ~ 500 bp nedstrøms for transkriptionsstartstedet. Vi opnåede ~ 5 millioner gentage steder, der var blevet fastsat af RepeatMasker program baseret på RepBase bibliotek af gentagelser.
Methylering niveau af genomiske elementer
methylering niveau af en CGI, promotor, gen-krop, og gentag element blev estimeret ved hjælp af MES overlappende hvert element. MES = 0 blev anvendt til at definere ikke-methylerede elementer. For at måle hypermethylering eller hypometylering i kræft, vi beregnet forskellen MESs som (Cancer MES - Normal MES). Differential MES > 1,0 blev anvendt som en tærskel. For at forstå funktionen af ​​udvalgte gener, brugte vi den ontologi klassificering af gener gennem DAVID Funktionel Annotation Clustering værktøj http:.... //David abcc ncifcrf gov /
Genekspression analyse
microarray produkt, der anvendes i denne undersøgelse var Codelink Humant Whole Genome 55 K chip (GE Healthcare, USA). Alle eksperimentelle procedurer, herunder cRNA target forberedelse, hybridisering blev post-hybridisering farvestof kobling udført ved anvendelse protokoller anbefalet leverandør. De resultat filer blev importeret til GeneSpring GX 7.3 (Agilent Technologies, USA) til filtrering og grundlæggende statistisk analyse. Blandt 55 K gener på microarray, kun de gener med nuværende flag i mindst 50% af prøverne blev udvalgt til efterfølgende analyse. De microarray data blev deponeret på GEO http:.. //Www NCBI NLM NIH gov /geo /(tiltrædelse nummer GSE33651)
MIRA og real-time qPCR
MIRA... blev udført på fire yderligere individuelle prøver. DNA blev oprenset fra supernatanten og overvåges af real-time qPCR hjælp Roche 480 maskine. Sekvenserne af anvendte primere er præsenteret i supplerende fil 1:. Tabel S1
bisulfitbehandling, methylering-specifik PCR og pyrosekventering
Vi isolerede den genomiske DNA fra enkelt prøve ved anvendelse af en Qiagen DNeasy Tissue Kit (Qiagen). Bisulfitbehandling blev udført under anvendelse af EZ DNA-methylering guld kit (Zymo Research) ifølge producentens anvisninger. Bisulfit behandlede DNA blev opbevaret ved -80 ° C indtil yderligere anvendelse. De anvendte primere til MSP blev designet ved hjælp Methprimer [34], og er vist i supplerende fil 1: Tabel S1. PCR blev udført med HotStarTaq polymerase (Qiagen) og omfattede en initial inkubation ved 95 ° C i 15 minutter, efterfulgt af 40 cykler ved 95 ° C i 1 min, 59 ° C i 1 min og 72 ° C i 40 sek, efterfulgt af en cyklus af 72 ° C i 10 minutter. MSP-produkter blev separeret på 2% agarosegeler og visualiseret ved ETBR farvning. De Pyrosekventering reaktioner blev automatisk udført med et PSQ 96-system (Pyrosequencing AB) ifølge producentens instruktioner. Kort fortalt blev det biotinylerede PCR-produktet (50 ul) oprenset ved hjælp af streptavidin-sepharose-perler (Amersham Biosciences). Det oprensede produkt blev fyldt i reagenskassetten med enzymet, substratet og dNTP inkluderet i PSQ96 SNP Reagent Kit (Pyrosequencing AB). De sekventeringsprimere til pyrosekventering er vist i supplerende fil 1:. Tabel S1
Resultater
Behandling af MIRA-seq methylome data
Vi renset den methylerede DNA beriget af MIRA (methylerede CpG ø opsving assay) og sekventeret den DNA under anvendelse næste generation sekventering. DNA methylering niveauer blev bestemt ved anvendelse af sekventering læse tællinger af de tilsvarende regioner, 50 bp intervaller, som beskrevet under Metoder. Vi skabte DNA methylering kort til både normale og kræft gastriske væv. For hver prøve, vi opnåede omkring 10 millioner sekvens læser (Yderligere fil 1: Tabel S2). Hver methylome indeholdt ~ 140 mio CpG læser, der dækker ~ 48% af alle genomiske CpG sites ekskl centromerer (Yderligere fil 1: Tabel S3). Den gennemsnitlige dækning af CpG læser i hvert methylome var 4,5 x. Til støtte for den høje følsomhed MIRA, genomiske segmenter, der kun indeholder én CpG havde højere læse tæller end dem uden CpG (p Drømmeholdet værdi = 0), hvilket tyder på, at enlige CpG ændringer kan løses ved hjælp af MIRA. Den gennemsnitlige sekvens læser steget i forhold til antallet af CpG'er inden for en 50-bp interval, og i virkeligheden, MIRA dækningen var ikke lav, selv for regioner med lav CpG densitet (Yderligere fil 2: Figur S1). Taget sammen viser disse resultater, at MIRA lykkedes udvinde en tilstrækkelig del af methylerede regioner. Som for rigtigheden af ​​MIRA, ~ 99% af MIRA-tilfangetagne fragmenter havde mindst én CpG sted inden for deres sekvens, hvilket indikerer en lav falsk opdagelse sats.
At måle berigelse af lokale methylering signaler, vi beregnede methylering berigelse scores (MESs ) ved at opnå en læse tæller i en given region, og derefter udføre normalisering for at styre for den samlede læse count (MEST) i prøven (global normalisering), eller den lokale read count (MESL) i en brugerdefineret omkringliggende region (lokal normalisering) (se fremgangsmåder). Dette muliggør en direkte sammenligning af uafhængige prøver med forskellig læse tæthed. Vi derefter foretaget en logaritmisk transformation af den afledte score. Sammen med at have andre matematiske fortjenester, dette giver fordelen af ​​varians stabilisering, især for høj læste tæller, som ofte kombineret med høje tekniske variationer, der kan introducere betydelig skævhed i dataene.
Vi vurderede den statistiske signifikans af MES i to måder. Randomiseret MESs blev genereret numerisk ved at permutere de genomiske positioner af vores sekvens læser. Baggrunden MES (MESbg) blev opnået ved forsøg ved sekventering af normale genom uden affinitetsoprensning. Som forventet, de reelle data gav markant højere berigelse scores (Yderligere fil 2: Figur S2). Især MESbg var højere end MES fra randomiserede genomer, en indikation af, at baggrunden sekvenser alene kan skabe berigelse, sandsynligvis på grund af kromatin tilgængelighed og forstærkning bias. I overensstemmelse med nylige rapporter [35], dette illustrerer behovet for en ordentlig kalibrering for iboende sekventering bias. Derfor har vi normaliseret vores MES med MESbg.
For at finde den optimale betingelse for normalisering, vi sammenlignet den statistiske egnethed af forskellige normalisering metoder. Tag fordeling langs genomet kan modelleres ved Poissonfordelingen [36, 37]. Den goodness of fit blev testet ved hjælp af Kolmogorov-Smirnov test. I denne test, en lav D statistik indikerer en god pasform. Mens Poisson model klaret sig bedre end Gauss Samlet viste MES en bedre pasform end rå læse tæller (Yderligere fil 2: Figur S3), der illustrerer den sjældne begivenhed karakter af log-skaleret læse tæller foranstaltning. De normaliserede MESL kalibreret ved kontrol sekventering (MESbg) gav endnu bedre resultater end normaliseret MEST kalibreret af kontrol sekventering (MESbg).
Global og kromosomale udsigt over DNA methylering
efter bekræfter den bedste metode til scoring genom-dækkende methylering niveauer ved 50-bp intervaller, vi først undersøgt de kromosomale mønstre for methylering af normale prøver. De gennemsnitlige MES beregnet for hvert kromosom foreslået, at CpG-rige og gen-rige kromosomer tendens til at være stærkt methyleret (figur 1A). De methylering niveauer af kromosomer med store mængder af lange afbrudt nukleare elementer (Lines) var relativt lav (for eksempel kromosom 4). Interessant, mængden af ​​korte indflettede nukleare elementer (Sines) var proportional med kromosom methylering mønster. Dette er sandsynligvis forårsaget af den kendsgerning, at Sines typisk grupperet i gen-rige regioner. Kønskromosomer blev globalt hypomethylated med lavere CpG densitet og højere indhold gentagelse end autosomer. Da vi anvendte væv taget fra en mandlig i dette forsøg, er den globale hypometylering af X-kromosomet observeret ikke forbundet med X-inaktivering. Kromosom-dækkende udsigt sammenfattet høj CpG tæthed og høj methylering omkring gen-rige (se sorte bjælker i bunden) og CGI-rige regioner (se blå bjælker foroven) (figur 1B). I modsætning hertil var lave CpG vægtfylde og lav methylering observeret omkring gen-fattige områder, der var rig på langtrækkende gentagelser (> 1 kb) (se røde bjælker øverst). De gennemsnitlige MES antyder, at methylering niveau af CGI'er er betydeligt højere end for fremkaldende regioner eller gentagelser (figur 1b). Figur 1 methyleringsmønstre af normalt gastrisk væv. (A) Kromosom-gennemsnit MES er vist som en funktion af den gennemsnitlige CpG tæthed, gen densitet (antallet af gener pr Mb), LINE mængde (længden af ​​linje pr Mb), og SINE mængde (længden af ​​SINE pr Mb) for hvert kromosom. (B) For kromosom 22, blev den gennemsnitlige CpG densitet (skraveret grå) og MES (sort kurve) opnået i en-Mb skydevinduer. Positionerne af transskriberede gener (sorte bjælker i bunden), CG øer (blå søjler i toppen), og lange gentagelser (> 1 kb, røde bjælker øverst) sammenlignes på baggrund af DNA-methylering og CpG densitet ( venstre). De gennemsnitlige MES for CGI'er, gen organer og gentagelser (til højre). (C) Fordelingen af ​​gen organer og CGI MES (til venstre). De gennemsnitlige MES for promotor-associerede og promoter-uafhængig CGI'er er vist til højre. (D) De gennemsnitlige MES for promoter undergrupper, baseret på eksistensen af ​​CGI (til venstre). (E) Grundlæggende informationer om intergenisk, exon og intron regioner, efter længde, CpG nummer, og kortlagt læser (til venstre). Fordelingen af ​​intergeniske, exon, og intron MESs er vist til højre. (F) Grundlæggende oplysninger om opstrøms 1-kb region, 5 'UTR exons, kodende exoner, 3'UTR exons og nedstrøms en kb region efter længde, CpG nummer og kortlagt læser (til venstre). Fordelingen af ​​MES for hvert element er vist til højre.
Generelt CGI'er tendens til at forblive methylering frie i normalt væv. For at analysere de høje methylering mønstre af CGI'er, tjekkede vi den gennemsnitlige MES distribution og fundet et lidt bimodal mønster (figur 1C). Omkring 66% (11.376 /17.284) af CGI'er i venstre top overlappede med en promotor (1 kb ved vores definition). I modsætning hertil 13% (1.386 /10.357) af CGI'er i den rigtige top overlappet med en promotor, hvilket antyder, at de fleste promotor-associerede CGI'er er umethyleret. I modsætning til promotor-relateret CGI'er, promotor-uafhængig CGI'er var kraftigt methyleret (figur 1C). Selv om de fleste CGI-positive promotorer ikke var methyleret, viste CGI-negative promotorer relativt høje methylering niveauer (figur 1D). Vi kontrolleres også methylering niveau af initiativtagere fra CpG tæthed som tidligere defineret [38] (Yderligere fil 3: Tabel S4). Methyleringsmønsteret af promotorer blev omvendt relateret til CpG densitet (Yderligere fil 2: Figur S4). På den anden side, CGI-holdige gen organer havde højere methylering niveauer end dem uden CGI'er (figur 1D).
Dernæst analyserede vi methylering berigelse mønstre på forskellige kommenterede genomiske elementer til at udforske regioner, blev fortrinsvis methylerede. Fremkaldende regioner optager ca. 40% af det humane genom, men omkring 53% af det samlede læser er inden for dette område, med hovedparten af ​​læser bliver placeret i intron-region (tabel 1). Selv om en betydelig del af methylerede fragmenter falder inden intronregioner er forholdet mellem kortlagt læser til længden af ​​exoner er betydeligt højere end for introner, hvilket antyder, at exoner er mere stærkt methylerede end introner (figur 1E). Inden gen-associerede regioner, berigelse af kodende exoner er endnu højere end i andre regioner som tidligere rapporteret (figur 1F og tabel 2) [39]. Dette tyder stærkt på, at methylering spiller en rolle i exon regulation.Table 1 humane genom og normale prøve informationer om fremkaldende og intergeniske region
human Genome Information
Normal Sample Information
Relativ Berigelse Ratio
Funktionel kategori
Længde (bp)
Ratio
# af CpG
Ratio
Læser
Ratio
vs. længde
vs. CpG Count

Genic
1,184,139,094
39.46
13,262,253
47.09
20,854,434
53.25
1.35
1.13
Exon
68,035,894
2.27
1,808,089
6.42
4,350,405
11.11
4.90
1.73
Intron
1,122,817,725
37.41
11,613,113
41.23
17,358,273
44.32
1.18
1.07
Intergenic
1,816,976,186
60.54
14,901,610
52.91
18,310,273
46.75
0.77
0.88
Human Genome
3001115280
100
28.163.863
100
39.164.707
100
1.00
1.00
Tabel 2 humane genom og normal prøve information af gen kommenterede regioner
human Genome Information
Normal Sample Information
Relativ Berigelse Ratio

Funktionel kategori
Længde (bp)
Ratio
# af CpG
Ratio
Læser

Ratio
vs. længde
vs. CpG Grev
Upstream 1 kb
24.468.069
0,82
937.748
3,33
535.593
1,37
1.68
0,41
5'UTR Exon
8.436.529
0,28
411.563
1,46
292.654
0,75
2,66
0,51
Kodning Exon
33.384.619
1.11
1.077.913
3,83
3.448.755
8,81
7,92
2,30
3'UTR Exon
28.387.978
0,95
378.012
1,34
806.832
2,06
2,18
1.53
Downstream 1 kb
23.136.263
0,77
340.866
1.21
551.071
1,41
1,83
1.16
menneskelige genom
3001115280
100
28.163.863
100
39.164.707
100
1.00
1.00
Ændringer i DNA methylering mønstre forbundet med mavekræft
Når gennemsnitlige kromosomale MES af kræft methylome blev sammenlignet med den for kontrol væv, fandt vi, at alle kromosomer i cancervævet tendens til at blive hypomethylated (Yderligere fil 2: Figur S5). Med kromosom-dækkende udsigt, blev fundet CGI-rige regioner til at være specielt hypermethyleret, mens gentagne-rige regioner bredt blev hypomethylated (figur 2A; Yderligere fil 2: Figur S6). For at analysere methylering ændringer i genomiske elementer, justeret vi hvert element på start og slut steder og derefter opnået den gennemsnitlige MES på hver respektive position. Slående, vi registreret hypermethylering i opstrøms-regionen, især fra 500 bp opstrøms for transkriptionsstartsitet (figur 2B). Dette er i overensstemmelse med hypermethyleringen af ​​promotorregioner hyppigt observeret i cancer. Figur 2 Sammenligning af mønstre for methylering i normalt og cancervæv. (A) Gennemsnitlig MES kurve for normal (sort) og kræft (rød) væv i kromosom 19 (venstre). De gennemsnitlige MES for CGI'er, gen organer og gentagelser (til højre). (B) DNA methylering af gen kommenteret elementer. Hvert element (opstrøms 1 kb, exon, intron, og nedstrøms 1 kb) blev opdelt i 20 placeringer og de gennemsnitlige MES blev opnået for hvert bin af alle tilsvarende elementer. (C) DNA-methylering ved transkript ender og kodende region ender. De gennemsnitlige MES blev opnået i et glidende 50-bp Vindue ifølge dets afstand fra transkript start (første) og slutningen (andet) for CGI-positive promotorer samt transkriptet start (tredje) og slutningen (fjerde) for CGI- positive initiativtagere. (D) DNA-methylering af alt 5 'UTR exoner (venstre) og 5' UTR kodende exoner (højre).
Region centreret ved transkriptionsstartstedet viste helt forskellige mønstre afhængig af tilstedeværelsen af ​​en CGI, hvilket afspejler den lave status for methylering af CGI-holdige promotorer (figur 2C). Vi fandt også, at i cancervæv, bemærkelsesværdig hypermethylering af CGI-holdige promotorer forekommer, og at tætheden af ​​CpG'er er afgørende for stigningen i DNA-methylering (figur 2C). For yderligere at analysere, om 5 'regioner af gener blev hypermethyleret samme måde genpromotorer, vi kontrolleret methylering mønster af de første exons. Interessant fandt vi, at det første exon blev hypermethyleret kun når det var 5'-enden af ​​en kodende exon, men ikke når det var en 5 'UTR exon (Figur 2D). Disse regioner indeholdt også høj CpG tæthed. Derfor CGI'er ved den opstrøms regioner af gener, promotoren og den kodende starten synes at være de vigtigste mål for DNA hypermethylering i cancer.
Methylering mønster af CpG-øer
At udforske sammenhængen mellem placeringen af ​​CGI'er og DNA methylering, vi subgrouped CGI'er henhold til deres position i genomet. Specifikt blev de inddelt i 5 '(placeret mellem 1 kb opstrøms og den kodende startsted af et gen), intragenisk (intragenisk CGI'er uden 5'-enden), og intergeniske (placeret i ikke-fremkaldende område) (Yderligere fil 1: tabel S5). Selvom CpG tæthed var ens blandt de tre grupper, ikke-5'CGI'er (intragenisk og intergeniske CGI'er) var signifikant mere methylerede end 5 'CGI'er (Yderligere fil 2: Figur S7). Vi yderligere i forhold de gennemsnitlige MES af subgrouped CGI'er og fundet methylering af alle CGI'er blev generelt forøget. den relative forskellen MES foreslås imidlertid, at ændringen i methylering i 5'CGI'er var signifikant større end for andre CGI'er (figur 3A), der afspejler de vigtige roller af 5 'CGI'er i kræft. Omfanget af 5'CGI hypermethylering signifikant korreleret med overlapning af transkriptionsstartsitet (figur 3B). Figur 3 DNA methylering af CpG-øer. (A) Relative differentiale MES af subgrouped CGI'er. (B) Korrelation mellem differential CGI methylering og afstand til transkriptionsstartsitet. (C) Sammenhæng mellem genekspression niveau og hypermethylering af CGI'er. (D) Methylering-specifik PCR af histon-gener viser den højeste differentielle MES værdier. . M1 og U1 svarer til HIST3H2A, mens M2 og U2 svarer til HIST3H2B
At udforske de funktioner af gener, der gennemgår forskellen methylering ved 5 'CGI'er, valgte vi gener med meget differentieret CGI MESs (forskellen MES > 1). Vi derefter udførte gen ontologi (GO) analyse for at få indsigt i de mekanismer, der er ansvarlige i kræft (tabel 3). Når generne blev grupperet i forskellige GO kategorier, fandt vi, at HOX
genklynger og nucleosomstørrelse assembly-relaterede gen-clustere var mål for hypermethylering, mens apoptose-relaterede gen-klynger var mål for hypometylering. Interessant, vores fund, at HOX
gen klynger var fordelagtige mål for DNA methylering er i overensstemmelse med en tidligere rapport [40]. Desuden gen plots bekræftet, at hypermethylering var CGI-specifik i kræft (Yderligere fil 2: Figur S8). For at estimere ændringer i ekspressionsmønstre forårsaget af hypermethylering af 5 'CGI'er, vi udførte en funktionel analyse af genekspression data fra cDNA microarray eksperimenter. Hypermethylering af 5'CGI'er var signifikant korreleret med nedregulering af gener (p
= 0,03) (Figur 3C Yderligere fil 3: Tabel S6 og S7). Dette indikerer, at lukke munden af ​​gener ved methylering kan blive direkte berørt af graden af ​​CpG tæthed og 5'CGI hypermethylering. Vi analyserede status DNA methylering af gener med hypermethyleret 5'CGI'er og nedreguleret ekspressionsmønstre. Blandt disse var genet kodende histon H2B type 3-B (HIST3H2BB
). Analyse af HIST3H2BB
promotor methylering under anvendelse methyleringsspecifik PCR viste, at de fleste kræftpatienter (8/10, 80%) udviste forøget methylering i promotorregionen (figur 3D) .table 3 Funktionel annotation gruppering af gener med hypermethyleret 5'CGIs
Annotation Cluster 1
Berigelse score: 3.27
Grev
P_Value
GOTERM_BP_FAT
nukleosom samling
11
3.90E-04
GOTERM_BP_FAT
kromatin samling
11
5.20E-04
GOTERM_BP_FAT
protein-DNA-kompleks samling
11
7.40E-04
Annotation Cluster 2
Berigelse score: 2,92
Grev
P_Value
INTERPRO
Histon kerne
8
6.80E-04
SP_PIR_KEYWORDS
nukleosom kerne
8
8.60E-04
GOTERM_CC_FAT
nukleosom
8
3.10E-03
Annotation Cluster 3
Berigelse score: site
17
5.10E-03
INTERPRO
Homeobox
17
5.70E-03
SP_PIR_KEYWORDS
Homeobox
17
5.80E-03
INTERPRO
Homeodomain-related
17
6.40E-03
SMART
HOX
17
1.40E-02
D4
3
9.10E-03
SP_PIR_KEYWORDS
embryo
3
3.30E-02
PIR_SUPERFAMILY
PIRSF002612:homeotic