identificatie van DNA methylatie veranderingen geassocieerd met menselijke maagkanker
Abstract achtergrond
epigenetische verandering van genexpressie is een veel voorkomende gebeurtenis in humane kanker. DNA methylatie is bekend epigenetische proces, maar het verifiëren van de precieze aard van epigenetische veranderingen in verband met kanker blijft moeilijk.
Methods
We geprofileerd de methyloom menselijke maagkanker weefsel bij 50-bp resolutie met behulp van een gemethyleerd DNA enrichment techniek (gemethyleerde CpG eiland herstel assay) in combinatie met een genoom analyser en een nieuwe normalisatie-algoritme.
Resultaten
We waren in staat om een uitgebreid overzicht van de initiatiefnemers met diverse CpG dichtheden, met inbegrip van CpG-eilanden (CGI) te krijgen, transcript lichamen en verschillende manieren van herhalen klassen. We vonden dat maagkanker geassocieerd met hypermethylering van 5 'CGI en het 5'-uiteinde van coderende exons en hypomethylatie terugkerende elementen, zoals korte afgewisseld nucleaire elementen en het samengestelde element SVA. Hypermethylering van 5 'CGIs was significant gecorreleerd met verlaagde expressie van geassocieerde genen, zoals die in de HOX Kopen en histon genfamilies. We ontdekten ook lange-afstands epigenetische silencing (LRE) regio bij maagkanker weefsel en geïdentificeerd verschillende gehypermethyleerd genen (MDM2
, DYRK2
en LYZ
) binnen deze regio's. De methylatie status van CGI en gen annotatie elementen in metastatische lymfeknopen tussen normale en kankerachtige weefsel, wat aangeeft dat methylatie van bepaalde genen geleidelijk verhoogd kankerweefsel.
Conclusies Home Onze bevindingen waardevolle gegevens voor toekomstige analyses CpG methylering patronen, bruikbare markers voor de diagnose van maagkanker, evenals een nieuwe analysemethode voor klinisch onderzoek epigenomics. achtergrond
maagkanker is de tweede belangrijkste oorzaak van sterfgevallen door kanker wereldwijd na longkanker, waardoor meer dan 800.000 doden wereldwijd per jaar [1]. De huidige 5-jaars overleving van mensen gediagnosticeerd met maagkanker is slechts 20-30%, met dit lage tarief zijn toe te schrijven aan het feit dat de meeste gevallen al in een vergevorderd stadium, wanneer de diagnose. Zoals bij alle kankers, vroege opsporing blijft de meest veelbelovende aanpak voor de verbetering van de overleving. Dus begrijpen van de oorzaak van tumorigenese in menselijk maagweefsel essentieel.
Infectie met H. pylori
is een gevestigde en voorkomende oorzaak van maagkanker. Echter, veranderingen in verschillende genetische factoren zijn belangrijk bij het verhogen maag kankerrisico. Het is bekend dat chromosomale oorsprong van genetische factoren als microsatelliet instabiliteit en KRAS Kopen en p53
mutaties leiden tot de ontwikkeling van tumoren. Verscheidene genomische studies kiemlijn mutaties geïdentificeerd in specifieke genen [2-4] en de ziekte vatbare loci [5, 6] voor maagkanker. Recente studies vergelijken van maagkanker en normaal weefsel hebben een aantal genetische merkers, waaronder diagnostische merkers geïdentificeerd [NF2
[7], INHBA
[8], sFRP4
[9]], prognostische merkers [CD9
[10], CDH17
[11], PDCD6
[12]], en maag-kanker geassocieerde genen [MUC13
[9], CLDN1
[13], Ki67
en CD34
[14]]. Bovendien hebben epigenetische mechanismen zoals DNA methylering en histon modificaties belangrijk gebleken voor het reguleren van de expressie van genen betrokken bij de biologie en de ziekte van het maagdarmkanaal [15] zijn.
DNA methylering speelt een essentiële rol in eukaryoten en is gekoppeld aan een aantal belangrijke mechanismen waaronder genomische imprinting, X-chromosoom inactivatie, veroudering en kanker. Wijziging van DNA methylatie in het genoom wordt gevonden in vrijwel alle vormen van kanker en kan leiden tot veranderingen in genexpressie, bijvoorbeeld overexpressie van oncogenen en onderdrukking van tumorsuppressorgenen in kankerontwikkeling [16]. Verschillende studies hebben aangetoond dat de accumulatie van genetische en epigenetische veranderingen in maag precancerous laesies kunnen een groot aantal doelen, zoals DNA herstel systeemcomponenten, tumor- suppressors, oncogenen, celcyclus regulatoren, groeifactoren en adhesiemoleculen [17-20] beïnvloeden . Echter, deze studies zijn voornamelijk gericht op enkele kandidaatgenen of bedekt slechts een gedeelte van het gehele genoom. Dus toegang tot een algemeen beeld van de epigenetische veranderingen geassocieerd met de ontwikkeling van kanker is moeilijk. In het bijzonder, begrip DNA-methylatie veranderingen in de intragene regio's, CpG eilanden, intergene gebieden, en herhaal sequenties blijft beperkt. Bijgevolg is er grote belangstelling voor genoom-brede analyse van afwijkende DNA-methylatie in deze regio's.
Voor uitvoerige genoom-schaal profilering van DNA-methylatie in embryogenese en carcinogenese, hoge-resolutie whole genome sequencing methoden, zoals BS-seq [21 -24] zijn MeDIP-seq [25, 26] en MethylCap-seq [27-29] ontwikkeld. Ondanks de snelle ontwikkeling van sequencing-gebaseerde mapping-technologie, is er nog steeds een gebrek aan vergelijkend onderzoek, dat is van cruciaal belang voor de klinische epigenomics studies, waaronder die gericht op kanker. In tegenstelling tot de microarray-gebaseerde benaderingen, zijn sequencing data geproduceerd in een formaat dat niet vatbaar is voor differentiële analyse, en de analyse workflow is nog niet gestandaardiseerd. Vandaar dat computationeel goedkope normalisatie methoden nodig zijn rekenlast verwerken groot formaat, hoge resolutie sequentiedata verwerken.
Hier hebben we een normalisatie algoritme dat rekening houdt met de sample-specifieke totale read dichtheid, de ruimtelijke distributie van CpG loci, en de achtergrond sequencing vooringenomenheid. Vervolgens creëerde een uitgebreide hele genoom methyloom van de normale maag weefsel, maagkanker weefsel, en metastatische lymfeklieren met behulp van de MethylCap-seq methode en de verkregen informatie over de verstoring tijdens carcinogenese en metastase. Dit is direct van toepassing is op een vergelijkende analyse van methylomes en andere vormen van epigenomisch data, en het heeft met name gevolgen voor de klinische epigenomics.
Methods
Gastric weefselmonsters
We kregen drie snap-bevroren maag tumoren en gematched normaal maag weefsel uit Seoul National University College of Medicine voor methyloom studie. Bovendien achtentwintig gepaarde normale en tumor maag weefsels werden verkregen voor verdere bevestiging. Alle monsters werden verkregen door endoscopische resectie tijdens het onderzoek van de patiënten gaven toestemming
gemethyleerde DNA herstel assay (MIRA)
Genomisch DNA van 25 mg maagweefsel werd gezuiverd met behulp DNeasy Blood &.; Tissue Kit (Qiagen, Valencia, CA). Genomische DNA-monsters van 3 personen werden samengevoegd bij dezelfde concentratie. MIRA werd uitgevoerd zoals eerder beschreven [30-32]. Kort samengevat, GST-gelabeld MBD2b en His-tag MBD3L1 eiwitten werden bereid zoals beschreven. 15 ug genomisch DNA werd gefragmenteerd tot 100 ~ 500 bp door sonicatie en geïncubeerd met 28 ug van gezuiverd GST-MBD2b eiwit, 28 ug His-MBD3L1 eiwit en 7 ug JM110 Bacterieel DNA voor 6 uur. 30 ul MagneGST korrels (Promega, Madison, WI) vooraf geblokkeerd met 7 ug JM110 bacterieel RNA toegevoegd en geïncubeerd bij 4 ° C met roterende gedurende 45 minuten in finale 600 pi MIRA bindende reactiemengsel. Parels werden driemaal gewassen met 1 ml wasbuffer en gemethyleerde fragmenten werden geëlueerd door incubatie bij kamertemperatuur gedurende 5 minuten en vervolgens 56 ° C gedurende 30 minuten met 30 ul TE dat RNase A (100 ug, Qiagen) en Proteinase K ( 15 ug, Qiagen). Geëlueerde DNA-fragmenten werden verder gezuiverd met behulp van Qiaquick PCR zuivering kits (Qiagen).
Illumina Genome Analyzer sequencing
We gebruikten 10 ng van geëlueerde DNA voor Illumina Genome Analyzer sequencing. Na ligatie van een paar Solexa adapters, ligatieproducten met de maximale insertiegrootte van 200 bp werden op gel gezuiverd op 2% agarose en onderworpen aan PCR-amplificatie. Cluster genereren en 36 cycli van sequencing werden uitgevoerd volgens instructies van de fabrikant. We sequentie 120 ul van adaptor-geligeerde, op grootte gefractioneerd DNA (2 ~ 4:00) op de Illumina Genome Analyzer. Sequence tags gekoppeld aan het menselijk genoom (UCSC hg18 database op basis NCBI Build 36,1 montage) met behulp van de Solexa Analyse Pipeline (versie 0.3.0). Gefaseerde bed van 34 bp (met uitzondering van de eerste en laatste nucleotide) die doorgegeven kwaliteitscontrole filters gebruikt.
Gegevensverwerking en MES berekening
We verlengden het 3 'uiteinde van het 34-bp leest van 200 bp DNA te dekken fragmenten gebonden door de MBD eiwitten. De uitlezing werd omgezet in browser uitbreidbaar data (BED) bestanden voor visualisatie in de UCSC genoom browser. Http: //genoom ucsc edu /.. We telden overlappende sequence tags op 50 resolutie bp. Verrijkte genomische regio ', het aantal toegewezen scant het schuifraam van 1 kb werd vergeleken met het totale aantal lezen of het aantal achtergrond leest het genoom. Als zodanig werd MES twee manieren berekend; men is als de log2 van (doel lees telling /target grootte) /(totaal lees count /grootte van het genoom) en gevloerd op nul, de andere is als de log2 van (doel lees telling /target grootte) /(achtergrond lees count /achtergrond grootte) en gevloerd op nul. Aan te passen voor de achtergrond sequencing bias, werd MESbg berekend op dezelfde wijze voor de input sequencing zonder affiniteit zuivering en afgetrokken van MES.
Genomic posities van CGI's, promotors, transcript lichamen, CDS, en repetitieve elementen
Al genomische posities van CGI's, transcripties en herhaal elementen werden gedownload van de UCSC genoom browser. Een totaal van 27.639 CGIs (behalve willekeurig gelegen CGI's) werden voorspeld door de volgende criteria: GC gehalte van 50% of meer, lengte groter dan 200 bp, en de verhouding groter dan 0,6 waargenomen aantal CpG dinucleotiden het verwachte aantal [33] . Het NCBI mRNA-referentie-sequenties collectie (RefSeq van versie 46, 11 maart 2011) werd gebruikt voor het identificeren van transcriptie-eenheden met de gedefinieerde transcriptie start, eind sites en CDS start, eind sites. Voor promoters, gebruikten we de regio 500 bp stroomopwaarts ~ 500 bp stroomafwaarts van de transcriptie startplaats. We verkregen ~ 5.000.000 repeat locaties die waren bepaald door de RepeatMasker programma op basis van de RepBase bibliotheek herhalingen.
Methylering niveau van genomische elementen
De methylatie niveau van een CGI, promoter, gen-body, en herhaal element werd geschat door middel van MES overlappende elk element. MES = 0 werd gebruikt om ongemethyleerde elementen definiëren. Om hypermethylatie of hypomethylatie bij kanker te meten, berekenden we het differentieel MESs als (Cancer MES - Normaal MES). Differential MES > 1,0 werd gebruikt als een drempel. Om de functies van geselecteerde genen te begrijpen, gebruikten we de ontologie classificatie van genen door de DAVID functionele annotatie Clustering hulpmiddel http:.... //David ABCC ncifcrf gov /
Genexpressieanalyse
microarray product dat gebruikt wordt in deze studie was Codelink Human Whole Genome 55 K chip (GE Healthcare, USA). Alle experimentele procedures, waaronder cRNA doel de voorbereiding, hybridisatie werden post-hybridisatie kleurstof koppeling uitgevoerd met behulp van de leverancier aanbevolen protocollen. Het resultaat dossiers werden in GeneSpring GX 7,3 (Agilent Technologies, USA) geïmporteerd voor het filteren en elementaire statistische analyse. Bij 55 K genen op de microarray, alleen de genen met vlaggen aanwezig in ten minste 50% van de monsters werden geselecteerd voor verdere analyse. De microarray gegevens werden gedeponeerd bij de GEO. Http: //www. NCBI NLM nih gov /geo /(toegangsnummer GSE33651)
MIRA en real-time qPCR
MIRA... werd uitgevoerd op vier extra individuele monsters. DNA werd gezuiverd uit de supernatant en gecontroleerd door real-time qPCR gebruikt Roche 480 machine. De sequenties van de gebruikte primers zijn weergegeven in Extra file 1:. Tabel S1
bisulfiet behandeling, methylatie-specifieke PCR en pyrosequencing
We isoleerden het genoom DNA van individuele monster met behulp van een Qiagen DNeasy Tissue Kit (Qiagen). Bisulfiet behandeling werd uitgevoerd met behulp van de EZ DNA methylatie goud kit (Zymo onderzoek) volgens de instructies van de fabrikant. Bisulfiet-behandelde DNA werd opgeslagen bij -80 ° C tot verder gebruik. De primers gebruikt voor MSP werden ontworpen met behulp van Methprimer [34], en worden getoond in Extra file 1: Tabel S1. PCR werd uitgevoerd met HotStarTaq polymerase (Qiagen) en omvatte een initiële incubatie bij 95 ° C gedurende 15 min, gevolgd door 40 cycli van 95 ° C gedurende 1 min, 59 ° C gedurende 1 min en 72 ° C gedurende 40 seconden, gevolgd door één cyclus van 72 ° C gedurende 10 minuten. MSP producten werden gescheiden op 2% agarosegels en zichtbaar gemaakt door kleuring EtBr. De pyrosequencing reacties werden uitgevoerd met een automatisch PSQ 96 systeem (Pyrosequencing AB) volgens de instructies van de fabrikant. Kort samengevat, het gebiotinyleerde PCR product (50 ul) werd gezuiverd met streptavidine-Sepharose parels (Amersham Biosciences). Het gezuiverde product werd geladen in de cartridge reagens met het enzym, substraat en dNTP in de PSQ96 SNP Reagent Kit (Pyrosequencing AB). De sequencing primers voor pyrosequencing worden getoond in Extra file 1:. Tabel S1
Resultaten
Verwerking van MIRA-seq methyloom data
We gezuiverd de gemethyleerd DNA verrijkt door MIRA (gemethyleerd CpG eiland herstel assay) en de sequentie van de DNA met behulp van next-generation sequencing. DNA methylatie werden bepaald middels sequentiebepaling leest tellingen van de overeenkomstige gebieden op 50 bp intervallen, zoals beschreven onder Werkwijzen. We hebben DNA-methylatie kaarten voor zowel normale als kankercellen de maag weefsels. Voor elk monster, kregen we ongeveer 10 miljoen volgorde leest (Extra file 1: Tabel S2). Elke methyloom bevatte ~ 140 miljoen CpG leest, die ~ 48% van alle genomische CpG exclusief centromeren (Extra file 1: Tabel S3). De gemiddelde dekking van CpG leest elk methyloom was 4,5X. Ter ondersteuning van de hoge gevoeligheid van MIRA, genomische segmenten die slechts één CpG hadden hogere lezen telt dan degenen die geen CpG (p
value = 0), wat suggereert dat enkele CpG veranderingen kunnen worden opgelost met behulp van MIRA. De gemiddelde sequentie leest verhoogd in verhouding tot het aantal CpGs in een 50-bp interval, en in feite, MIRA dekking was laag, zelfs voor gebieden met lage dichtheid CpG (aanvullende bestandsinformatie 2: Figuur S1). Samengenomen tonen deze resultaten dat MIRA succes in het winnen van een voldoende fractie van gemethyleerde gebieden was. Zoals voor de juistheid van MIRA, ~ 99% van de MIRA-gevangen fragmenten had ten minste één CpG plaats binnen de volgorde, wat wijst op een lage valse detectie. Belgique Om verrijking van lokale methylatie signalen te meten, berekenden we methylatie verrijking scores (MESs ) door het verkrijgen van een gelezen telling in een bepaalde regio en dan het uitvoeren van normalisatie om te controleren voor de totale lezen count (MEST) in het monster (mondiale normalisatie) of het plaatselijke read count (MESL) in een door de gebruiker gedefinieerde omliggende regio (lokale normalisatie) (zie methoden). Dit maakt een directe vergelijking van onafhankelijke monsters met verschillende densiteit lezen. Vervolgens hebben we uitgevoerd een logaritmische transformatie van de verkregen score. Samen met het hebben andere wiskundige voordelen verschaft dit het voordeel van variantie stabilisering, met name voor hoge lees tellingen, die vaak gepaard gaan met hoge technische variaties die significante vertekening introduceren in data.
Wij hebben de statistische significantie van de in MES twee manieren. Gerandomiseerd MESs werden numeriek gegenereerd door permuteren de genomische posities van onze reeks leest. De achtergrond MES (MESbg) werd experimenteel verkregen door sequencing van de normale genoom zonder affiniteitszuivering. Zoals verwacht, de echte gegevens leverden aanzienlijk hogere verrijking scores (aanvullende bestandsinformatie 2: Figuur S2). Opmerkelijk MESbg was hoger dan MES uit gerandomiseerde genomen, een indicatie dat de achtergrond sequenties kunnen alleen verrijking te creëren, waarschijnlijk als gevolg van chromatine toegankelijkheid en versterking vooringenomenheid. Consistent met recente rapporten [35] Dit illustreert de noodzaak van een goede kalibratie voor sequentiebepaling inherente vooroordelen. Daarom hebben we genormaliseerd onze MES met MESbg.
Om de optimale conditie voor normalisatie vinden, vergeleken we de statistische geschiktheid van de verschillende normalisatie methoden. Tag langsheen het genoom kan worden gemodelleerd door Poisson verdeling [36, 37]. De goedheid van fit werd getest met behulp van de Kolmogorov-Smirnov-test. In deze test, een lage D statistiek geeft een goede pasvorm. Terwijl de Poissonmodel overtrof de Gauss algemeen de MES toonde een betere pasvorm dan rauw read tellingen (aanvullende bestandsinformatie 2: Figuur S3) illustreert het zeldzame geval aard van de log-schaal gelezen aftelling. De genormaliseerde MESL gekalibreerd door controle sequencing (MESbg) leverde zelfs betere resultaten dan genormaliseerd MEST gekalibreerd door controle sequencing (MESbg). For global en chromosomaal uitzicht op DNA-methylatie
Na bevestiging van de beste methode voor het scoren van genoom-brede methylatie niveaus 50 bp intervallen, we eerst gekeken naar de chromosomale methylatie patronen van de normale monsters. De gemiddelde MES berekend voor elk chromosoom gesuggereerd dat CpG-rijke en gen-rijke chromosomen hebben de neiging om zeer worden gemethyleerd (Figuur 1A). De methylering chromosomen met grote hoeveelheden lange afgewisseld nucleaire elementen (lijnen) relatief laag (bijvoorbeeld chromosoom 4). Interessant is dat de hoeveelheid korte afgewisseld nucleaire elementen (SINE) is evenredig met het chromosoom methylatiepatroon. Dit wordt waarschijnlijk veroorzaakt doordat SINE typisch geclusterd in gen-rijke gebieden. Geslachtschromosomen werden wereldwijd hypomethylated met lagere CpG dichtheid en een hoger gehalte dan herhaal autosomen. Aangezien we de weefselmonsters uit man in dit experiment gebruikt, wordt de globale hypomethylatie van het X-chromosoom waargenomen niet gekoppeld aan X-inactivatie. uitzicht op chromosoom-breed recapituleerde hoge CpG dichtheid en een hoge methylatie rond gen-rijke (zie zwarte balken aan de onderkant) en CGI-rijke regio's (zie blauwe balken aan de boven-) (Figuur 1B). In contrast, lage CpG dichtheid en lage methylatie werden waargenomen rond gen-arme regio's die rijk zijn aan lange-afstands repeats waren (> 1 kb) (zie rode balken boven). De gemiddelde MES suggereert dat het niveau van methylatie CGIs aanzienlijk hoger dan die van gene gebieden of herhalingen (Figuur 1B). Figuur 1 methyleringspatronen normaal maagweefsel. (A) Chromosoom-brede gemiddelde MES wordt als functie van de gemiddelde CpG dichtheid gen dichtheid (het aantal genen per Mb), LINE hoeveelheid (de lengte van de baan per Mb) en SINE hoeveelheid (de lengte van SINE per mb) voor elk chromosoom. (B) voor chromosoom 22, de gemiddelde CpG dichtheid (grijs gearceerd) en MES (zwarte kromme) verkregen in 1-Mb schuiframen. De posities van getranscribeerd genen (zwarte balken aan de onderkant), CG eilanden (blauwe balken aan de boven-) en lange herhalingen (> 1 kb, rode balken op de top) worden vergeleken met de achtergrond van DNA-methylatie en CpG dichtheid ( links). De gemiddelde MES voor CGI, gen lichamen, en herhalingen (rechts). (C) De verdeling van gen-organen en CGI MES (links). De gemiddelde MES for-promotor geassocieerd en promotor-onafhankelijke CGI wordt getoond aan de rechterkant. (D) De gemiddelde MES promotor voor subgroepen, gebaseerd op het bestaan van CGI (links). (E) basisinformatie over intergene, exon en intron gebieden, op lengte, CpG nummer en toegewezen leest (links). De verdeling van intergenisch, exon en intronic MESs wordt getoond aan de rechterkant. (F) basisinformatie over de stroomopwaartse 1-kb, 5 'UTR exons coderende exons, 3' UTR exons en downstream-1 kb gebied op lengte, CpG nummer en toegewezen leest (links). De verdeling van de MES voor elk element wordt getoond aan de rechterkant.
Algemeen CGI neiging methylering vrij in normaal weefsel blijft. Om de hoge methylatie patronen van CGI's te analyseren, checkten we de gemiddelde MES distributie en vond een iets bimodale patroon (figuur 1C). Ongeveer 66% (11.376 /17.284) van CGI in de linker piek overlapt met een promotor (1 kb door onze definitie). Daarentegen 13% (1386 /10.357) van CGIs in de juiste piek overlapt met een promoter wijst dat promotor-geassocieerde CGI zijn gemethyleerd. In tegenstelling tot promotor-gerelateerde CGI, promotor-onafhankelijke CGI werden zwaar gemethyleerd (figuur 1C). Hoewel de meeste CGI-positieve initiatiefnemers niet werden gemethyleerd, CGI-negatieve promotors toonde relatief hoge methylatie niveaus (figuur 1D). Wij checkten de methylatie niveau van de initiatiefnemers van CpG dichtheid zoals eerder gedefinieerd [38] (Extra file 3: Tabel S4). De methylatie patroon van de initiatiefnemers is omgekeerd evenredig met de CpG dichtheid (Extra file 2: Figuur S4). Anderzijds, CGI-gen bevattende organen hadden hogere methylering dan die zonder CGI's (figuur 1D).
Vervolgens analyseerden we verrijking methylatie patronen op verschillende geannoteerde genomische elementen die gebieden die bij voorkeur werden gemethyleerd verkennen. Genic gebieden bezetten ongeveer 40% van het menselijk genoom, maar ongeveer 53% van de totale leest binnen dit gebied, met de meeste leest gelegen is in het intron gebied (tabel 1). Hoewel een groot deel van gemethyleerd fragmenten binnen intron gebieden vallen, de verhouding toegewezen leest de lengte van exons aanzienlijk hoger dan voor introns, wat suggereert dat exons hoger dan gemethyleerd introns (Figuur 1E). Binnen-verbonden gen gebieden, de verrijking van coderende exonen is zelfs hoger dan die van andere gebieden zoals eerder beschreven (Figuur 1F en tabel 2) [39]. Dit suggereert sterk dat methylatie een rol in exon regulation.Table 1 menselijk genoom en normaal monster informatie van gene en intergene gebied
Human Genome Informatie
normaal monster Informatie Gids Relatieve Enrichment Ratio
Functionele Categorie
Lengte (bp)
Ratio
# van CpG
Ratio
Leest
Ratio
vs. lengte
vs. CpG Count
Genic
1,184,139,094
39.46
13,262,253
47.09
20,854,434
53.25
1.35
1.13
Exon
68,035,894
2.27
1,808,089
6.42
4,350,405
11.11
4.90
1.73
Intron
1,122,817,725
37.41
11,613,113
41.23
17,358,273
44.32
1.18
1.07
Intergenic
1,816,976,186
60.54
14,901,610
52.91
18,310,273
46.75
0.77
0.88
Human Genome
3001115280
100
28.163.863
100
39.164.707
100
1,00
1,00
Tabel 2 menselijk genoom en normaal monster informatie van gen geannoteerde regio
Human Genome Informatie
normaal monster Informatie Gids Relatieve Enrichment Ratio
Functioneel Categorie
Lengte (bp)
Ratio
# van CpG
Ratio
Leest
Ratio
vs. lengte
vs. CpG Count
Upstream 1 kb
24.468.069
0.82
937.748
3,33
535.593
1.37
1.68
0,41
5'UTR Exons
8.436.529
0.28
411.563
1,46
292.654
0.75
2,66
0,51
Coding Exons
33.384.619
1.11
1.077.913
3,83
3.448.755
8,81
7,92
2.30
3'UTR Exons
28.387.978
0.95
378.012
1,34
806.832
2,06
2.18
1,53
Downstream 1 kb
23.136.263
0.77
340.866
1.21
551.071
1,41
1,83
1.16
Human Genome
3001115280
100
28.163.863
100
39.164.707
100
1,00
1,00
Veranderingen in het DNA methylatie patronen in verband met maagkanker
Wanneer de gemiddelde chromosomale MES van kanker methyloom werd vergeleken met die van controleweefsel, vonden wij dat alle chromosomen in het kankerweefsel neiging te hypomethylated (aanvullende bestandsinformatie 2: Figuur S5). Met uitzicht op chromosoom-breed, werden CGI-rijke regio's hebben specifiek worden gehypermethyleerd, terwijl de repeat-rijke gebieden op grote schaal werden hypomethylated (Figuur 2A; Extra file 2: Afbeelding S6). Methylatie veranderingen in genomische elementen analyseren uitgelijnd we elk element aan het begin en einde plaatsen en vervolgens de verkregen gemiddelde MES op elke respectieve positie. Opvallend gedetecteerd we Hypermethylering in het stroomopwaartse gebied, in het bijzonder van 500 bp stroomopwaarts van de transcriptie startplaats (Figuur 2B). Dit is in overeenstemming met de hypermethylering van promotergebieden frequent waargenomen bij kanker. Figuur 2 Vergelijking van methylatiepatronen in normale en kankerachtige weefsels. (A) Gemiddeld MES curve voor normaal (zwart) en kankerachtige (rood) weefsel in chromosoom 19 (links). De gemiddelde MES voor CGI, gen organen en herhalingen (rechts). (B) DNA methylatie van genen geannoteerd elementen. Elk element (1 kb stroomopwaarts exon, intron en downstream 1 kb) werden verdeeld in 20 bakken en de gemiddelde MES werd verkregen voor elke bin van overeenkomstige elementen. (C) DNA methylatie op transcript uiteinden coderende gebied eindigt. De gemiddelde MES werd verkregen in een glijdende 50 bp venster met de afstand van de transcriptie start (eerste) en einde (tweede) naar CGI-positieve promoters en de transcriptie start (derde) en einde (vierde) voor CGI- positieve promoters. (D) DNA methylatie van totaal 5 'UTR exons (links) en 5' UTR coderende exons (rechts). Ondernemingen De gecentreerd op de transcriptiestartplaats bleek heel andere patronen afhankelijk van de aanwezigheid van een CGI, wat het lage methylatie status van CGI-bevattende promotors (figuur 2C). We vonden ook dat, in kankerweefsel, opmerkelijke hypermethylatie van CGI bevattende promoters optreedt en dat de dichtheid van CpGs is cruciaal voor de verhoging van DNA methylatie (figuur 2C). Om verder te analyseren of 5 'regio's van genen op dezelfde manier werden gehypermethyleerd om gen promoters, checkten we de methylatie patroon van de eerste exons. Interessant, vonden we dat het eerste exon gehypermethyleerd wanneer het het 5'-uiteinde van een coderende exon, maar niet wanneer het een 5 'UTR exon (figuur 2D). Deze regio's bevatten ook hoge CpG dichtheid. Daarom CGI aan het stroomopwaartse gebieden van genen, de promoter en het coderende start lijken de voornaamste doelwitten van DNA hypermethylatie in kanker.
Methyleringspatroon van CpG eilanden Belgique Om de correlatie tussen de locatie CGI verkennen DNA-methylatie, we subgrouped CGI's op basis van hun positie in het genoom. Specifiek, werden ze ingedeeld als 5 '(tussen 1 kb stroomopwaarts en de coderende startplaats van een gen), intragene (intragene CGI buiten het 5' uiteinde) en intergene (in niet-genic gebied) (aanvullende bestandsinformatie 1: tabel S5). Hoewel CpG dichtheid was vergelijkbaar tussen de drie groepen, non-5 'CGI (intragene en intergenisch CGI) waren significant meer gemethyleerd dan 5' CGI (Extra file 2: Figuur S7). We verder ten opzichte van de gemiddelde MES van subgrouped CGI's en vond de methylering van alle CGI werd over het algemeen verhoogd. De relatieve verschil MES suggereerde dat de verandering in methylatie van 5 'CGI significant groter dan voor andere CGI (Figuur 3A), hetgeen de belangrijke rol van 5' CGI bij kanker. De mate van 5'CGI hypermethylering significant gecorreleerd met de overlap van de transcriptie startplaats (Figuur 3B). Figuur 3 DNA methylatie van CpG eilanden. (A) Relatieve differentiële MES van subgrouped CGI. (B) Correlatie tussen differentiële CGI methylatie en de afstand tot de transcriptie start site. (C) Correlatie tussen genexpressie niveau en de hypermethylering van CGI. (D) Methylatiespecifieke PCR van histon-genen met de hoogste differentiële MES waarden. . M1 en U1 overeen met HIST3H2A, terwijl de M2 en U2 komen overeen met HIST3H2B
Om de functies van genen ondergaan differentiële methylatie op 5 'CGI's te verkennen, selecteerden we genen met zeer differentieel CGI MESs (differentiële MES > 1). We vervolgens uitgevoerd (GO) analyse gen ontologie om inzicht te krijgen in de mechanismen die verantwoordelijk zijn bij kanker (tabel 3). Wanneer de genen geclusterd in verschillende categorieën GO, vonden we dat HOX
genclusters en nucleosoom-samenstel gerelateerde genclusters waren doelen voor hypermethylatie, terwijl apoptose-gerelateerde gen clusters waren doelen voor hypomethylering. Interessant is dat onze bevinding dat HOX
genenclusters waren preferentiële targets voor DNA methylatie is consistent met een eerder verslag [40]. Daarnaast gen plots bevestigd dat Hypermethylering was CGI-specifiek bij kanker (Extra file 2: Figuur S8). De veranderingen in expressiepatronen door hypermethylering van 5 'CGI schatten, hebben we een functionele analyse van genexpressie gegevens verkregen van cDNA microarray experimenten. Hypermethylatie van 5 'CGIs was significant gecorreleerd met een neerwaartse regulatie van genen (p
= 0,03) (Figuur 3C; Extra file 3: Table S6 en S7). Dit geeft aan dat silencing door methylering van genen direct worden beïnvloed door de mate van CpG dichtheid en 5 'CGI hypermethylering. We analyseerden het DNA methylatie status van genen met hypermethylated 5 'CGI's en gedownreguleerd expressie patronen. Onder hen was het gen dat codeert voor soort histon H2B 3-B (HIST3H2BB
). Analyse van HIST3H2BB
promoter methylatie middels methylering-specifieke PCR bleek dat de meeste kankerpatiënten (8/10, 80%) vertoonden verhoogde methylatie in het promotorgebied (Figuur 3D) .table 3 Functionele annotatie clustering van genen met hypermethylated 5'CGIs
Annotation Cluster 1
Enrichment Score: 3.27
Count
P_Value
GOTERM_BP_FAT
nucleosoom assemblage
11
3.90E-04
GOTERM_BP_FAT
chromatine assemblage
11
5.20E-04
GOTERM_BP_FAT
eiwit-DNA-complex assemblage
11
7.40E-04
annotatie Cluster 2
Enrichment Score: 2.92
Count
P_Value
Interpro
histon kern
8
6.80E-04
SP_PIR_KEYWORDS
nucleosomen kern
8
8.60E-04
GOTERM_CC_FAT
nucleosomen
8
3.10E-03
annotatie Cluster 3
Enrichment Score: site
17
5.10E-03
INTERPRO
Homeobox
17
5.70E-03
SP_PIR_KEYWORDS
Homeobox
17
5.80E-03
INTERPRO
Homeodomain-related
17
6.40E-03
SMART
HOX
17
1.40E-02
D4
3
9.10E-03
SP_PIR_KEYWORDS
embryo
3
3.30E-02
PIR_SUPERFAMILY
PIRSF002612:homeotic