Identifizierung von DNA-Methylierungs-Änderungen mit menschlichen Magenkrebs
Zusammenfassung assoziiert Methylierungsänderungen DNA-Hintergrund
epigenetische Veränderung der Genexpression ist ein häufiges Ereignis in der menschlichen Krebs. DNA-Methylierung ist ein bekannter epigenetischer Prozess, aber mit Krebs, die genaue Art der epigenetischen Veränderungen, die die Überprüfung wie vor schwierig.
Methoden kaufen Wir die Methylom von menschlichen Magenkrebsgewebe bei 50 bp Auflösung Anreicherung unter Verwendung eines methylierten DNA Profil Technik (methylierte CpG-Assay Insel Recovery) in Kombination mit einem Genome Analyzer und einem neuen Normalisierungsalgorithmus.
Ergebnis einschränken konnten wir einen umfassenden Überblick über Veranstalter zu gewinnen, mit verschiedenen CpG Dichten, einschließlich CpG-Inseln (CGIs), transcript Körper und verschiedene Wiederholungsklassen. Wir fanden, dass Magenkrebs mit hypermethylation of 5 'CGIs und dem 5'-Ende der kodierenden Exons sowie hypomethylation von Wiederholungselementen zugeordnet wurde, wie Kurzstreuten Kernelementen und dem Verbundelement SVA. Hypermethylation of 5 'CGIs war signifikant mit der Herunterregulation assoziierten Genen, wie sie in den HOX
und Histon-Genfamilien korreliert. Wir haben auch Langstrecken epigenetische Silencing (LRES) Regionen in Magenkrebsgewebe entdeckt und identifiziert mehrere hypermethyliert Gene (MDM2
, DYRK2
und LYZ
) innerhalb dieser Regionen. Der Methylierungsstatus von CGIs und Gen-Annotation-Elemente in metastatischen Lymphknoten lag zwischen normalen und Krebsgewebe, was darauf hinweist, dass die Methylierung spezifischer Gene nach und nach in Krebsgewebe erhöht wird.
Schlussfolgerungen
Unsere Erkenntnisse werden wertvolle Daten für künftige Analysen liefern von CpG-Methylierungsmuster, nützliche Marker für die Diagnose von Magenkrebs, sowie eine neue Analysemethode für die klinische epigenomics Untersuchungen.
Hintergrund
Magenkrebs ist die zweithäufigste Ursache von Krebs weltweit nach Lungenkrebs Todesfälle, was in mehr als 800.000 Todesfälle weltweit pro Jahr [1]. Die aktuellen 5-Jahres-Überlebensrate von Patienten mit Magenkrebs diagnostiziert ist nur 20-30%, wobei diese niedrige Rate auf die Tatsache zurückzuführen ist, dass die meisten Fälle sind bereits in einem fortgeschrittenen Stadium, wenn diagnostiziert. Wie bei allen Krebsarten, bleibt die Früherkennung der vielversprechendste Ansatz für die Überlebensrate zu verbessern. Daher wird in menschlichen Magengewebe die Ursache der Tumorentstehung zu verstehen, ist von wesentlicher Bedeutung.
Infektion mit H. pylori
ist eine gut etablierte und häufige Ursache für Magenkrebs. Allerdings sind Veränderungen in verschiedenen genetischen Faktoren auch wichtig, bei Magenkrebsrisiko erhöhen. Es ist bekannt, daß chromosomale Instabilität von genetischen Faktoren wie Mikrosatelliten-Instabilität Ursprung sowie KRAS Karten und p53 führen
Mutationen in der Entwicklung von Tumoren. Mehrere Studien haben genomische Keimbahnmutationen in spezifischen Genen identifiziert [2-4] und Krankheit anfällig loci [5, 6] für Magenkrebs. Jüngste Studien Magenkrebs und normalem Gewebe verglichen haben eine Reihe von genetischen Markern, einschließlich diagnostischer Marker identifiziert [NF2
[7], INHBA
[8], sFRP4
[9]], prognostische Marker [CD9
[10], CDH17
[11], PDCD6
[12]] und Magenkrebs-assoziierte Gene [MUC13
[9], CLDN1
[13], Ki67
und CD34
[14]]. Darüber hinaus haben epigenetische Mechanismen, wie DNA-Methylierung und Histon-Modifikationen gefunden, in der Biologie und Erkrankung des Magen-Darm-Trakt [15].
DNA Methylierung spielt eine wesentliche Rolle in Eukaryoten beteiligt an der Regulation der Expression von Genen, wichtig zu sein, und ist mit einer Reihe von Schlüsselmechanismen, einschließlich genomische Prägung, X-Chromosom-Inaktivierung, Altern und Karzinogenese in Verbindung gebracht. Veränderung der DNA-Methylierung in dem Genom ist in fast allen Krebsarten gefunden und kann zu Veränderungen in der Genexpression, wie beispielsweise die Überexpression von Onkogenen und silencing von Tumorsuppressorgenen während der Krebsentwicklung [16] führen. Mehrere Studien haben gezeigt, daß die Akkumulation von genetischen und epigenetischen Veränderungen in Magen präkanzerösen Läsionen gezeigt, eine große Anzahl von Zielen beeinflussen können, wie beispielsweise DNA-Reparatursystem-Komponenten, Tumorsuppressoren, Onkogene, Zellzyklus-Regulatoren, Wachstumsfaktoren, Adhäsionsmoleküle und [17-20] . Allerdings wurden diese Untersuchungen hauptsächlich auf einige Kandidatengene konzentriert oder nur einen Teil des gesamten Genoms bedeckt. Somit kann bei der Entwicklung von Krebs eine globale Sicht auf die epigenetischen Veränderungen Zugriff assoziiert war schwierig. Insbesondere das Verständnis der DNA-Methylierung Veränderungen in den intragenischen Regionen, CpG-Inseln, intergenischen Regionen, und wiederholen Sequenzen begrenzt bleibt. Folglich gibt es ein großes Interesse an der genomweiten Analyse von veränderter DNA-Methylierung in diesen Regionen.
Für umfassende genomweite Profilierung von DNA-Methylierung in der Embryonalentwicklung und Karzinogenese, hochauflösende Genomsequenzierungsverfahren wie BS-seq [21 -24], MeDIP-seq [25, 26] und MethylCap-seq [27-29] entwickelt wurden. Trotz der rasanten Entwicklung der Sequenzierungs-basierte Mapping-Technologie, ist es immer noch ein Mangel an vergleichenden Forschung, die für klinische Studien von Epigenomics kritisch ist, auch die auf Krebs. Im Gegensatz zu Biochip-basierten Ansätzen, Sequenzierungsdaten werden in einem Format, das nicht zugänglich ist Analyse Differential und die Analyse-Workflow standardisiert worden ist. Daher rechnerisch kostengünstige Normalisierung Methoden benötigt werden, um die Rechenlast der Verarbeitung großformatiger, hochauflösende Sequenzierungsdaten zu verarbeiten.
Hier haben wir ein Normalisierungsalgorithmus, der die Probe spezifische Gesamtlesedichte berücksichtigt, die räumliche Verteilung von CpG-Loci und Hintergrund-Sequenzierung Bias. Wir haben dann ein umfassendes Gesamtgenom-Methylom der normalen Magen-Gewebe, Magenkrebs Gewebe, und metastatischen Lymphknoten die MethylCap-seq-Methode und erhalten detaillierte Informationen über seine Störung während der Karzinogenese und Metastasierung. Dies ist ohne weiteres auf eine vergleichende Analyse der methylomes und andere Arten von epigenomischen Daten, und es hat eine besondere Bedeutung für die klinische epigenomics.
Methoden Magengewebeproben online kaufen Wir erhalten drei schockgefroren Magentumoren und abgestimmt normalen Magengewebe von der Seoul National University College of Medicine für Methylom Studie. Zusätzlich achtundzwanzig angepaßte Paare von normalen und Tumormagengewebe wurden für eine weitere Bestätigung erhalten. Alle Proben wurden durch endoskopische Resektion bei der Untersuchung der Patienten, die ihr Einverständnis gab
methylierter DNA Recovery-Test (MIRA)
genomischer DNA aus 25 mg Magengewebe wurde gereinigt durch DNeasy Blood &. Tissue Kit (Qiagen, Valencia, CA). Genomische DNA-Proben von drei Personen wurden bei der gleichen Konzentration gepoolt. MIRA wurde wie zuvor beschrieben durchgeführt [30-32]. Kurz-GST getaggt MBD2b und wurden mit His-Tag MBD3L1 Proteine wie beschrieben hergestellt. 15 ug genomische DNA wurden zu 100 ~ 500 bp durch Beschallung fragmentiert und mit 28 ug gereinigtem GST-MBD2b Protein, 28 &mgr; g His-MBD3L1 Protein und 7 ug von JM110 Bacterial DNA für 6 Stunden inkubiert. 30 ul von MagneGST Kügelchen (Promega, Madison, WI) vorblockiert mit 7 ug von JM110 bakterielle RNA wurden zugegeben und bei 4 ° C inkubiert in final 600 ul von MIRA-Bindungsreaktionsmischung für 45 Minuten rotiert. Perlen wurden dreimal mit 1 ml Waschpuffer gewaschen und methylierte Fragmente durch 5 Minuten Inkubation bei RT eluiert wurden und dann 56 ° C für 30 Minuten mit 30 ul TE, enthaltend RNase A (100 ug, Qiagen) und Proteinase K ( 15 ug, Qiagen). Die eluierten DNA-Fragmente wurden weiter gereinigt durch Qiaquick PCR-Reinigungs-Kits (Qiagen).
Illumina Genome Analyzer-Sequenzierung
Wir haben 10 ng der eluierten DNA für Illumina Genome Analyzer-Sequenzierung. Nach der Ligation eines Paares von Solexa Adapter, Ligierungsprodukte mit der maximalen Einsatz Größe von 200 bp wurde Gel auf 2% Agarose gereinigt und einer PCR-Amplifikation unterzogen. Cluster Generation und 36 Zyklen der Sequenzierung wurden nach den Anweisungen des Herstellers durchgeführt. Wir sequenzierten 120 &mgr; l-Adapter ligiert, Größe fraktioniert DNA (2 ~ 04.00) auf dem Illumina Genome Analyzer. Sequence Tags wurden mit dem menschlichen Genom (UCSC hg18 Datenbank auf NCBI Build-36.1 Montage basiert) mit der Solexa Analyse Pipeline (Version 0.3.0) abgebildet. Sequenced liest von 34 bp (mit Ausnahme des ersten und letzten Nucleotid), die Qualität geführt Kontrollfilter verwendet wurden.
Datenverarbeitung und MES-Berechnung kaufen Wir 3'-Ende des 200 bp liest 34 bp verlängert DNA abzudecken durch die MBD Proteine gebundenen Fragmente. Die Anzeige wurde auf Browser erweiterbare Daten (BED) Dateien für die Visualisierung im http-Genom-Browser UCSC umgewandelt. //Genom ucsc edu /.. Wir zählten überlappende Sequenz-Tags bei 50 bp Auflösung. Zu angereicherter genomischen Regionen zu finden, der die Anzahl kartiert liest in einem gleitenden Fenster von 1 kb wurde zur Gesamtzahl der im Vergleich liest oder die Hintergrundzahl liest im Genom. Als solches wurde MES auf zwei Arten berechnet werden; ist als log2 (Ziel lesen Zahl /Zielgröße) /(Gesamtlesezählung /Genomgröße) und auf Null platt, die andere als log2 (Ziel lesen Zahl /Zielgröße) ist /(Hintergrund lesen Zahl /Hintergrund Größe) und auf Null platt. Zur Einstellung Befangenheits Hintergrund Sequenzierung wurde MESbg in gleicher Weise für die Eingabe-Sequenzierung berechnet ohne Affinitätsreinigung und subtrahiert von MES.
Genomic Positionen von CGIs, Promoter, transcript Körper, CDSs, und sich wiederholende Elemente
Alle genomischen Positionen CGIs, Abschriften und Wiederholungselemente wurden aus dem UCSC Genom-Browser heruntergeladen. Insgesamt 27.639 CGIs (außer CGIs zufällig), indem den folgenden Kriterien vorhergesagt wurden: GC-Gehalt von 50% oder mehr, die Länge größer als 200 bp, und das Verhältnis größer als 0,6 der beobachteten Anzahl der CpG Dinukleotide der erwarteten Anzahl [33] . Die NCBI mRNA Referenzsequenzen Sammlung (RefSeq von Release-Version 46; 11. März 2011) wurde zur Identifizierung von Transkriptionseinheiten mit dem definierten Transkriptionsstart, Endstellen und CDS starten verwendet, Endstellen. Für Promotoren, verwendeten wir die Region 500 bp stromaufwärts ~ 500 bp stromabwärts von der Transkriptionsstartstelle. Wir erhalten ~ 5 Millionen Wiederholungs Stellen, die durch die RepeatMasker Programm bestimmt worden war, auf der Grundlage der RepBase Bibliothek der Wiederholungen.
Methylierungsgrad von genomischen Elemente
Der Methylierungsgrad eines CGI-Promotor, Gen-Körper, und wiederholen Element überlappende jedes Element wurde mittels MES geschätzt. MES = 0 wurde verwendet unmethylierte Elemente zu definieren. Um Hyper oder Hypomethylierung in der Krebs messen wir die Differential MESs als (- Normal MES Krebs MES) berechnet. Differential MES > 1,0 wurde als Schwellenwert verwendet. Um die Funktionen von ausgewählten Genen zu verstehen, haben wir die Ontologie Klassifikation von Genen durch die DAVID Functional Annotation Clustering-Tool http:.... //David abcc ncifcrf gov /
Genexpressionsanalyse
Die Microarray-Produkt in dieser Studie verwendet wurde Codelink Menschen Whole Genome 55-K-Chip (GE Healthcare, USA). Alle experimentellen Verfahren einschließlich cRNA Zielvorbereitung, Hybridisierung, post-Hybridisierung Farbstoffkopplung wurden mit Lieferanten empfohlenen Protokolle durchgeführt. Die Ergebnisdateien wurden in Genespring GX importiert 7,3 (Agilent Technologies, USA) für die Filterung und grundlegende statistische Analyse. Unter 55 K-Gene auf dem Mikroarray, nur die Gene mit anwesendem flags in mindestens 50% der Proben wurden für die nachfolgende Analyse ausgewählt. Die Microarray-Daten wurden auf der GEO http hinterlegt. //Www. Ncbi NLM nih gov /geo /(Zugangsnummer GSE33651)
MIRA und Echtzeit-qPCR
MIRA... wurde auf vier zusätzlichen einzelnen Proben durchgeführt. DNA wurde aus dem Überstand gereinigt und überwacht durch qPCR Roche 480 Maschine. Die Sequenzen der verwendeten Primer sind in den weiteren Datei präsentiert. 1: Tabelle S1
Bisulfit-Behandlung, methylierungsspezifische PCR und Pyrosequenzierung kaufen Wir die genomische DNA aus einzelnen Probe isoliert durch eine Qiagen DNeasy Tissue Kit (Qiagen) verwendet. Die Bisulfit-Behandlung wurde die EZ-DNA-Methylierungs-Gold-Kit durchgeführt (Zymo Forschung) nach den Anweisungen des Herstellers. Bisulfit-behandelte DNA wurde bei -80 ° C bis zur weiteren Verwendung gelagert. Die Primer für MSP verwendet wurden mit Methprimer [34] entworfen und werden in den weiteren Datei 1 dargestellt: Tabelle S1. PCR wurde mit HotStarTaq Polymerase (Qiagen) durchgeführt und beinhaltete eine anfängliche Inkubation bei 95 ° C für 15 min, gefolgt von 40 Zyklen von 95 ° C für 1 min, 59ºC für 1 min und 72 ° C für 40 sec, gefolgt von ein Zyklus von 72 ° C für 10 Minuten. MSP-Produkte wurden auf 2% igen Agarosegelen getrennt und durch EtBr-Färbung sichtbar gemacht. Die Pyrosequenzierung Reaktionen wurden automatisch mit einem PSQ 96 System (Pyrosequencing AB) gemäß den Anweisungen des Herstellers durchgeführt. Kurz gesagt, wurde das biotinylierte PCR-Produkt (50 ul) unter Verwendung von Streptavidin-Sepharose-Kügelchen (Amersham Biosciences) gereinigt. Das gereinigte Produkt wurde in die Reagenzienkartusche mit dem Enzym, Substrat und dNTP in dem PSQ96 SNP Reagent Kit (Pyrosequencing AB) enthalten geladen. Die Sequenzierungsprimer für Pyrosequenzierung sind in den weiteren Datei angezeigt. 1: Tabelle S1
Ergebnisse | Bearbeitung von MIRA-seq Methylom Daten kaufen Wir die methylierte DNA durch MIRA (methylierte CpG-Insel Recovery-Test) angereichert, gereinigt und sequenziert, um die DNA der nächsten Generation Sequenzierung. DNA-Methylierungs-Niveaus wurden bestimmt Sequenzierung zählt der entsprechenden Bereiche gelesen Verwendung bei 50 bp Intervallen, wie sie unter Methoden beschrieben. Wir haben DNA-Methylierungs-Karten für die normalen und Krebsmagengewebe. Für jede Probe erhalten wir etwa 10 Millionen Sequenz liest (Zusätzliche Datei 1: Tabelle S2). Jeder Methylom enthielt ~ 140 Millionen CpG liest und deckt ~ 48% aller genomischen CpG Romeren ohne (zusätzliche Datei 1: Tabelle S3). Die durchschnittliche Reichweite von CpG liest in jeder Methylom 4.5X war. Zur Unterstützung der hohen Empfindlichkeit von MIRA, enthaltend genomische Segmente nur ein CpG hatten höhere gelesen Zählwerte als diejenigen ohne CpG (p
Wert = 0), was darauf hindeutet, dass MIRA einzelne CpG Änderungen aufgelöst werden konnte verwenden. Die durchschnittliche Sequenz liest im Verhältnis zu der Anzahl der CpGs innerhalb eines 50-bp-Intervall erhöht, und in der Tat MIRA Abdeckung war nicht gering, auch für Bereiche niedriger Dichte CpG (Zusatzdatei 2: Abbildung S1). Zusammengenommen zeigen diese Ergebnisse, dass MIRA erfolgreich war, eine ausreichende Bruchteil methyliert Regionen in erholt. Wie für die Richtigkeit von MIRA, ~ 99% der MIRA-erfassten Fragmente hatten mindestens eine CpG-Stelle innerhalb ihrer Sequenz, eine niedrige Falscherkennungsrate angibt.
Zur Anreicherung von lokalen Methylierungssignale messen, wir Methylierung Anreicherung Scores berechnet (MESs ) durch einen Lesezählung in einem bestimmten Bereich zu erhalten und dann die Normalisierung für die Gesamtlesezählung (MESt) in der Probe (global Normalisierung) oder die lokale Lesezählung (MESL) in einer benutzerdefinierten Region (lokale Normalisierung zur Steuerung der Durchführung) (siehe Methoden). Dies ermöglicht einen direkten Vergleich von unabhängigen Proben mit unterschiedlichen Lesedichte. Wir führten dann eine logarithmische Transformation der abgeleiteten Punktzahl aus. Neben anderen mathematischen Verdienste hat, bietet dies den Vorteil der Varianz Stabilisierung, insbesondere für hohe Lesezählungen, die oft mit hohen technischen Veränderungen verbunden sind, die erhebliche Verzerrung der Daten einführen.
Wir die statistische Signifikanz der MES bewertet in zwei Wege. Randomisierte MESs wurden durch Permutieren der genomischen Positionen unserer Sequenz liest numerisch erzeugt. Die Hintergrund MES (MESbg) wurde durch Sequenzierung des normalen Genoms ohne Affinitätsreinigung experimentell erhalten. Wie erwartet, ergaben die realen Daten deutlich höhere Anreicherung Scores (Weitere Datei 2: Abbildung S2). Bemerkenswerterweise war MESbg höher als MES aus randomisierten Genome, ein Hinweis darauf, dass allein Hintergrund Sequenzen Anreicherung schaffen kann, wahrscheinlich aufgrund der Chromatin Zugänglichkeit und amplification bias. Im Einklang mit den jüngsten Berichten [35], zeigt dies die Notwendigkeit für eine korrekte Kalibrierung für inhärente Sequenzierung Bias. Deshalb haben wir unser MES mit MESbg normalisiert.
Um die optimale Voraussetzung für die Normalisierung finden, verglichen wir die statistischen Eignung verschiedener Normierungsverfahren. Tag Verteilung entlang des Genoms kann durch die Poisson-Verteilung modelliert werden [36, 37]. Die Güte der Anpassung wurde mit dem Kolmogorov-Smirnov-Test getestet. In diesem Test zeigt eine niedrige D-Statistik eine gute Passform. Während die Poisson-Modell die Gaußsche insgesamt übertrafen zeigten die MES eine bessere Passform als rohe Lesezählungen (Weitere Datei 2: Abbildung S3), das seltene Ereignis der Natur des Log-skalierten Lesezählung Maßnahme darstellt. Die normalisierten MESL durch den Steuerungsablauf kalibriert (MESbg) ergab sogar bessere Ergebnisse als normalisierte MESt durch den Steuerungsablauf kalibriert (MESbg).
Globale und chromosomale Ansichten von DNA-Methylierung
Nach der besten Methode für das Scoring genomweiten Methylierungsniveaus bestätigt bei 50-bp Abständen untersuchten wir zunächst die chromosomale Methylierungsmuster von normalen Proben. Die durchschnittlichen MES für jedes Chromosom berechnet vorgeschlagen, dass CpG-rich und Gen-reiche Chromosomen neigen stark methyliert (1A) werden. Die Methylierungsstufen Chromosomen mit großen Mengen an langen setzt Kernelemente (Linien) waren relativ niedrig (z.B. Chromosom 4). Interessanterweise war die Menge an kurzen streuten Kernelemente (SINEs) proportional zu dem Chromosom Methylierungsmuster. Dies wird wahrscheinlich durch die Tatsache verursacht, dass SINEs werden typischerweise in Gen-reichen Regionen geclustert. Geschlechtschromosomen wurden weltweit mit niedriger Dichte CpG und höheren Wiederholungsgehalt als Autosomen hypomethyliert. Da wir das Gewebe von einem männlichen in diesem Experiment genommen verwendet, beobachtet die globale Hypomethylierung des X-Chromosoms ist nicht mit X-Inaktivierung verbunden. Chromosome weite Ansichten rekapituliert hohe CpG Dichte und eine hohe Methylierung um Gen-reichen (siehe schwarze Balken an der Unterseite) und CGI-reichen Regionen (siehe blaue Balken am oberen Rand) (1B). Im Gegensatz dazu waren niedrige CpG Dichte und geringer Methylierung um Gen-armen Regionen beobachtet, die in Langstrecken wiederholt reich waren (> 1 kb) (siehe rote Balken oben). Die durchschnittlichen MES legt nahe, dass der Methylierungsgrad von CGIs ist wesentlich höher als die von genen Regionen oder Repeats (1B). Abbildung 1 Methylierungsmuster der normalen Magen-Gewebe. (A) Chromosome weiten Durchschnitt MES wird in Abhängigkeit von der durchschnittlichen CpG Dichte, Gendichte (die Anzahl von Genen pro Mb), LINE Menge (die Länge der Linie pro Mb) und SINE Menge (die Länge von SINE gezeigt pro Mb) für jedes Chromosom. (B) für das Chromosom 22, die durchschnittliche CpG Dichte (grau schattiert) und MES (schwarze Kurve) wurden in 1-MB-Schiebefenster erhalten. Die Positionen der transkribierten Genen (schwarze Balken am unteren Rand), CG Inseln (blaue Balken am oberen Rand), und lange wiederholt (> 1 kb; roten Balken oben) verglichen werden vor dem Hintergrund der DNA-Methylierung und CpG-Dichte ( links). Die durchschnittliche MES für CGIs, Gen Körper und wiederholt (rechts). (C) Die Verteilung der Gen Körper und CGI-MES (links). Die durchschnittlichen MES für Promotor-assoziierten Promotor und unabhängige CGIs ist rechts gezeigt. (D) Die durchschnittlichen MES für Promoter Untergruppen auf der Grundlage der Existenz von CGI (links). (E) Grundlegende Informationen über intergenic, exonische und Intron-Regionen, nach Länge, CpG-Nummer und abgebildet liest (links). Die Verteilung der intergenischen, exonische und intro MESs ist rechts gezeigt. (F) Grundinformationen auf dem vorgelagerten 1-kb-Region, 5'-UTR Exons, Exons, 3 'UTR Exons und nachgeschaltete 1-kb-Region nach Länge, CpG-Nummer und abgebildet liest (links). Die Verteilung der MES für jedes Element auf der rechten Seite dargestellt ist.
Im Allgemeinen neigen CGIs Methylierung frei in normalem Gewebe zu bleiben. Um die hohen Methylierungsmuster von CGIs analysieren, überprüfen wir die durchschnittliche MES Verteilung und fand eine leicht bimodale Muster (Abbildung 1C). Über 66% (11.376 /17.284) von CGIs in der linken Spitze überlappt mit einem Promotor (1 kb nach unserer Definition). Im Gegensatz dazu 13% (1.386 /10.357) von CGIs in der rechten Peak überlappt mit einem Promotor, was darauf hindeutet, dass die meisten Promotor-assoziierten CGIs unmethyliert sind. Im Gegensatz zu Promotor bezogenen CGIs, Promoter unabhängige CGIs waren stark methyliert (1C). Obwohl die meisten CGI-positiven Promotoren nicht methyliert wurden, CGI-negativen Promotoren zeigten relativ hohe Methylierungsniveaus (Abbildung 1D). Wir überprüften auch die Methylierungsgrad von Promotoren durch CpG-Dichte wie vorstehend definiert ist [38] (Zusätzliche Datei 3: Tabelle S4). Das Methylierungsmuster von Promotoren wurde umgekehrt zu CpG Dichte bezogen (Weitere Datei 2: Abbildung S4). Auf der anderen Seite, CGI-enthaltende Gen Körper hatten höhere Methylierungsstufen als solche ohne CGIs (Abbildung 1D).
Als nächstes wir Methylierungsmuster Anreicherung an verschiedenen kommentierten genomischen Elemente analysiert Regionen zu erkunden, die bevorzugt methyliert. Genen Regionen besetzen etwa 40% des menschlichen Genoms, aber etwa 53% der Gesamt liest, ist in diesem Bereich, wobei die Mehrzahl der Lesevorgänge in dem Intron-Bereich (Tabelle 1) angeordnet ist. Obwohl ein großer Teil der methylierten Fragmente innerhalb Intronregionen fallen, ist das Verhältnis von kartiert liest der Länge der Exons erheblich höher als die für Introns was darauf hindeutet, dass die Exons höher methyliert sind als Introns (Figur 1E). Innerhalb von Gen-assoziierter Regionen ist die Anreicherung der kodierenden Exons sogar höher als die der anderen Regionen, wie früher berichtet (1F und Tabelle 2) [39]. Dies legt nahe, dass die Methylierung eine Rolle in Exon regulation.Table 1 menschliche Genom und die normale Probe Informationen gene und Zwischengenregion spielt
Human Genome Informationen
Normale Probeninformationen Relative Anreicherungsverhältnis
Functional Kategorie
Länge (bp)
Verhältnis
# CpG
Verhältnis
Liest
Verhältnis
vs. Länge
vs. CpG Count
Genic
1,184,139,094
39.46
13,262,253
47.09
20,854,434
53.25
1.35
1.13
Exon
68,035,894
2.27
1,808,089
6.42
4,350,405
11.11
4.90
1.73
Intron
1,122,817,725
37.41
11,613,113
41.23
17,358,273
44.32
1.18
1.07
Intergenic
1,816,976,186
60.54
14,901,610
52.91
18,310,273
46.75
0.77
0.88
Human Genom
3001115280
100
28.163.863
100
39.164.707
100
1,00
1,00
Tabelle 2 menschliche Genom und die normale Probe Informationen von Gen kommentierten Regionen
Human Genome Informationen
normale Probe Informationen
Relative Anreicherungsverhältnis
Funktionelle Kategorie
Länge (bp)
Verhältnis
# CpG
Verhältnis
Liest
Verhältnis
vs. Länge
vs. CpG Count
Upstream 1 kb
24.468.069
0,82
937.748
3,33
535.593
1,37
1,68
0,41
5'UTR Exons
8.436.529
0,28
411.563
1,46
292.654
0.75
2,66
0,51
Exons
33.384.619
1,11
1077913
3,83
3.448.755
8,81
7,92
2,30
3'UTR Exons
28.387.978
0,95
378.012
1,34
806.832
2,06
2,18
1,53
Downstream 1 kb
23.136.263
0,77
340.866
1,21
551.071
1,41
1,83
1,16
Menschen Genom
3001115280
100
28.163.863
100
39.164.707
100
1,00
1,00
Veränderungen in der DNA-Methylierungsmuster im Zusammenhang mit Magenkrebs
Wenn die durchschnittliche chromosomalen MES des Krebses Methyloms wurde im Vergleich zu der Kontrollgewebe, fanden wir, dass alle Chromosomen in dem Krebsgewebe zu hypomethyliert neigten (Zusatzdatei 2: Abbildung S5). Mit Chromosom-weiten Blick, CGI reichen Regionen gefunden wurden speziell hypermethyliert werden, während Wiederholung reichen Regionen wurden weit hypomethyliert (2A; Weitere Datei 2: Abbildung S6). Um Methylierung Veränderungen in der genomischen Elemente analysieren, ausgerichtet wir jedes Element an den Start- und Zielseiten und erhalten dann die durchschnittlichen MES an jeder jeweiligen Position. Auffallender entdeckten wir hypermethylation in dem stromaufwärtigen Bereich, insbesondere von 500 bp stromaufwärts der Transkriptionsstartstelle (2B). Dies ist in Übereinstimmung mit der Hypermethylierung von Promotorregionen häufig in Krebs beobachtet. Abbildung 2: Vergleich von Methylierungsmustern in normalen und Krebsgewebe. (A) Durchschnittliche MES-Kurve für normal (schwarz) und bösartig (rot) Gewebe in Chromosom 19 (links). Die durchschnittliche MES für CGIs, Gen Körper und Wiederholungen (rechts). (B) DNA-Methylierung von Gen-Elemente kommentiert. Jedes Element (upstream 1 kb, Exon, Intron, und Downstream 1 kb) wurden in 20 Bins aufgeteilt und die durchschnittliche MES wurde für jeden Behälter aller entsprechenden Elemente erhalten. (C) DNA Methylierung an Transkript Enden und Enden Region Codierung. Die durchschnittliche MES wurde in einem gleitenden 50-bp Fenster nach seiner Entfernung aus dem Protokoll Anfang (erste) und Ende (zweiten) für CGI-positiven Promotoren sowie das Transkript Start (dritten) und Ende (vierte) für CGI- erhalten positive Veranstalter. (D) der DNA-Methylierung von insgesamt 5 'UTR Exons (links) und 5'-UTR codierende Exons (rechts).
Der Bereich an der Transkriptionsstartstelle zentriert zeigte völlig unterschiedliche Muster in Abhängigkeit von der Anwesenheit eines CGI, was auf die geringe Methylierungsstatus von CGI-enthaltenden Promotoren (2C). Wir fanden auch, dass in Krebsgewebe, bemerkenswerte hypermethylation of CGI-enthaltenden Promotoren auftritt, und daß die Dichte der CpGs ist entscheidend für die Erhöhung der DNA-Methylierung (Abbildung 2C). Zur weiteren ob Regionen von Genen "5 Analyse wurden ähnlich Genpromotern hypermethyliert, überprüften wir das Methylierungsmuster der ersten Exons. Interessanterweise fanden wir, dass das erste Exon nur hypermethyliert wurde, wenn es das 5'-Ende einer codierenden Exon war, aber nicht, wenn es eine 5 'UTR war Exon (Figur 2D). Diese Regionen enthalten auch hohe CpG Dichte. Daher CGIs an den stromaufwärtigen Regionen von Genen, dem Promotor und der kodierenden Beginn werden die Hauptziele von DNA hypermethylation in Krebs.
Methylierungsmuster CpG islands
Um die Korrelation zwischen der Lage von CGIs erkunden und DNA Methylierung, subgrouped wir CGIs entsprechend ihrer Position innerhalb des Genoms. Insbesondere wurden sie als 5 '(zwischen 1 kb stromaufwärts und der Codierungsstartstelle eines Gens), intragenic (intragenic CGIs außerhalb der 5'-kategorisierten Ende) und intergenischen (befindet sich in nicht-gene Region) (Weitere Datei 1: Tabelle S5). Obwohl CpG Dichte zwischen den drei Gruppen ähnlich war, non-5 'CGIs (intragenischen und intergenic CGIs) waren signifikant methylierte als 5' CGIs (Zusätzliche Datei 2: Abbildung S7). Wir verglichen weiter die durchschnittlichen MES von subgrouped CGIs und fand die Methylierung aller CGIs im Allgemeinen erhöht. Jedoch schlug die relative Differential MES, dass die Änderung der Methylierung in 5 'CGIs als signifikant größer war für andere CGIs (3A), die wichtige Rolle von 5 reflektieren' CGIs in der Krebstherapie. Das Ausmaß der 5'-CGI hypermethylation signifikant mit der Überlappung der Transkriptionsstartstelle (3B) korreliert. Abbildung 3: DNA-Methylierung von CpG-Inseln. (A) Relative Differential MES von subgrouped CGIs. (B) Die Korrelation zwischen Differential CGI-Methylierung und die Entfernung zu der Transkriptionsstartstelle. (C) Zusammenhang zwischen Genexpression Ebene und der Hyper von CGIs. (D) Methylierungs-spezifische PCR von Histon-Gene, die die höchsten Differenz MES-Werte zeigt. . M1 und U1 bis HIST3H2A entsprechen, während M2 und U2 bis HIST3H2B entsprechen
Um die Funktionen von Genen unterziehen Differential-Methylierung bei 5 'CGIs erkunden, wir Gene, die mit hochdifferenzierten CGI MESs ausgewählt (Differential MES > 1). Wir führten dann Gene Ontology (GO) Analyse Einblick in die Mechanismen der Krebs verantwortlich zu gewinnen (Tabelle 3). Wenn die Gene in verschiedene Kategorien gruppierte GO wurden, fanden wir, daß HOX
Gencluster und Nukleosomen montagebedingte Gencluster Ziele für hypermethylation waren, während der Apoptose-verwandten Gencluster Ziele für hypomethylation waren. Interessanterweise unsere Erkenntnis, dass HOX
Gencluster bevorzugte Ziele für die DNA-Methylierung waren konsistent mit einem früheren Bericht [40]. Darüber hinaus bestätigte Gen Plots, dass Hypermethylierung war CGI-spezifische in der Krebstherapie (zusätzliche Datei 2: Abbildung S8). Um die Änderungen in Expressionsmuster durch hypermethylation of 5 'CGIs abzuschätzen, führten wir eine funktionelle Analyse von Genexpressionsdaten, erhalten von cDNA-Mikroarray-Experimenten. Hypermethylation von 5 'CGIs war signifikant mit Herabregulation von Genen (p
= 0,03) (;: Tabelle S6 und S7 Weitere Datei 3 3C) korreliert. Dies zeigt, dass der Gene durch Methylierung Silencing kann direkt durch den Grad der CpG Dichte und 5 'CGI hypermethylation berührt. Wir analysierten die DNA-Methylierungsstatus von Genen mit hypermethylated 5 'CGIs und downregulated Expressionsmuster. Unter diesen war das Gen, das für Histon-H2B-Typ 3-B (HIST3H2BB
). Analyse HIST3H2BB
Promotormethylierung methylierungsspezifische PCR zeigten, dass die meisten Krebspatienten (8/10, 80%) erhöhte Methylierung in der Promotorregion (Figur 3D) zeigte .Tabelle 3 Functional Annotation clustering von Genen mit hypermethylated 5'CGIs
Annotation Cluster 1
Enrichment Score: 3,27
Graf
P_Value
GOTERM_BP_FAT
Nukleosomen Montage
11
3.90E-04
GOTERM_BP_FAT
Chromatin
11
5.20E-04
GOTERM_BP_FAT
Protein-DNA-Komplex Montage
11
7.40E-04
Annotation Cluster 2
Enrichment Score: 2,92
Graf
P_Value
Interpro
Histone Kern
8 6.80E-04
SP_PIR_KEYWORDS
Nucleosom
8 8.60E-04
GOTERM_CC_FAT
Nukleosomen
8 3.10E-03
Annotation Cluster 3
Enrichment Score: site
17
5.10E-03
INTERPRO
Homeobox
17
5.70E-03
SP_PIR_KEYWORDS
Homeobox
17
5.80E-03
INTERPRO
Homeodomain-related
17
6.40E-03
SMART
HOX
17
1.40E-02
D4
3
9.10E-03
SP_PIR_KEYWORDS
embryo
3
3.30E-02
PIR_SUPERFAMILY
PIRSF002612:homeotic