Stomach Health > Estomac Santé >  > Stomach Knowledges > Recherches

Identification des changements de méthylation d'ADN associés au cancer gastrique humaine

Identification des changements de méthylation d'ADN associés au cancer gastrique humaine
Résumé de l'arrière-plan
épigénétique altération de l'expression des gènes est un événement commun dans le cancer humain. Méthylation de l'ADN est un processus épigénétique bien connu, mais de vérifier la nature exacte des changements épigénétiques associés au cancer reste difficile.
Méthodes
Nous profilées l'méthylome du tissu du cancer gastrique humaine à une résolution de 50 pb en utilisant un enrichissement de l'ADN méthylé technique (méthylé CpG d'essai de récupération de l'île) en combinaison avec un analyseur de génome et un nouvel algorithme de normalisation.: Résultats
Nous avons été en mesure d'obtenir une vue d'ensemble des promoteurs avec différentes densités CpG, y compris les îles CpG (CGIs), transcription organismes et différentes classes de répétition. Nous avons constaté que le cancer gastrique a été associée à une hyperméthylation de 5 'et le CGI extrémité 5 exons codants, ainsi que l'hypométhylation d'éléments répétitifs, tels que des éléments nucléaires entrecoupées de courtes et l'élément SVA composite. Hyperméthylation 5 'CGI était significativement corrélée avec la régulation négative des gènes associés, tels que ceux dans les HOX et
gène d'histone familles. Nous avons aussi découvert silencing épigénétique (LRES) régions à longue portée dans les tissus du cancer gastrique et identifié plusieurs gènes hyperméthylés (MDM2 de
, DYRK2
et LYZ
) dans ces régions. Le statut de méthylation d'éléments CGIs et d'annotation des gènes dans les ganglions lymphatiques métastatiques était intermédiaire entre les tissus normaux et cancéreux, ce qui indique que la méthylation de gènes spécifiques est progressivement augmentée dans le tissu cancéreux. De Conclusions
Nos résultats fourniront des données précieuses pour une analyse future des motifs CpG de méthylation, des marqueurs utiles pour le diagnostic de cancer de l'estomac, ainsi que d'une nouvelle méthode d'analyse pour épigénomique cliniques investigations.
Contexte
le cancer gastrique est la deuxième cause de décès par cancer dans le monde après le cancer du poumon, ce qui entraîne plus de 800.000 décès dans le monde chaque année [1]. Le taux de survie à 5 ans actuelle des individus diagnostiqués avec le cancer de l'estomac est seulement 20-30%, avec ce faible taux étant attribuable au fait que la plupart des cas sont déjà à un stade avancé au moment du diagnostic. Comme dans tous les cancers, le dépistage précoce reste l'approche la plus prometteuse pour améliorer le taux de survie. Par conséquent, la compréhension de la cause de la tumorigenèse dans le tissu gastrique humain est essentiel.
L'infection par H. pylori
est une cause bien établie et commune de cancer gastrique. Cependant, des modifications de divers facteurs génétiques sont également importants dans l'augmentation du risque de cancer de l'estomac. Il est bien connu que l'instabilité chromosomique provenant de facteurs génétiques tels que l'instabilité des microsatellites ainsi que KRAS
et p53
mutations se traduire par le développement de tumeurs. Plusieurs études génomiques ont identifié des mutations germinales dans les gènes spécifiques [2-4] et les maladies loci sensibles [5, 6] pour le cancer gastrique. Des études récentes comparant le cancer gastrique et les tissus normaux ont identifié un certain nombre de marqueurs génétiques, y compris les marqueurs de diagnostic [NF2
[7], [8], SFRP4
[9] de INHBA], marqueurs pronostiques [CD9
[10], [11], PDCD6
[12]], et les gènes associés au cancer gastrique de CDH17 [[9
MUC13], CLDN1
[13], Ki67
et CD34
[14]]. En outre, les mécanismes épigénétiques telles que la méthylation de l'ADN et des histones modifications ont été jugés importants dans la régulation de l'expression des gènes impliqués dans la biologie et de la maladie du tractus gastro-intestinal [15].
Méthylation de l'ADN joue un rôle essentiel dans les eucaryotes et est associée à un certain nombre de mécanismes clés, y compris l'empreinte génomique, l'inactivation du chromosome X, le vieillissement et la cancérogenèse. Altération de méthylation de l'ADN dans le génome se trouve dans presque tous les types de cancer et peut conduire à des changements dans l'expression génique, tels que la surexpression d'oncogènes et le silençage de gènes suppresseurs de tumeur au cours du développement du cancer [16]. Plusieurs études ont montré que l'accumulation d'altérations génétiques et épigénétiques dans les lésions pré-cancéreuses gastriques peuvent affecter un grand nombre de cibles, telles que des composants de réparation d'ADN du système, les gènes suppresseurs de tumeur, des oncogènes, des régulateurs du cycle cellulaire, des facteurs de croissance et des molécules d'adhésion [17-20] . Toutefois, ces études ont été principalement axés sur un petit nombre de gènes candidats ou ne couvre qu'une partie de l'ensemble du génome. Ainsi, l'accès à une vision globale des changements épigénétiques associés au développement du cancer a été difficile. En particulier, la compréhension des changements de méthylation d'ADN dans les régions intragéniques, îlots CpG, régions intergéniques, et répéter des séquences reste limitée. Par conséquent, il y a un grand intérêt pour l'analyse du génome entier d'aberrant de méthylation de l'ADN dans ces régions.
Pour complète profilage du génome échelle de méthylation de l'ADN dans l'embryogenèse et la carcinogenèse, entiers à haute résolution des méthodes de séquençage du génome tels que BS-seq [21 -24], MeDIP-seq [25, 26], et MethylCap-seq [27-29] ont été développés. Malgré le développement rapide de la technologie de cartographie sur le séquençage, il y a encore un manque de recherche comparative, ce qui est essentiel pour les études épigénomique cliniques, y compris ceux qui sont axés sur le cancer. Contrairement aux approches à base de puces à ADN, les données de séquençage sont produites dans un format qui ne se prête pas à une différence de l'analyse, et l'analyse de travail n'a pas été normalisées. Par conséquent, les méthodes de normalisation des calculs peu coûteux sont nécessaires pour gérer la charge de calcul du traitement de grande taille, les données de séquençage à haute résolution.
Ici, nous avons introduit un algorithme de normalisation, qui prend en compte la densité de lecture spécifique totale-échantillon, le spatial distribution de CpG loci, et le biais de séquençage de l'arrière-plan. Nous avons ensuite créé un génome entier complet méthylome du tissu normal gastrique, un tissu de cancer gastrique, et les ganglions lymphatiques métastatiques en utilisant la méthode MethylCap-seq et obtenu des informations détaillées sur la perturbation pendant la carcinogenèse et les métastases. Ceci est facilement applicable à une analyse comparative des methylomes et d'autres types de données épigénomiques, et il a des implications particulières pour epigenomics cliniques.
Méthodes
échantillons de tissus gastriques
Nous avons obtenu trois tumeurs gastriques mousquetons congelés et appariés normale tissu gastrique de Séoul College Université nationale de médecine pour l'étude de méthylome. En outre, vingt-huit paires de tissus de l'estomac normales et tumorales ont été obtenues pour une confirmation supplémentaire. Tous les échantillons ont été obtenus par résection endoscopique lors de l'examen des patients qui ont donné leur consentement éclairé
méthylé test de récupération d'ADN (MIRA)
de l'ADN génomique de 25 mg de tissu gastrique a été purifié en utilisant DNeasy Blood &. Kit Tissue (Qiagen, Valencia, CA). Des échantillons d'ADN génomique à partir de 3 individus ont été réunies à la même concentration. MIRA a été effectuée comme décrit précédemment [30-32]. En bref, la TPS-étiqueté MBD2b et marquage His protéines MBD3L1 ont été préparées comme décrit. 15 ug d'ADN génomique a été fragmentée à 100 ~ 500 pb par sonication et mis en incubation avec 28 pg de protéine purifiée GST-MBD2b, 28 ug de protéine His-MBD3L1 et 7 ug d'ADN bactérien JM110 pendant 6 heures. 30 ul de billes MagneGST (Promega, Madison, WI) avec prébloquées 7 pg d'ARN bactérienne JM110 ont été ajoutés et mis à incuber à 4 ° C avec la rotation pendant 45 minutes dans 600 ul finale de liant MIRA mélange réactionnel. Les billes ont été lavées trois fois avec 1 ml de tampon de lavage, et les fragments méthylés ont été éluées par incubation à température ambiante pendant 5 minutes puis 56 ° C pendant 30 minutes avec 30 ul de TE contenant de la RNase A (100 ug, Qiagen) et de la proteinase K ( 15 ug, Qiagen). Les fragments d'ADN élues ont été encore purifiés en utilisant des kits de purification PCR Qiaquick (Qiagen). Le plus séquençage du génome Illumina analyseur
Nous avons utilisé 10 ng d'ADN élué pour le séquençage du génome Illumina analyseur. Après la ligature d'une paire d'adaptateurs Solexa, les produits de ligature avec la taille maximale de l'insert de 200 pb ont été purifiés sur gel d'agarose à 2% et soumis à une amplification par PCR. génération Cluster et 36 cycles de séquençage ont été réalisées en suivant les instructions du fabricant. Nous avons séquencé 120 ul d'ADN de taille fractionnés adaptateur ligaturé (2 ~ 16 heures) sur le génome Illumina Analyzer. étiquettes de séquence ont été cartographiés à la (base de données de hg18 UCSC basé sur NCBI Construire ensemble 36.1) du génome humain en utilisant le Solexa Pipeline Analysis (version 0.3.0). Séquencée lit de 34 pb (à l'exception du premier et dernier nucléotide) qui passent les filtres de contrôle de qualité ont été utilisés. Le traitement
des données et le calcul MES
Nous avons étendu l'extrémité 3 'du 34 pb lit de 200 pb pour couvrir l'ADN fragments liés par les protéines MBD. La lecture a été converti en navigateur extensibles données (BED) pour la visualisation des fichiers dans le navigateur UCSC du génome http:. //Génome UCSC edu /.. Nous avons compté des marqueurs de séquences qui se chevauchent à une résolution de 50 pb. Pour trouver des régions génomiques enrichies, le nombre de mappé lit dans une fenêtre glissante de 1 kb a été comparé au nombre total de lit ou le nombre de fond se lit dans le génome. En tant que tel, MES a été calculé de deux façons; on est comme log2 de (lire la taille compte /cible cible) /(nombre de lecture total /taille du génome) et parqueté à zéro, l'autre est que le log2 de (lire la taille compte /cible cible) /(fond lire count /fond taille) et terrassé à zéro. Pour régler pour le biais de séquençage de l'arrière-plan, MESbg a été calculé de la même manière pour le séquençage d'entrée sans purification par affinité et soustraite de MES.
Positions génomiques de CGIs, promoteurs, organismes de transcription, les CDS et les éléments répétitifs
Toutes les positions génomiques CGIs, les transcriptions et les éléments de répétition ont été téléchargés à partir du navigateur de génome UCSC. Un total de 27.639 CGIs (sauf situé au hasard CGIs) ont été prédite par les critères suivants: le contenu GC de 50% ou plus, longueur supérieure à 200 pb, et ratio supérieur à 0,6 nombre observé de dinucléotides CpG au nombre attendu [33] . Le NCBI ARNm séquences de référence collection (RefSeq de version de version 46, 11 Mars 2011) a été utilisé pour identifier les unités de transcription avec le début de transcription défini, les sites finaux et CDS commencent, les sites finaux. Pour les promoteurs, nous avons utilisé la région de 500 pb en amont ~ 500 pb en aval du site d'initiation de la transcription. Nous avons obtenu ~ 5 millions de lieux de répétition qui avaient été déterminées par le programme de RepeatMasker basé sur la bibliothèque RepBase de répétitions.
Niveau des éléments génomiques
Le niveau d'un CGI, promoteur, gène-corps méthylation La méthylation, et répéter l'élément a été estimée au moyen de MES qui se chevauchent chaque élément. MES = 0 a été utilisé pour définir des éléments non méthylés. Pour mesurer hyperméthylation ou hypométhylation dans le cancer, nous avons calculé le MESS différentiel (Cancer MES - Normal MES). Différentiel MES > 1,0 a été utilisé comme seuil. Pour comprendre les fonctions des gènes sélectionnés, nous avons utilisé la classification de l'ontologie des gènes par le DAVID outil fonctionnel Annotation Clustering http:.... //David abcc ncifcrf gov /analyse de l'expression génique
The produit de microréseau utilisé dans cette étude était Codelink Whole Human Genome 55 K puce (GE Healthcare, États-Unis). Toutes les procédures expérimentales, y compris la préparation cible d'ARNc, l'hybridation, le couplage de colorant post-hybridation ont été effectuées en utilisant des protocoles de fournisseurs recommandés. Les fichiers de résultats ont été importés en GeneSpring GX 7.3 (Agilent Technologies, États-Unis) pour le filtrage et l'analyse statistique de base. Parmi les 55 gènes K sur la puce à ADN, seuls les gènes ayant des drapeaux présents dans au moins 50% des échantillons ont été sélectionnés pour une analyse ultérieure. Les données de puces à ADN ont été déposés au http GEO:.. //Www NCBI nlm nih (numéro d'accession GSE33651) gov /geo /
MIRA et en temps réel qPCR de MIRA... a été réalisée sur quatre échantillons individuels supplémentaires. On a purifié l'ADN à partir du surnageant et contrôlé en temps réel par qPCR en utilisant 480 Roche machine. Les séquences des amorces utilisées sont présentées dans le fichier supplémentaire 1:. Tableau S1
traitement bisulfite, PCR spécifique de la méthylation et de pyroséquençage
Nous avons isolé l'ADN génomique de l'échantillon individuel en utilisant un kit de tissus Qiagen DNeasy (Qiagen). traitement au bisulfite a été réalisée en utilisant le kit EZ méthylation de l'ADN de l'or (recherche Zymo) selon les instructions du fabricant. L'ADN traité au bisulfite a été stocké à -80 ° C jusqu'à utilisation ultérieure. Les amorces utilisées pour MSP ont été conçus en utilisant Methprimer [34], et sont présentés dans les fichiers supplémentaires 1: Tableau S1. La PCR a été réalisée avec HotStarTaq Polymerase (Qiagen) et a inclus une incubation initiale à 95 ° C pendant 15 min, puis 40 cycles de 95 ° C pendant 1 min, 59 ° C pendant 1 min et 72 ° C pendant 40 secondes, suivi par un cycle de 72 ° C pendant 10 minutes. produits MSP ont été séparés sur gels à 2% d'agarose et visualisés par coloration ETBR. Les réactions ont été effectuées automatiquement pyroséquençage avec un système SPQ 96 (pyroséquençage AB) selon les instructions du fabricant. En bref, le produit PCR biotinylé (50 ul) a été purifié en utilisant des billes de streptavidine-Sepharose (Amersham Biosciences). Le produit purifié a été chargé dans la cartouche de réactif avec l'enzyme, du substrat et du dNTP inclus dans le kit de réactifs PSQ96 PNS (pyroséquençage AB). Les amorces de séquençage pour pyroséquençage sont présentées dans les fichiers supplémentaires 1:. Résultats de tableau S1
Traitement des MIRA-seq données méthylome
Nous avons purifié l'ADN méthylé enrichie par MIRA (CpG assay de récupération de l'île méthylé) et séquencé le l'ADN en utilisant le séquençage de prochaine génération. les niveaux de méthylation d'ADN ont été déterminées en utilisant le séquençage lu compte des régions correspondantes, à 50 pb des intervalles, comme décrit dans les méthodes. Nous avons créé des cartes de méthylation d'ADN pour les deux tissus gastriques normaux et cancéreux. Pour chaque échantillon, nous avons obtenu environ 10 millions de séquence lit (fichiers supplémentaires 1: Tableau S2). Chaque méthylome contenait ~ 140 millions de CpG lit, couvrant ~ 48% de tous les sites CpG génomiques à l'exclusion des centromères (fichier supplémentaires 1: Tableau S3). La couverture moyenne de CpG se lit dans chaque méthylome était 4,5X. À l'appui de la haute sensibilité du MIRA, segments génomiques ne contenant qu'un seul CpG avaient plus lu compte que ceux qui ne (valeur = 0 p
) CpG, ce qui suggère que les changements CpG simples pourraient être résolus en utilisant MIRA. La séquence moyenne se lit augmenté en proportion du nombre de CpG dans un intervalle de 50 pb, et en fait, la couverture MIRA n'a pas été faible, même pour les régions de faible densité CpG (fichier supplémentaire 2: Figure S1). Pris ensemble, ces résultats montrent que MIRA a réussi à récupérer une fraction suffisante des régions méthylées. En ce qui concerne la précision de MIRA, ~ 99% des fragments MIRA-capturés avait au moins un site CpG dans leur séquence, ce qui indique un taux de fausse détection faible.
Pour mesurer l'enrichissement des signaux de méthylation locaux, nous avons calculé les scores d'enrichissement de méthylation (terriennes ) en obtenant un nombre de lectures dans une région donnée, puis en effectuant une normalisation pour contrôler pour le compte total de lecture (MEST) dans l'échantillon (normalisation mondiale) ou le nombre de lecture locale (MESL) dans une région entourant défini par l'utilisateur (normalisation locale) (voir Méthodes). Cela permet une comparaison directe des échantillons indépendants avec une densité de lecture différente. Nous avons ensuite procédé à une transformation logarithmique de la partition dérivée. En plus d'avoir d'autres mérites mathématiques, cela offre l'avantage de la stabilisation de la variance, en particulier pour nombre élevé de lecture, qui sont souvent couplées avec des variations techniques élevées qui peuvent introduire un biais important dans les données.
Nous avons évalué la signification statistique des MES dans deux façons. Terriennes randomisés ont été générés numériquement en permutant les positions génomiques de notre séquence se lit. Les MES de fond (MESbg) a été expérimentalement obtenues par le séquençage du génome normal sans purification par affinité. Comme prévu, les données réelles ont donné des scores nettement plus élevés (enrichissement de fichiers supplémentaires 2: Figure S2). Notamment, MESbg était plus élevé que MES de génomes aléatoires, une indication que les séquences de fond seuls peuvent créer l'enrichissement, probablement en raison de l'accessibilité de la chromatine et le biais d'amplification. Conformément aux rapports récents [35], cela illustre la nécessité d'un bon étalonnage pour le biais de séquençage inhérente. Par conséquent, nous avons normalisé nos MES avec MESbg.
Pour trouver la condition optimale pour la normalisation, nous avons comparé l'aptitude statistique de diverses méthodes de normalisation. la distribution d'étiquette le long du génome peut être modélisé par la distribution de Poisson [36, 37]. La qualité de l'ajustement a été testée en utilisant le test de Kolmogorov-Smirnov. Dans ce test, une statistique faible D indique un bon ajustement. Alors que le modèle de Poisson a surperformé l'ensemble gaussien, le MES a montré un meilleur ajustement que les chiffres de lecture premières (fichier supplémentaire 2: Figure S3), illustrant la nature des événements rares de la mesure de comptage lu log-échelle. Les MESL normalisées calibrées par séquençage de commande (MESbg) ont donné des résultats encore meilleurs que MEST normalisé calibré par séquençage de commande (MESbg) de. Global et vues chromosomiques de méthylation de l'ADN
Après confirmation de la meilleure méthode pour les niveaux de méthylation du génome à l'échelle de notation à 50 pb des intervalles, nous avons d'abord examiné les motifs chromosomique de méthylation des échantillons normaux. Les MES moyennes calculées pour chaque chromosome suggéré que les chromosomes CpG-riches et riches en gènes ont tendance à être fortement méthylé (figure 1A). Les niveaux de chromosomes avec de grandes quantités d'éléments nucléaires de long intercalées (lignes) de méthylation étaient relativement faibles (par exemple, le chromosome 4). Fait intéressant, la quantité d'éléments nucléaires courtes intercalées (SINE) est proportionnelle à la structure chromosomique de la méthylation. Cela est probablement dû au fait que SINE sont généralement regroupés dans les régions riches en gènes. Les chromosomes sexuels ont été globalement hypométhylée avec faible densité CpG et le contenu de répétition supérieure à autosomes. Étant donné que nous avons utilisé les tissus prélevés à partir d'un mâle dans cette expérience, l'hypométhylation globale du chromosome X observée n'a pas été associée à une inactivation de l'X. vues chromosomiques échelle récapitulées haute densité CpG et de haute méthylation dans les régions riches en gènes (voir barres noires en bas) et CGI riche (voir barres bleues en haut) (figure 1B). En revanche, la faible densité CpG et une faible méthylation ont été observées dans les régions de gènes pauvres qui étaient riches en répétitions à long terme (> 1 kb) (voir barres rouges en haut). Les MES moyennes suggèrent que le niveau de CGIs de méthylation est considérablement plus élevé que celui des régions ou des répétitions (figure 1B) géniques. Figure 1 des motifs de méthylation de tissu gastrique normale. (A) MES moyenne chromosomiques à l'échelle est représentée en fonction de la densité moyenne CpG, la densité du gène (le nombre de gènes par Mb), la quantité de LINE (la longueur de la ligne par Mb), et la quantité SINE (la longueur du SINE par Mb) pour chaque chromosome. (B) Pour le chromosome 22, la densité moyenne CpG (grisée) et MES (courbe noire) ont été obtenus dans des fenêtres coulissantes 1 Mb. Les positions des gènes transcrits (barres noires en bas), les îles CG (barres bleues en haut), et de longues répétitions (> 1 kb; barres rouges sur le dessus) sont comparées dans le contexte de la méthylation de l'ADN et la densité CpG ( à gauche). Les MES moyennes pour CGIs, les organismes de gènes, et des répétitions (à droite). (C) La répartition des organismes de gènes et MES CGI (à gauche). Les MES moyennes pour le promoteur-associé et promoteur indépendant CGIs est montré à droite. (D) Les MES moyennes pour les sous-groupes de promoteurs, en fonction de l'existence de CGI (à gauche). (E) Information de base sur intergénique, exonique et régions introniques, selon la longueur, le nombre CpG, et cartographié lit (à gauche). La répartition des intergénique, exonique et terriennes intronique est indiqué à droite. (F) Les informations de base sur la région de 1 kb en amont, 5 'exons UTR, exons codants, 3' UTR exons et région 1-kb en aval selon la longueur, le nombre CpG et cartographiés lit (à gauche). La distribution du MES pour chaque élément est représenté à droite. Le plus générale, CGIs ont tendance à rester méthylation libre dans les tissus normaux. Pour analyser les modèles haut de méthylation de la CGIS, nous avons vérifié la répartition moyenne MES et trouvé un modèle légèrement bimodale (figure 1C). Environ 66% (11.376 /17.284) de CGIs dans le pic gauche recouverte par un promoteur (1 kb par notre définition). En revanche, 13% (1.386 /10.357) de CGIs dans le bon pic de chevauchement avec un promoteur, ce qui suggère que la plupart CGIs promoteur-associé sont non méthylé. CGIs En revanche au promoteur lié, promoteur indépendant CGIs ont été fortement méthylé (figure 1C). Bien que la plupart des promoteurs de CGI-positives ne sont pas méthylés, les promoteurs de CGI-négatif ont montré des niveaux de méthylation relativement élevés (figure 1D). Nous avons également vérifié le niveau des promoteurs de méthylation par la densité CpG tel que défini précédemment [38] (fichier supplémentaire 3: Tableau S4). Le modèle de méthylation des promoteurs était inversement proportionnelle à la densité CpG (fichier supplémentaire 2: Figure S4). D'autre part, les organismes de gènes contenant CGI avaient des niveaux de méthylation plus élevés que ceux sans CGIs (figure 1D).
Ensuite, nous avons analysé les modèles d'enrichissement de méthylation à divers éléments génomiques annotées pour explorer les régions qui ont été préférentiellement méthylés. les régions géniques occupent environ 40% du génome humain, mais environ 53% du total lit se situe dans cette région, la majorité de lectures étant située dans la région intronique (tableau 1). Bien qu'une proportion importante de fragments méthylés tombent dans les régions introniques, le rapport de tracé lit à la longueur d'exons est nettement supérieur à celui des introns, ce qui suggère que les exons sont plus fortement méthylée que introns (figure 1E). Dans les régions de gènes associées, l'enrichissement des exons codant est encore plus élevé que celui des autres régions comme indiqué précédemment (Figure 1F et tableau 2) [39]. Cela suggère fortement que la méthylation joue un rôle dans l'exon 1 regulation.Table génome humain et de l'information de l'échantillon normal de la région genic et intergénique
Human Genome information
information de l'échantillon normal

Ratio d'enrichissement relatif
Catégorie fonctionnelle
Longueur (pb)
N ° de Ratio
de CpG
Ratio
Reads
Ratio
vs. longueur
vs. CpG Count

Genic
1,184,139,094
39.46
13,262,253
47.09
20,854,434
53.25
1.35
1.13
Exon
68,035,894
2.27
1,808,089
6.42
4,350,405
11.11
4.90
1.73
Intron
1,122,817,725
37.41
11,613,113
41.23
17,358,273
44.32
1.18
1.07
Intergenic
1,816,976,186
60.54
14,901,610
52.91
18,310,273
46.75
0.77
0.88
Human Génome
3001115280
100
28163863
100
39164707
100
1,00
1,00
Tableau 2 Génome humain et de l'information des régions annotées du gène échantillon normal
génome humain information
normal information de l'échantillon

Ratio d'enrichissement relative
Catégorie fonctionnelle
Longueur (pb) du n
Ratio
de CpG
Ratio
Lit

Ratio
vs. longueur
vs. 24468069
0,82
937.748
3.33
535.593
1,37
1,68
0,41
5'UTR exons de CpG comte
amont 1 kb
8436529
0,28
411.563
1,46
292.654
0,75
exons 2,66
0,51
codage
33384619
1.11
1077913
3,83
3448755
8,81
7,92
2,30
3'UTR exons
28387978
0,95
378.012
1,34
806.832
2.06
2.18
1,53
aval 1 kb
23136263
0,77
340.866
1.21
551.071
1,41
1,83
1.16
humain 3001115280
100
28163863
100
39164707
100
1,00
1,00
changements de génomique dans les profils de méthylation d'ADN associées à un cancer gastrique
Lorsque le MES chromosomiques moyenne de la méthylome du cancer a été comparée à celle d'un tissu de contrôle, nous avons constaté que tous les chromosomes dans le tissu du cancer ont tendance à être hypométhylés (fichier supplémentaire 2: Figure S5). Avec des vues chromosomiques à l'échelle, les régions CGI riches se sont révélés être spécifiquement hyperméthylé, tandis que les régions de répétition riches ont été largement hypométhylée (figure 2A; Fichier supplémentaire 2: Figure S6). Pour analyser les changements de méthylation dans des éléments génomiques, nous avons aligné chaque élément sur les sites de début et de fin, puis obtenu le MES moyenne à chaque position respective. Étonnamment, nous avons détecté une hyperméthylation dans la région en amont, en particulier de 500 pb en amont du site d'initiation de la transcription (figure 2B). Ceci est en accord avec l'hyperméthylation des régions de promoteur fréquemment observée dans le cancer. Figure 2: Comparaison des modèles de méthylation dans les tissus normaux et cancéreux. courbe (A) Moyenne MES pour la normale (noir) et cancéreuses (rouge) tissu dans le chromosome 19 (à gauche). Les MES moyennes pour CGIs, les organismes de gènes, et des répétitions (à droite). (B) méthylation de l'ADN des éléments de gènes annotés. Chaque élément (en amont 1 kb, exon, intron, et en aval de 1 kb) ont été divisées en 20 bacs et les MES moyennes ont été obtenues pour chaque bac de tous les éléments correspondants. (C) la méthylation de l'ADN aux extrémités de la transcription et le codage des extrémités de la région. Les MES moyennes ont été obtenues dans une fenêtre de 50 pb de glissement en fonction de sa distance depuis le début de la transcription (en premier) et à la fin (seconde) pour les promoteurs de CGI-positifs, ainsi que le début de la transcription (troisième) et à la fin (quatrième) pour CGI- promoteurs positifs. (D) méthylation de l'ADN du total 5 'exons UTR (gauche) et 5' UTR exons codants (à droite).
La région centrée sur le site de début de transcription a montré complètement différents modèles en fonction de la présence d'un CGI, ce qui reflète le faible l'état de méthylation de promoteurs contenant CGI (figure 2C). Nous avons également constaté que, dans les tissus cancéreux, remarquable hyperméthylation de promoteurs contenant CGI se produit et que la densité des CpG est crucial pour l'augmentation de la méthylation de l'ADN (figure 2C). Afin d'analyser plus précisément si les régions 5 'des gènes ont été hyperméthylés de manière similaire à des promoteurs de gènes, nous avons vérifié le schéma de méthylation des premiers exons. Chose intéressante, on a trouvé que le premier exon était hyperméthylé seulement quand il est l'extrémité 5 'd'un exon de codage, mais pas quand il était UTR exon 5 (figure 2D). Ces régions contiennent également une forte densité CpG. Par conséquent, CGIs dans les régions en amont des gènes, le promoteur et le début de codage semblent être les principales cibles de l'ADN hyperméthylation dans le cancer.
Motif de méthylation de CpG îles
Pour explorer la corrélation entre l'emplacement de CGIs et méthylation de l'ADN, nous avons sous-groupes en CGIs selon leur position dans le génome. Plus précisément, ils ont été classés comme 5 '(situé entre 1 kb en amont et le site de départ de codage d'un gène), intragénique (intragenic CGIs extérieur l'extrémité 5'), et intergénique (situé dans la région non-géniques) (fichier supplémentaire 1: tableau S5). Bien que la densité CpG était similaire entre les trois groupes, non-5 'CGIs (intragénique et intergénique CGIs) étaient significativement plus méthylé que 5' CGIs (fichier supplémentaire 2: Figure S7). Nous avons comparé encore les MES moyennes des sous-groupes en CGIs et avons trouvé la méthylation de tous les CGIs était généralement augmenté. Cependant, l'écart par rapport MES suggéré que le changement de la méthylation dans 5 'CGIs était significativement supérieure à celle d'autres CGIs (figure 3A), ce qui reflète le rôle important des 5' CGIs dans le cancer. L'étendue de la 5 CGI hyperméthylation en corrélation significative avec le chevauchement du site d'initiation de la transcription (figure 3B). Figure 3 méthylation de l'ADN des îlots CpG. (A) MES différentielles relatives des sous-groupes en CGIs. (B) La corrélation entre la méthylation différentielle de CGI et la distance du site d'initiation de la transcription. (C) Corrélation entre le niveau d'expression des gènes et l'hyperméthylation des CGIs. (D) par PCR des gènes histones montrant les valeurs les plus élevées MES différentielles spécifiques méthylation. . M1 et U1 correspondent à HIST3H2A, tandis que M2 et U2 correspondent à HIST3H2B
Pour explorer les fonctions des gènes subissant une méthylation différentielle à 5 'CGIs, nous avons sélectionné des gènes avec terriennes CGI hautement différentiel (différentiel MES > 1). Nous avons ensuite procédé à l'ontologie (GO) analyse du gène afin de mieux comprendre les mécanismes responsables du cancer (tableau 3). Lorsque les gènes ont été regroupés en différentes catégories de GO, nous avons constaté que les groupes de gènes de HOX et nucléosomes groupes de gènes liés à l'assemblage de cibles étaient pour hypermethylation, tandis que des groupes de gènes liés à l'apoptose étaient des cibles pour hypométhylation. Fait intéressant, nous avons constaté que les groupes de gènes de HOX étaient des cibles préférentielles pour méthylation de l'ADN est compatible avec un précédent rapport [40]. En outre, des parcelles de gènes ont confirmé que hypermethylation était dans le cancer (fichier supplémentaire 2: Figure S8) spécifique à CGI. Pour estimer les variations des motifs d'expression provoquées par hyperméthylation de 5 'CGI, nous avons effectué une analyse fonctionnelle des données d'expression génique obtenues à partir d'expériences de puces à ADN d'ADNc. Hyperméthylation de 5 'CGIs était significativement corrélée avec la régulation négative des gènes (p
= 0,03) (figure 3C; Fichier supplémentaire 3: Tableau S6 et S7). Cela indique que l'inhibition des gènes par méthylation peut être directement affectée par le degré de densité CpG et 5 'CGI hypermethylation. Nous avons analysé l'état de méthylation d'ADN de gènes avec hyperméthylé 5 'et CGI downregulated les motifs d'expression. Parmi ceux-ci est le gène codant pour le type d'histone H2B 3-B (HIST3H2BB
). L'analyse de la méthylation du promoteur de HIST3H2BB en utilisant une PCR spécifique de méthylation a révélé que la plupart des patients cancéreux (10/08, 80%) présentaient une augmentation méthylation dans la région du promoteur (figure 3D) .Tableau 3 clusters d'annotation fonctionnelle des gènes avec 5'CGIs hyperméthylés
Cluster Annotation 1
Score enrichissement: 3,27
comte
P_Value
GOTERM_BP_FAT
ensemble nucléosome
11
3.90E-04
GOTERM_BP_FAT
chromatine ensemble
11
5.20E-04
GOTERM_BP_FAT
protéine ADN-assemblage complexe
11
7.40E-04
Annotation Cluster 2
Score enrichissement: 2,92
comte
P_Value
noyau Histone de INTERPRO 8
6.80E-04
SP_PIR_KEYWORDS
noyau nucléosome 8
8.60E-04
GOTERM_CC_FAT
nucléosome 8
3.10e-03
Annotation Cluster 3
Score enrichissement: site
17
5.10E-03
INTERPRO
Homeobox
17
5.70E-03
SP_PIR_KEYWORDS
Homeobox
17
5.80E-03
INTERPRO
Homeodomain-related
17
6.40E-03
SMART
HOX
17
1.40E-02
D4
3
9.10E-03
SP_PIR_KEYWORDS
embryo
3
3.30E-02
PIR_SUPERFAMILY
PIRSF002612:homeotic