Идентификация изменений метилирования ДНК, связанных с раком желудка человека
Аннотация
Справочная информация
эпигенетические изменения экспрессии генов является обычным явлением в раковых заболеваний человека. Метилирование ДНК является хорошо известный эпигенетическое процесс, но проверив точный характер эпигенетических изменений, связанных с раком остается сложной.
Методы
Мы профилированного methylome желудка раковой ткани человека при разрешении 50-ВР с использованием метилированная обогащения ДНК методика (метилированный CpG пробирной восстановления острова) в сочетании с анализатором генома и новый алгоритм нормализации.
Результаты
Нам удалось получить полное представление о промоутеров с различной плотностью CpG, включая CpG острова (CGIS), стенограмма тела, а также различные классы повторов. Мы обнаружили, что рак желудка был связан с гиперметилированием 5 'CGIs и 5'-конец кодирующих экзонов, а также гипометилированию повторяющихся элементов, таких, как короткие вкрапленными ядерных элементов и составного элемента СВА. Гиперметилирование 5 'CGIs была достоверно коррелирует с понижающей регуляции генов, ассоциированных с, таких как те, в НОХ
и генных гистона семей. Мы также обнаружили дальнего радиуса действия эпигенетической Глушащий (ЖРД) области в желудочной ткани рака и идентифицировали несколько гиперметилированы генов (MDM2
, DYRK2
и Lyz
) в пределах этих регионов. Статус метилирования CGIS и генная аннотаций элементов в метастатических лимфатических узлов промежуточное положение между нормальной и раковой ткани, что свидетельствует о том, что метилирование специфических генов постепенно увеличивается в раковой ткани.
Выводы
Наши выводы будут предоставлять ценные данные для последующего анализа ЦГ метилирования, полезные маркеры для диагностики рака желудка, а также новый метод анализа для клинических исследований EPIGENOMICS.
Справочная информация
рака желудка является второй ведущей причиной смерти от рака во всем мире после того, как рак легких, в результате чего более чем 800.000 смертей во всем мире каждый год [1]. В настоящее время 5-летняя выживаемость больных с диагнозом рака желудка составляет всего 20-30%, при этом низкий уровень быть связано с тем, что в большинстве случаев уже находятся в продвинутой стадии, когда поставлен диагноз. Как и во всех раковых заболеваний, раннее выявление остается наиболее перспективным подходом для улучшения выживаемости. Следовательно, понимание причины онкогенеза в ткани желудка человека имеет важное значение.
Инфицирование H. Pylori
является устоявшейся и распространенной причиной рака желудка. Тем не менее, изменения в различных генетических факторов также играют важную роль в увеличении риска развития рака желудка. Хорошо известно, что хромосомная нестабильность, происходящих из генетических факторов, таких, как нестабильность микросателлитных, а также KRAS
и р53
мутации приводят к развитию опухолей. Несколько геномные исследования выявили зародышевых мутации в определенных генах [2-4] и заболевания восприимчивых локусов [5, 6] для рака желудка. Недавние исследования, сравнивающие рак желудка и нормальные ткани выявили ряд генетических маркеров, в том числе диагностических маркеров [НФ2
[7], INHBA
[8], SFRP4
[9]], прогностические маркеры [CD9
[10], CDH17
[11], PDCD6
[12]], а также рака желудка генов, ассоциированных с [MUC13
[9], CLDN1
[13], Ki67
и CD34
[14]]. Кроме того, эпигенетические механизмы, такие как ДНК-метилирования и модификации гистонов были признаны важную роль в регуляции экспрессии генов, участвующих в биологии и болезни желудочно-кишечного тракта [15].
Метилирование ДНК играет существенную роль в эукариот и связано с рядом ключевых механизмов, включая геномного импринтинга, инактивация Х-хромосомы, старения и канцерогенеза. Изменение метилирования ДНК в геноме встречается почти во всех типах рака и может привести к изменениям в экспрессии генов, таких как избыточная экспрессия онкогенов и молчанием генов-супрессоров опухолей во время развития рака [16]. Несколько исследований показали, что накопление генетических и эпигенетических изменений в желудочном предраковых поражений может повлиять на большое количество целей, таких как компоненты системы репарации ДНК, супрессоров опухолей, онкогенов, регуляторы клеточного цикла, факторов роста и молекул адгезии [17-20] , Тем не менее, эти исследования были в основном сосредоточены на нескольких генов-кандидатов или покрыты лишь часть целого генома. Таким образом, доступ к глобальной вид эпигенетических изменений, связанных с развитием рака было трудно. В частности, понимание изменений метилирования ДНК в внутригенных районах, CpG островов, межгенных и повторяющихся последовательностей остается ограниченным. Следовательно, существует большой интерес к общегеномного анализа аберрантных метилирования ДНК в этих регионах.
Для всестороннего генома масштабного профилирования метилирования ДНК в эмбриогенезе и канцерогенезе, с высокой разрешающей способностью целые методы секвенирования генома, такие как BS-21 [SEQ -24], MEDIP-сл [25, 26], и MethylCap-сл [27-29] были разработаны. Несмотря на бурное развитие секвенирования на основе технологии отображения, существует до сих пор отсутствие сравнительных исследований, которая имеет решающее значение для клинических исследований EPIGENOMICS, в том числе те, которые сосредоточены на раке. В отличие от микрочипов на основе подходов, данные секвенирования производятся в формате, который не поддается дифференциального анализа, а рабочий процесс анализ не был стандартизирован. Следовательно, вычислительно недорогие методы нормализации необходимы для обработки вычислительной нагрузки обработки большого размера, секвенирование данных в высоком разрешении.
Здесь мы ввели алгоритм нормализации, который учитывает выборки конкретной общей плотностью записи, пространственное распределение CpG локусов, а также смещения фона секвенирования. Затем мы создали комплексную целого генома methylome нормальной ткани желудка, желудка раковой ткани и метастатических лимфатических узлов с использованием MethylCap-Seq метод и получил подробную информацию о своем возмущении в ходе канцерогенеза и метастазирования. Это легко применимо к сравнительному анализу methylomes и других видов эпигеномном данных, и она имеет определенные последствия для клинических Epigenomics.
Методы
образцы желудочной ткани
Мы получили три быстро замораживают опухоли желудка и в норме у желудочной ткани из Сеульского национального университета медицинского колледжа для methylome исследования. Кроме того, двадцать восемь согласованных пар нормальных и опухолевых тканей желудка были получены для дальнейшего подтверждения. Все образцы были получены при эндоскопической резекции при обследовании пациентов, информированное согласие
метилированный анализ восстановления ДНК (MIRA)
геномную ДНК от 25 мг желудка ткани очищают с помощью DNeasy Blood &усилитель. Ткань (Qiagen, Valencia, CA). Геномных ДНК образцов от 3-х особей были объединены в той же концентрации. MIRA проводили, как описано ранее [30-32]. В кратком изложении, GST-меченый MBD2b и Его-меченый MBD3L1 белки получали, как описано. 15 мкг геномной ДНК была раздроблена до 100 ~ 500 пар оснований путем обработки ультразвуком и инкубируют с 28 мкг очищенного белка GST-MBD2b 28 мкг His-MBD3L1 белка и 7 мкг JM110 ДНК микобактерий в течение 6 часов. Добавляли 30 мкл MagneGST бусин (Promega, Madison, WI), preblocked с 7 мкг JM110 бактериальной РНК и инкубировали при 4 ° С при вращении в течение 45 мин в конечном 600 мкл MIRA связывания реакционной смеси. Гранулы промывали три раза 1 мл промывочного буфера, а также метилированные фрагменты элюируют инкубацией при комнатной температуре в течение 5 минут, а затем 56 ° С в течение 30 минут с 30 мкл ТЕ, содержащего РНКазы А (100 мкг, Qiagen) и протеиназы К ( 15 мкг, Qiagen). Элюированные фрагменты ДНК дополнительно очищали с помощью ПЦР QIAquick комплектов очистки (Qiagen).
Illumina Genome Analyzer секвенирование
Мы использовали 10 нг ДНК элюированного для Illumina Genome Analyzer секвенирования. После лигирования пары Solexa адаптеров, лигирование продуктов с максимальным размером вставки 200 п.н. очищают в геле на 2% агарозном геле и подвергали ПЦР-амплификации. Кластер генерации и 36 циклов секвенирования были выполнены в соответствии с инструкциями изготовителя. Мы секвенировали 120 мкл-адаптера лигируют, фракционировали ДНК (2 ~ 4 пМ) на Illumina Genome Analyzer. Последовательность метки были нанесены на карту генома человека (база данных hg18 УСК на базе NCBI Сборка 36,1 узла) с использованием Solexa Analysis Pipeline (версия 0.3.0). Sequenced считывает из 34 пар оснований (за исключением первого и последнего нуклеотида), которые прошли использовались фильтры контроля качества. Обработка
данных и расчет MES
Мы расширили 3 'конец от 34-ВР читает на 200 б.п., чтобы покрыть ДНК фрагменты, связанные с белками MBD. Отсчет был преобразован в браузер расширяемых файлы данных (кровать) для визуализации в УСК генома браузера HTTP:. //УСК генома Edu /.. Мы насчитали перекрывающиеся метки последовательности при разрешении 50 пар оснований. Чтобы найти обогащенные геномные области, число сопоставляется читает в скользящем окне 1 кб по сравнению с общим числом читает или фоновое количество читает в геноме. Таким образом, МЭС была рассчитана двумя способами; один как log2 (требуемое для чтения /счетчик заданного размера) /(общее количество чтения /размер генома) и сражен к нулю, а другой как log2 (требуемое для чтения /счетчик заданного размера) /(фон чтения /счетчик фон размер) и сражен к нулю. Для того, чтобы сделать поправку на смещение фона секвенирования, MESbg была рассчитана таким же образом, для ввода последовательности без очистки на основе сродства и вычитают из MES.
Геномные позиции CGIs, промоутеров, стенограмма тел, CDSS, и повторяющиеся элементы изображения Все геномные позиции CGIs, стенограммы и повторить элементы были загружены из генома браузера УСК. В общей сложности 27,639 CGIs (за исключением случайно расположенных CGI скрипты) были предсказаны следующие критерии: GC содержание 50% и выше, длина которых больше 200 пар оснований, а отношение больше, чем 0,6 от наблюдаемого числа CpG динуклеотидах к ожидаемому числу [33] , Коллекция NCBI мРНК ссылки последовательности (RefSeq от выпуска версии 46; 11 марта 2011 г.) был использован для идентификации единиц транскрипции с определенным началом транскрипции, конечные сайты и CDS начало, конец сайтов. Для промоутеров, мы использовали область 500 б.п. выше ~ 500 б.п. вниз по течению от сайта инициации транскрипции. Мы получили 5 миллионов ~ местах повторных, которые были определены программой RepeatMasker на основе библиотеки RepBase повторов.
Уровень метилирования геномных элементов
Уровень метилирования в CGI, промоутер, генная тела, и повторить элемент оценивалась с помощью MES перекрытием каждого элемента. MES = 0 используется для определения неметилированные элементов. Для измерения гиперметилирование или гипометилирование при раке, мы рассчитали дифференциальный Mess как (рак MES - Нормальный MES). Дифференциальный MES > 1,0 использовали в качестве порогового значения. Для того, чтобы понять функции выбранных генов, мы использовали классификацию онтологий генов через DAVID Функциональная Аннотация Кластеризация инструмент HTTP:.... //David ABCC ncifcrf гов /Анализ экспрессии генов
микрочипов продукт, используемый в данном исследовании был CodeLink Human Всего Геном 55 K чип (GE Healthcare, США). Все экспериментальные процедуры, в том числе целевой подготовки кРНК, гибридизации, сочетания красителя после гибридизации были проведены с использованием поставщика рекомендуемые протоколы. В результате файлы были импортированы в GeneSpring GX 7.3 (Agilent Technologies, США) для фильтрации и базового статистического анализа. Среди 55 K генов на микрочипе, только гены с присутствующими флагами в по меньшей мере 50% образцов были выбраны для последующего анализа. Данные микрочипов были сданы на хранение в GEO HTTP:.. //WWW NCBI NLM NIH (инвентарный номер GSE33651) гов /гео /
MIRA и реальном времени кПЦР
MIRA... проводили на четырех дополнительных отдельных образцов. ДНК очищали из супернатанта и контролироваться в режиме реального времени с использованием кПЦР Roche 480 машины. Последовательности праймеров, используемых представлены в дополнительный файл 1:. Таблица S1
бисульфит лечения, специфической в отношении метилирования ПЦР и Пиросеквенирование
Мы выделили геномную ДНК из отдельного образца с помощью носового платка набора QIAGEN DNeasy (Qiagen). Бисульфит лечение проводилось с использованием EZ метилирование ДНК золотой комплект (Zymo исследование) в соответствии с инструкциями изготовителя. Бисульфит обработанной ДНК хранили при -80 ° С до дальнейшего использования. Праймеры, используемые для МПВ были разработаны с использованием Methprimer [34], а также приведены в дополнительном файле 1: Таблица S1. ПЦР проводили с HotStarTaq полимеразной (Qiagen) и включали начальную инкубацию при 95 ° С в течение 15 мин, затем 40 циклов при 95 ° С в течение 1 мин, 59 ° С в течение 1 мин и 72 ° С в течение 40 сек, с последующим один цикл при 72 ° C в течение 10 минут. Продукты MSP были разделены на 2% агарозном геле и визуализировали путем окрашивания EtBr. Эти Пиросеквенирование реакции выполняются автоматически с системой PSQ 96 (Пиросеквенирование AB) в соответствии с инструкциями изготовителя. Вкратце, биотинилированный продукт ПЦР (50 мкл) очищали с помощью стрептавидин-сефарозы (Amersham Biosciences). Очищенный продукт был загружен в картридж реагента с ферментом, субстратом и дНТФ, включенного в комплект PSQ96 SNP Реагент (Пиросеквенирование AB). Секвенирования праймеров для Пиросеквенирование приведены в дополнительном файле 1:. Таблица S1
Результаты
Обработка MIRA-сл данных methylome
Мы очистили метилированных ДНК, обогащенную через MIRA (метилированный CpG анализа восстановления острова) и секвенировали ДНК с помощью следующего поколения секвенирования. Уровни метилирования ДНК определяли с помощью секвенирования чтения подсчеты соответствующих областей, с интервалом 50 б.п., как описано в разделе Методы. Мы создали карты метилирования ДНК как для нормальных, так и раковых тканей желудка. Для каждого образца было получено около 10 миллионов последовательность операций чтения (Дополнительный файл 1: Таблица S2). Каждый methylome содержал ~ 140 миллионов CpG читает, покрывая ~ 48% всех геномных сайтов CpG за исключением центромеры (Дополнительный файл 1: Таблица S3). Средний охват CpG читает в каждом methylome был 4,5 ·. В поддержку высокой чувствительности MIRA, геномные сегменты, содержащие только один CpG был выше, чем прочитать подсчет тех, кто не CpG (р
значение = 0), предполагая, что отдельные изменения CpG могут быть решены с помощью MIRA. Средняя последовательность операций чтения увеличивается пропорционально количеству CpGs в 50 п.о. интервала, а на самом деле, охват MIRA не было низким, даже для областей низкой плотности CpG (Дополнительный файл 2: Рисунок S1). Взятые вместе, эти результаты показывают, что MIRA был успешным в восстановлении достаточной доли метилированных регионов. Что касается точности MIRA, ~ 99% MIRA-захваченных фрагментов имели по крайней мере один сайт CpG в их последовательности, что указывает на низкий уровень обнаружения ложных.
Для измерения обогащения локальных сигналов метилирования, мы вычислили баллы обогащения метилирование (Mess ) путем получения чтения счета в данном регионе, а затем выполнять нормализацию, чтобы контролировать для полного считывания счетчика (МОНТ) в образце (глобальной нормализации) или подсчета локального чтения (MESL) в определенной пользователем окружающего региона (локальная нормализация) (см методы). Это позволяет провести прямое сравнение независимых выборок с разной плотностью записи. Затем мы провели логарифмическое преобразование производного балла. Наряду с наличием других математических достоинств, это дает преимущество стабилизации дисперсии, особенно для графов высокого чтения, которые часто в сочетании с высокими техническими изменениями, которые могут внести значительные смещения в данных.
Мы оценили статистическую значимость МЧС в два пути. Рандомизированное беспорядке были получены численно перестановкой геномные позиции нашей последовательности читает. Фоновые MES (MESbg) был получен экспериментально путем секвенирования нормального генома без аффинной очистки. Как и следовало ожидать, реальные данные дали значительно более высокие баллы по обогащению урана (дополнительный файл 2: Рисунок S2). Примечательно, что MESbg был выше, чем MES рандомизированных геномов, признак того, что фоновые последовательности в одиночку может создать обогащение, вероятно, из-за доступности хроматина и смещения усиления. В соответствии с недавними сообщениями [35], это свидетельствует о необходимости правильной калибровки для присущего смещения секвенирования. Поэтому мы нормализовали наши MES с MESbg.
Чтобы найти оптимальное условие для нормализации, мы сравнили статистическую пригодность различных методов нормализации. Распределение тегов вдоль генома могут быть смоделированы распределением Пуассона [36, 37]. Совершенство приступе была проверена с помощью теста Колмогорова-Смирнова. В этом тесте низкий D статистика показывает хорошее соответствие. В то время как модель Пуассона превзошла Gaussian целом, MES показал лучше подходит, чем сырые подсчетов чтения (дополнительный файл 2: Рисунок S3), иллюстрирующий редкую природу событий лог-масштабируется для чтения счетчика меры. Нормированные MESL калиброванные по контрольной последовательности (MESbg) дает даже лучшие результаты, чем нормированной МОНТ, калиброванный по контрольной последовательности (MESbg).
Global и хромосомных видом метилирования ДНК
После подтверждения наилучший метод генома уровней метилирования подсчета очков в 50 п.н. интервалами, мы сначала исследовали хромосомные метилирования нормальных образцов. Средние MES, рассчитанные для каждой хромосомы предположил, что CpG-богатых и генов богатых хромосом, как правило, высоки метилированный (Рис. 1А) Уровни метилирования хромосом с большими объемами длинные перемежаются ядерных элементов (Линейки) были относительно низкими (например, хромосома 4). Интересно отметить, что количество коротких вкрапленными ядерных элементов (SINEs) была пропорциональна образцу хромосома метилирования. Вероятно, это вызвано тем, что SINEs, как правило, сосредоточены в генных богатых регионах. Половые хромосомы были глобально hypomethylated с меньшей плотностью CpG и более высоким содержанием повторов чем аутосомах. Так как мы использовали тканей, взятых от мужчины в этом эксперименте, глобальная гипометилирование Х-хромосомы, наблюдаемой не связан с X инактивацией. Хромосомой широкий вид высокой плотности воспроизводятся CpG и высокую метилирование генов вокруг богатых (см черные полосы внизу) и CGI-богатых регионах (см синие полосы в верхней части) (рис 1B). В отличие от этого, наблюдались низкая плотность CpG и низкая метилирование вокруг генов бедных регионов, которые были богаты повторами дальнего радиуса действия (&GТ; 1 кб) (см красные полосы вверху). Средние MES предполагает, что уровень метилирования CGIs значительно выше, чем у генных областей или повторов (рис 1В). Рисунок 1 метилирования нормальной ткани желудка. (A) хромосомой широкий средний MES показан в зависимости от средней плотности CpG, плотностью генов (число генов на Mb), количество линии (длина линии на Mb) и SINE количество (длина СИНЕ на Мб) для каждой хромосомы. (B) Для хромосомы 22, средняя плотность CpG (выделено серым цветом) и MES (черная кривая) были получены в 1-Mb раздвижные окна. Позиции расшифрованных генов (черные полосы в нижней части), CG острова (синие полосы в верхней части), а также длинные повторы (&GТ; 1 килобайт, красные полосы вверху) сравниваются на фоне метилирования ДНК и плотности CpG ( оставил). Средние MES для CGIs, генные тела, и повторы (справа). (C) Распределение генов органов и CGI MES (слева). Средние MES для промоторной-ассоциированных и промотор независимым CGIs показано справа. (Д) Средние MES-промоутер подгрупп, основанный на существовании CGI (слева). (E) Основная информация о межгенная, exonic и интронных регионах, в зависимости от длины, числа CpG и сопоставляется читает (слева). Распределение межгенная, exonic и интронной бардак показано справа. (F) Основная информация о входе 1-кб область, 5 'UTR экзонов, кодирующих экзонов, 3' UTR экзоны и вниз по течению 1-кб область в зависимости от длины, количества CpG и сопоставляется читает (слева). Распределение MES для каждого элемента показано справа.
Как правило, CGIs, как правило, остаются метилирование свободными в нормальной ткани. Для анализа высокой метилирования CGIs, мы проверили среднее распределение MES и нашел несколько бимодальное шаблон (рис 1C). Около 66% (11376/17284) из CGIs в левый пик перекрывается с промотором (1 кб по нашему определению). В отличие от этого, 13% (1386/10357) от CGIs в правильном пик перекрывается с промотором, предполагая, что наиболее промотор-ассоциированных CGIs являются неметилированная. В отличие от промотора, связанных с CGIs, промотор-независимый CGIs были сильно метилируется (рис 1C). Хотя большинство CGI-положительными промоутеры не были метилируется, CGI-отрицательными промоутеры показали относительно высокие уровни метилирования (Рисунок 1D). Мы также проверили уровень метилирования промоторов по плотности CpG, как определено ранее [38] (Дополнительный файл 3: Таблица S4). Метилирование промоторов в обратной зависимости от плотности CpG (дополнительный файл 2: Рисунок S4). С другой стороны, CGI-содержащие тела гена имели более высокие уровни метилирования, чем те, без CGIs (Рисунок 1D).
Далее, мы проанализировали образцы с обогащением метилирования при различных аннотированные геномных элементов, чтобы исследовать области, которые были преимущественно метилированию. Генная области занимают около 40% генома человека, но около 53% от общего количества читает находится в пределах этой области, причем большинство чтений расположены в интронной области (таблица 1). Несмотря на то, значительная часть метилированных фрагментов попадают в интронных областей, отношение сопоставляются читает к длине экзонов значительно выше, чем для интронов, предполагая, что экзоны более высоко, чем метилированный интронов (рис 1д). В геноассоциированным регионах, обогащение кодирующих экзонов даже выше, чем в других регионах, как сообщалось ранее (рис 1F и таблица 2) [39]. Это наводит на мысль, что метилирование играет определенную роль в экзоне regulation.Table 1 геноме человека и нормальной информации образца генном и межгенном области
Геном человека информация
Нормальный образец данных
относительное обогащение Ratio
функциональной категории
Длина (BP)
Соотношение
# ЦГ
Ratio
Считывает
Ratio
vs. Длина
vs. CpG Count
Genic
1,184,139,094
39.46
13,262,253
47.09
20,854,434
53.25
1.35
1.13
Exon
68,035,894
2.27
1,808,089
6.42
4,350,405
11.11
4.90
1.73
Intron
1,122,817,725
37.41
11,613,113
41.23
17,358,273
44.32
1.18
1.07
Intergenic
1,816,976,186
60.54
14,901,610
52.91
18,310,273
46.75
0.77
0.88
Human Геном
3001115280
100
28163863
100
39164707
100
1.00
1.00
Таблица 2 генома человека и нормальная выборка информации из генов аннотированных регионов <бр>
Геном человека информация
Нормальный образец данных
Относительное соотношение по обогащению
функциональной категории
Длина (BP) завод
Соотношение
# ЦГ
Ratio
Читает
Коэффициент
vs. Длина
vs. CPG графа
вверх по течению 1 КБ
24468069
0,82
937748
3,33
535593
1,37
1,68
0.41
5'UTR экзоны
8436529
0,28
411563
1,46
292654
0.75
2,66
0,51
экзоны
Coding 33384619
1,11
1077913 <бр> 3,83
3448755
8,81
7,92
2,30
3'UTR экзоны
28387978
0,95
378012
1,34
806832
2,06
2,18
1,53
Вниз по течению 1 кб
23136263
0,77
340866
1,21
551071
1,41
1,83
1.16
человека Геном
3001115280
100
28163863
100
39164707
100
1.00
1.00
Изменения в характере метилирования ДНК, связанные с желудочным
рака Когда средние хромосомные МЭС methylome рака сравнивали с контрольной ткани, мы обнаружили, что все хромосомы в опухолевой ткани, как правило, быть hypomethylated (дополнительный файл 2: Рисунок S5). С хромосомных масштабе взглядов, были найдены CGI регионы, богатые должны быть специально гиперметилированы, в то время как повторные богатые регионы были широко hypomethylated (Рисунок 2А; Дополнительный файл 2: Рисунок S6). Для анализа изменений метилирование геномных элементов, мы выровнены каждый элемент в начальной и конечной участков, а затем полученные средние MES в каждой соответствующей позиции. Поразительно, но мы обнаружили гиперметилирование выше по потоку области, в частности, от 500 пар оснований против хода транскрипции относительно сайта инициации транскрипции (Фигура 2В). Это в соответствии с гиперметилированием промоторных областей часто наблюдается при раке. Рисунок 2. Сравнение паттернов метилирования в нормальной и раковой ткани. (А) Средняя кривая MES для нормальной (черный цвет) и злокачественными (красный) ткани в хромосоме 19 (слева). Средние MES для CGIs, генные тела, и повторы (справа). (В) метилирование ДНК гена аннотированный элементов. Каждый элемент (выше 1 кб, экзон, интрон, и вниз по течению 1 кб) распределяют на 20 бункеров и средние MES получали для каждого бункера всех соответствующих элементов. (C) метилирование ДНК на концах транскриптов и кодирования заканчивается область. Средние МЭС была получена в скользящем 50 п.н. окна в соответствии с ее расстоянием от начала транскрипта (первый) и в конце (второй) для CGI-положительных промоторы, а также в начале транскрипта (третьего) и в конце (четвертой) для cgi- положительные промоутеры. (D), метилирование ДНК всего 5 'экзонов UTR (слева) и 5' экзонов, кодирующих UTR (справа).
Регионе с центром в сайте инициации транскрипции показали совершенно разные узоры в зависимости от наличия CGI, что отражает низкий статус метилирования CGI-промоторов (рис 2С). Мы также обнаружили, что, в раковой ткани, замечательный гиперметилирование CGI-промоторов происходит и что плотность CpGs имеет решающее значение для увеличения метилирование ДНК (рис 2C). Для дальнейшего анализа были ли гиперметилированы регионы 5 'генов подобно промоторов генов, мы проверили образец метилирования первых экзонов. Интересно, что мы обнаружили, что первый экзон был гиперметилированы только тогда, когда это было 5'-конец экзона кодирования, но не тогда, когда это было 5 'UTR экзон (рис 2D). Эти регионы также содержали высокую плотность CpG. Поэтому CGIs в верховьях областях генов, промотор, и начала кодирования, по всей видимости, являются основными целями гиперметилированием ДНК при раке.
Рисунок метилирования CpG островков
Чтобы изучить корреляцию между расположением и CGIs метилирование ДНК, мы на подгруппы в соответствии с CGI, их позиции в геноме. В частности, они были классифицированы как 5 '(находится в диапазоне от 1 кб вверх по течению и стартовым сайтом кодирования гена), внутригенная (внутригенная CGIs вне 5'-конца) и межгенном (расположенный в не генном области) (Дополнительный файл 1: Таблица S5). Хотя плотность CpG была одинаковой во всех трех группах, не 5 'CGIs (внутригенная и межгенная CGIs) были значительно более метилированный чем 5' CGIs (дополнительный файл 2: Рисунок S7). Кроме того, мы сравнили средние МЭС CGIs и на подгруппы найдены метилирование всех CGIs в целом увеличилась. Тем не менее, относительное дифференциальное МЭС предположил, что изменение метилирования в 5 'CGIs был значительно больше, чем для других CGIs (фиг.3А), что отражает важные роли 5' CGIs в рак. Степень 5 'CGI гиперметилировании достоверно коррелирует с перекрытием начала транскрипции (фиг.3В). Рисунок 3 метилирование ДНК CpG островков. (A) Относительные дифференциальные МЭС CGIs на подгруппы. (B) Соотношение между дифференциальной CGI метилирования и расстояния до сайта начала транскрипции. (C) Корреляция между уровнем экспрессии гена и гиперметилированием CGIs. (D) Метилирование-специфической ПЦР гистоновых генов, показывающих наибольшие значения дифференциальных MES. . M1 и U1 соответствуют HIST3H2A, в то время как M2 и U2 соответствуют HIST3H2B
Для изучения функций генов, подвергающихся дифференциальной метилирование 5 'CGIs, мы выбрали гены с высокой дифференциальной CGI Mess (дифференциальный MES > 1). Затем мы проводили онтологий (GO) анализ генов, чтобы получить представление о механизмах, ответственных рака (таблица 3). Когда гены были сгруппированы в различные категории GO, мы обнаружили, что Нох
генные кластеры и кластеры генов нуклеосом сборки связанных были мишенью для гиперметилированием, в то время как связанных с апоптозом кластеры генов были мишенью для гипометилированию. Интересно отметить, что наш вывод, что Нох
кластеры генов были льготными мишени для метилирования ДНК согласуется с предыдущим докладом [40]. Кроме того, генные участки подтвердили, что гиперметилирование был CGI-специфический при раке (дополнительный файл 2: Рисунок S8). Для оценки изменений в характере экспрессии, вызванных гиперметилированием 5 'CGIs, мы провели функциональный анализ данных экспрессии генов, полученных из кДНК микрочипов экспериментов. Гиперметилирование 5 'CGIs значимо коррелировали с понижающей генов (р
= 0,03) (Рисунок 3C; Дополнительный файл 3: Таблица S6 и S7). Это указывает на то, что глушителей генов с помощью метилирования может быть напрямую зависит от степени плотности CpG и 5 'CGI гиперметилированием. Мы проанализировали статус метилирования ДНК генов с гиперметилированы 5 'CGIs и подавляются паттерны экспрессии. Среди них был ген, кодирующий тип гистона Н2В 3-B (HIST3H2BB
). Анализ HIST3H2BB
метилирования промотора с использованием специфической в отношении метилирования ПЦР показал, что большинство раковых больных (8/10, 80%), показывает повышенную метилирование в области промотора (рис 3D) .table 3 Функциональное аннотаций кластеризация генов с гиперметилированы 5'CGIs
Аннотация кластера 1
Обогащение Счет: 3,27
Граф
P_Value
GOTERM_BP_FAT
нуклеосома сборка
11
3.90E-04
GOTERM_BP_FAT
хроматина сборка
11
5.20E-04
GOTERM_BP_FAT
белок-ДНК комплекс сборки
11
7.40E-04
Аннотация кластера 2
Обогащение Счет: 2,92
Граф
P_Value
Interpro
ядро гистонов
8
6.80E-04
SP_PIR_KEYWORDS
нуклеосом ядро
8
8.60E-04
GOTERM_CC_FAT
нуклеосома
8
3.10E-03
Аннотация кластера 3
Обогащение Оценка: site
17
5.10E-03
INTERPRO
Homeobox
17
5.70E-03
SP_PIR_KEYWORDS
Homeobox
17
5.80E-03
INTERPRO
Homeodomain-related
17
6.40E-03
SMART
HOX
17
1.40E-02
D4
3
9.10E-03
SP_PIR_KEYWORDS
embryo
3
3.30E-02
PIR_SUPERFAMILY
PIRSF002612:homeotic