Введение Обсуждение Проблема в нашей экспериментальной конструкции является то, что средства управления были выбраны в качестве симптоматических лиц, посещающих службу гастроэнтерологии, проходит эндоскопию и большинство из них с желудочный поражение: 6 с гистологически нормальной слизистой оболочки желудка, 248 с гастритом, и 46 с метаплазией. Можно утверждать, что оптимальное управление будет состоять только людей с нормальной слизистой оболочки желудка. Однако, только через эндоскопии возможность точно установить отсутствие повреждений желудка, а также выполнение эндоскопию для исследовательских целей, а не на почве желудка, связанных с симптомами больше не является этически приемлемым. С другой стороны, используя в качестве контрольных лиц из общей популяции, которые не претерпевают эндоскопии не обязательно является лучшим выбором, так как эта стратегия включала бы в качестве контроля лиц с невыявленной гастрита [35] и других подобных повреждений. Поэтому мы считаем, что наши средства управления, тем лучше оперативный выбор для данного исследования, поскольку они являются лица, посещающие те же услуги, как гастроэнтерология случаев, и так как они подверглись эндоскопии, мы точно знаем, состояние их слизистой оболочки желудка. Кроме того, в Латинской Америке существует значительный уровень расслоения населения из-за социально-экономического уровня и происхождения, которые коррелируют в крупных городских центрах в Латинской Америке (в дополнение к этому исследованию, см Авена и др. 2012 [30] для примера в Буэнос-Айрес и Кэмпбелл и др. 2012 [27]). При выборе управления среди обслуживающего персонала той же больницы, чем случаев, мы уменьшить этот другой потенциальный источник стратификации населения между случаями и контролем В заключение, мы показали, что в городской смешанной популяции Лима, Индеец индивидуальное происхождение связано с раком желудка, но это объясняется ассоциацией социально-экономических переменных, как с раком желудка и индейского происхождения. Несмотря на высокую заболеваемость раком желудка в перуанской населения с очень высокой индейского происхождения, наш результат показывает, что это эпидемиологическое наблюдение не опирается на генетической основе, что свидетельствует о преобладающей роли социально-экономических факторов и различий в доступе к медицинским услугам. Мы сообщаем о неожиданно высокой индейского происхождения (&GТ; 74%) у лиц, посещающих больницы из ныне космополитического города Лима. Так как коренные американцы являются пренебрегли группой в геномных исследованиях, мы предполагаем, что население из Лимы и других крупных городов в западной части Южной Америки может быть удобной мишенью эпидемиологических исследований, ориентированных на коренных американцев населения. Преследование этого направление исследований в дальнейшем более крупные исследования начнут ликвидировать разрыв [37] в генетических исследованиях и их потенциальных выгод между европейскими частными лицами и из других обычно менее хорошо обслуживаемому населению. Субъекты Мы также собрали образцы из 296 индейских лиц, которые были использованы в качестве родительских популяций оценить происхождение из желудка случаев рака и средства управления. К ним относятся 23 фермеров из Pichacani (Пуно), принадлежащие к преобладающей Андского кечуа этнической группы, а также 87 Shimaa и 186 ашанинка из этнической группы Matsiguenga, поселились между Андами и Амазонии. Для всех случаев рака желудка и контроля, а для коренных американцев, мы извлекли геномной ДНК с использованием метода фенол-хлороформ, описанного Sambrook и др. с изменениями или набора крови Gentra Puregene (Qiagen, США) [38]. Это исследование было одобрено IRBs из Asociación Benéfica PRISMA, Universidad Peruana Каэтано Эредиа, Университет Джона Хопкинса, Федеральным университетом де Минас-Жерайс, больницы Arzobispo Loayza, больницы Дос-де-Майо и Instituto Nacional де Enfermedades Neoplásicas. Все участники исследования дали письменное информированное согласие. Статистический анализ
<р> рак желудка является одним из самых смертоносных видов рака, что составляет около 800 000 смертей в год, но его частота существенно меняется во всем мире [1]. Самый высокий уровень заболеваемости раком желудка наблюдается в Восточной Азии, Восточной Европе и в странах Андского региона Южной Америки. Действительно, в перуанской популяции, рак желудка занимает второе место в заболеваемости среди мужчин и третий среди женщин (22,6 и 20 случаев на 100000 мужчин и женщин соответственно), являющийся типом рака с самой высокой смертностью. Для сравнения, заболеваемость раком желудка в Перу примерно в пять раз выше, чем в Соединенных Штатах, и вдвое больше, чем в Бразилии [1].
<Р> Recavarren-Арсе и др. и Correa предложена модель прогрессии для развития кишечного типа аденокарциномы желудка, которые состоят из перехода от поверхностного гастрита к метаплазии до дисплазии и, наконец, аденокарциномы желудка [2], [3]. Множество социально-экономических, экологических и диетических факторов модулировать этот прогресс и индивидуальный риск, в конечном счете развития рака желудка. Хроническая инфекция желудка бактерией <ЕМ> Helicobacter Pylori
что приводит к хроническому воспалению является одним из основных факторов риска приходящаяся [4], хотя и менее чем 2% от H. Pylori
носителей развивается рак желудка [5]. хеликобактерной
разнообразие также влияет на риск развития рака желудка хозяина, а наличие бактериального фактора вирулентности CAG + является одним из наиболее важных факторов риска. В то время как этот фактор вирулентности имеет частоту ~ 60% в популяциях Европы и США, то она достигает более 90% в перуанской населения [6]. Кроме того, в то время как индейские лица из изолированных популяций заражены в основном носителями штаммов, которые напоминают азиатские штаммы, из-за азиатского происхождения плейстоцена коренных американцев, люди, живущие в средних и крупных городских центрах, даже если они могут иметь преобладающую индейского происхождения, заражаются в основном европейских или гибридных штаммов принесли в Америку после того, как 15-го века. Эти штаммы в значительной степени заменены менее вирулентные или энергичные родные штаммы [7], [8].
<Р> Бедность также коррелирует с аденокарциномы желудка [9] и в то время как повышенное потребление обработанного или копченой пищи и соли являются факторами риска, частые потребление свежих фруктов и овощей является защитной [10], [11], [12], [13]. Человеческое генетическое разнообразие также имеет отношение [14]. Наблюдаемые различия в заболеваемости раком желудка во всем мире может быть связано с факторами окружающей среды или при наличии предрасположенности генетических вариантов, которые чаще встречаются в популяциях с высокой заболеваемостью, но идентификация и дискриминация этих факторов является сложной задачей. Хотя общая восприимчивость генетические варианты были идентифицированы в европейских и китайских популяций по всему геному и кандидат-ген ассоциации исследований в генах, таких как PLCE
[15], IL1B
[14], IL8
[16], [17], [18], IL1RN
[19], и PTGS2
[20], составляют эти варианты для небольшой части генетическая дисперсия, связанная с спорадическим раком желудка.
<р> Перу, с высокой частотой развития рака желудка, имеет наибольшее индейское население в Южной Америке [21] и крупные города, такие как Лима заполняются людьми, классифицируемых как метисы ( то есть, люди с примесью из африканцев, европейцев и коренных американцев). Если есть человек генетическая основа высокой заболеваемости раком желудка в Андском регионе, мы ожидаем, что смешан население из Лимы в гавани генетические варианты, учитывающие эту высокую частоту, и если эти варианты были более распространены в индейской генетического фона это население, можно было бы использовать геному стратегию картирования примесей, чтобы обнаружить эти варианты. исследования по картированию Добавка недавно помогли выявить варианты, связанные с раком простаты [22] в афро-американских популяций, но этот подход еще не в полной мере применяться к латиноамериканским или латиноамериканец /латиноамериканского населения США. В этом контексте, цели этого случай-контроль исследования генетической ассоциации являются: (я), чтобы оценить этнический состав и связанный с ним генетическую структуру пациентов, посещающих крупные больницы в Лиме; (II), чтобы проверить, является ли физическое лицо Индеец, европейские и африканские родословных являются факторами риска развития рака желудка, контроль за действием негенетическими факторов (т.е. социально-экономические системы, расстройства питания и клинические). Социально-экономические, диетическое и клиническая информация была собрана для каждого участника исследования и происхождение оценивалось на основе 103-родословной информативными маркерами (AIMS). Мы определили, что высшее Индеец индивидуальное происхождение связано с раком желудка, но что социально-экономические факторы, связанные как с раком желудка и этнической счета для этой ассоциации. Несмотря на высокую заболеваемость раком желудка среди перуанцев с преимущественно индейского происхождения, наши результаты не указывают на четкой генетической основы этого несоответствия заболеваемости. Скорее всего, они предлагают главную роль для этнических ассоциированных с социально-экономических и экологических факторов человека и различий в доступе к медицинским услугам.
Результаты
<р> Мы набраны лиц, посещающих Гастроэнтерология отделы и предписанные для эндоскопии в трех крупные больницы в Лиме (таблица S1). Случаи были взрослыми людьми, указанные для эндоскопии и чьи биопсии были подтверждены как положительные для рака желудка с помощью гистологических анализов. Контрольная группа состояла из лиц, чьи биопсии были отрицательными для рака желудка. Лица с кишечной метаплазией (п = 46) были включены в качестве элементов управления на предположении, что этот тип метаплазии не увеличивает риск развития рака желудка [23], [24], [25].
<Р> Мы использовали валидизированный набор 103 AIMS [26] для оценки Индеец, европейской и индейской индивидуальной родословной для каждого из 241 случаев рака желудка и 300 управлений, завербованных для данного исследования. Основной компонент анализа (РСА, Рисунок 1) отдельных генотипов для наших перуанских образцов (в том числе 296 коренных американцев) и для Европы, Африки и Мексики лиц из HapMap-III показывает, что цели, используемые различия между странами Африки, Европы, и перуанец американских индейцев родительских популяций, и смешанных мексиканцев (резидент в Лос-Анджелесе) и перуанских желудка и контрольной посещающих Лима больницы расположены между европейцами и коренными американцами. Кроме того, перуанские желудка случаи и контроля относительно ближе к перуанских индейских родительских популяций. Хотя городское население из Лимы считается метисы (т.е. обычно примешивают), изученных групп в данном описании показали очень высокую индейского происхождения (78,4% для случаев и 74,6% для элементов управления, коробка на рисунке 1), с низким африканского происхождения (&л; 5%, рис S1). Интересно отметить, что существует положительная связь между индейского происхождения и рака желудка (логистическую регрессию, OR = 3,69, 95% ДИ от OR: 1.34-10.09, р = 0,011, R2 = 0,016), и, следовательно, отрицательная связь с европейской родословной .
<р> Как и следовало ожидать, переменные, которые являются заменителями бедности (низкий уровень образования, качественные характеристики дома, например, использование некачественных материалов, отсутствие хороших приборов, а также плохие санитарные условия) были связаны с раком желудка (табл 1). Кроме того, некоторые пищеварительные связанные симптомы, такие как сжигание (р &Лт; 0,0001), тошнота (р &л; 0,0001), рвота (р &ЛТ; 0,0001) и тяжеловесности (р &ЛТ; 0,0001) чаще в тех случаях, чем в контрольной группе, но эти симптомы скорее всего, является следствием заболевания (таблица 1). Переменная возраст не был распределен нормально (р &л; 0,01, Колмогорова-Смирнова тест), медианы (и отклонение межквартильный) для управления и случаи были 61 (стандартное отклонение (SD): 21) и 65 (SD: 25) лет соответственно ( р = 0,042, Манна-Уитни тест); Поэтому, эта переменная рассматривалась как ковариатой в дальнейшей анализа логистической регрессии.
<р> Мы синтезировали широкий набор негенетическими переменных, собранных в случаях и управления с использованием многомерного факторного анализа, чтобы уменьшить размерность этих 43 не- генетические переменные путем захвата корреляции между ними (таблица 1 и таблица S2). Интересно, что первый фактор (16,38% от общей дисперсии) преобладают социально-экономических переменных, но включает в себя подмножество коррелированные питательных переменных, более высокие значения коэффициента, соответствующего благополучных условиях. Второй фактор (5,95% от общей дисперсии) включает в себя подмножества социально-экономических и питательных переменных, а также жалобы, такие как боль. Третий фактор (5,26% от общей дисперсии) преобладают симптомы пищеварительных связанных. Мы использовали отдельные координаты для каждого из этих трех факторов, синтетически представляют оригинальный набор из 43 переменных. И первый, "социально-экономический" фактор, а второй фактор связаны с раком желудка (OR = 0,68, р = 0,0002 и OR = 0,7, р = 0,0008, соответственно), а также с этнической (р = 0,02 и р = 0,00003 соответственно, где более высокие значения коэффициента соответствуют лучшим социально-экономическим условиям). Третий фактор "пищеварительные симптомы" ассоциируется с раком желудка (OR = 2,16, р ≪ 0,0001).
<Р> наблюдаемую связь между индейского происхождения и раком желудка может быть обусловлено действием смешивающих социально-экономических или питательных переменных связано как с раком желудка и родословной. Хорошо известно, что высокая Индеец или африканского происхождения связано с бедностью во многих популяциях в Северной и Южной Америке (см также [27]). Последовательно, мы наблюдали, что Индеец происхождение связано с переменными, которые являются показателями бедности (многие из которых также были связаны с раком желудка), а также их синтетические "социально-экономических" первого фактора многомерного анализа (таблица 1). Когда мы контролировали для всех регрессоров (т.е. три фактора многовариантного анализа и возраста), связь между раком желудка и индейского происхождения не сохраняется (OR = 1,28, 95% ДИ от OR: 0.37-4.47, р = 0,69). Точно так же, когда мы отдельно контролируется для влияния социально-экономических условий (первый фактор многофакторного анализа) или возраст, связь между раком желудка и индейского происхождения также не сохраняется (OR = 2,58, 95% ДИ от ОР: 0,83 -8,07 для фактора 1 и OR = 1,01, 95% ДИ от ОР:. 0.99-1.02 по возрасту)
<р> Мы провели исследование случай-контроль в городской смешанной популяции из Лима (Перу) и определил, что Индеец индивидуальное происхождение связано с раком желудка. Тем не менее, эта ассоциация, кажется, в первую очередь, связано с ассоциацией социально-экономических переменных, как с раком желудка и с индейского происхождения. Последовательно, хотя ассоциация происхождения с раком желудка является значимым (р = 0,011), родословная только объясняет 1,6% дисперсии в состоянии болезни. Когда негенетические ковариаты включены, их совместное действие с родословной объясняет 22,3% дисперсии в состоянии болезни. Таким образом, высокий уровень заболеваемости раком желудка в Перу [1], не кажется, [28] в связи с наличием общей восприимчивости генетических вариантов чаще у коренных американцев населения, а скорее к сочетанию социально-экономических факторов, присутствующих в этой группе населения , Однако дальнейшие исследования с более крупными размерами выборки необходимы для изучения этого наблюдения, так как мощность для обнаружения родословной генетических эффектов была ограничена в настоящем исследовании. Этот результат согласуется с относительным снижением заболеваемости раком желудка в Соединенных Штатах в последние десятилетия, в связи с улучшением социально-экономических условий [29].
<Р> Точность оценок родословной зависит от целого ряда вопросов. Во-первых, количество и характер маркеров, используемых для оценки примеси. 103 AIMS, используемые в данном исследовании, содержат достаточно информации для получения приемлемых оценок примеси [26], [30]. Galanter и др. также показали, что группа из более чем 88 AIMS содержит достаточно информации для оценки индивидуальной смеси с точностью [31]. Второй распространенной методологической проблемой при оценке примеси является трудность в использовании данных из наиболее представительных родительских африканских, европейских и индейских популяций смешанной группы. В этом случае, мы включили в качестве прокси для родительских популяций европейских и африканских лиц из проекта HapMap, и набор перуанских индейцев из перуанских Андах и соседних восточных районах. В то время как этот выбор может не быть оптимальным, используются 103 ОНП, будучи AIMS, смягчены эту проблему, потому что их частоты сильно отличаются среди родительских этнических групп и высокой степени однородности в них [26]. Таким образом, использование маркеров с этими характеристиками делает наши результаты устойчивы к выбору неоптимальных родительских популяций. В-третьих, различные методы оценки индивидуальной примеси могут производить несколько иные результаты, даже начиная с того же набора данных. Для того, чтобы проверить надежность наших результатов примеси в отношении методов оценки примеси, мы переосмыслены данные с использованием альтернативного максимального правдоподобия подходы, предложенные Tang и др. [32] и реализованы в программном обеспечении Frappe, и метод, с помощью Александр и др. реализованы в программном обеспечении Примесь ст. 1.2 [33]. Эти три метода, полученные результаты сильно коррелированные (рис S2) и та же картина ассоциации с раком желудка (данные не показаны).
<Р> Перуанские людей, родившихся в сельской местности, имеют более индейское происхождение, чем в среднем делают жители больших городских центров (Таблица 1). В исследовании случай-контроль, случаи могут часто включать лиц с более индейского происхождения, так как они называются от небольших загородных оздоровительных центров в крупных городских больницах, чтобы получить лучшее здравоохранение. Эта модель направления оказывает меньшее влияние на контроль, и, следовательно, может создать поддельную ассоциацию индейского происхождения с болезнью. Тем не менее, мы записали места рождения для всех участников исследования, и, таким образом, под контролем этот потенциальный сбивающий фактор: когда мы включили место рождения (Лима против сельской местности) в качестве ковариант в логистической регрессии, ассоциации индейского происхождения с раком желудка сохранялась, хотя при более низком значении (р = 0,05 по сравнению с р = 0,011). Мы пришли к выводу, что связь между раком желудка и родословной не является артефактом рефералов сельской местности людей с высокой индейского происхождения нашего исследования больниц. Этот результат подчеркивает важность сбора рождения и жительство данные для генетических исследований ассоциации с заболеваниями в Латинской Америке и других регионах, где большинство европейских колонизация и Примесь произошли в городах, и более автохтонные особи преобладают в сельской местности, например, в Меланезии и Южной Африки .
<р> В этом исследовании мы включили в качестве контроля лиц с кишечной метаплазией (п = 46), при условии, что это не увеличивает риск развития рака желудка [23], [24], [25]. Однако это предположение не является общепринятым [34]. Когда мы в качестве альтернативы принимать три порядковых категории риска заболевания (т.е. лиц, не имеющих кишечной метаплазией, с кишечной метаплазией и раком желудка), эта прогрессия, оценивается с помощью порядкового логистической регрессии также ассоциируется с индейского происхождения (OR = 2,83, 95 % ДИ от ОР: 1.10-7.29, р = 0,031), но опять же, эта связь не сохраняется, когда контролируется для всех регрессоров (фактор 1, 2, и 3, и возраста) (OR = 1,08, 95% ДИ от OR : 0.35-3.34, р = 0,897). Таким образом, наши результаты не зависят от включения кишечной метаплазии лиц в качестве контроля.
<р> В этом исследовании мы сообщаем удивительно высокую индейского происхождения (> 74%). И в контрольной группе и случаев, посещающих государственные больницы из ныне космополитического города Лима, национального капитала, который был также столицей испанца Вицелицензионного Перу в течение пяти веков и, следовательно, центр испанца колониальной власти. Крупные города населения принимающей страны Эквадор, Перу, Боливии и Северной Аргентины, чья обычная культурная идентификация, как метисы
вероятно, игнорирует их большой индейцах генетический фон. Эти городское население часто населены выходцами из сельской местности. Наши результаты свидетельствуют о том, что крупные города западной части Южной Америки пройдет миллионы особей преимущественно индейской генетического фона. Современные международные миграции Юг-Север от кого южноамериканских городов из Андского региона также распространяют генетический фон коренных американцев по всему миру, и ожидается, что почти один миллион США иммигрантам, которые приходят из андских стран [36] имеют высокие уровни Индеец фон. Это не было бы удивительно, если бы эти группы населения, классифицированные как "Испано /выходец из Латинской Америки" в Соединенных Штатах, было больше, чем индейцах происхождение США лиц, классифицированных как коренных американцев.
Материалы и методы <бр>
<р> Для этого исследования мы изначально набираемых на 576 лиц, посещающих Гастроэнтерология подразделений следующих трех больниц в Лиме, в период между 2006 и 2009: Arzobispo Loayza, Дос-де-Майо (оба правительства правили), и рак специализированы Instituto Nacional де Enfermedades Neoplásicas. Каждый участник ответил на вопросник рекордного возраста, пола, места рождения и проживания, а также других социально-экономических, пищевой и медицинской информации (таблица 1). Случаи были взрослыми людьми, указанные для эндоскопии и чьи биопсии были подтверждены как положительные для рака желудка с помощью гистопатологического анализа. Контрольная группа также состоит из взрослых лиц, перечисленных для эндоскопии, но чьи биопсий оказалось отрицательным для рака желудка. Лица с предраковыми поражениями, такими как дисплазия (п = 3) или с наличием других чем рак желудка опухолей желудка (п = 16) были исключены из исследования. Лица с кишечной метаплазией (п = 46) были включены в качестве контрольной группы (см Обсуждение). Окончательное число рассматриваемых предметов для тестирования в исследовании ассоциации было 241 случаев рака желудка и 300 управления.
Ancestry информативные маркеры (AIMS) и генотипирование
<р> Для оценки этнической принадлежности для каждого из испытуемых, мы генотипирование 106 SNPs, которые являются информативными для Африки, Европейский и индейского происхождения [26]. Генотипирование проводили в биомедицинской геномных Центре детской больницы Оклендского исследовательского института (Университет штата Миннесота, Миннесота, США), с использованием платформы Sequenom Iplex (Сан-Диего, штат Калифорния, США). Если коротко, то он основан на удлинением праймера с аллель-специфической с последующим разделением альтернативных аллелей методом масс-спектрометрии. Генотипирование участвуют четыре мультиплексированных анализов, три, содержащие 26 ОНП и один из них содержит 28 ОНП. Перед генотипирования образцов ДНК прошли процедуру контроля качества (КК), который состоял из: (1) неаллельных количественного ПЦР анализа, который измеряет количество ПЦР-укрупнения ДНК и (2) чтения конечной точки из Taqman SNP генотипирование анализ (Applied Biosystems, Пало-Альто, штат Калифорния, США), что, в дополнение к предоставлению второй оценки способности ПЦР для амплификации каждого образца, является чувствительным индикатором образца к образцу перекрестного загрязнения. После того, как мы удалили rs30125 и rs888861 ОНП, показавшие скорость вызова &лт; 95%, средняя скорость вызова для ОНП составила 99,7%. Из 106 маркеров, 104 робастно генерироваться тарифы на звонки в течение по крайней мере 95% образцов, но для rs2592888 SNP нет генотипы общедоступными для населения HapMap и SNP был исключен из дальнейшего анализа. Таким образом, мы использовали генотипов для 103 ОНП для оценки примесей (смотри таблицу S3 для получения полного списка, с их частотами аллелей в популяциях).
оценки Восходящее
<р> Мы оценили индивидуальный родословную с использованием следующие три родительские группы, состоящие из лиц, не связанных между собой: (1) западноафриканская йоруба из Нигерии (йеменских риалов - 118 лиц из HapMap II /III проекта); (2) Юта лиц европейского происхождения, имеющиеся на Centre d'Etude дю Polymorphisme Humain-
коллекции CEPH (CEU - 60 человек, из проекта HapMap II) и (3) 296 перуанских коренных американцев, собранные нашей группой , Генотипы для африканцев и европейцев были получены из базы данных общих HapMap [39], в то время как коренные американцы были генотипированы для этого исследования.
<Р> Мы оценили отдельные родословной и его 90% интервал доверия, используя метод, реализованный в Структура программы 2.3.3 [40], [41]. Это соответствует байесовского вероятностной модели структуры популяции и смеси с использованием методики цепи Маркова Монте-Карло (MCMC), оценивая вклад K родительских популяций к геномах особей из смешанного населения. Мы предположили, что HapMap YRI и КЕС и наши индейские образцы были представителями родительских популяций и желудочные случаев рака и контроля из Лимы примешивали лиц. Для этого набора данных, каждая структура имела пробег 50000 связанные с выжиганием шаги с последующим 250000 шагов MCMC, и повторяли три раза, чтобы позволить проверки надежности результатов. Эта длина пробега и процедуры проверки исключает нежелательное отсутствие сходимости цепей Маркова, которое происходит, когда процедура не должным образом изучить пространство параметров модели. Все опыты проводились в предположении три кластера (К = 3), лямбда был установлен на 1,0, а параметры альфа были оценены для каждого из трех кластеров, GENSBACK = 2, MIGRPRIOR = 0,05, и мы не использовали априорную информацию для лиц из родительские группы населения для оказания помощи кластеризацию (USEPOPINFO = 0).
<р> чтобы представить генетическую структуру наших образцов в контексте разнообразия родительской популяции, мы провели анализ главных компонент (PCA) индивидуальных генотипов (Рисунок 1), как это реализовано в программном обеспечении Adegenet и Ade4 для R окружающей среды [42], [43]. Мы также использовали Ade4 применить метод кластеризации, который основан на PCA двумерного представления индивидов и их центроид населения, проектирование двумерная эллипсы дисперсии. В дополнение к полу, возрасту и самооценка этнической принадлежности, была собрана широкий набор социально-экономических, пищевой и медицинской информации, включая гражданское состояние, место рождения, уровень образования, бытовых условий, привычек питания, частоты потребления фруктов, овощей, мяса и птицы, настои, а также симптомы желудка, связанных с. Эта информация была организована в двоичном, порядкового или категориальные переменные, как указано в таблице S4). Мы исключили переменные, которые имели более 10% недостающих данных, а окончательный набор из 43 переменных были включены в последующих анализах. Чтобы уменьшить размерность этого множества личных, социально-экономических, пищевой и клинической негенетическими переменных мы провели многомерный факторный анализ с использованием статистического пакета для социальных наук (SPSS) Программное обеспечение (SPSS 19 для Windows, SPSS Inc, Chicago, IL , США). Факторный анализ синтезирует дисперсию исходного набора переменных в заданном незначительного числа преобразованных переменных (в нашем случае 3), называемых факторами. Каждый фактор захватывает коррелированный информацию о исходного массива данных, но эти факторы коррелируют среди них [44].
<Р> Чтобы проверить связь между этими негенетическими переменными или его представление полученных многофакторного анализа с фактором рака желудка (бинарная