análise da sequência do genoma do Helicobacter pylori
estirpes associadas a ulceração gástrica e câncer gástrico da arte abstracta
Fundo
colonização persistente do estômago humano por Helicobacter pylori
está associada com inflamação gástrica assintomática (gastrite) e um aumento do risco de ulceração duodenal, ulceração gástrica, e cancro gástrico não-cárdia. Em estudos anteriores, as sequências do genoma de H. pylori
estirpes de pacientes com gastrite ou doença de úlcera duodenal foram analisados. Neste estudo, foram analisadas as sequências do genoma de um H. pylori
tensão (98-10) isolado de um paciente com câncer gástrico e um H. pylori
estirpe (B128) isolado de um paciente com doença de úlcera gástrica .
resultados com base na digitação sequência multilocus, estirpe 98-10 foi mais estreitamente relacionadas com H. pylori
estirpes do Leste asiático origem e estirpe B128 foi mais estreitamente relacionadas com as estirpes de origem europeia. Strain 98-10 continha vários aspectos característicos de estirpes do Leste Asiático, incluindo a Vaca
alelo tipo s1c e uma cagA
alelo que codifica um motivo de fosforilação de tirosina Epiya-D. Um genoma do núcleo de 1237 genes esteve presente em todas as cinco estirpes que seqüências do genoma estavam disponíveis. Entre os genes de núcleo 1237, um subconjunto de alelos era altamente divergente na estirpe Leste asiático 98-10, que codifica proteínas que exibiram < 90% de identidade de sequência de aminoácidos em relação às proteínas correspondentes nas outras quatro estirpes. genes únicos específicos de deformação foram identificados em cada uma das estirpes recentemente sequenciados, e um conjunto de genes específicos de estirpe foi compartilhado entre H. pylori
estirpes associadas a cancro gástrico ou lesões gástricas pré-malignas.
Conclusão
Estes dados fornecem uma visão sobre a diversidade que existe entre H. pylori
cepas de diferentes origens clínicas e geográficas. alelos altamente divergentes e genes específicos de tensão identificados neste estudo podem representar biomarcadores úteis para a análise de particionamento geográfica de H. pylori
e para a identificação de cepas capazes de induzir lesões gástricas malignas ou pré-malignas.
Fundo
Helicobacter pylori
é uma bactéria em forma de espiral Gram-negativa que persistentemente coloniza o estômago humano [1]. Persistente H. pylori
colonização do estômago humano é um fator de risco para várias doenças, incluindo adenocarcinoma não-cárdia gástrico, linfoma gástrico e úlcera péptica [1, 2]. A incidência dessas doenças varia consideravelmente em todo o mundo. Por exemplo, a incidência de adenocarcinoma gástrico é substancialmente maior na Ásia Oriental, América Central e América do Sul do que na maioria das outras partes do mundo [3].
H. pylori
isolados de seres humanos não relacionados exibem um elevado nível de diversidade genética [4, 5]. A variação genética é prontamente detectável por análise das sequências de nucleótidos dos genes individuais em diferentes estirpes de H. pylori
[6]. H. pylori
diversidade alélica é provavelmente a consequência de vários fatores, incluindo uma alta taxa de mutação, uma alta taxa de intraspecies recombinação genética, e uma longa história evolutiva das espécies [4, 7]. Correspondentes alelos em diferentes estirpes de H. pylori
são tipicamente 92 a 99% idênticas em sequências de nucleótidos [4, 6], mas vários genes pylori
H. exibem um nível muito mais elevado de diversidade genética [8, 9].
Outras análises mostraram que há uma variação geográfica entre as cepas do H. pylori
[10-16]. Com base na análise da sequência multilocus de um painel de 370 H. pylori
estirpes isoladas a partir de seres humanos em diferentes partes do mundo, sete populações de estirpes com distribuições geográficas distintas foram identificadas [17]. Estes H. pylori
populações reflectir a migração de seres humanos da África para outras partes do mundo ao longo de um período de tempo estimado em cerca de 58.000 anos [12]. diferenças geográficas entre H. pylori
estirpes poderia ser um fator que ajuda a explicar a incidência variando de H. pylori
doenças -associated em várias partes do mundo.
Além de variação entre H. pylori
estirpes nas sequências de genes individuais, existe uma considerável variação entre as cepas em conteúdo genético. Um estudo analisou o DNA genômico de 56 H. pylori
estirpes diferentes, utilizando métodos de hibridização matriz e identificou 1150 genes que estavam presentes em todas as cepas testadas (representando, assim, um genoma "core") [18]. Entre 1531 genes analisados, 25% estavam ausentes a partir de pelo menos uma das 56 estirpes de H. pylori
. A previsão era de que o H. pylori
núcleo genoma seria composto de 1.111 genes se um conjunto muito maior de isolados foram testados [18]. Outros estudos têm relatado a existência de genomas núcleo que compreende 1091 ou 1281 genes, com base na análise de arranjo de DNA de 34 ou 15 H. pylori
estirpes, respectivamente [19, 20]. Um estudo relatou que a filogenia de estirpes de H. pylori
com base na análise MLST era substancialmente diferente da filogenia do H. pylori
estirpes com base na análise de conteúdo de gene [18].
Um dos mais marcantes diferenças no conteúdo de gene entre as estirpes de H. pylori
é a presença ou ausência de uma região de 40 kb de ADN cromossómico conhecida como a ilha de patogenicidade cag
(PAI) [8, 21-24]. Nos Estados Unidos e na Europa, cerca de 50-60% do H. pylori
cepas contêm a cag
PAI e as estirpes restantes não têm esta região do cromossoma [8, 21-24]. Em muitas outras partes do mundo, incluindo a Ásia Oriental, quase todos H
. pylori
cepas contêm a cag
PAI [15, 25, 26]. A H. pylori cag
PAI codifica uma proteína efectora, CagA, e um aparelho de secreção de tipo IV, que transloca o CagA em células epiteliais gástricas [27]. H. pylori
estirpes albergando o CAG
PAI estão associados com um aumento do risco de cancro gástrico não-cárdia ou doença ulcerosa péptica em comparação com as estirpes que não possuem o CAG
PAI [21, 28]. A correlação entre estas doenças e presença do cag
PAI fornece um exemplo de como a evolução clínica da infecção por H. pylori
é determinado em parte por características genéticas das cepas com que uma pessoa é infectada.
em estudos anteriores, os genomas completos de três estirpes de H. pylori
foram analisados [29-31]. Estes três H. pylori
estirpes foram isoladas de pacientes que tinham gastrite, gastrite atrófica, ou úlcera duodenal. No presente estudo, procurou-se analisar as características genéticas de H. pylori
cepas isoladas de pacientes com dois diferentes H. pylori
doenças -associated: úlcera gástrica e câncer gástrico. Para esta análise, foram selecionadas uma cepa úlcera gástrica (B128) que prontamente coloniza o estômago de ratos e gerbos da Mongólia. Esta estirpe é de particular interesse porque um derivado passadas animal da estirpe B128 (estirpe 7,13) causa câncer gástrico num modelo de gerbilo da Mongólia [32, 33]. Para uma análise de um H. pylori associado a um cancro
estirpe gástrica, foram selecionados estirpe 98-10, que foi isolada de um paciente com câncer gástrico no Japão [34], um país com uma elevada incidência de câncer gástrico [3 , 35].
resultados características gerais do H. pylori
genomas
Antes do estudo, as seqüências genômicas completas de H. pylori
cepas isoladas de pacientes com gastrite superficial, atrófica gastrite, úlcera duodenal ou doença tinha sido relatada [29-31]. No presente estudo, analisamos as sequências do genoma de uma estirpe de H. pylori
(98-10) que foi isolado a partir de um paciente com cancro gástrico [34] e uma estirpe (B128) que foi isolado a partir de um paciente com gástrica doença da úlcera [32]. Características gerais dos dois genomas analisados no presente estudo, em comparação com três genomas sequenciados anteriormente encontram-se resumidos na Tabela 1. Para identificar elementos genéticos transponíveis que podem estar presentes nos dois genomas recentemente sequenciados, as sequências de nucleótidos de cada genoma foram usadas como consultas para procurar uma inserção http banco de dados de sequência:.. //www-se biotoul fr. Estirpe 98-10 continham ORF (HP9810_5g1 e HP9810_5g2) homólogas à ORF encontrados em IS607 (número de acesso AF189015) [36]. A estirpe B128 (ORFs contidas HPB128_26g16, HPB128_26g17, e HPB128_26g18) às ORFs homólogas encontradas em ISHp608 (número de acesso AF357224), mas inserções de nucleótidos são previstos para romper o gene de transposase na estirpe B128 [37]. IS607 e ISHp608 não estão presentes em qualquer um dos três H. pylori
estirpes que seqüências do genoma estavam disponíveis anteriormente. Um estudo anterior relatou que IS607 foi detectada em cerca de 20% de H. pylori
estirpes [36]. ISHp608 é nonrandomly distribuídos geograficamente entre H. pylori
cepas, e este elemento foi relatado para ser mais abundante em cepas de pacientes peruanos com câncer gástrico do que em cepas de pacientes com gastrite peruanos apenas [37] .table 1 Características de H. pylori
genomas
H. pylori estirpe | 26695 J99 HPAG1 98-10 B128 Origem UK US Suécia Japão US doença stateâ Gastrite única DU AG GC GU cag PAI Sim Sim Sim Sim Sim vacA genótipo S1A /m1 s1b /m1 s1b /m1 s1c /m1 S1A /m2h O tamanho do genoma (Mb) 1,67 1,64 1.61b 1.6c 1.6c total não. de ORF 1564d 1491e 1544f 1527 1731 No. de genesg específicos de estirpe 69 23 38 22 51 um DU, úlcera duodenal; AG, gastrite atrófica; GC, câncer gástrico; GU, úlcera gástrica b Inclui um plasmídeo 9.3 kb. C O tamanho do genoma da estirpe 98-10 é baseado na análise de 51 grandes contigs, conforme definido em Métodos. O tamanho do genoma da estirpe B128 é baseado na análise de 73 grandes contigs. D A presente análise é baseada em dados baixados do TIGR, compreendendo 1564 ORF. Em contraste, um quadro sobre as listas de sites TIGR 1587 ORFs na estirpe 26695 e arquivos de GenBank incluem 1566 ORFs de tensão 26695. E ORF adicionais, não incluídas nesse total, foram posteriormente detectado na estirpe J99 [43]. f o cromossomo HPAG1 contém 1.536 previu genes codificadores de proteínas, eo restante estão contidos em um plasmídeo. g presente em apenas um dos cinco cepas analisadas neste estudo. h vacA é truncada em B128 tensão. análise MLST de H. pylori estirpes Online em estudos anteriores, a análise MLST tem sido usado para classificar H. pylori isolados em vários haplogrupos que têm distribuições geográficas distintas [17]. Para atribuir os dois recentemente sequenciados H. pylori estirpes a um dos aglomerados populacionais anteriormente descritos, comparou-se oito sequências de genes a partir de cada estirpe com as sequências correspondentes de outros 434 H. pylori isolados, utilizando um banco de dados como MLST descrito nos Métodos. Com base nesta análise, a estirpe 98-10 foi classificada como um membro do cluster população e tensão B128 Leste Asiático foi classificada como um membro do cluster população europeia. Uma árvore de neighbor-joining que descreve as relações das duas estirpes recentemente sequenciado para cepas de referência representativas isoladas de diversas localizações geográficas é mostrado na Figura 1. O agrupamento representado nesta árvore neighbor-joining reflete com precisão as origens geográficas das cepas de referência, e está em acordo com as atribuições anteriores das estirpes de referência para grupos populacionais distintos [18]. De acordo com um relatório anterior [17], um dos previamente sequenciado H. pylori cepas (J99) foi mais estreitamente relacionadas com estirpes isoladas na África Ocidental, e outro (26695) foi mais estreitamente relacionadas com estirpes isoladas na Europa . Um terceiro H. pylori estirpe (HPAG1) analisada em um estudo prévio foi estreitamente relacionado com estirpes isoladas na Europa. A Figura 1 ilustra que a estirpe 98-10 está mais intimamente relacionado com as estirpes de origem asiática Leste, e, por conseguinte, estirpe 98-10 pertence a um cluster população diferente daqueles de estirpes que foram relatados anteriormente sequências genómicas. Colectivamente, as sequências do genoma disponíveis para análise representam três principais populações geográficas do H. pylori estirpes [Europeia (26695, HPAG1 e B128), do Oeste Africano (J99) e da Ásia Oriental (98-10)]. Figura 1 a estrutura filogenética baseada na análise da sequência de genes do núcleo 8 H. pylori. H. pylori cepas analisadas nesta figura incluem cepas 98-10, B128, três estirpes que foram determinados anteriormente sequências do genoma (26695, J99, HPAG1) e estirpes representativas isoladas de pacientes em diversas localizações geográficas [18]. A figura lista as designações de deformação e os países onde as estirpes foram isoladas. As sequências de nucleótidos dos loci MLST concatenada foram alinhadas e comparadas, como descrito em Métodos. Todas as posições contendo lacunas e dados em falta foram eliminados do conjunto de dados. Houve um total de 3041 posições no conjunto de dados final. árvores de junção de vizinhos foram construídos com base em distâncias estimadas pelo modelo de 2 parâmetros Kimura de substituição de nucleotídeos [57, 58]. A árvore de consenso de bootstrap inferida a partir de 1000 repetições é tomada para representar a história evolutiva das cepas analisadas [59]. Ramos correspondentes às partições reproduzido em menos de 50% réplicas de bootstrap são recolhidos. A árvore está desenhada à escala, com os comprimentos dos ramos nas mesmas unidades que as das distâncias evolutivas utilizadas para inferir a árvore filogenética. Análises filogenéticas foram conduzidas em MEGA4 [63]. Cinco estirpes de H. pylori Compra de que seqüências do genoma estavam disponíveis são indicados por diamantes. Três principais pylori grupos populacionais H. (Leste da Ásia, Europa e África Ocidental) são identificáveis. Análise de cagA Comprar e vacA CagA e VacA são dois importantes H. pylori fatores de virulência que são secretados por uma via de secreção do tipo IV e um caminho tipo V (Autotransporter) secreção, respectivamente [14, 38]. Diversidade na cagA Comprar e vacA genes tem sido investigada em detalhes em estudos anteriores, e diversidade nestes genes fornece uma base para a digitação H. pylori estirpes [8, 13-15]. Assim, analisamos o cag e vacA genes em cada uma das duas estirpes recentemente sequenciados. Quando estirpe 98-10 foi incubado com células epiteliais gástricas AGS como descrito anteriormente [39], CagA foi submetido a fosforilação da tirosina (dados não apresentados), o que indica que esta estirpe tem um sistema de secreção funcional de tipo IV para a translocação de CagA em células hospedeiras [27]. A proteína CagA codificado pela estirpe 98-10 contém 3 Epiya motivos (sítios de fosforilação de tirosina), que tenham sido designadas Epiya-A, Epiya-B, e Epiya-D [14]. A presença de um motivo Epiya-D é característica do H. pylori estirpes isoladas no Leste da Ásia [13, 14]. Caldo de cultura sobrenadante a partir da estirpe 98-10 causada vacuolização das células HeLa, o que indica a presença de uma toxina activa VacA. Esta estirpe contém um tipo s1c /m1 vacA alelo, uma característica que é característica do H. pylori estirpes isoladas no Leste da Ásia [15, 40]. Identificação de East Asian cagA e vacA motivos em estirpe 98-10 é consistente com os resultados da análise MLST, que classificou estirpe 98-10 como um membro do cluster população do Leste Asiático de H. pylori estirpes. Semelhante a estirpe 98-10, a estirpe B128 tem um sistema de secreção funcional do tipo IV que pode translocar CagA em células epiteliais gástricas e CagA, posteriormente, sofre fosforilação da tirosina [41]. A proteína codificada pelo CagA estirpe B128 contém dois motivos Epiya, designados Epiya-A e Epiya-C [14]. A estirpe B128 contém um tipo S1 /m2 vacA alelo, mas a Vaca mutação nesta estirpe está previsto para impedir a expressão de uma proteína de VacA de comprimento completo. A presença deste último mutação foi confirmada por análise da sequência de nucleótidos de um fragmento de vacA amplificado por PCR. A análise de imunotransferência utilizando múltiplos anti-soros anti-VacA indicaram que esta estirpe não produzem uma proteína VacA detectável, e caldo sobrenadante da cultura desta estirpe não causar vacuolização das células HeLa (dados não mostrados). Caracterização da H. pylori genoma do núcleo delineamento de uma H. pylori núcleo genoma (ou seja, genes que são consistentemente presente em todos H. pylori isolados) é de interesse, pois muitos desses genes são susceptíveis de ser necessário para a colonização do estômago humano. Com base no uso de análise de relação pontuação BLAST como descrito nos Métodos, foram identificados 1237 genes que estavam presentes em todos os 5 H. pylori genomas (Figura 2 e arquivo adicional 1). Num estudo anterior, 56 H. pylori estirpes diferentes foram analisados pela metodologia de matriz, e um núcleo de genoma de 1150 genes foi relatada para estar presente em todas as estirpes 56 [18]. Entre os genes de 1150 relatados para compreender o H. pylori núcleo genoma com base na análise de matriz, 1.094 estavam presentes em todas as 5 estirpes analisados no presente estudo, tal como determinado por análise da sequência. A lista de genes nucleares detectadas em todas as cinco estirpes por análise da sequência, mas não por análise de matriz inclui > 20 genes localizados dentro do cag PAI. Embora a cag PAI está presente em todos os 5 cepas analisadas no estudo atual, esta região do DNA é conhecido por ser ausente de muitas pylori estirpes H. [24]. Cinco outros aglomerados de genes adjacentes (cada um com, pelo menos, 4 genes por cacho) estavam presentes em todas as estirpes sequenciadas 5, mas estavam ausentes na lista de genes fundamentais identificados por análise de matriz (HP0061-0065, HP0797-0800, HP1339-1343, HP1400-1403 e HP1455-1458) (arquivo adicionais 1). As diferenças na designação de genes fundamentais no estudo atual em comparação com estudos anteriores pode ser atribuída a vários fatores, incluindo as diferenças no número de cepas analisadas e diferenças de metodologia para detecção do gene. Figura 2 Comparação de proteomas previstos pela análise de relação BLAST-score (BSR). O painel esquerdo mostra uma análise BSR das proteínas codificadas por J99 tensão e HPAG1, com a estirpe 26695 como estirpe de referência. O painel da direita mostra uma análise de BSR de proteínas codificadas por estirpe 98-10 e B128, com a estirpe 26695 como estirpe de referência. A abordagem BSR análises todas as proteínas preditas para serem codificadas por três genomas, usando uma medida de similaridade com base na relação de pontuação BLAST, como descrito nos Métodos. Proteínas representadas dentro da caixa no canto inferior esquerdo (BSR < 0,4) correspondem a proteínas presentes no proteoma de referência (estirpe 26695), mas ausente das duas proteomas de consulta. O quadrante direito superior representa proteínas conservadas em todos os três proteomas. Uma análise dos genes de 1237 do núcleo central indica que, em quase todos os casos, não houve diferenças nas sequências de aminoácidos das proteínas codificadas por estirpes individuais. comparações par a par das proteínas codificadas por diferentes estirpes indicou que os níveis de parentesco variou de 65% a 100% de identidade de aminoácidos. Uma comparação representativa das proteínas do núcleo codificadas por duas estirpes (98-10 e 26695) é mostrado na Figura 3. Foram identificados apenas 11 genes para os quais as sequências de aminoácidos das proteínas codificadas eram idênticos entre todas as 5 estirpes. Sete desses 11 genes codificados proteínas ribossomais; outros codificado um factor de iniciação da tradução (IF-1), uma lipoproteína (lpp 20), uma proteína flagelar basal do corpo (Flie), e uma proteína de função desconhecida (HP0031). Figura 3 Relatedness de proteínas do núcleo previstos para ser codificado por H. pylori 98-10 e 26695. Um conjunto de 1237 genes presentes em todas as 5 estirpes de H. pylori foi identificado, como descrito nos Métodos. As sequências de aminoácidos deduzidas das proteínas correspondentes codificadas por estirpe 98-10 foram utilizadas para pesquisar uma base de dados de sequências de 26695 estirpe utilizando FastA. A melhor partida foi identificado, e a identidade por cento de ácido amino foi calculado. O histograma mostra o número de ORFs exibindo o nível indicado de identidade de aminoácidos. Análise de genes divergentes num H. Leste Asiático associado a um cancro estirpe pylori H. pylori estirpes isoladas a partir alheios os seres humanos exibem a diversidade alélica (tipicamente identidade de nucleotídeos 92-99% entre os alelos correspondentes), que fornece uma base para a classificação das cepas em grupos populacionais, através de análise MLST. Vários genes exibem um nível substancialmente mais elevado de diversidade alélica. Por exemplo, pelo menos dois genes (cagA e uma sel1 homólogo) são conhecidos por serem consideravelmente divergentes em East Asian H. pylori estirpes comparação com ocidentais H. pylori estirpes [13, 14 , 42]. Trabalhamos com a hipótese de que os genes adicionais podem ser muito divergentes na estirpe do Leste Asiático 98-10 em comparação com as outras 4 estirpes sequenciadas. Para identificar produtos de genes codificados pelo genoma de 98-10 que são marcadamente divergentes em relação aos produtos codificados pelos outros 4 genomas, nós nos concentramos em análise dos 1237 genes fundamentais que estiveram presentes em todas as 5 estirpes sequenciadas. Utilizando a abordagem descrita em Methods, foram identificadas 8 produtos de genes que eram altamente divergente na estirpe Tradicional Oriental em comparação com as outras quatro estirpes (Tabela 2). Estes incluem CagA e uma sel1 homólogo, que foram previamente relatado para ser consideravelmente divergentes em cepas da Ásia Oriental em comparação com linhagens de outras partes do mundo [13, 42]. As sequências de aminoácidos destas proteínas divergentes codificados pela estirpe Japonesa 98-10 foram cada uma < 90% idênticas às sequências de proteínas correspondentes a partir das outras quatro estirpes (Tabela 2). Em cada caso, os alelos divergentes em estirpe 98-10 e alelos correspondentes nas outras quatro estirpes foram ladeado pelo mesmo cromossômica genes.Table 2 alelos altamente divergentes na estirpe do Leste Asiático 98-10 número Gene (98-10) número Gene (26695) Descrição % aa identidade (98 -10) uma % de identidade aa (não-98-10) b % sítios únicos c
HP9810_903g20 HP0061d Hypothetical 67 86 21 HP9810_889g5 HP0492d hpaA homologue 72 92 21 HP9810_889g32 HP0519d sel1 homólogo 73 92 15 HP9810_905g13 HP0547 cagA 79 87 11 HP9810_868g41 HP0806d Hypothetical 86 92 6 HP9810_899g75 HP1322d Hypothetical 75 90 18 HP9810_899g76 HP1323d Ribonuclease 88 92 6 HP9810_885g15 HP1524d Hypothetical 80 95 13 um As sequências dos produtos de genes indicada na estirpe 98-10 foram comparadas com as sequências correspondentes em cada uma das outras 4 estirpes (26695, J99, HPAG1 e B128) identidades de ácidos aminados%, e significam foram calculados conforme descrito nos métodos. b as sequências dos produtos de genes indicados em cada estirpe foram comparados em todas as permutações, excepto que as comparações envolvendo estirpe 98-10 foram excluídos da análise. A média de identidades de ácidos aminados% foram calculados como descrito em Métodos. CPercentage de sítios alinhados na qual a proteína a partir da estirpe 98-10 continham um aminoácido diferente a partir dos correspondentes aminoácidos de proteínas a partir de outras 4 estirpes. Para dReported ser um constituinte da H. pylori núcleo do genoma, com base em pelo menos uma matriz de análise de [18-20]. Como mostrado na Figura 1, estirpe J99 foi o mais estreitamente relacionado com H. pylori estirpes isolado na África Ocidental, um cluster população diferentes daqueles das outras estirpes para as quais estavam disponíveis sequências genómicas. Portanto, a hipótese de que genes específicos pode ser altamente divergentes na J99 estirpe Oeste Africano em comparação com as outras 4 estirpes sequenciadas. Para identificar estes genes, foi utilizada a mesma abordagem tal como acima descrito. Quatro alelos altamente divergentes originais foram identificados na estirpe J99 (Tabela 3), cada um codificando produtos que eram < 90% idênticas às proteínas correspondentes nas outras quatro estirpes. alelos altamente divergentes exclusivas não eram facilmente identificáveis em estirpes 26695, HPAG1, ou B128. Uma exceção notável foi a identificação de um vacA altamente divergentes alelo em B128 estirpe (HPB128_147g10 gene). Identificação de vacA como um alelo divergente na estirpe B128 é atribuível à presença de uma S1 /m2 vacA alelo desta estirpe e a presença de alelos S1 /m1 nas outras quatro estirpes; M1 e M2 formas de VacA normalmente exibem apenas 60-70% de identidade de aminoácidos dentro mid-região da proteína do [38] .table 3 alelos altamente divergentes em estirpe J99 número Gene (J99) número Gene (26695) Descrição % aa identidade (J99) um identidade% aa (não-J99) b % sítios únicos c
jhp0028 HP0032 Hypothetical 68 91 24 jhp0080 HP0087d Hypothetical 89 96 8 jhp0173 HP0185d Hypothetical 88 93 7 jhp0395 HP1029d Hypothetical 88 95 7 um As sequências dos produtos de genes indicados na estirpe J99 foram comparadas com sequências correspondentes em cada uma das outras 4 estirpes (26695, HPAG1, B128, e 98-10), e significa identidades de ácidos aminados% foram calculados. b A sequências dos produtos de genes indicados em cada estirpe foram comparados em todas as permutações, excepto que as comparações envolvendo estirpe J99 foram excluídos da análise. A média de identidades de ácidos aminados% foram calculados. CPercentage de sítios alinhados na qual a proteína a partir da estirpe J99 contidos um aminoácido diferente a partir dos ácidos aminados correspondentes das proteínas a partir de outras 4 estirpes. D Relatado seja um constituinte do H. pylori núcleo do genoma, com base em pelo menos uma matriz de análise de [18-20]. a identificação de novos genes específicos de estirpe Para identificar genes específicos da estirpe que está presente em um dos dois recentemente sequenciado genomas sequenciados, mas não anteriormente H. pylori genomas, mais uma vez usou uma análise da relação pontuação BLAST, como descrito nos Métodos (Figura 2). Estirpe 98-10 continham 22 novos genes específicos de deformação e tensão B128 continha 51 (arquivos adicionais 2 e 3). Além disso, foram identificados 16 genes que estavam presentes em ambos estirpe 98-10 e B128, mas não está presente em nenhuma das estirpes anteriormente sequenciadas (arquivo adicional 4). Várias das ORFs específica de estirpe de H. pylori estirpes 98-10 e B128 foram < 100 nucleótidos de comprimento, e é incerto se ou não estes ORFs curtos sejam efectivamente traduzidos em proteínas. Uma análise de genes específicos de tensão única nos três previamente sequenciado H. pylori genomas (26695, J99, e HPAG1) revelou um número similar de genes específicos de estirpe única (Tabela 1), que foram descritos em estudos anteriores [ ,,,0],29-31]. para identificar possíveis funções dos genes específicos da estirpe encontrados apenas em tensão 98-10 ou B128 (ou ambos 98-10 e B128), as sequências de proteínas deduzidas foram usados como consultas para BLAST procura de um banco de dados NCBI de sequências de proteínas não redundantes (Tabela 4 e os arquivos adicionais 2, 3, 4). A maioria das proteínas específicas da estirpe encontradas exclusivamente na estirpe B128 98-10 ou não estavam intimamente relacionada com quaisquer proteínas conhecidas ou estavam relacionados com proteínas na base de dados para os quais as funções não são conhecidos. Vários dos genes específicos da estirpe encontra exclusivamente na estirpe 98-10 ou B128 foram previamente detectados em cepas de H. pylori para os quais não foram determinadas as sequências do genoma. Tal como descrito acima, foram identificadas sequências de inserção e os genes codificadores de transposase (IS607 e ISHp608). Dois genes específicos da estirpe de H. pylori em estirpe B128 (HPB128_11g15 e HPB128_11g23) proteínas codificadas relacionadas com o tipo de componentes do sistema de secreção IV (VirB9 e VirD4, respectivamente). Os genes do aglomerado (que mede a HPB128_11g15 HPB128_11g23) não foram detectados em análises genómicas originais de estirpes J99, 26695, ou HPAG1 [29-31], mas foram subsequentemente detectado na estirpe J99 e várias outras estirpes de H. pylori específica Strain-4 [43] .table H. pylori genes presentes exclusivamente na estirpe 98-10 ou B128 | Número de genes em a tensão indicada (s) a | 98-10 B128 98-10 e B128 número total de tensão Genesa espec�ico 22 51 16 classe funcional transposase 2 Sims 3 6 Tipo gene secreção IV clusterb 0 7 0 hipotético 17 37 9 No jogo de banco de dados 8 8 Página 2 mais próximo jogo não tem função conhecida 9 29 7 Outros Sims 3 4 1 ilhas genética que contém genesc específicos de estirpe Página 2 11 Sims 3 aPresent na estirpe indicada (s), mas não em qualquer uma das outras quatro estirpes para as quais as sequências de genoma estão disponíveis. bEsta grupo de genes não foi detectada na análise inicial do genoma da estirpe J99, mas foi subsequentemente detectados na estirpe J99 [43]. Cfor esta análise, uma ilha foi considerada presente se dois ou mais genes específicos de tensão estavam em loci cromossómico contíguo. Curiosamente, a estirpe B128 contém vários genes (HPB128_155g19, HPB128_156g11 , HPB128_156g12, HPB128_184g1, HPB128_190g1) previsto para codificar proteínas que são mais estreitamente relacionados com a proteínas codificadas por H. acinonychis (a Helicobacter espécies isoladas a partir de grandes felinos) [44] ou H. cetorum (a espécies Helicobacter isolados de mamíferos marinhos) [45] do que a qualquer relatado anteriormente H. pylori sequências de proteínas (arquivo adicionais 3). http://www.softberry.com/berry.phtml?topic=fgenesb&group=programs&subgroup=gfindb[56],
|