sequenza del genoma Helicobacter pylori
ceppi associati con ulcerazione gastrica e cancro gastrico
Abstract
sfondo colonizzazione
persistente dello stomaco umano da Helicobacter pylori
è associata ad infiammazione asintomatica gastrica (gastrite) e un aumento del rischio di ulcerazione duodenale, ulcera gastrica e cancro gastrico non cardiale. In studi precedenti, le sequenze del genoma di H. pylori
ceppi di pazienti con gastrite o ulcera duodenale sono stati analizzati. In questo studio, abbiamo analizzato le sequenze del genoma di un ceppo di H. pylori
(98-10) isolato da un paziente con cancro gastrico e una H. pylori
ceppo (B128), isolati da un paziente con malattia ulcera gastrica
. Risultati commercio basato su multilocus tipizzazione sequenza, ceppo 98-10 è stato più strettamente legato alla H. pylori
ceppi di origine orientale e la tensione B128 è stato più strettamente connesse con ceppi di origine europea. Strain 98-10 conteneva più caratteristiche dei ceppi dell'Asia orientale, tra cui un tipo S1c vacA
allele e un CagA
allele che codifica per un motivo fosforilazione della tirosina Epiya-D. Un genoma nucleo di 1237 geni era presente in tutti e cinque i ceppi per i quali sequenze genomiche erano disponibili. Tra i geni di base 1237, un sottoinsieme di alleli era altamente divergenti nel ceppo orientale 98-10, che codifica per le proteine che mostravano < 90% aminoacido sequenza identità rispetto alle proteine corrispondenti negli altri quattro ceppi. geni specifici del ceppo unici sono stati individuati in ognuno dei ceppi recentemente sequenziato, e una serie di geni specifici del ceppo è stata condivisa tra H. pylori
ceppi associati al cancro gastrico o lesioni gastriche precancerose.
Conclusione
Questi dati forniscono un'idea della diversità che esiste tra H. pylori
ceppi provenienti da diverse origini clinici e geografici. alleli altamente divergenti e geni specifici del ceppo identificati in questo studio possono rappresentare biomarcatori utili per analizzare il partizionamento geografica di H. pylori
e per identificare i ceppi in grado di indurre lesioni gastriche maligne o precancerose.
Sfondo
Helicobacter pylori
è un batterio a forma di spirale Gram-negativi che colonizza con insistenza il [1] stomaco umano. Persistente H. pylori
colonizzazione dello stomaco umano è un fattore di rischio per molte malattie, tra cui non-cardias adenocarcinoma gastrico, linfoma gastrico e ulcera peptica [1, 2]. L'incidenza di queste malattie varia considerevolmente in tutto il mondo. Ad esempio, l'incidenza di adenocarcinoma gastrico è sostanzialmente più alto in Asia orientale, America Centrale e Sud America che in molte altre parti del mondo [3].
H. pylori
isolati da esseri umani indipendenti mostrano un alto livello di diversità genetica [4, 5]. La variazione genetica è facilmente rilevabile analizzando le sequenze nucleotidiche dei geni singoli in diverse H. pylori
ceppi [6]. H. pylori
diversità allelica è probabilmente la conseguenza di molteplici fattori, tra cui un alto tasso di mutazione, un alto tasso di intraspecie ricombinazione genetica, e una lunga storia evolutiva della specie [4, 7]. alleli corrispondenti nelle diverse H. pylori
ceppi tipicamente sono 92 a 99% identico nella sequenza nucleotidica [4, 6], ma diversi pylori
geni H. presentano un livello molto più elevato di diversità genetica [8, 9].
Ulteriori analisi hanno dimostrato che non c'è variazione geografica tra H. pylori
ceppi [10-16]. Sulla base di analisi di sequenza multilocus di un panel di 370 H. pylori
ceppi isolati da uomo in varie parti del mondo, sono stati identificati sette popolazioni di ceppi con distribuzioni geografici distinti [17]. Questi H. pylori
popolazioni riflettono la migrazione degli esseri umani dall'Africa ad altre parti del mondo, in un periodo di tempo stimato in circa 58 mila anni [12]. Le differenze geografiche tra H. pylori
ceppi potenzialmente potrebbe essere un fattore che contribuisce a spiegare l'incidenza variabile di H. pylori
malattie -associated in varie parti del mondo.
Oltre alla variazione tra H. pylori
ceppi nelle sequenze di singoli geni, vi è una notevole variabilità tra i ceppi nel contenuto gene. Uno studio ha analizzato il DNA genomico da 56 diversi H. pylori
ceppi con metodi serie di ibridazione e identificati 1150 geni che erano presenti in tutti i ceppi testati (che rappresentano quindi un genoma "core") [18]. Tra 1531 geni analizzati, 25% erano assenti da almeno uno dei 56 H. pylori
ceppi. E 'stato previsto che il H. pylori
genoma nucleo sarebbe composto da 1.111 geni se un insieme molto più ampio di isolati sono stati testati [18]. Altri studi hanno riportato l'esistenza di genomi di nucleo composto da 1091 o 1281 geni, sulla base di analisi del DNA array di 34 o 15 H. pylori
ceppi, rispettivamente [19, 20]. Uno studio ha riportato che la filogenesi di H. pylori
ceppi sulla base di analisi MLST era sostanzialmente diverso dalla filogenesi di H. pylori
ceppi sulla base di analisi dei contenuti gene [18].
Uno dei più suggestivi differenze nel contenuto genico tra H. pylori
ceppi è la presenza o l'assenza di una regione di 40 kb di DNA cromosomico conosciuta come isola cag
patogenicità (PAI) [8, 21-24]. Negli Stati Uniti e in Europa, circa il 50-60% di H. pylori
ceppi contengono il cag
PAI ei rimanenti ceppi mancano di questa regione del cromosoma [8, 21-24]. In molte altre parti del mondo, tra cui Asia orientale, quasi tutti H
. pylori
ceppi contengono il cag
PAI [15, 25, 26]. Il H. pylori cag PAI
codifica per una proteina effettrici, CagA, e un apparato di secrezione di tipo IV che trasloca CagA nelle cellule epiteliali gastriche [27]. H. pylori
ceppi ospitano il cag
PAI sono associati ad un aumentato rischio di cancro gastrico non cardiale o ulcera peptica rispetto a ceppi che non hanno la cag
PAI [21, 28]. La correlazione tra queste malattie e la presenza del cag
PAI fornisce un esempio di come il risultato clinico di H. pylori
infezione è determinata in parte da caratteristiche genetiche dei ceppi con cui una persona è infetta.
in studi precedenti, i genomi completi di tre H. pylori
ceppi sono stati analizzati [29-31]. Questi tre H. pylori
ceppi sono stati isolati da pazienti che avevano gastrite, gastrite atrofica, o ulcera duodenale. In questo studio, abbiamo cercato di analizzare le caratteristiche genetiche di H. pylori
ceppi isolati da pazienti con due differenti H. pylori
malattie -associated: ulcera gastrica e cancro gastrico. Per questa analisi, abbiamo selezionato un ceppo ulcera gastrica (B128), che colonizza facilmente lo stomaco di topi e gerbilli mongoli. Questo ceppo è di particolare interesse perché un derivato animale diversi passaggi di deformazione B128 (ceppo 7.13) provoca il cancro gastrico in un modello gerbillo mongolo [32, 33]. Per l'analisi di un gastrica H. cancro-associata pylori
ceppo, abbiamo selezionato ceppo 98-10, che è stato isolato da un malato di cancro gastrico in Giappone [34], un paese con un alta incidenza di cancro gastrico [3 , 35].
Risultati
caratteristiche generali di H. pylori
genomi
Prima di questo studio, le sequenze del genoma completo di H. pylori
ceppi isolati da pazienti affetti da gastrite superficiale, atrofica gastrite o ulcera duodenale sono stati riportati [29-31]. In questo studio, abbiamo analizzato le sequenze del genoma di un ceppo di H. pylori
(98-10) che è stato isolato da un paziente con cancro gastrico [34] e un ceppo (B128) che è stato isolato da un paziente con gastrica ulcera malattia [32]. caratteristiche generali dei due genomi analizzati nel presente studio rispetto a tre genomi sequenziati precedenza sono riassunti nella Tabella 1. Per identificare elementi genetici trasponibili che potrebbero essere presenti nei due genomi sequenziati recentemente, le sequenze nucleotidiche di ogni genoma sono stati usati come query per cercare un inserimento database di sequenze http:.. //www-è biotoul fr. Strain 98-10 conteneva ORF (HP9810_5g1 e HP9810_5g2) omologhe a ORF si trovano in IS607 (numero di accesso AF189015) [36]. Strain B128 conteneva ORF (HPB128_26g16, HPB128_26g17, e HPB128_26g18) omologhe a ORF si trovano in ISHp608 (numero di accesso AF357224), ma inserzioni di nucleotidi sono previsti per distruggere il gene trasposasi nel ceppo B128 [37]. IS607 e ISHp608 non sono presenti in nessuna delle tre H. pylori
ceppi per i quali sequenze del genoma in precedenza erano disponibili. Un precedente studio ha riportato che IS607 è stato rilevato in circa il 20% dei ceppi di H. pylori
[36]. ISHp608 è non casualmente distribuito geograficamente tra H. pylori
ceppi, e questo elemento è stato segnalato per essere più abbondante in ceppi provenienti da pazienti peruviani con cancro gastrico rispetto a ceppi di pazienti con gastrite peruviani solo [37] .table 1 Caratteristiche di H. pylori
genomi
H. pylori ceppo | 26695 J99 HPAG1 98-10 B128 origine UK US Svezia Giappone US Disease statea gastrite solo DU AG GC GU cag PAI Sì Sì Sì Sì Si vacA genotipo S1A /m1 S1B /m1 S1B /m1 S1c /m1 S1A /m2h dimensione del genoma (Mb) 1.67 1.64 1.61b 1.6c 1.6c Total no. di ORF 1564d 1491e 1544f 1527 1731 No. di specifici ceppo genesg 69 23 38 22 51 un DU, ulcera duodenale; AG, gastrite atrofica; GC, cancro gastrico; GU, ulcera gastrica B comprende una 9.3 kb plasmide. C Le dimensioni del genoma del ceppo 98-10 si basa sull'analisi di 51 grandi contigs, come definito nei metodi. La dimensione del genoma del ceppo B128 è basato sull'analisi di 73 grandi contigs. D L'attuale analisi si basa sui dati scaricati da TIGR, che comprende 1564 ORF. Al contrario, una tabella sul sito web elenchi TIGR 1587 ORF in ceppo 26695, e file di sequenze Genbank includono 1566 ORF dal ceppo 26695. e ORF aggiuntivi, non compresi in questo totale, sono stati successivamente rilevata nel ceppo J99 [43]. f il cromosoma HPAG1 contiene 1.536 predetto geni codificanti proteine, e il resto sono contenute in un plasmide. g presente solo uno dei cinque ceppi analizzati in questo studio. h vacA è troncato nel ceppo B128. analisi MLST di H. pylori ceppi in studi precedenti, l'analisi MLST è stato utilizzato per classificare H. pylori isolati in diversi aplogruppi che hanno distribuzioni geografiche distinte [17]. Per assegnare i due nuovi sequenziato H. pylori ceppi ad uno dei gruppi di popolazione precedentemente descritti, abbiamo confrontato otto sequenze di geni provenienti da ogni ceppo ai corrispondenti sequenze di 434 altri H. pylori isolati, utilizzando un database MLST come descritto nei Metodi. Sulla base di questa analisi, ceppo 98-10 è stato classificato come un membro del cluster di popolazione e la tensione B128 orientale è stato classificato come un membro del cluster popolazione europea. Un albero vicino di casa-joining raffiguranti rapporti dei due ceppi di recente in sequenza per ceppi rappresentativi di riferimento isolati da diverse aree geografiche è mostrato in Figura 1. Il raggruppamento raffigurato su questo albero vicino-giunzione riflette accuratamente le origini geografiche dei ceppi di riferimento, ed è in accordo con le precedenti assegnazioni dei ceppi di riferimento a gruppi di popolazione distinti [18]. In accordo con una precedente relazione [17], una delle precedentemente sequenziati H. pylori ceppi (J99) è stato più strettamente legato ai ceppi isolati in Africa occidentale, e un altro (26695) è stato più strettamente legato ai ceppi isolati in Europa . Un terzo H. pylori ceppo (HPAG1) analizzati in uno studio preliminare è stato strettamente legato alla ceppi isolati in Europa. La Figura 1 mostra che ceppo 98-10 è più strettamente legato a ceppi di origine asiatica Est, e quindi, ceppo 98-10 appartiene a un cluster di popolazione diverse da quelle dei ceppi per i quali sono stati registrati precedentemente sequenze genomiche. Collettivamente, le sequenze del genoma disponibili per l'analisi rappresentano tre principali popolazioni geografiche di H. pylori ceppi [europea (26695, HPAG1 e B128), dell'Africa occidentale (J99), e orientale (98-10)]. Figura 1 Struttura filogenetica sulla base di analisi di sequenza di 8 geni fondamentali H. pylori. H. pylori ceppi analizzati in questa figura comprendono ceppi 98-10, B128, tre ceppi per i quali sequenze del genoma sono stati precedentemente determinati (26695, J99, HPAG1), e ceppi rappresentativi isolati da pazienti in aree geografiche diverse [18]. La figura elenca le designazioni di deformazione e dei paesi in cui sono stati isolati ceppi. Le sequenze nucleotidiche della concatenato loci MLST sono stati allineati e confrontati, come descritto in Metodi. Tutte le posizioni che contengono lacune e dati mancanti sono stati eliminati dal set di dati. Ci sono stati un totale di 3041 posizioni nel set di dati finale. alberi vicini-giunzione sono stati costruiti sulla base di distanze stimati dal Kimura modello 2-parametro di sostituzione nucleotidica [57, 58]. L'albero di consenso bootstrap dedurre dal 1000 repliche viene preso per rappresentare la storia evolutiva dei ceppi analizzati [59]. Branches corrispondenti alle partizioni riprodotte in meno del 50% repliche di bootstrap sono crollati. L'albero è in scala, con le lunghezze filiali nelle stesse unità come quelli delle distanze evolutive utilizzati per dedurre l'albero filogenetico. Le analisi filogenetiche sono state condotte in MEGA4 [63]. Cinque H. pylori ceppi per i quali sequenze genomiche erano disponibili sono indicati con diamanti. Tre principali H. pylori gruppi di popolazione (est asiatico, europei e dell'Africa occidentale) sono identificabili . Analisi di cagA e vacA CagA e VacA sono due importanti H. pylori fattori di virulenza che vengono secreti da un percorso di secrezione di tipo IV e un percorso di tipo V (autotransporter) secrezione rispettivamente [14, 38]. La diversità in cagA Vaca geni ed è stato studiato in dettaglio in studi precedenti, e la diversità in questi geni fornisce una base per la tipizzazione H. pylori ceppi [8, 13-15]. Pertanto, abbiamo analizzato la cagA Vaca geni e in ciascuno dei due ceppi di recente sequenziato. Quando ceppo 98-10 è stata incubata con cellule epiteliali gastriche AGS, come descritto in precedenza [39], ha subito CagA fosforilazione della tirosina (dati non mostrati), che indica che questo ceppo ha un sistema di secrezione di tipo IV funzionale per traslocazione di CagA nelle cellule ospiti [27]. La proteina CagA codificata dal ceppo 98-10 contiene 3 Epiya motivi (siti di fosforilazione della tirosina), che sono state designate Epiya-A, Epiya-B, e Epiya-D [14]. La presenza di un motivo Epiya-D è caratteristica di H. pylori ceppi isolati in Asia orientale [13, 14]. Brodo di coltura surnatante dal ceppo 98-10 causato vacuolizzazione delle cellule HeLa, che indica la presenza di una tossina VacA attiva. Questo ceppo contiene un tipo S1c /m1 vacA allele, una caratteristica che è caratteristica di H. pylori ceppi isolati in Asia orientale [15, 40]. Identificazione orientale cagA e Vaca motivi in tensione 98-10 è coerente con i risultati delle analisi MLST, che classificato ceppo 98-10 come un membro del gruppo orientale popolazione asiatica di H. pylori ceppi. simile per la tensione 98-10, ceppo B128 ha un sistema di secrezione di tipo IV funzionale che può traslocare CagA nelle cellule epiteliali gastriche, e CagA subisce successivamente fosforilazione della tirosina [41]. La proteina CagA codificata dal ceppo B128 contiene due motivi Epiya, designati Epiya-A e Epiya-C [14]. Strain B128 contiene un tipo S1 /m2 vacA allele, ma a Vaca mutazione in questo ceppo è previsto per impedire l'espressione di una proteina VacA full-length. La presenza di quest'ultimo mutazione era confermata mediante analisi della sequenza nucleotidica di un vacA frammento amplificato mediante PCR. analisi immunoblot utilizzando più antisieri anti-VacA ha indicato che questo ceppo non ha prodotto una proteina VacA rilevabile, e brodo di coltura surnatante da questo ceppo non ha causato vacuolizzazione delle cellule HeLa (dati non riportati). Caratterizzazione del H. pylori nucleo genoma delineazione di un H. pylori genoma di base (cioè i geni che sono costantemente presenti in tutti H. pylori isolati) è di interesse, in quanto molti di questi geni sono suscettibili di essere richiesto per la colonizzazione dello stomaco umano. Basato sull'utilizzo del punteggio BLAST analisi per indici, come descritto nei metodi, abbiamo identificato 1237 geni che erano presenti in tutti i 5 H. pylori genomi (Figura 2 e file aggiuntivo 1). In uno studio precedente, 56 differenti ceppi di H. pylori sono stati analizzati mediante metodologie di matrice e un genoma nucleo di 1150 geni stato segnalato per essere presente in tutti i 56 ceppi [18]. Tra i 1150 geni segnalati comprendere H. pylori genoma core basato su analisi serie, 1094 erano presenti in tutti i 5 ceppi analizzati nel presente studio, come determinato da analisi di sequenza. L'elenco dei geni di base rilevate in tutti i cinque ceppi di analisi di sequenza, ma non da analisi serie include > 20 geni localizzati all'interno del cag PAI. Anche se il cag PAI è presente in tutti i 5 ceppi analizzati nel presente studio, questa regione del DNA è noto per essere assente da molti pylori ceppi H. [24]. Cinque altri cluster di geni contigui (ciascuna con almeno 4 geni per cluster) erano presenti in tutti e 5 i ceppi sequenziato, ma erano assenti dalla lista dei geni fondamentali identificati da analisi serie (HP0061-0065, HP0797-0800, HP1339-1343, HP1400-1403, e HP1455-1458) (file supplementare 1). Le differenze di designazione di geni fondamentali in questo studio rispetto agli studi precedenti, può essere attribuita a numerosi fattori, tra cui differenze nel numero di ceppi analizzati e le differenze nella metodologia per l'individuazione del gene. Figura 2 Confronto di proteomi previsti dal rapporto BLAST-score (BSR) analisi. Il pannello di sinistra mostra un'analisi BSR di proteine codificate da ceppo J99 e HPAG1, con ceppo 26695 come ceppo di riferimento. Il pannello di destra mostra un'analisi BSR di proteine codificate da ceppo 98-10 e B128, con ceppo 26695 come ceppo di riferimento. L'approccio BSR analizza tutte le proteine previsto per essere codificati da tre genomi, utilizzando una misura di similarità sulla base del rapporto di punteggi BLAST, come descritto nei Metodi. Le proteine raffigurati all'interno della casella in basso a sinistra (BSR < 0,4) corrispondono a proteine presenti nel proteoma di riferimento (ceppo 26695), ma assente dalle due proteomi di query. Il quadrante in alto a destra rappresenta proteine conservati in tutti e tre i proteomi. Un'analisi dei 1237 geni di base indicato che, in quasi tutti i casi, vi erano differenze nelle sequenze di aminoacidi delle proteine codificate da singoli ceppi. confronti a coppie delle proteine codificate da diversi ceppi indicato che i livelli di parentela variavano dal 65% al 100% di identità aminoacidica. Un confronto rappresentativo delle proteine codificate dal nucleo due ceppi (98-10 e 26695) è mostrato in Figura 3. sono stati identificati solo 11 geni per cui le sequenze amminoacidiche delle proteine codificate erano identici tra tutte 5 ceppi. Sette di questi 11 geni codificati proteine ribosomali; altri codificati un fattore di inizio della traduzione (IF-1), una lipoproteina (Lpp20), un flagellare basale proteine del corpo (flie), e una proteina di funzione sconosciuta (HP0031). Figura 3 Relatedness delle proteine fondamentali previsti da codificare da H. pylori ceppi 98-10 e 26695. Un insieme di 1237 geni presenti in tutti i 5 ceppi di H. pylori è stato identificato, come descritto nei metodi. Le sequenze di amminoacidi dedotta delle corrispondenti proteine codificate da ceppo 98-10 sono stati usati per la ricerca di un database di sequenze dal ceppo 26695 utilizzando Fasta. La migliore partita è stata identificata, e l'identità di acido per cento amino è stato calcolato. L'istogramma mostra il numero di ORF espositrici al livello indicato di identità con gli aminoacidi . L'analisi dei geni divergenti in un orientale H. cancro-associata pylori ceppo H. pylori ceppi isolati da estranei gli esseri umani mostrano la diversità allelica (tipicamente 92-99% di identità nucleotidica tra alleli corrispondenti), che fornisce una base per la classificazione dei ceppi in cluster di popolazione attraverso l'analisi MLST. Diversi geni mostrano un livello notevolmente più elevata di diversità allelica. Ad esempio, almeno due geni (cagA e SEL1 omologo) sono noti per essere marcatamente divergenti in Est asiatico H. pylori ceppi rispetto al occidentali H. pylori ceppi [13, 14 , 42]. Abbiamo ipotizzato che i geni aggiuntivi potrebbero essere altamente divergenti nel ceppo orientale 98-10 rispetto agli altri 4 ceppi sequenziato. Per identificare prodotti genici codificate dal genoma di 98-10 che sono nettamente divergenti rispetto ai prodotti codificati dagli altri 4 genomi, ci siamo concentrati sull'analisi dei 1237 geni fondamentali che erano presenti in tutti e 5 i ceppi sequenziato. Utilizzando l'approccio descritto in Metodi, sono stati identificati 8 prodotti genici che sono stati altamente divergenti nel ceppo dell'Asia orientale rispetto alle altre quattro ceppi (Tabella 2). Questi includono CagA e SEL1 omologo, che in precedenza erano segnalato per essere marcatamente divergenti in ceppi dell'Asia orientale rispetto a ceppi provenienti da altre parti del mondo [13, 42]. Le sequenze di amminoacidi di queste proteine codificate divergenti dal ceppo giapponese 98-10 erano ogni < 90% identico a sequenze di proteine corrispondenti dalle altre quattro ceppi (Tabella 2). In ogni caso, gli alleli divergenti in tensione 98-10 e alleli corrispondenti nelle altre quattro ceppi sono stati affiancati dallo stesso cromosomica genes.Table 2 alleli altamente divergenti orientale ceppo 98-10 numero Gene (98-10) numero Gene (26695) Descrizione % aa identità (98 -10) un % aa identità (non-98-10) b % siti unici c
HP9810_903g20 HP0061d Hypothetical 67 86 21 HP9810_889g5 HP0492d hpaA omologo 72 92 21 HP9810_889g32 HP0519d sel1 omologo 73 92 15 HP9810_905g13 HP0547 cagA 79 87 11 HP9810_868g41 HP0806d Hypothetical 86 92 6 HP9810_899g75 HP1322d Hypothetical 75 90 18 HP9810_899g76 HP1323d Ribonuclease 88 92 6 HP9810_885g15 HP1524d Hypothetical 80 95 13 un Le sequenze dei prodotti genici indicato nel ceppo 98-10 sono stati confrontati con le sequenze corrispondenti ciascuno degli altri 4 ceppi (26695, J99, HPAG1 e B128), e significare identità acido% amminoacidi sono stati calcolati come descritto in Metodi. b le sequenze dei prodotti genici indicati in ogni ceppo sono stati confrontati in tutte le permutazioni, tranne che i confronti che coinvolgono ceppo 98-10 sono stati esclusi dall'analisi. Significano identità acidi% amminoacidi sono stati calcolati come descritto in Metodi. CPercentage di siti allineati in cui la proteina dal ceppo 98-10 conteneva un amminoacido diverso dai corrispondenti amminoacidi nelle proteine da 4 altri ceppi. DReported a essere un costituente del H. pylori nucleo genoma, sulla base di almeno una analisi serie [18-20]. Come mostrato nella Figura 1, ceppo J99 è più strettamente legato alla H. pylori ceppi isolato in Africa occidentale, un cluster popolazione diversa da quelle degli altri ceppi che sequenze genomiche erano disponibili. Pertanto, abbiamo ipotizzato che i geni specifici potrebbero essere altamente divergenti degli Stati dell'Africa occidentale J99 sforzo rispetto agli altri 4 ceppi sequenziato. Per identificare tali geni, abbiamo utilizzato lo stesso metodo descritto sopra. Quattro alleli altamente divergenti unici sono stati identificati nel ceppo J99 (Tabella 3), ogni codifica dei prodotti che erano < il 90% identico alle proteine corrispondenti negli altri quattro ceppi. Unico alleli altamente divergenti non erano facilmente identificabili in ceppi 26695, HPAG1 o B128. Una notevole eccezione è stata l'individuazione di un altamente divergenti vacA allele nel ceppo B128 (gene HPB128_147g10). Identificazione vacA come allele divergente ceppo B128 è attribuibile alla presenza di un s1 /m2 vacA allele in questo ceppo e la presenza di alleli s1 /m1 negli altri quattro ceppi; M1 e M2 forme di VacA in genere mostrano solo il 60-70% aminoacido identità all'interno della metà regione della proteina [38] .table 3 alleli altamente divergenti ceppo J99 numero Gene (J99) numero Gene (26695) Descrizione % aa identità (J99) a % aa identità (non-J99) b % siti unici c
jhp0028 HP0032 Hypothetical 68 91 24 jhp0080 HP0087d Hypothetical 89 96 8 jhp0173 HP0185d Hypothetical 88 93 7 jhp0395 HP1029d Hypothetical 88 95 7 un Le sequenze dei prodotti genici indicati nel ceppo J99 sono state confrontate con le sequenze corrispondenti a ciascuno degli altri 4 ceppi (26695, HPAG1, B128, e 98-10), e significano identità acidi% amminoacidi sono stati calcolati. b L' sequenze dei prodotti genici indicati in ogni ceppo sono stati confrontati in tutte le permutazioni, tranne che i confronti che coinvolgono ceppo J99 sono stati esclusi dall'analisi. Significano identità acidi% amminoacidi sono stati calcolati. CPercentage di siti allineati in cui la proteina dal ceppo J99 conteneva un amminoacido diverso dagli amminoacidi corrispondenti proteine da 4 altri ceppi. D Segnalato come un costituente H. pylori genoma di base, sulla base di almeno una analisi serie [18-20] . l'identificazione di nuovi geni specifici del ceppo per identificare i geni specifici del ceppo unicamente presenti in uno dei due neo sequenziato genomi ma non precedentemente sequenziato H. pylori genomi, abbiamo usato ancora una volta un punteggio BLAST analisi del rapporto, come descritto nei metodi (Figura 2). Strain 98-10 conteneva 22 nuovi geni specifici del ceppo e la tensione B128 conteneva 51 (File aggiuntivi 2 e 3). Inoltre, abbiamo identificato 16 geni che erano presenti in entrambe ceppo 98-10 e B128, ma non è presente in nessuno dei ceppi precedentemente sequenziati (file aggiuntivo 4). Molti dei ORF specificità di ceppo a H. pylori ceppi 98-10 e B128 erano < 100 nucleotidi di lunghezza, e non è certo se questi brevissimi ORF sono effettivamente tradotti in proteine. L'analisi di specifici geni ceppo unico nei tre precedentemente sequenziato H. pylori genomi (26695, J99, e HPAG1) ha rivelato un numero simile di geni specifici per deformazione unici (Tabella 1), che sono stati descritti in studi precedenti [ ,,,0],29-31]. per identificare potenziali funzioni dei geni specifici del ceppo trovato solo nel ceppo 98-10 o B128 (o entrambi 98-10 e B128), le sequenze proteiche dedotte sono state utilizzate come query per la ricerca di un BLAST Database NCBI di sequenze proteiche non ridondanti (Tabella 4 e file aggiuntivi 2, 3, 4). La maggior parte delle proteine specifiche del ceppo trovato solo nel ceppo 98-10 o B128 non sono stati strettamente correlati a qualsiasi proteine note o erano legati alle proteine nel database per il quale le funzioni non sono noti. Molti dei geni specifici del ceppo trovato esclusivamente in ceppo 98-10 o B128 sono stati precedentemente rilevati in ceppi di H. pylori per le quali non sono state determinate le sequenze del genoma. Come descritto in precedenza, sono state identificate le sequenze di inserimento e geni trasposasi-codifica (IS607 e ISHp608). Due geni specifici del ceppo di H. pylori B128 ceppo (HPB128_11g15 e HPB128_11g23) proteine codificate relative al tipo componenti del sistema di secrezione IV (rispettivamente VirB9 e VirD4,). I geni in questo cluster (che copre HPB128_11g15 a HPB128_11g23) non sono stati rilevati nelle analisi genomiche originali di ceppi J99, 26695, o HPAG1 [29-31], ma sono stati successivamente rilevati nel ceppo J99 e molti altri H. pylori ceppi [43] .table 4 Strain-specifica H. pylori geni presenti esclusivamente nel ceppo 98-10 o B128 | numero di geni in il ceppo indicato (s) un | 98-10 B128 98-10 e B128 numero totale di ceppo SPECIFICI Genesa 22 51 16 classe funzionale trasposasi 2 3 6 Tipo secrezione IV gene clusterb 0 7 0 ipotetico 17 37 9 Nessuna corrispondenza del database Pagina 8 Pagina 8 2 più vicina partita manca funzione nota 9 29 7 Altri 3 4 1 isole Gene contenenti genesc specifico per ceppo 2 11 Pagina 3 aPresent nel ceppo indicato (s), ma non in uno qualsiasi degli altri quattro ceppi per i quali sono disponibili sequenze genomiche. gruppo BQuesto di geni non è stato rilevato nell'analisi originale del genoma dal ceppo J99, ma era successivamente rilevato nel ceppo J99 [43]. CFOR questa analisi, un 'isola è stata considerata di essere presente se due o più geni specifici del ceppo erano contigui loci cromosomici. è interessante notare che, ceppo B128 contiene diversi geni (HPB128_155g19, HPB128_156g11 , HPB128_156g12, HPB128_184g1, HPB128_190g1) prevedeva per codificare proteine che sono più strettamente legati alle proteine codificate da H. acinonychis (un Helicobacter specie isolate dai grandi gatti) [44] o H. cetorum (un Helicobacter specie isolate da mammiferi marini) [45] che a qualsiasi precedentemente segnalati H. pylori sequenze proteiche (file supplementare 3). http://www.softberry.com/berry.phtml?topic=fgenesb&group=programs&subgroup=gfindb[56],
|