Stomach Health > magen Helse >  > Stomach Knowledges > undersøkelser

Genome sekvensanalyse av Helicobacter pylori stammer assosiert med magesår og mage cancer

Genome sekvensanalyse av Helicobacter pylori
stammer assosiert med magesår og magekreft
Abstract
Bakgrunn
Vedvarende kolonisering av den menneskelige magen ved Helicobacter pylori
er forbundet med asymptomatisk mage betennelse (gastritt) og en økt risiko for duodenal sår, magesår, og ikke-Cardia magekreft. I tidligere studier, genomsekvenser av H. pylori
stammer fra pasienter med gastritt eller magesår sykdom har blitt analysert. I denne studien, analyserte vi genomsekvenser av en H.pylori
stamme (98-10) isolert fra en pasient med gastrisk cancer og en H. pylori
stamme (B128) isolert fra en pasient med gastrisk ulcer .
Resultater
Basert på multilocus sekvens typing, stamme 98-10 ble mest knyttet til H. pylori
stammer av østasiatisk opprinnelse og belastning B128 var mest knyttet til stammer av europeisk opprinnelse. Strain 98-10 inneholdt flere funksjoner karakteristisk for østasiatiske stammer, inkludert type s1c Vaca
allel og en CagA
allel koder en Epiya-D tyrosinfosforylering motiv. En kjerne genomet av 1237 gener var til stede i alle de fem stammer som genomsekvenser var tilgjengelige. Blant de 1237 kjerne-genene, et delsett av alleler var sterkt divergerende i Øst-Asia-stamme 98-10, som koder for proteiner som viste < 90% aminosyre-sekvensidentitet i forhold til tilsvarende proteiner i de andre fire stammer. Unike stammespesifikke gener ble identifisert i hver av de nylig sekvenserte stammer, og et sett av stammespesifikke gener ble delt mellom Helicobacter pylori
stammer assosiert med magekreft eller premaligne gastriske lesjoner.
Konklusjon
Disse data gi innsikt i mangfoldet som finnes blant H. pylori
stammer fra ulike kliniske og geografiske opphav. Meget divergerende alleler og stammespesifikke gener identifisert i denne studien kan representere nyttige biomarkører for å analysere geografisk fordeling av H. pylori Hotell og for å identifisere stammer som kan indusere maligne eller premaligne helsefare.
Bakgrunn
Helicobacter pylori
er en Gram-negativ spiralformet bakterie som koloniserer vedvarende magesekken hos mennesket [1]. Vedvarende H. pylori
kolonisering av magesekken hos mennesket er en risikofaktor for en rekke sykdommer, inkludert ikke-cardia gastrisk adenokarsinom, gastrisk lymfom, og peptisk sårdannelse [1, 2]. Forekomsten av disse sykdommene varierer betydelig over hele verden. For eksempel forekomsten av adenokarsinom i ventrikkel er betydelig høyere i Øst-Asia, Sentral-Amerika og Sør-Amerika enn i de fleste andre deler av verden [3].
H. pylori
isolater fra ubeslektede mennesker oppviser et høyt nivå av genetisk variasjon [4, 5]. Genetisk variasjon er lett påvisbar ved å analysere nukleotidsekvensene til individuelle gener i forskjellige H. pylori
stammer [6]. H. pylori
allel mangfold er sannsynligvis en konsekvens av flere faktorer, blant annet en høy grad av mutasjon, en høy grad av intraspecies rekombinasjon, og en lang evolusjonær historie av artene [4, 7]. Tilsvarende alleler i ulike H. pylori
stammer vanligvis er 92-99% identisk i nukleotidsekvenser [4, 6], men flere H. pylori
gener utviser et mye høyere nivå av genetisk mangfold [8, 9].
Videre analyser har vist at det er geografisk variasjon mellom H. pylori
stammer [10-16]. Basert på multilocus sekvensanalyse av et panel av 370 H. pylori
stammer isolert fra mennesker i forskjellige deler av verden, har syv populasjoner av stammer med forskjellige geografiske fordelinger blitt identifisert [17]. Disse H. pylori
populasjoner reflektere migrering av mennesker fra Afrika til andre deler av verden i løpet av en tidsperiode estimert til å være omtrent 58 000 år [12]. Geografiske forskjeller blant H. pylori
stammer kan potensielt være en faktor som bidrar til å forklare den varierende forekomst av H. pylori
-associated sykdommer i ulike deler av verden.
I tillegg til variasjonen mellom H. pylori
stammer i sekvenser av enkeltgener, er det betydelig variasjon mellom stammene i genet innhold. En studie analysert genomisk DNA fra 56 forskjellige H. pylori
-stammer ved hjelp av matrisen hybridiserings- metoder og identifisert 1150 gener som var tilstede i alle de testede stammer (således som representerer en "kjerne" genom) [18]. Blant 1531 gener som ble analysert, 25% var fraværende fra minst en av de 56 H. pylori
stammer. Det ble spådd at H. pylori
kjerne genomet vil bestå av 1,111 gener hvis et mye større antall isolater ble testet [18]. Andre studier har rapportert at det finnes kjerne genomer omfatter 1091 eller 1281 gener, basert på DNA rekke analyse av 34 eller 15 H. pylori
stammer henholdsvis [19, 20]. En studie rapporterte at fylogeni av H. pylori
stammer basert på MLST analyse var vesentlig forskjellig fra fylogeni av H. pylori
stammer basert på analyse av gen innhold [18].
En av de mest slående forskjeller i genet innhold blant H. pylori
-stammer er nærvær eller fravær av et 40 kb område av kromosomalt DNA kjent som cag
patogenitet øy (PAI) [8, 21-24]. I USA og Europa, omtrent 50-60% av H. pylori
stammer inneholder cag
PAI, og de gjenværende stammer som mangler denne regionen av kromosomet [8, 21-24]. I mange andre deler av verden, inkludert Asia, nesten alle H
. pylori
stammer inneholde CAG
PAI [15, 25, 26]. H. pylori cag
PAI koder for en effektor protein, CagA, og en type IV sekret apparat som translocates CagA inn i gastriske epitel-celler [27]. H. pylori
stammer som bærer den CAG
PAI er forbundet med økt risiko for ikke-Cardia magekreft eller magesår sykdom sammenlignet med stammer som mangler CAG
PAI [21, 28]. Sammenhengen mellom disse sykdommene og nærvær av CAG
PAI gir et eksempel på hvordan det kliniske utfallet av H. pylori
infeksjon bestemmes delvis av genetiske egenskapene til stammene som en person er smittet.
i tidligere studier har de komplette genomene til tre H. pylori
stammer blitt analysert [29-31]. Disse tre H. pylori
stammer isolert fra pasienter som hadde gastritt, atrofisk gastritt eller magesår sykdom. I denne studien, forsøkte vi å analysere genetiske trekk H. pylori
stammer isolert fra pasienter med to forskjellige H. pylori
-associated sykdommer: magesår og magekreft. For denne analysen, valgte vi et magesår stamme (B128) som lett koloniserer magen på mus og mongolske ørkenrotte. Denne stamme er av spesiell interesse fordi et dyr-passaged derivat av stamme B128 (belastning 7,13) forårsaker magekreft i en mongolske ørkenrotte-modellen [32, 33]. For en analyse av en magekreft-forbundet H. pylori
belastning, valgte vi belastning 98-10, som ble isolert fra en magekreft pasient i Japan [34], et land med en svært høy forekomst av magekreft [3 , 35].
Resultater
Generelle trekk ved H. pylori
genomer
Før denne studien, den komplette genomsekvenser av H. pylori
stammer isolert fra pasienter med overfladisk gastritt, atrofisk gastritt eller magesår sykdom hadde blitt rapportert [29-31]. I denne studien, analyserte vi genomsekvenser av en H.pylori
stamme (98-10) som ble isolert fra en pasient med gastrisk kreft [34] og en stamme (B128) som ble isolert fra en pasient med gastrisk ulcus [32]. Generelle trekk ved de to genomer analysert i denne studien sammenlignet med tre tidligere sekvenserte genomer er oppsummert i tabell 1. For å identifisere transposable genetiske elementer som kan være til stede i de to nylig sekvenserte genomer, ble nukleotidsekvensene til hver genomet anvendes som spørringer å søke et innførings sekvens database http:.. //www-er biotoul fr. Strain 98-10 inneholdt ORF (HP9810_5g1 og HP9810_5g2) homologe til ORF funnet i IS607 (tiltredelse antall AF189015) [36]. Strain B128 inneholdt ORF (HPB128_26g16, HPB128_26g17, og HPB128_26g18) homologe til ORF funnet i ISHp608 (tiltredelse antall AF357224), men nucleotide innsett er spådd å forstyrre transposase genet i stamme B128 [37]. IS607 og ISHp608 ikke er til stede i noen av de tre H. pylori
stammer som genomsekvenser tidligere var tilgjengelige. En tidligere studie rapporterte at IS607 ble påvist i 20% av H. pylori
stammer [36]. ISHp608 er nonrandomly fordelt geografisk mellom H. pylori
stammer, og dette elementet ble rapportert å være mer rikelig i stammer fra peruanske pasienter med magekreft enn i stammer fra peruanske pasienter med gastritt bare [37] .table 1 Funksjoner av H. pylori
genomer

H. pylori belastning

26695 <.no> J99
HPAG1
98-10
B128
Origin
UK
US
Sverige
Japan
US
Disease statea
gastritt bare
DU
AG: GC
GU
CAG
PAI
Ja
Ja
Ja
Ja
Ja
Vaca
genotype
S1 A /m1
s1b /m1
s1b /m1
s1c /m1
S1 A /m2h
Genome størrelse (Mb)
1.67
1.64
1.61b
1.6c
1.6c
Total nei. av ORF
1564d
1491e
1544f
1527
1731
No. belastning spesifikke genesg
69
23
38
22
51
en DU, duodenal sår; AG, atrofisk gastritt; GC, magekreft; GU, magesår
b Inkluderer et 9,3 kb plasmid.
C Genomet størrelsen på belastningen 98-10 er basert på analyse av 51 store contigs, som definert i metoder. Genomet størrelsen på belastningen B128 er basert på analyse av 73 store contigs.
D Analysen er basert på data som lastes ned fra TIGR, bestående av 1564 ORF. I motsetning til en tabell på TIGR nettsted lister 1587 ORF i stammen 26 695, og Genbank sekvensfiler inkluderer 1566 ORF belastningsskader 26695.
e Ekstra ORF, som ikke inngår i denne summen, ble senere påvist i belastning J99 [43].
f HPAG1 kromosomet inneholder 1536 spådde proteinkodende gener, og resten befinner seg på et plasmid.
g Tilstede i bare én av fem stammer analysert i denne studien.
h Vaca
er avkortet i belastningen B128.
MLST analyse av H. pylori
stammer
i tidligere studier har blitt brukt MLST analyse for å klassifisere H. pylori
isolater i flere haplogrupper som har forskjellige geografiske fordelinger [17]. For å tildele de to nylig sekvenserte H. pylori
stammer til en av de tidligere beskrevne populasjons klynger, sammenlignet vi åtte gensekvenser fra hver stamme til de tilsvarende sekvenser av 434 annen H.pylori
isolater, ved hjelp av en database som MLST beskrevet i Metoder. Basert på denne analysen, ble belastningen 98-10 klassifisert som et medlem av den østasiatiske befolkningen klynge og belastning B128 ble klassifisert som et medlem av den europeiske befolkningen klyngen. En nabo-sammenføyning treet som viser forholdene mellom de to nylig sekvenserte stammer til representative referansestammer isolert fra ulike geografiske steder er vist i figur 1. clustering avbildet på denne nabo-sammenføyning treet nøyaktig gjenspeiler den geografiske opprinnelsen til referansestammer, og er i avtalen med tidligere oppdrag av referansestammer til forskjellige befolkningsgrupper [18]. Etter avtale med en tidligere rapport [17], en av de tidligere sekvensert H. pylori
stammer (J99) ble mest knyttet til stammer isolert i Vest-Afrika, og en annen (26695) ble mest knyttet til stammer isolert i Europa . En tredje H. pylori
stamme (HPAG1) analysert i en tidligere studie var nært knyttet til stammer isolert i Europa. Figur 1 viser at belastningen 98-10 er mest knyttet til stammer av østasiatisk opprinnelse, og derfor tilhører belastning 98-10 til en befolkning klynge forskjellig fra de stammer som genomsekvenser ble tidligere rapportert. Kollektivt, de genomsekvenser er tilgjengelige for analyse representerer tre hoved geografiske populasjoner av H. pylori
stammer [European (26695, HPAG1 og B128), vestafrikanske (J99), og østasiatiske (98-10)]. Figur 1 Fylogenetisk struktur basert på sekvensanalyse av 8 H. pylori kjerne gener. H. pylori
stammer analysert i dette tallet inkluderer stammer 98-10, B128, tre stammer som genomsekvenser ble tidligere fastsatte (26695, J99, HPAG1), og representative stammer isolert fra pasienter i ulike geografiske steder [18]. Figuren viser strekk betegnelser og de landene hvor stammer ble isolert. Nukleotidsekvensene til den sammenkjedede MLST loci ble justert og sammenlignet, som beskrevet i Metoder. Alle stillingene som inneholder hull og manglende data ble fjernet fra datasettet. Det var totalt 3041 stillinger i den endelige datasettet. Neighbor-sammenføyning trær ble konstruert basert på avstander som er estimert av Kimura to-parameter modell av nukleotidsubstitusjon [57, 58]. Bootstrap konsensus tre utledes fra 1000 gjentak er tatt til å representere den evolusjonære historien til stammene analysert [59]. Grener tilsvarende partisjoner gjengitt i færre enn 50% bootstrap gjentak er kollapset. Treet er trukket til skala, med avdelings lengder i samme enheter som de av de evolusjonære avstander som brukes til å utlede fylogenetisk tre. Fylogenetiske analyser ble utført i MEGA4 [63]. Fem H. pylori
stammer som genomsekvenser var tilgjengelige er merket med diamanter. Tre hoved H. pylori
befolkningsgrupper (østasiatiske, europeiske og vestafrikanske) er identifiserbare.
Analyse av CagA Hotell og Vaca
CagA og Vaca er to viktige H. pylori
virulensfaktorer som skilles av en type IV sekresjon sti og en type V (auto) sekresjon vei, henholdsvis [14, 38]. Mangfold i CagA Hotell og Vaca
gener har blitt undersøkt i detalj i tidligere studier, og mangfold i disse genene gir grunnlag for å skrive H. pylori
stammer [8, 13-15]. Derfor har vi analysert CagA
og Vaca
gener i hver av de to nylig sekvenserte stammer.
Når stammen 98-10 ble inkubert med AGS gastriske epitel-celler som beskrevet tidligere [39], CagA gikk tyrosinfosforylering (data ikke vist), noe som indikerer at denne stammen har en funksjonell type IV sekresjon system for translokasjon av CagA inn i vertsceller [27]. Den CagA protein kodet av belastning 98-10 inneholder 3 Epiya motiver (områder av tyrosinfosforylering), som har blitt utpekt Epiya-A, Epiya-B, og Epiya-D [14]. Tilstedeværelsen av en Epiya-D-motivet som er karakteristisk for H. pylori
stammer isolert i Øst-Asia [13, 14]. Buljongkultur supernatant fra stamme 98-10 forårsaket vakuolisering av HeLa-celler, noe som indikerer nærværet av en aktiv Vaca toksin. Denne belastningen inneholder en type s1c /m1 Vaca
allele, en funksjon som er karakteristisk for H. pylori
stammer isolert i Øst-Asia [15, 40]. Identifisering av østasiatisk CagA
og Vaca
motiver i belastning 98-10 er i tråd med resultatene av MLST analyse, som er klassifisert belastning 98-10 som medlem av den østasiatiske befolkningen klynge av H. pylori
stammer.
likhet med stamme 98-10, stamme B128 har en funksjonell type IV sekresjon system som kan translocate CagA inn mage epitelceller, og CagA gjennomgår deretter tyrosinfosforylering [41]. Den CagA protein kodet av belastning B128 inneholder to Epiya motiver, utpekt Epiya-A og Epiya-C [14]. Strain B128 inneholder en type s1 /m2 Vaca
allel, men en Vaca
mutasjon i denne stammen er spådd å hindre uttrykk for en full-lengde Vaca protein. Tilstedeværelsen av den sistnevnte mutasjonen ble bekreftet ved nukleotid-sekvensanalyse av en Vaca
fragment amplifisert ved PCR. Immunoblot-analyse ved hjelp av flere anti-Vaca antisera viste at denne stammen ikke produserte en påvisbar Vaca protein, og buljongkultur supernatant fra denne stamme førte ikke til vakuolisering av HeLa-celler (data ikke vist).
Karakterisering av H. pylori
kjernegenomet
Avgrensning av en H. pylori
kjernegenomet (dvs. gener som er konsekvent til stede i det hele tatt H. pylori
isolater) er av interesse, fordi mange slike gener vil trolig være nødvendig for kolonisering av magesekken hos mennesket. Basert på bruk av BLAST poengsum ratio analyse som beskrevet i Methods identifiserte vi 1237 gener som var til stede i alle 5 H. pylori
genomer (figur 2 og tilleggsfiler 1). I en tidligere studie ble 56 forskjellige H. pylori
stammer analysert ved matrise metode, og en kjerne genomet av 1150 gener ble rapportert å være til stede i alle 56 stammer [18]. Blant de 1150 genene som er rapportert å omfatte de H. pylori
kjerne genom basert på rekke analyse, 1094 var til stede i alle 5 stammer analysert i denne studien, som bestemt ved sekvensanalyse. Listen over kjerne gener påvist i alle de fem stammer ved sekvensanalyse, men ikke ved rekke analyse inkluderer > 20 gener som befinner seg innenfor CAG
PAI. Selv om CAG
PAI er til stede i alle 5 stammer analysert i denne studien, er denne delen av DNA kjent for å være fraværende fra mange H. pylori
stammer [24]. Fem andre klynger av sammenhengende gener (hver med minst 4 gener per cluster) var til stede i alle 5 sekvensert stammer, men var fraværende fra listen over kjerne gener identifisert ved rekke analyse (HP0061-0065, HP0797-0800, HP1339-1343, HP1400-1403, og HP1455-1458) (tilleggsfiler 1). Forskjellene i betegnelse av kjerne gener i denne studien sammenlignet med tidligere studier kan tilskrives mange faktorer, blant annet forskjeller i antall stammer analysert og forskjeller i metodikk for genet deteksjon. Figur 2 Sammenligning av spådd proteom ved BLAST-poengsum ratio (BSR) analyse. Den venstre panel viser en BSR analyse av proteiner kodet av belastning J99 og HPAG1, med strekk 26695 som referanse belastning. Høyre panel viser en BSR analyse av proteiner kodet av belastning 98-10 og B128, med strekk 26695 som referanse belastning. BSR-tilnærmingen analyserer alle proteiner anslått til å være kodet av tre genomer, ved hjelp av et mål på likhet basert på forholdet av BLAST-score, som beskrevet i Metoder. Proteiner er avbildet inne i boksen i nedre venstre hjørne (BSR < 0,4) tilsvarer proteiner tilstede i referanse proteomet (stamme 26 695), men fraværende fra de to spørre proteom. Den øvre høyre kvadrant representerer proteiner konservert i alle tre proteom.
En analyse av kjerne 1237 genene indikerte at i nesten alle tilfeller, var der forskjeller i aminosyresekvensene til proteinene kodet av individuelle stammer. Parvise sammenligninger av proteiner kodet av forskjellige stammer viste at nivåene av slektskap varierte fra 65% til 100% aminosyre identitet. En representativ sammenligning av kjerneproteiner som kodes av to stammer (98-10 og 26695) er vist i figur 3. Bare 11 gener ble identifisert hvor aminosyresekvensene av kodede proteiner var identisk blant alle 5 stammer. Syv av disse 11 gener kodet ribosomale proteiner; andre kodet for et translasjons-initierings-faktor (IF-1), et lipoprotein (Lpp20), et flagell basal kroppsprotein (flue), og et protein med ukjent funksjon (HP0031). Figur 3 slektskapet av kjerneproteiner anslått til å være kodet av H. pylori-stammer 98-10 og 26695. Et sett med 1237-gener som er tilstede i alle 5 H. pylori
stammer har blitt identifisert, som beskrevet i Metoder. De utledede aminosyresekvenser for de tilsvarende proteiner kodet av stammen 98 til 10 ble brukt til å søke i en database over sekvenser fra stammen 26 695 ved hjelp av FastA. Den beste tilpasning ble identifisert, og den prosentvise aminosyre identitet ble beregnet. Histogrammet viser antall ORF stiller det angitte nivået av aminosyren identitet.
Analyse av avvikende gener i et østasiatisk kreft-assosiert H. pylori
belastning
H. pylori
stammer isolert fra urelaterte mennesker utviser allel mangfold (typisk 92-99% nucleotide identitet blant tilsvarende alleler), som gir grunnlag for klassifisering av stammer i befolkningsgrupper via MLST analyse. Flere gener utviser en betydelig høyere grad av allelisk variasjon. For eksempel, er minst to gener (CagA Kjøpe og en sel1
homolog) kjent for å være markert avvikende i østasiatiske H. pylori
stammer sammenlignet med vestlige H. pylori
stammer [13, 14 , 42]. Vi antok at flere gener kan være svært divergerende i østasiatiske belastningen 98-10 i forhold til de andre 4 sekvenserte stammer. Å identifisere genprodukter kodet av genomet til 98-10 som er markert avvikende i forhold til produkter kodet av de 4 andre genomer, vi fokusert på analyse av 1237 sentrale gener som var til stede i alle 5 sekvensert stammer. Ved å bruke den tilnærmingen som er beskrevet i Methods, identifiserte vi 8 genprodukter som var sterkt divergerende i østasiatiske belastning i forhold til de andre fire stammer (tabell 2). Disse inkluderer CagA og en sel1
homolog, som tidligere ble rapportert å være markert avvikende i østasiatiske stammer forhold til stammer fra andre deler av verden [13, 42]. Aminosyresekvensene i disse avvikende proteiner kodet av den japanske stammen 98-10 ble hver < 90% identisk med sekvenser av tilsvarende proteiner fra de fire andre stammer (tabell 2). I hvert tilfelle ble de avvikende alleler i belastning 98-10 og tilsvarende alleler i de andre fire stammer flankert av samme kromosom genes.Table 2 svært avvikende alleler i østasiatisk belastning 98-10
Gene antall plakater (98-10)
Gene nummer (26695)
Beskrivelse
% aa identitet (98 -10) en
% aa identitet plakater (non-98-10) b
% unike nettsteder C

HP9810_903g20
HP0061d
Hypothetical
67
86
21
HP9810_889g5
HP0492d
hpaA
homolog
72
92
21
HP9810_889g32
HP0519d
sel1
homolog
73
92
15
HP9810_905g13
HP0547
CagA

79
87
11
HP9810_868g41
HP0806d
Hypothetical
86
92
6
HP9810_899g75
HP1322d
Hypothetical
75
90
18
HP9810_899g76
HP1323d
Ribonuclease
88
92
6
HP9810_885g15
HP1524d
Hypothetical
80
95
13
en Sekvensene av de angitte genprodukter i belastning 98-10 ble sammenlignet med tilsvarende sekvenser i hver av de 4 andre stammer (26695, J99, HPAG1 og B128) ble, og mener% aminosyre identiteter beregnet som beskrevet i metoder.
b sekvensene til de angitte genproduktene i hver stamme ble sammenlignet i alle permutasjoner, bortsett fra at sammenligninger som involverer stamme 98-10 ble ekskludert fra analysen. Bety% aminosyre identitet ble beregnet som beskrevet i Metoder.
CPercentage av innrettede områder hvor proteinet fra stamme 98-10 inneholdt en aminosyre forskjellig fra de tilsvarende aminosyrer i proteiner fra 4 andre stammer.
DReported til være en bestanddel av H. pylori
kjerne-genomet, basert på minst en rekke analyse [18-20].
Som vist i figur 1, ble stamme J99 nærmest beslektet med H. pylori
stammer isolert i Vest-Afrika, en populasjon klynge forskjellig fra de av andre stammer som genomsekvenser var tilgjengelige. Derfor hypotese vi at bestemte gener kan være svært avvikende i det vestafrikanske belastning J99 i forhold til de andre 4 sekvenserte stammer. For å identifisere slike gener, vi brukte samme metode som beskrevet ovenfor. Fire unike sterkt avvikende alleler ble identifisert i stamme J99 (tabell 3), som hver koder for produkter som var < 90% identiske med tilsvarende proteiner i de andre fire stammer. Unike sterkt avvikende alleler var ikke lett identifiserbare i stammer 26695, HPAG1, eller B128. Et bemerkelsesverdig unntak var identifiseringen av en svært avvikende Vaca
allel i belastning B128 (genet HPB128_147g10). Identifisering av Vaca
som en avvikende allel i belastning B128 skyldes tilstedeværelsen av en s1 /m2 Vaca
allel i denne belastningen og tilstedeværelsen av S1 /m1 alleler i de fire andre stammer; m1 og m2 former Vaca oppviser typisk bare 60-70% aminosyre identitet innenfor midtområde av proteinet [38] .table 3 Sterkt avvikende alleler i stammen J99
Gene antall plakater (J99)
Gene nummer (26695)
Beskrivelse
% aa identitet (J99) en

% aa identitet (non-J99) b
% unike nettsteder C

jhp0028
HP0032
Hypothetical
68
91
24
jhp0080
HP0087d
Hypothetical
89
96
8
jhp0173
HP0185d
Hypothetical
88
93
7
jhp0395
HP1029d
Hypothetical
88
95
7
en Sekvensene til de angitte genproduktene i stammen J99 ble sammenlignet med tilsvarende sekvenser i hver av de andre 4-stammer (26695, HPAG1, B128, og 98-10), og gjennomsnittlig% aminosyre identitet ble beregnet.
b sekvenser av de angitte genproduktene i hver stamme ble sammenlignet i alle permutasjoner, bortsett fra at sammenligninger som omfatter stammen J99 ble ekskludert fra analysen. Bety% aminosyre identitet ble beregnet.
CPercentage av innrettede områder hvor proteinet fra stamme J99 inneholdt en aminosyre forskjellig fra de tilsvarende aminosyrer i proteiner fra 4 andre stammer.
D rapportert å være en bestanddel i H. pylori
kjerne-genomet, basert på minst en rekke analyse [18-20].
Identifisering av nye stamme-spesifikke gener
for å identifisere stammespesifikke gener entydig til stede i ett av de to nye sekvensert genomer men ikke tidligere sekvensert H. pylori
genomer, vi igjen benyttet en BLAST poengsum ratio analyse, som beskrevet i Methods (figur 2). Strain 98-10 inneholdt 22 nye stammespesifikke gener og belastning B128 inneholdt 51 (Tilleggsfiler 2 og 3). I tillegg har vi identifisert 16 gener som var til stede i både belastning 98-10 og B128, men ikke til stede i noen av de tidligere sekvenserte stammer (Tilleggs fil 4). Flere av stammespesifikke ORF i H. pylori
stammer 98-10 og B128 var < 100 nukleotider i lengde, og det er usikkert hvorvidt disse svært korte ORF faktisk oversatt til proteiner. En analyse av unike strekk spesifikke gener i de tre tidligere sekvensert H. pylori
genomer (26695, J99, og HPAG1) viste et lignende antall unike stamme-spesifikke gener (tabell 1), som har blitt beskrevet i tidligere studier [ ,,,0],29-31].
for å identifisere potensielle funksjonene til stammespesifikke gener som finnes utelukkende i stamme 98-10 eller B128 (eller begge deler 98-10 og B128), ble den utledede proteinsekvensene brukt som forespørsler for BLAST-søking av en NCBI-databasen ikke-redundante proteinsekvenser (Tabell 4 og tilleggsfiler 2, 3, 4). De fleste av de stamme-spesifikke proteiner som finnes utelukkende i stamme 98-10 eller B128 ikke var nært knyttet til eventuelle kjente proteiner eller var knyttet til proteiner i databasen for hvilke funksjoner som ikke er kjent. Flere av stammespesifikke gener som finnes utelukkende i belastning 98-10 eller B128 har tidligere blitt påvist i stammer av H. pylori
for hvilke genomsekvenser ikke er fastlagt. Som beskrevet ovenfor, ble innsettingssekvenser og transposase-kodende gener (IS607 og ISHp608) identifisert. To stammespesifikke gener i H. pylori
belastning B128 (HPB128_11g15 og HPB128_11g23) kodet proteiner knyttet til type IV sekresjon systemkomponenter (VirB9 og VirD4, henholdsvis). Genene i denne klyngen (spenner HPB128_11g15 til HPB128_11g23) ble ikke påvist i de opprinnelige genomiske analyser av stammer J99, 26695, eller HPAG1 [29-31], men ble senere påvist i belastning J99 og flere andre H. pylori
stammer [43] .table 4 Strain spesifikke H. pylori
gener som finnes utelukkende i belastning 98-10 eller B128

Antall gener i den angitte belastningen (e) en

98-10
B128
98-10 og B128
Totalt antall belastning -spesifikk genesa
22
51
16
funksjonsklasse
Transposase
2
3
6
Type IV sekresjon genet clusterb
0
7
0
Hypotetisk
17
37
9
Ingen database kamp
8
8
2
Nærmest kamp mangler kjent funksjon
9
29
7
Andre
3
4
1 Gene øyene inneholder strekk spesifikk genesc
2
11
3
aPresent i den angitte stamme (s), men ikke i noen av de andre fire stammer hvor genomsekvenser er tilgjengelige.
bDette gruppe av gener som ikke ble påvist i den opprinnelige analyse av genomet fra stamme J99, men ble senere påvises i stammen J99 [43].
cFor denne analysen, ble en øy ansett å være til stede hvis to eller flere stammespesifikke gener var i sammenhengende kromosomale loci.
Interessant nok inneholder stammen B128 flere gener (HPB128_155g19, HPB128_156g11 , HPB128_156g12, HPB128_184g1, HPB128_190g1) spådd å kode proteiner som er tettere knyttet til proteiner kodet av H. acinonychis plakater (en Helicobacter
arter isolert fra store katter) [44] eller H. cetorum plakater (en http://​www.​softberry.​com/​berry.​phtml?​topic=​fgenesb&​group=​programs&​subgroup=​gfindb[56],

Other Languages