genom-sekvensanalyse af Helicobacter pylori Salg stammer forbundet med gastrisk ulceration og gastrisk cancer
Abstract
Baggrund
Vedvarende kolonisering af den humane mave med Helicobacter pylori
er forbundet med asymptomatisk gastrisk inflammation (gastritis) og en øget risiko for duodenal ulceration, gastrisk ulceration, og ikke-Cardia gastrisk cancer. I tidligere undersøgelser, de genom sekvenser af H. pylori
stammer fra patienter med gastritis eller sår på tolvfingertarmen sygdom er blevet analyseret. I denne undersøgelse har vi analyseret genom sekvenser af en H. pylori
stamme (98-10) isoleret fra en patient med gastrisk cancer og et H. pylori
stamme (B128) isoleret fra en patient med mavesår .
Resultater
Baseret på multilocus sekvens maskinskrivning, stamme 98-10 var mest nært beslægtet med H. pylori
stammer af østasiatisk B128 oprindelse og stamme blev mest tæt forbundet med stammer af europæisk oprindelse. Stamme 98-10 indeholdt flere funktioner karakteristiske for østasiatiske stammer, herunder en type S1c Vaca
allel og en CagA
allel koder for et EPIYA-D-tyrosinphosphorylering motiv. En kerne genomet af 1237 gener var til stede i alle fem stammer, som genomsekvenser var tilgængelige. Blandt de 1237 centrale gener, en delmængde af alleler var stærkt divergerende i øst asiatiske stamme 98-10, der koder for proteiner, som udviste < 90% aminosyresekvensidentitet sammenlignet med tilsvarende proteiner i de andre fire stammer. Unikke stamme-specifikke gener blev identificeret i hver af de nyligt sekventerede stammer, og et sæt af stamme-specifikke gener blev delt mellem H. pylori
stammer associeret med gastrisk cancer eller præmaligne gastriske læsioner.
Konklusion
Disse data giver indsigt i den mangfoldighed, der eksisterer blandt H. pylori
stammer fra forskellige kliniske og geografiske oprindelse. Meget forskellige alleler og stamme-specifikke gener, der er identificeret i denne undersøgelse kan repræsentere nyttige biomarkører til analyse geografisk opdeling af H. pylori
til at identificere stammer stand til at fremkalde maligne eller præmaligne gastriske læsioner.
Baggrund
Helicobacter pylori
er en Gram-negativ spiralformet bakterie, der vedvarende koloniserer den humane mave [1]. Vedvarende H. pylori
kolonisering af den humane mave er en risikofaktor for en række sygdomme, herunder ikke-Cardia gastrisk adenocarcinom, gastrisk lymfom og peptisk ulceration [1, 2]. Forekomsten af disse sygdomme varierer betydeligt i hele verden. For eksempel forekomsten af gastrisk adenocarcinom er væsentligt højere i Østasien, Mellemamerika og Sydamerika end i de fleste andre dele af verden [3].
H. pylori
isolater fra ubeslægtede mennesker udviser en høj grad af genetisk mangfoldighed [4, 5]. Genetisk variation er let påviselig ved at analysere nucleotidsekvenserne af individuelle gener i forskellige H. pylori
stammer [6]. H. pylori
alleldiversitet er sandsynligvis en følge af flere faktorer, herunder en høj mutation, en høj intraspecies genetisk rekombination, og en lang udviklingshistorie af arten [4, 7]. Tilsvarende alleler i forskellige H. pylori
stammer typisk der 92 til 99% identisk i nukleotidsekvenser [4, 6], men flere H. pylori
gener udviser en langt højere grad af genetisk diversitet [8, 9].
Yderligere analyser har vist, at der er geografisk variation blandt H. pylori
stammer [10-16]. Baseret på multilocus sekvensanalyse af et panel af 370 H. pylori
stammer isoleret fra mennesker i forskellige dele af verden, har syv populationer af stammer med særskilte geografiske fordelinger blevet identificeret [17]. Disse H. pylori
befolkninger afspejler migration af mennesker fra Afrika til andre dele af verden, over en tidsperiode skønnes at være ca. 58 tusind år [12]. Geografiske forskelle mellem H. pylori Salg stammer kunne potentielt være en faktor, der bidrager til at forklare den varierende forekomst af H. pylori
associeret sygdomme i forskellige dele af verden.
Foruden variation blandt H. pylori
stammer i de sekvenser af enkelte gener, er der betydelig variation blandt stammer i gen indhold. En undersøgelse analyserede genomisk DNA fra 56 forskellige H. pylori
stammer hjælp vifte hybridiseringsmetoder og identificeret 1150 gener, der var til stede i alle de testede stammer (hvilket repræsenterer en "kerne" genom) [18]. Blandt 1531 gener analyserede, 25% var fraværende fra i det mindste en af de 56 H. pylori
stammer. Det var forudsagt, at H. pylori
Kernegenomet ville bestå af 1.111 gener, hvis et meget større sæt af isolater blev testet [18]. Andre undersøgelser har rapporteret, at der findes centrale genomer omfattende 1091 eller 1281 gener, baseret på DNA-array analyse af 34 eller 15 H. pylori
stammer henholdsvis [19, 20]. En undersøgelse rapporterede, at fylogeni af H. pylori
stammer baseret på MLST analyse var væsentligt forskellig fra fylogeni af H. pylori
stammer baseret på analyse af gen-indhold [18].
En af de mest slående forskelle i gen indhold blandt H. pylori
stammer er tilstedeværelsen eller fraværet af en 40-kb region af kromosomalt DNA kendt som cag
patogenicitet island (PAI) [8, 21-24]. I USA og Europa, omkring 50-60% af H. pylori
stammer indeholder den cag
PAI og de resterende stammer mangler denne region af kromosomet [8, 21-24]. I mange andre dele af verden, herunder Østasien, næsten alle H
. pylori
stammer indeholder KAG
PAI [15, 25, 26]. H. pylori CAG
PAI koder for et effektor-protein, CagA, og en type IV sekretion apparat, der translokerer CagA i gastriske epitelceller [27]. H. pylori
stammer der indeholder den cag
PAI er forbundet med en øget risiko for manglende cardia gastrisk cancer eller mavesår sygdom sammenlignet med stammer, der mangler cag
PAI [21, 28]. Sammenhængen mellem disse sygdomme og tilstedeværelsen af cag
PAI giver et eksempel på, hvordan det kliniske resultat af H. pylori
infektion bestemmes delvist af genetiske egenskaber af stammen, som en person er smittet.
I tidligere undersøgelser, er blevet analyseret de fuldstændige genomer af tre H. pylori
stammer [29-31]. Disse tre H. pylori
stammer blev isoleret fra patienter, som havde gastritis, atrofisk gastritis eller duodenalsår sygdom. I den aktuelle undersøgelse, søgte vi at analysere genetiske anlæg af H. pylori
stammer isoleret fra patienter med to forskellige H. pylori
associeret sygdomme: mavesår og gastrisk cancer. Til denne analyse, valgte vi en mavesår stamme (B128), som let koloniserer maver af mus og mongolske ørkenrotter. Denne stamme er af særlig interesse, fordi et dyr-passeret derivat af stamme B128 (stamme 7.13) forårsager gastrisk cancer i en mongolsk hoppemus model [32, 33]. For en analyse af en gastrisk cancer-associeret H. pylori
stammen, valgte vi stamme 98-10, som blev isoleret fra en mavekræft patient i Japan [34], et land med en meget høj forekomst af mavekræft [3 , 35].
Resultater
Generelle træk af H. pylori
genomer
Forud for den aktuelle undersøgelse, det komplette genom sekvenser af H. pylori
stammer isoleret fra patienter med overfladiske gastritis, atrofisk gastritis, eller sår på tolvfingertarmen sygdom var blevet rapporteret [29-31]. I den aktuelle undersøgelse, analyserede vi de genom-sekvenser af en H. pylori
stamme (98-10), der blev isoleret fra en patient med gastrisk cancer [34] og en stamme (B128), som blev isoleret fra en patient med gastrisk ulcussygdom [32]. Generelle træk ved de to genomer analyseret i den foreliggende undersøgelse i sammenligning med tre hidtil sekventerede genomer er opsummeret i tabel 1. For at identificere transposerbare genetiske elementer, der måtte være til stede i de to nyligt sekventerede genomer, blev nukleotidsekvenserne af hver genomet anvendes som forespørgsler at søge en indsættelse sekvens database http:.. //www-er biotoul fr. Stamme 98-10 indeholdt ORF (HP9810_5g1 og HP9810_5g2) homologe til ORF'er findes i IS607 (tiltrædelse nummer AF189015) [36]. Stamme B128 indeholdt ORF'er (HPB128_26g16, HPB128_26g17, og HPB128_26g18) homologe til ORF'er findes i ISHp608 (tiltrædelse nummer AF357224), men nukleotidinsertioner forventes at forstyrre transposasen genet i stammen B128 [37]. IS607 og ISHp608 findes ikke i nogen af de tre H. pylori Salg stammer, som genomsekvenser tidligere var tilgængelige. En tidligere undersøgelse rapporterede, at IS607 blev påvist i ca. 20% af H. pylori
stammer [36]. ISHp608 er nonrandomly geografisk fordelt blandt H. pylori
stammer, og dette element blev rapporteret at være mere rigelige i stammer fra peruvianske patienter med mavekræft end i stammer fra peruvianske patienter med gastritis kun [37] .table 1 Funktioner af H. pylori
genomer
H. pylori stamme | 26.695 J99 HPAG1 98-10 B128 Origin UK USA Sverige Japan USA Disease statea Gastritis kun DU AG GC GU KAG PAI Ja Ja Ja Ja Ja Vaca genotype S1A /m1 S1b /m1 S1b /m1 S1c /m1 S1A /m2h Genome størrelse (Mb) 1,67 1,64 1.61b 1.6c 1.6c Total no. af ORF 1564d 1491e 1544f 1527 1731 No. af stammen-specifikke genesg 69 23 38 22 51 en DU, sår på tolvfingertarmen; AG, atrofisk gastritis; GC, gastrisk cancer; GU, mavesår b Inkluderer et 9,3 kb plasmid. C Genomet størrelse stamme 98-10 er baseret på analyse af 51 store contigs, som defineret i Methods. Genomet størrelse stammen B128 er baseret på analyse af 73 store contigs. D Den aktuelle analyse er baseret på data hentet fra TIGR, bestående 1564 ORF'er. I modsætning hertil et bord på TIGR hjemmeside lister 1587 ORF i stamme 26.695 og Genbank sekvens filer omfatter 1566 ORF'er fra stamme 26695. e Ekstra ORF'er, ikke medtaget i denne total, blev efterfølgende fundet i stammen J99 [43]. f HPAG1 kromosom indeholder 1536 forudsagde protein-kodende gener, og resten er indeholdt på et plasmid. g stede i kun én af fem stammer analyseret i denne undersøgelse. h Vaca er afkortet i stammen B128. MLST analyse af H. pylori stammer i tidligere undersøgelser har MLST analyse blevet brugt til at klassificere H. pylori isolater i flere haplogruppe der har særskilte geografiske fordelinger [17]. At tildele de to nyligt sekventerede H. pylori Salg stammer til en af de tidligere beskrevne population klynger sammenlignede vi otte gensekvenser fra hver stamme til de tilsvarende sekvenser af 434 andre H. pylori isolater under anvendelse af en database, som MLST beskrevet i fremgangsmåderne. Baseret på denne analyse blev stamme 98-10 klassificeret som et medlem af østasiatiske befolkning klynge og stamme B128 blev klassificeret som et medlem af den europæiske befolkning klynge. En nabo-sammenføjning træ skildrer relationer de to nyligt sekventerede stammer til repræsentative reference- stammer isoleret fra forskellige geografiske lokaliteter er vist i figur 1. clustering afbildet på denne nabo-sammenføjning træ nøjagtigt afspejler de geografiske oprindelse reference- stammer, og er i aftale med tidligere opgaver af referencestammer til forskellige befolkningsgrupper [18]. Efter aftale med en tidligere rapport [17], en af de tidligere sekventeret H. pylori stammer (J99) var mest nært beslægtet med stammer isoleret i Vestafrika, og en anden (26.695) var mest nært beslægtet med stammer isoleret i Europa . En tredje H. pylori stamme (HPAG1) analyseret i en forudgående undersøgelse blev tæt knyttet til stammer isoleret i Europa. Figur 1 illustrerer, at stammen 98-10 er mest tæt forbundet med stammer af østasiatisk oprindelse, og derfor stamme 98-10 tilhører en population klynge anderledes end stammer, som tidligere blev rapporteret genom-sekvenser. Kollektivt, de genom-sekvenser til rådighed for analyse repræsenterer tre vigtigste geografiske populationer af H. pylori stammer [europæisk (26.695, HPAG1 og B128), vestafrikanske (J99), og østasiatiske (98-10)]. Figur 1 Phylogenetisk struktur baseret på sekvensanalyse af 8 H. pylori core gener. H. pylori stammer analyseret i denne figur indbefatter stammer 98-10, B128, tre stammer, som genom sekvenser tidligere blev bestemt (26.695, J99, HPAG1), og repræsentative stammer isoleret fra patienter i forskellige geografiske lokaliteter [18]. Figuren viser de stamme betegnelser og de lande, hvor stammer blev isolerede. Nukleotidsekvenserne af den sammenkædede MLST loci var tilpasset til hinanden og sammenlignet, som beskrevet i Methods. Alle positioner indeholder huller og manglende data blev slået ud datasættet. Der var i alt 3041 stillinger i det endelige datasæt. Neighbor-sammenføjning træer blev bygget på grundlag af afstande anslået af Kimura 2-parameter model af nukleotid substitution [57, 58]. Den bootstrap konsensus træ udledes 1000 gentagelser er taget til at repræsentere den evolutionære historie af stammerne analyseret [59]. Filialer svarende til partitioner gengivet i færre end 50% bootstrap gentagelser er kollapset. Træet henledes på skala, med branche længder i de samme enheder som dem af de evolutionære afstande bruges til at udlede det fylogenetiske træ. Fylogenetiske analyser blev udført i MEGA4 [63]. Fem H. pylori stammer, som genom sekvenser var tilgængelige er angivet med diamanter. Tre vigtigste H. pylori befolkningsgrupper (East Asian, europæiske, og Vestafrikanske) kan identificeres. Analyse af CagA og Vaca CagA og VacA er to vigtige H. pylori virulensfaktorer, der udskilles af en type IV sekretionsvejen og en type V (autotransportør) sekretion pathway, henholdsvis [14, 38]. Mangfoldighed i CagA og Vaca gener er blevet undersøgt i detaljer i tidligere undersøgelser, og mangfoldighed i disse gener giver grundlag for at skrive H. pylori stammer [8, 13-15]. Derfor analyserede vi CagA og VacA gener i hver af de to nyligt sekventerede stammer. Når stamme 98-10 blev inkuberet med AGS gastriske epitelceller som tidligere beskrevet [39], CagA undergik tyrosinphosphorylering (data ikke vist), hvilket indikerer, at denne stamme har en funktionel type IV sekretion system til translokation af CagA i værtsceller [27]. Den CagA-proteinet kodes af stamme 98-10 indeholder 3 EPIYA motiver (steder af tyrosinphosphorylering), som er blevet udpeget EPIYA-A, EPIYA-B, og EPIYA-D [14]. Tilstedeværelsen af en EPIYA-D-motiv er karakteristisk for H. pylori stammer isoleret i Østasien [13, 14]. Bouillon kultursupernatant fra stamme 98-10 forårsaget vakuolisering af HeLa-celler, hvilket viser tilstedeværelsen af en aktiv VacA toksin. Denne stamme indeholder en type S1c /m1 Vaca allel, en funktion, der er karakteristisk for H. pylori stammer isoleret i Østasien [15, 40]. Identifikation af Østasiatisk CagA og Vaca motiver i stammen 98-10 er i overensstemmelse med resultaterne af MLST analyse, som er klassificeret stamme 98-10 som medlem af den østasiatiske befolkning klynge af H. pylori stammer. Svarende til stamme 98-10, stamme B128 har en funktionel type IV sekretion system, der kan translokere CagA i gastriske epitelceller, og CagA undergår efterfølgende tyrosinphosphorylering [41]. Den CagA-proteinet kodes af stamme B128 indeholder to EPIYA motiver, betegnet EPIYA-A og EPIYA-C [14]. Stamme B128 indeholder en type s1 /m2 VacA allel, men en VacA mutation i denne stamme forudsiges at forhindre ekspression af et fuldlængde VacA-proteinet. Tilstedeværelsen af sidstnævnte mutation blev bekræftet ved nukleotidsekvensanalyse af et VacA fragment amplificeret ved PCR. Immunoblotanalyse ved hjælp af flere anti-VacA-antisera indikerede, at denne stamme ikke producerede et påviseligt VacA-protein, og bouillon kultursupernatanten fra denne stamme ikke forårsagede vakuolation af HeLa-celler (data ikke vist). Karakterisering af H. pylori kerne genom Afgrænsning af en H. pylori kerne genom (dvs. gener, som er konstant til stede i alle H. pylori isolater) er af interesse, fordi mange af disse gener vil sandsynligvis være behov for kolonisering af den menneskelige mave. Baseret på brugen af BLAST score forholdet analyse som beskrevet i Metoder, vi identificeret 1237 gener, der var til stede i alle 5 H. pylori genomer (figur 2 og ekstra fil 1). I en tidligere undersøgelse blev 56 forskellige H. pylori stammer analyseret ved matrix metode, og en kerne genom 1150 gener blev rapporteret at være til stede i alle 56 stammer [18]. Blandt de 1150 gener rapporteret at omfatte H. pylori Kernegenomet baseret på array analyse, 1094 var til stede i alle 5 analyserede stammer i den aktuelle undersøgelse, som bestemt ved sekvensanalyse. Listen af centrale gener detekteret i alle fem stammer fra sekvensanalyse, men ikke af array analyse omfatter > 20 gener placeret inden KAG PAI. Selvom cag PAI er til stede i alle 5 analyserede stammer i den aktuelle undersøgelse er denne region af DNA vides at være fraværende fra mange H. pylori stammer [24]. Fem andre klynger af sammenhængende gener (hver med mindst 4 gener pr klynge) var til stede i alle 5 sekventerede stammer, men var fraværende fra listen over centrale gener identificeret ved array analyse (HP0061-0065, HP0797-0800, HP1339-1343, HP1400-1403, og HP1455-1458) (Ekstra fil 1). Forskellene i udpegningen af centrale gener i den aktuelle undersøgelse i forhold til tidligere undersøgelser kan tilskrives en lang række faktorer, herunder forskelle i antallet af analyserede stammer og forskelle i metodologi til gen-opdagelse. Figur 2 Sammenligning af forudsagte proteomer ved BLAST-score ratio (BSR) analyse. Den venstre panel viser en BSR analyse af proteiner kodet af stammen J99 og HPAG1, med stamme 26.695 som reference stamme. Højre panel viser en BSR-analyse af proteiner kodet af stamme 98-10 og B128, med stamme 26.695 som reference stamme. BSR tilgang analyserer alle proteiner forudsiges at være kodet af tre genomer under anvendelse af en mål for lighed baseret på forholdet af BLAST score, som beskrevet i fremgangsmåderne. Proteiner afbildet i boksen nederst til venstre hjørne (BSR < 0,4) svarer til proteiner til stede i henvisningen proteomet (stamme 26.695), men fraværende fra de to forespørgslen proteomer. Den øverste højre kvadrant repræsenterer proteiner konserveret i alle tre proteomer. En analyse af de 1237 centrale gener anført, at i næsten alle tilfælde, der var forskelle i aminosyresekvenserne af proteinerne kodet af individuelle stammer. Parvise sammenligninger af proteiner kodet af forskellige stammer viste, at niveauerne af slægtskab varierede fra 65% til 100% aminosyreidentitet. En repræsentativ sammenligning af de centrale proteiner kodet af to stammer (98-10 og 26695) er vist i figur 3. Kun 11 gener blev identificeret for hvilke aminosyresekvenserne af kodede proteiner var identiske blandt alle 5 stammer. Syv af disse 11 gener kodede ribosomale proteiner; andre kodede for en translationsinitiering faktor (IF-1), et lipoprotein (Lpp20), en flagellar basal organ protein (flie), og et protein med ukendt funktion (HP0031). Figur 3 Relaterethed af kerneproteiner forudsagt at være kodet af H. pylori-stammerne 98-10 og 26695. Et sæt af 1237 gener til stede i alle 5 H. pylori Salg stammer blev identificeret, som beskrevet i fremgangsmåderne. De udledte aminosyresekvenser af de tilsvarende proteiner kodet af stamme 98-10 blev anvendt til at søge i en database af sekvenser fra stamme 26.695 vha FastA. Det bedste match blev identificeret, og den procentvise aminosyreidentitet blev beregnet. Histogrammet viser antallet af ORF'erne udviser det angivne niveau af aminosyren identitet. Analyse af divergerende gener i et østasiatisk cancer-associeret H. pylori stammen H. pylori stammer isoleret fra uafhængige mennesker udviser alleldiversitet (typisk 92-99% nukleotid identitet blandt tilsvarende alleler), der danner grundlag for klassificering af stammer i befolkningens klynger via MLST analyse. Adskillige gener udviser et væsentligt højere niveau af alleldiversitet. For eksempel er mindst to gener (CagA og en sel1 homolog) kendt for at være markant forskellige i East Asian H. pylori stammer forhold til vestlige H. pylori stammer [13, 14 , 42]. Vi antager, at yderligere gener kan være meget divergerende i østasiatiske stammen 98-10 sammenlignet med de andre 4 sekventerede stammer. For at identificere genprodukter kodet af genomet af 98-10, der er markant forskellige i forhold til produkter, kodet af de andre 4 genomer, vi fokuseret på analyse af de 1237 centrale gener, der var til stede i alle 5 sekventerede stammer. Ved at bruge den fremgangsmåde, der er beskrevet i Methods, vi identificeret 8 genprodukter, der var meget divergerende i østasiatiske belastning i forhold til de fire andre stammer (tabel 2). Disse omfatter CagA og en sel1 homolog, som tidligere blev rapporteret til at være markant forskellige i østasiatiske stammer sammenlignet med stammer fra andre dele af verden [13, 42]. Aminosyresekvenserne af disse divergerende proteiner kodet af den japanske stamme 98-10 var hver < 90% identiske med sekvenser af tilsvarende proteiner fra de andre fire stammer (tabel 2). I hvert tilfælde blev de divergerende alleler i stamme 98-10 og tilsvarende alleler i de andre fire stammer flankeret af samme kromosomale genes.Table 2 Meget divergerende alleler i østasiatiske stamme 98-10 Gene nummer (98-10) Gene nummer (26.695) Beskrivelse % aa identitet (98 -10) en % aa identitet (ikke-98-10) b % unikke sites c
HP9810_903g20 HP0061d Hypothetical 67 86 21 HP9810_889g5 HP0492d hpaA homolog 72 92 21 HP9810_889g32 HP0519d sel1 homolog 73 92 15 HP9810_905g13 HP0547 CagA 79 87 11 HP9810_868g41 HP0806d Hypothetical 86 92 6 HP9810_899g75 HP1322d Hypothetical 75 90 18 HP9810_899g76 HP1323d Ribonuclease 88 92 6 HP9810_885g15 HP1524d Hypothetical 80 95 13 a Sekvenserne af de angivne genprodukter i stamme 98-10 blev sammenlignet med tilsvarende sekvenser i hver af de andre 4 stammer (26.695, J99, HPAG1 og B128) blev, og betyder% Aminosyreidentiteterne beregnet som beskrevet i Methods. b sekvenserne af de angivne genprodukter i hver stamme blev sammenlignet i alle permutationer, bortset fra, at sammenligninger involverer stamme 98-10 blev udelukket fra analysen. Mean% aminosyre-identitet blev beregnet som beskrevet i Methods. CPercentage af aligned lokaliteter, hvor proteinet fra stamme 98-10 indeholdt en aminosyre forskellig fra de tilsvarende aminosyrer i proteiner fra 4 andre stammer. DReported til være en bestanddel af H. pylori kernegenomet, baseret på mindst ét array analyse [18-20]. Som vist i figur 1, blev stamme J99 nærmest beslægtet med H. pylori stammer isoleret i Vestafrika, en befolkning klynge anderledes end de andre stammer, som genom sekvenser var til rådighed. Derfor fremsatte vi den hypotese, at specifikke gener kan være meget forskellige i det vestafrikanske stamme J99 sammenlignet med de andre 4 sekventerede stammer. For at identificere sådanne gener, brugte vi den samme fremgangsmåde som beskrevet ovenfor. Fire unikke stærkt divergerende alleler blev identificeret i stamme J99 (tabel 3), hver kodende produkter, der var < 90% identiske med tilsvarende proteiner i de andre fire stammer. Unikke stærkt divergerende alleler var ikke umiddelbart kan identificeres i stammer 26.695, HPAG1 eller B128. En bemærkelsesværdig undtagelse er identifikationen af et stærkt divergerende Vaca allel i stammen B128 (gen HPB128_147g10). Identifikation af VacA som en divergerende allel i stamme B128 skyldes tilstedeværelsen af en S1 /m2 VacA allel i denne stamme og tilstedeværelsen af S1 /m1 alleler i de fire andre stammer; M1 og M2 former af VacA udviser typisk kun 60-70% aminosyreidentitet i den midt-område af proteinet [38] .table 3 Stærkt divergerende alleler i stamme J99 Gene nummer (J99) Gene nummer (26.695) Beskrivelse % aa identitet (J99) en % aa identitet (ikke-J99) b % unikke sites c
jhp0028 HP0032 Hypothetical 68 91 24 jhp0080 HP0087d Hypothetical 89 96 8 jhp0173 HP0185d Hypothetical 88 93 7 jhp0395 HP1029d Hypothetical 88 95 7 a Sekvenserne af de angivne genprodukter i stammen J99 blev sammenlignet med tilsvarende sekvenser i hver af de andre 4 stammer (26.695, HPAG1, B128, og 98-10), og betyde% aminosyreidentitet blev beregnet. b The sekvenser af de angivne genprodukter i hver stamme blev sammenlignet i alle permutationer, bortset fra, at sammenligninger involverer stamme J99 blev udelukket fra analysen. Mean% aminosyre-identitet blev beregnet. CPercentage af aligned lokaliteter, hvor proteinet fra stamme J99 indeholdt en aminosyre forskellig fra de tilsvarende aminosyrer i proteiner fra 4 andre stammer. D Rapporteret at være en bestanddel af H. pylori kernegenomet, baseret på mindst ét array analyse [18-20]. Identifikation af hidtil ukendte stamme-specifikke gener at identificere stammespecifikke gener unikt til stede i en af de to nyligt sekventeret genomer men ikke tidligere sekventeret H. pylori genomer, vi igen anvendt en BLAST score forholdet analyse som beskrevet i fremgangsmåderne (figur 2). Stamme 98-10 indeholdt 22 nye stamme-specifikke gener og stamme B128 indeholdt 51 (Flere filer 2 og 3). Desuden har vi identificeret 16 gener, der var til stede i både stamme 98-10 og B128, men ikke i nogen af de tidligere sekventerede stammer (Ekstra fil 4). Flere af de stammespecifikke ORF'er i H. pylori stammer 98-10 og B128 var < 100 nukleotider i længden, og det er usikkert, om disse meget korte ORF'er faktisk omsættes til proteiner. En analyse af unikke strain specifikke gener i tre tidligere sekventeret H. pylori genomer (26.695, J99, og HPAG1) afslørede en lignende antal unikke stamme-specifikke gener (tabel 1), som er blevet beskrevet i tidligere undersøgelser [ ,,,0],29-31]. at identificere potentielle funktioner i stammespecifikke gener findes udelukkende stamme 98-10 eller B128 (eller både 98-10 og B128), blev de udledte proteinsekvenser bruges som forespørgsler til BLAST søger en NCBI database af ikke-redundante protein-sekvenser (tabel 4 og yderligere filer 2, 3, 4). De fleste af de stammespecifikke proteiner, der findes udelukkende stamme 98-10 eller B128 var ikke nært beslægtet med nogen kendte proteiner eller var forbundet med proteiner i databasen, for hvilke funktioner, der ikke er kendt. Flere af de stammespecifikke gener udelukkende findes i stammen 98-10 eller B128 er tidligere blevet påvist i stammer af H. pylori for hvilke der ikke er fastlagt de genom-sekvenser. Som beskrevet ovenfor blev indsættelse sekvenser og transposasesekvenser-kodende gener (IS607 og ISHp608) identificeres. To stammespecifikke gener i H. pylori stamme B128 (HPB128_11g15 og HPB128_11g23) kodede proteiner relateret til type IV sekretion systemkomponenter (VirB9 og VirD4 henholdsvis). Generne i denne klynge (spænder HPB128_11g15 til HPB128_11g23) blev ikke påvist i de oprindelige genomiske analyser af stammerne J99, 26.695, eller HPAG1 [29-31], men blev efterfølgende påvist i stammen J99 og flere andre H. pylori stammer [43] .table 4 Strain-specifikke H. pylori gener til stede udelukkende stamme 98-10 eller B128 | Antal gener i den angivne stamme (r) en | 98-10 B128 98-10 og B128 Samlet antal stammen -specifik GENESA 22 51 16 Funktionel klasse transposasen 2 3 6 type IV sekretion gen clusterb 0 7 0 Hypotetisk 17 37 9 Ingen database match 8 8 2 Nærmeste match mangler kendt funktion 9 29 7 Andre 3 4 1 Gene øer indeholder stamme-specifikke genesc 2 11 3 aPresent i den angivne stamme (r), men ikke i nogen af de andre fire stammer, som genomsekvenser er tilgængelige. bDenne gruppe af gener blev ikke påvist i den oprindelige analyse af genomet fra stamme J99, men blev efterfølgende påvist i stammen J99 [43]. cFor denne analyse blev en ø for at være til stede, hvis to eller flere stammespecifikke gener var i sammenhængende kromosomale loci. Interessant indeholder stammen B128 flere gener (HPB128_155g19, HPB128_156g11 , HPB128_156g12, HPB128_184g1, HPB128_190g1) forudsiges at koder for proteiner, der er mere tæt relateret til proteiner kodet af H. acinonychis (en Helicobacter arter isoleret fra store katte) [44] eller H. cetorum (en http://www.softberry.com/berry.phtml?topic=fgenesb&group=programs&subgroup=gfindb[56],
|