genomin analyysi Helicobacter pylori
kantoja liittyvä mahahaava ja mahasyöpä
tiivistelmä
tausta
Pysyvät kolonisoida ihmisen mahan Helicobacter pylori
liittyy oireeton mahalaukun tulehdus (gastriitti) ja lisääntynyt riski pohjukaissuolihaavan, mahalaukun haavaumia, ja ei-cardia mahasyövän. Aiemmissa tutkimuksissa genomin sekvenssit helikobakteeri
kannat potilaalla on gastriitti tai pohjukaissuolihaava sairaus on analysoitu. Tässä tutkimuksessa olemme analysoineet genomin sekvensseihin helikobakteeri
kantaa (98-10) eristettiin potilaalta, jolla mahasyövän ja helikobakteeri
kantaa (B128) eristetty potilaasta, jolla mahahaava .
tulokset
Perustuen multilocus järjestyksessä kirjoittamista, kanta 98-10 oli läheisintä sukua helikobakteeri
kantoja Itä-Aasian alkuperää ja kanta B128 oli läheisintä sukua kantoja eurooppalaista alkuperää. Strain 98-10 sisälsivät useita ominaisuuksia piirre Aasian kantoja, mukaan lukien tyyppi s1c Vaca
alleeli ja Caga
alleeli koodaa EPIYA-D tyrosiinifosforylaation motiivi. Ydin genomi 1237 geenien oli läsnä kaikissa viidessä kantoja, joille genomin sekvenssejä oli saatavilla. Niistä 1237 ydin geenien alaryhmä alleelien oli hyvin erilaiset Itä-Aasian kanta 98-10, jotka koodaavat proteiineja, jotka osoittivat < 90%: n aminohapposekvenssi-identtisyys verrattuna vastaavat proteiinit muissa neljä kantaa. Ainutlaatuinen kanta-geenit tunnistettiin kuhunkin vasta sekvenssikannoissa, ja joukko kannan suhteen spesifisistä geeneistä jaetaan helikobakteeri
kantoja liittyy mahasyöpä tai syöpää edeltävä mahavaurioita.
Päätelmät
Näitä data antaa käsityksen monimuotoisuuden keskuudessa vallitsee helikobakteeri
kantoja erilaisista kliinisistä ja maantieteellistä alkuperää. Hyvin erilaisten alleelien ja kanta-geenit tunnistettu tässä tutkimuksessa voi edustaa hyödyllisiä biomarkkereita analysoida maantieteellisiä eristämiseen Helikobakteeri
ja tunnistaa kantoja, jotka kykenevät indusoimaan pahanlaatuisia tai syöpää edeltävä mahavaurioita.
Tausta
Helicobacter pylori
on gram-negatiivinen spiraalin muotoinen bakteeri, joka jatkuvasti colonizes ihmisen mahalaukussa [1]. Pysyvät Helikobakteeri
kolonisoida ihmisen vatsa on riskitekijä useiden sairauksien, kuten ei-cardia mahalaukun adenokarsinooma, mahan lymfooma, ja ulkustauti [1, 2]. Ilmaantuvuus näiden tautien vaihtelee huomattavasti eri puolilla maailmaa. Esimerkiksi esiintyvyys mahalaukun adenokarsinooma on huomattavasti korkeampi Itä-Aasiassa, Keski-Amerikassa, ja Etelä-Amerikassa kuin useimmissa muissa osissa maailmaa [3].
H. pylori
isolaatteja ulkopuoliselta ihmisillä osoittavat korkeaa geneettinen monimuotoisuus [4, 5]. Geneettinen vaihtelu on helposti havaittavissa analysoimalla nukleotidisekvenssit yksittäisten geenien eri H. pylori
kantoja [6]. Helikobakteeri
alleeliset monimuotoisuus on luultavasti seurausta useista tekijöistä, mukaan lukien korkea-mutaatio, on korkea lajinsisäinen geneettisen rekombinaation, ja pitkä evoluutiohistoriasta lajin [4, 7]. Vastaavat alleelit eri helikobakteeri
kannat ovat tyypillisesti 92-99% identtisiä nukleotidisekvenssejä [4, 6], mutta useat helikobakteeri
geenien näytteille paljon korkeampi geneettisen monimuotoisuuden [8, 9].
Lisäksi analyysit ovat osoittaneet, että on olemassa maantieteellisiä eroja joukossa H. pylori
kantoja [10-16]. Perustuen multilocus sekvenssianalyysi paneelin 370 helikobakteeri
eristettyjen kantojen ihmisiin eri puolilla maailmaa, seitsemän populaatioita kantojen erillisten maantieteellisten jakaumien on tunnistettu [17]. Nämä Helikobakteeri
populaatioiden kuvastavat siirtymistä ihmisten Afrikasta muualle maailmaan jakson aikana arvioidaan olevan noin 58000 vuotta [12]. Maantieteellinen eroja helikobakteeri
kannat saattavat olla tekijä, joka auttaa selittämään vaihteleva esiintyvyys helikobakteeri
-associated tautien eri puolilla maailmaa.
Lisäksi vaihtelua helikobakteeri
kantoja sarjoissa yksittäisten geenien välillä on huomattavia vaihtelua kantojen geenien sisältöön. Eräässä tutkimuksessa analysoitiin genomista DNA 56 eri Helikobakteeri
kantoja käyttäen array hybridisaatiomenetelmin ja tunnistettu 1150 geenejä, jotka olivat läsnä kaikissa testatut kannat (jotka siis edustivat "ydin" genomi) [18]. Keskuudessa 1531-geenit analysoidaan, 25% oli poissa ainakin yksi 56 H. pylori
kantoja. Se oli ennustettu, että H. pylori
ydin genomi koostuisi 1111 geenien jos paljon suurempi joukko isolaateista testattiin [18]. Muut tutkimukset ovat raportoineet olemassaolon ytimen genomien käsittää 1091 tai 1281 geenejä, jotka perustuvat DNA erilaisia analyysi 34 tai 15 H. pylori
kannoista, vastaavasti [19, 20]. Yksi tutkimus raportoi, että fylogenia helikobakteeri
kannat perustuvat MLST analyysi oli olennaisesti erilainen kuin fylogenia helikobakteeri
kantoja analyysiin perustuvat geenin sisällöstä [18].
Yksi silmiinpistävä erot geeni sisällön joukossa H. pylori
kantoja on läsnä tai poissa ollessa 40-kb: n alueen kromosomaalisen DNA tunnetaan cag
patogeenisyyssaarekkeen (PAI) [8, 21-24]. Yhdysvalloissa ja Euroopassa, noin 50-60% H. pylori
kannat sisältävät CAG
PAI ja loput kannat puuttuu tällä alueella kromosomissa [8, 21-24]. Monissa muissa osissa maailmaa, kuten Aasiassa, lähes kaikki H
. pylori
kannat sisältävät CAG
PAI [15, 25, 26]. H. pylori cag
PAI koodaa efektoriproteiinia, CagA, ja tyypin IV eritystä laite, joka translokoituu CagA mahalaukun epiteelisoluihin [27]. Helikobakteeri
kannoissa rannikkotoimintaryhmillä
PAI liittyy lisääntynyt riski ei-cardia mahasyövän tai mahahaava tauti verrattuna kantoja, joilta puuttuu CAG
PAI [21, 28]. Korrelaatio näiden sairauksien ja läsnäolo CAG
PAI on esimerkki siitä, miten kliininen tulos H. pylori
tartuntaa määräytyy osittain geneettisiä ominaisuuksia kannat, jolla henkilö on saanut tartunnan.
aikaisemmissa tutkimuksissa, täydellinen genomit kolmen helikobakteeri
kantoja on analysoitu [29-31]. Nämä kolme Helikobakteeri
kantaa eristettiin potilaista, joilla oli gastriitti, atrofinen gastriitti tai pohjukaissuolihaava sairaus. Nykyisessä tutkimuksessa olemme pyrkineet analysoimaan geneettisiin ominaisuuksiin H.pylorin
eristettyjen kantojen potilaista kahdella eri helikobakteeri
-associated sairaudet: vatsahaavan ja mahasyövän. Tätä analyysiä varten valitsimme mahahaava kantaa (B128), joka helposti colonizes vatsat hiirien ja Mongolian gerbiilit. Tämä kanta on erityisen kiinnostava, koska eläin-siirrostettiin johdannainen kannan B128 (kanta 7,13) aiheuttaa mahalaukun syövän mongoliangerbiili malli [32, 33]. Jotta analyysi mahalaukun syöpään liittyvän helikobakteeri
kanta, valitsimme kanta 98-10, joka eristettiin mahalaukun syöpäpotilaan Japanissa [34], maassa, jossa on erittäin korkea esiintyvyys mahasyövän [3 , 35].
tulokset
yleispiirteet helikobakteeri
genomit
Ennen nykyistä tutkimusta, täydellinen genomin sekvenssit helikobakteeri
eristettyjen kantojen potilaalla on pinnallinen gastriitti, atrofinen gastriitti tai pohjukaissuolihaava sairaus oli todettu [29-31]. Nykyisessä tutkimuksessa olemme analysoineet genomin sekvenssit H. pylori
kanta (98-10), joka eristettiin potilaan mahalaukun syöpä [34], ja kanta (B128), joka eristettiin potilaan mahalaukun ulkustaudin [32]. Yleiset ominaisuudet kahden genomien analysoidaan olevassa tutkimuksessa verrattuna kolmeen aiemmin sekvensoitu genomin on esitetty yhteenvetona taulukossa 1. tunnistaa siirrettävissä geneettiset elementit, jotka voivat olla läsnä kaksi äskettäin sekvensoitu genomin, nukleotidisekvenssit kunkin genomin käytettiin kyselyt etsiä insertio sekvenssin tietokantaan http: //www-on. biotoul. fr. Strain 98-10 sisälsi ORF (HP9810_5g1 ja HP9810_5g2) homologisia ORF löytyy IS607 (tulonumero AF189015) [36]. Strain B128 sisälsi ORF (HPB128_26g16, HPB128_26g17, ja HPB128_26g18) homologisia ORF löytyy ISHp608 (hakunumero AF357224), mutta nukleotidin insertioita ennustetaan häiritä transposaasi geenin kannasta B128 [37]. IS607 ja ISHp608 joita ei esiinny missään kolmesta H. pylori
kantoja, joille genomin sekvenssit olivat aiemmin saatavilla. Aiemmassa tutkimuksessa on todettu, että IS607 havaittiin noin 20%: H. pylori
kantoja [36]. ISHp608 on nonrandomly jaetaan maantieteellisesti kesken Helikobakteeri
kantoja, ja tämä elementti raportoitiin olevan runsaampaa kannat Perun potilaalla on mahasyöpä kuin kannat Perun potilaalla on gastriitti vain [37] .table 1 Ominaisuudet H. pylori
genomit
H. pylori -kanta | 26695 J99 HPAG1 98-10 B128 alkuperä UK US Ruotsi Japani US Disease statea gastriitti vain DU AG GC GU CAG PAI Kyllä Kyllä Kyllä Kyllä Kyllä vaca genotyyppi S1A /m1 S1B /m1 S1B /m1 s1c /m1 S1A /m 2h Genome koko (Mb) B 1,67 1,64 1.61b 1.6c 1.6c Yhteensä no. ORF: ien 1564d 1491e 1544f 1527 1731 No. kannan suhteen spesifisistä genesg 69 23 38 22 51 DU, pohjukaissuolihaava; AG, atrofinen gastriitti; GC, mahasyöpä; GU, mahahaava b Sisältää 9,3 kb plasmidin. C genomin koko kannan 98-10 perustuu analyysiin 51 suurten contigien määriteltyjä Methods. Genomin koko kannan B128 perustuu analyysiin 73 suurten contigien. D Nykyinen analyysi perustuu tietoihin ladata TIGR, joka sisältää 1564 ORF. Sitä vastoin taulukko TIGR verkkosivuilla luettelot 1587 ORF rasitusta 26695, ja Genbank järjestyksessä tiedostot sisältävät 1566 ORF kannasta 26695. e Muita ORF, ei sisälly tähän koko, sittemmin havaittu kannan J99 [43]. f HPAG1 kromosomi sisältää 1536 ennustetun proteiinia koodaavan geenien, ja loput sisältyvät plasmidissa. g läsnä vain yksi viidestä kannoista analysoitiin tässä tutkimuksessa. h vaca on katkaistu kannassa B128. MLST analyysi helikobakteeri kantoja Aikaisemmissa tutkimuksissa MLST analyysia on käytetty luokitella helikobakteeri isolaattien useisiin haplogroups jotka ovat eri maantieteelliset jakaumat [17]. Määrittää kaksi äskettäin sekvensoitiin H. pylori kantojen johonkin aiemmin kuvattu väestön klustereita, vertasimme kahdeksan geenin sekvenssiä kustakin kannasta vastaaviin sekvensseihin 434 muiden H. pylori isolaatit, käyttäen MLST tietokannan kuvattu menetelmät. Tämän analyysin perusteella, kanta 98-10 luokiteltiin jäsenenä Itä-Aasian väestöstä klusterin ja kanta B128 luokiteltiin jäseneksi Euroopan väestöstä klusteri. Naapuri-liittymällä puu kuvaa suhteita kahden vasta sekvenssikannoissa edustaville viittaus eristettyjen kantojen monipuolinen maantieteellisten paikkojen on esitetty kuvassa 1. ryhmittely kuvattu tämän naapurin-liittymällä puu kuvaa tarkasti maantieteellistä alkuperää viitteen kantoja, ja on sopimus aiempien toimeksiannot viitteen kantojen selvä väestöryhmille [18]. Suostumuksella aiemman raportin [17], yksi aiemmin sekvensoitu helikobakteeri kannat (J99) oli läheisintä sukua eristetyt Länsi-Afrikassa, ja toinen (26695) oli läheisintä sukua eristetyt Euroopassa . Kolmas Helikobakteeri kantaa (HPAG1) analysoitiin etukäteen tutkimus liittyy läheisesti eristetyt Euroopassa. Kuvio 1 osoittaa, että kanta 98-10 läheisimmin liittyy kantojen East aasialaista alkuperää, ja näin ollen, kannan 98-10 kuuluu väestön klusterin eroavat kannoista, joiden genomin sekvenssit on raportoitu aikaisemmin. Yhdessä genomin sekvenssit analysoitaviksi edustavat kolme maantieteellistä populaatiot helikobakteeri kantoja [Euroopan (26695, HPAG1, ja B128), Länsi-Afrikkalainen (J99), ja Itä-Aasian (98-10)]. Kuvio 1 fylogeneettinen rakenne perustuu sekvenssianalyysi 8 helikobakteeri ydin geenejä. Helikobakteeri kannat analysoitiin tässä kuvassa ovat kannat 98-10, B128, kolme kantaa, jota varten genomin sekvenssit aikaisemmin määritettiin (26695, J99, HPAG1), ja edustava eristettyjen kantojen potilaista monipuolinen maantieteellisten sijaintien [18]. Luku luetellaan rasitusta nimitykset ja maista, joissa kantaa eristettiin. Nukleotidisekvenssien ketjutettujen MLST loci yhdenmukaisia ja verrattiin, kuten on kuvattu menetelmät. Kaikki asemat, jotka sisältävät aukkoja ja puuttuvien tietojen eliminoitu aineisto. Oli yhteensä 3041 lopullisissa aineisto. Naapuri-liittymällä puita rakennettiin etäisyyksien perusteella arvioima Kimura 2 muuttujan mallia nukleotidisubstituutiosta [57, 58]. Bootstrap konsensus puu päätellä 1000 rinnakkaista otetaan edustamaan evoluutiohistoriasta kannoista analysoitiin [59]. Haaraa, jotka vastaavat osiot toistettu alle 50% bootstrap toistojen on romahtanut. Puu on piirretty mittakaavaan, jossa haara pituudet samoissa yksiköissä kuin evoluution etäisyydet käytetään päättelemään fylogeneettiseen puu. Phylogenetic analyysit tehtiin MEGA4 [63]. Viisi Helikobakteeri kantoja, joille genomin sekvenssit olivat käytettävissä on merkitty timantteja. Kolme tärkeintä Helikobakteeri väestöryhmien (Itä-Aasian, Euroopan ja Länsi-Afrikkalainen) ovat tunnistettavissa. Analyysi Caga ja Vaca CagA ja VacA kaksi tärkeää helikobakteeri virulenssitekijät jotka erittävät tyypin IV eritystapahtumasarjan ja tyyppi V (autotransporter) eritystapahtumasarjan vastaavasti [14, 38]. Diversity in Caga ja Vaca geenejä on tutkittu yksityiskohtaisesti aiemmissa tutkimuksissa, ja monimuotoisuutta näiden geenien muodostaa perustan kirjoittamalla Helikobakteeri kantoja [8, 13-15]. Näin ollen, olemme analysoineet CagA ja Vaca geenejä kussakin kaksi hiljattain sekvenssikannoissa. Kun kanta 98-10 inkuboitiin AGS mahalaukun epiteelisolujen, kuten aiemmin on kuvattu [39], CagA tehtiin tyrosiinifosforylaatio (tuloksia ei ole esitetty), mikä osoittaa, että tämä kanta on toimiva tyypin IV eritystä järjestelmä translokaatio CagA isäntäsoluihin [27]. CagA koodaama proteiini-kanta 98-10 sisältää 3 EPIYA motiiveja (tyrosiinin fosforylaatio), jotka on nimetty EPIYA-A, EPIYA-B, ja EPIYA-D [14]. Läsnäolo EPIYA-D motiivi on ominaista helikobakteeri eristetyt Itä-Aasiassa [13, 14]. Liemi viljelmän supernatanttia kannasta 98-10 aiheutti vakuolisaatiota HeLa-solut, mikä osoittaa, että läsnä on aktiivinen VacA toksiinia. Tämä kanta sisältää eräänlainen s1c /m1 Vaca alleeli, ominaisuus, joka on tunnusomaista helikobakteeri eristetyt Itä-Aasiassa [15, 40]. Tunnistaminen Aasian Caga ja Vaca motiiveja -kanta 98-10 on sopusoinnussa tulosten MLST analyysin, joka luokitellaan kanta 98-10 jäsenenä Itä-Aasian väestöstä klusterin helikobakteeri kantoja. Samanlaisia jännittäen 98-10, kanta B128 on toimiva tyypin IV eritys, joka voi translokoituvat CagA mahalaukun epiteelisolujen ja CagA jälkeen sille tehdään tyrosiinifosforylaatiota [41]. CagA koodaama proteiini-kanta B128 sisältää kaksi EPIYA motiivia, joka on nimetty EPIYA-A ja EPIYA-C [14]. Kanta B128 sisältää tyyppi s1 /m2 VacA alleeli, mutta Vaca mutaatio tässä kannassa on ennustettu estää ilmentymisen täyspitkän VacA proteiinia. Läsnäolo jälkimmäinen mutaatio vahvistettiin nukleotidisekvenssi analyysi VacA fragmentti monistettiin PCR: llä. Immunoblot-analyysillä käyttäen useita anti-VacA antiseerumit osoittivat, että tämä kanta ei tuottanut havaittavaa VacA proteiinia, ja liemi viljelmän supernatanttia tästä kannasta ei aiheuttanut vakuolisaatiota HeLa-soluja (tietoja ei esitetty). Karakterisointi H. pylori core genomin rajaaminen on helikobakteeri ydin genomin (eli geeniä, jotka ovat jatkuvasti läsnä kaikissa helikobakteeri isolaatit) on kiinnostava, koska monet tällaiset geenit ovat todennäköisesti tarvitaan Kolonisaatiopotentiaalin ihmisen vatsaan. Perustuen käytöstä BLAST pisteet suhteen mittaamiseen kuvatulla tavalla Methods tunnistimme 1237 geenejä, jotka olivat läsnä kaikissa 5 H. pylori genomit (kuvio 2 ja Additional tiedosto 1). Aiemmassa tutkimuksessa 56 eri helikobakteeri kannat analysoitiin joukko menetelmiä, ja ydin genomin 1150 geenien raportoitiin olevan läsnä kaikissa 56 kantoja [18]. Niistä 1150 geenit raportoitu käsittävän helikobakteerin ydin genomin perustuu erilaisia analyysi, 1094 olivat läsnä kaikissa 5 kantaa analysoitiin nykyisessä tutkimuksessa, määritettynä sekvenssianalyysillä. Luettelo ytimen geenien havaittiin kaikissa viidessä kannat sekvenssianalyysillä mutta ei erilaisia analyysi sisältää > 20 geenit sijaitsevat CAG PAI. Vaikka CAG PAI on läsnä kaikissa 5 kantaa analysoitiin nykyisessä tutkimuksessa, tämä DNA-alueen tiedetään olevan poissa monista Helikobakteeri kantoja [24]. Viisi muuta klustereita vierekkäisten geenien (joilla kullakin on vähintään 4-geenien ryhmää kohti) oli läsnä kaikissa 5 sekvenssikannoissa, mutta olivat poissa luettelosta ytimen geenien tunnistaa erilaisia analyysi (HP0061-0065, HP0797-0800, HP1339-1343, HP1400-1403, ja HP1455-1458) (Additional tiedosto 1). Erot nimeäminen keskeisten geenien nykyisessä tutkimuksessa verrattiin aikaisempiin tutkimuksiin voi johtua lukuisista tekijöistä, mukaan lukien lukumäärien eroista kantojen analysoitu ja erot menetelmiä geenin havaitseminen. Kuva 2 vertailu ennusti proteomeja BLAST-pistemäärä suhde (BSR) analyysi. Vasemmassa paneelissa näkyy BSR analyysin koodaamien proteiinien kannan J99 ja HPAG1, kannalla 26695 vertailukohtana rasitusta. Oikeassa paneelissa näkyy BSR analyysin koodaamien proteiinien -kannan 98-10 ja B128, kannalla 26695 vertailukohtana rasitusta. BSR lähestymistapa analysoi kaikki proteiinit ennustetaan koodata kolme genomeja, käyttäen samankaltaisuuden mitta, joka perustuu suhde BLAST tulokset, kuten on kuvattu menetelmät. Proteiinit kuvattu laatikon sisällä on vasemmassa alakulmassa (BSR < 0,4) vastaavat proteiinien läsnä viite Proteome (kanta 26695), mutta poissa kaksi kyselyn proteomeja. Oikeassa yläkulmassa neljännekseen edustaa proteiinien konservoituneet kaikissa kolmessa proteomeja. Analyysi 1237 ydin geenit osoittivat, että lähes kaikissa tapauksissa, oli eroja aminohapposekvenssien koodaamien proteiinien yksittäisten kantojen. Parittaiset vertailut koodaamien proteiinien eri kannat osoittivat, että tasot sukulaisuuden vaihteli 65%: sta 100%: n aminohapposekvenssi identiteettiä. Edustaja vertailu ydin koodaamien proteiinien kaksi kantaa (98-10 ja 26695) on esitetty kuviossa 3. Vain 11 geeniä tunnistettiin, joiden aminohapposekvenssit on koodattujen proteiinien olivat samat kaikkien 5 kantaa. Seitsemän näistä 11 geenien koodaama ribosomaalisen proteiineja; toiset koodasi translaation aloituksen tekijä (IF-1), lipoproteiini (Lpp20), flagellaarinen pohjapinta kehon proteiinin (FliE), ja proteiini, jonka toimintaa ei tunneta (HP0031). Kuvio 3 suhteuttaminen ydinproteiineiksi ennustetaan koodata helikobakteeri-kannat 98-10 ja 26695. Joukko 1237 geenien läsnä kaikissa 5 H. pylori kannat tunnistettiin, kuten on kuvattu menetelmät. Päätelty aminohapposekvenssi sekvenssien koodaamat vastaavat proteiinit -kannan 98-10 käytettiin hakemaan tietokannan sekvenssien kannan 26695 käyttäen FastA. Paras ottelu tunnistettiin ja prosentuaalinen aminohappoidenttisyys laskettiin. Histogrammi näyttää määrän ORF näytteille tasoisia Aminohappoidenttisyyden. Analyysi erilaisten geenien Itä-Aasian syöpään liittyvän helikobakteeri rasitusta helikobakteeri eristettyjen kantojen etuyhteydettömiltä ihmisillä näytteille alleelinen monimuotoisuus (tyypillisesti 92-99% nukleotidin identiteettiä vastaava alleelit), joka on pohjana luokittelun kantojen osaksi väestön klustereihin kautta MLST analyysi. Useita geenejä omaavat huomattavasti korkeamman alleeliset monimuotoisuus. Esimerkiksi ainakin kaksi geeniä (Caga ja SEL1 homologi) tiedetään olevan huomattavasti eri Itä-Aasian helikobakteeri kantoja verrattuna Länsi helikobakteeri kantoja [13, 14 , 42]. Oletimme, että ylimääräiset geenit saattavat olla erittäin poikkeavia Itä-Aasian kanta 98-10 verrattuna muihin 4 sekvenssikannoissa. Tunnistaa geenituotteiden koodaama genomin 98-10, jotka ovat selvästi toisistaan poikkeavia verrattuna tuotteisiin, joita koodaavat muiden 4 genomien, olemme keskittyneet analyysiin 1237 ydin geenit, jotka olivat läsnä kaikissa 5 sekvenssikannoissa. Käyttämällä kuvatun lähestymistavan Methods tunnistimme 8 geenin tuotteita, jotka olivat hyvin erilaiset Itä-Aasian rasitusta verrattuna muihin neljä kantaa (taulukko 2). Näitä ovat CagA ja SEL1 homologin, jotka on aiemmin raportoitu olevan huomattavasti eri Itä-Aasian kantoja verrattuna kantoja muualta maailmasta [13, 42]. Aminohapposekvenssit näiden erilaisten koodaamien proteiinien Japanin kannan 98-10 olivat kunkin < 90% identtisiä sekvenssit vastaavien proteiinien muista neljä kantaa (taulukko 2). Kussakin tapauksessa, eriävät alleeli rasitusta 98-10 ja vastaavien alleelien muut neljä kannat reunustaa sama kromosomi genes.Table 2 hyvin erilaisten alleelien Aasian kannan 98-10 Gene numero (98-10) Gene numero (26695) Kuvaus % aa identiteetti (98 -10) % aa identiteetti (non-98-10) b % ainutlaatuinen sivustoja c
HP9810_903g20 HP0061d Hypothetical 67 86 21 HP9810_889g5 HP0492d hpaA homologi 72 92 21 HP9810_889g32 HP0519d SEL1 homologin 73 92 15 HP9810_905g13 HP0547 Caga 79 87 11 HP9810_868g41 HP0806d Hypothetical 86 92 6 HP9810_899g75 HP1322d Hypothetical 75 90 18 HP9810_899g76 HP1323d Ribonuclease 88 92 6 HP9810_885g15 HP1524d Hypothetical 80 95 13 a sekvenssit osoitetun geenin tuotteiden -kannan 98-10 verrattiin vastaavaan sekvenssejä jokaisessa muussa 4 kantoja (26695, J99, HPAG1 ja B128), ja keskimääräinen% aminohapon identiteetin laskettiin, kuten on kuvattu menetelmät. b sekvenssit ilmoitettu geenituotteiden kutakin kantaa verrattiin kaikkien permutaatioiden, paitsi että vertailut, joissa kanta 98-10 jätettiin analyysin ulkopuolelle. Tarkoittaa%: n aminohapposekvenssi-identiteettien laskettiin, kuten on kuvattu menetelmät. CPercentage linjassa sivustoja, joissa proteiini kannasta 98-10 sisälsi aminohappo eroaa vastaavasta aminohaposta proteiineissa 4 muiden kantojen. DReported on olla ainesosa H. pylori ydin genomin, joka perustuu vähintään yhden sirun analyysi [18-20]. Kuten kuviossa 1 on esitetty, kanta J99 oli läheisintä sukua H. pylori kantoja eristetty Länsi-Afrikassa, populaatio klusteri eroaa muiden kantojen, joille genomin sekvenssejä oli saatavilla. Siksi me arveltu, että geenit saattavat olla hyvin erilaista eri Länsi-Afrikkalainen rasitusta J99 verrattuna muihin 4 sekvenssikannoissa. Tunnistaa tällaisia geenejä, käytettiin samaa lähestymistapaa kuin on kuvattu edellä. Neljä ainutlaatuista hyvin erilaisten alleelien todettiin kannan J99 (taulukko 3), kukin koodaus tuotteita, jotka olivat < 90% identtisiä vastaavien proteiinien muissa neljässä kantoja. Ainutlaatuinen hyvin erilaisten alleelien eivät olisi helposti tunnistettavissa kannoissa 26695, HPAG1 tai B128. Merkittävä poikkeus oli tunnistaminen hyvin erilaisista Vaca alleeli kanta B128 (geeni HPB128_147g10). Tunnistaminen vaca kuin erilaiset alleeli kanta B128 johtuu läsnäolo s1 /m2 Vaca alleeli tässä kannassa ja läsnäolo s1 /m1 alleeleja neljän muita kantoja; m1 ja m2 muodot VacA tyypillisesti vain 60-70% aminohappo identiteetin puolivälissä proteiinin alueelle, [38] .table 3 hyvin erilaisten alleelien kannan J99 Gene numero (J99) Gene numero (26695) Kuvaus % aa identiteetti (J99) % aa identiteetti (non-J99) b % ainutlaatuinen sivustoja c
jhp0028 HP0032 Hypothetical 68 91 24 jhp0080 HP0087d Hypothetical 89 96 8 jhp0173 HP0185d Hypothetical 88 93 7 jhp0395 HP1029d Hypothetical 88 95 7 a sekvenssit ilmoitettu geenituotteiden kannan J99 verrattiin vastaavien sekvenssien kanssa jokaisessa muussa 4 kantoja (26695, HPAG1, B128, ja 98-10), ja keskimääräinen% aminohapon identiteetin laskettiin. b sekvenssit ilmoitettu geenituotteiden kutakin kantaa verrattiin kaikkien permutaatioiden, paitsi että vertailut, joissa kannan J99 jätettiin analyysin ulkopuolelle. Tarkoittaa%: n aminohapposekvenssi-identiteettien laskettiin. CPercentage linjassa sivustoja, joissa proteiini kannasta J99 sisälsi aminohappo eroaa vastaavasta aminohaposta proteiineissa 4 muiden kantojen. D Raportoitu olla aineosa helikobakteeri ydin genomin, joka perustuu ainakin yhteen erilaisia analyysi [18-20]. tunnistaminen uusia kannan geenit tunnistamiseen kannan suhteen spesifisiä geenejä ainutlaatuisesti läsnä toinen hiljattain sekvensoitu genomit, mutta ei aiemmin sekvensoitu H. pylori genomeja, me käytettiin jälleen BLAST-pisteytys suhteen analyysi, kuten on kuvattu menetelmät (kuvio 2). Strain 98-10 sisälsivät 22 novel kannan suhteen spesifisiä geenejä ja kanta B128 sisälsi 51 (Additional tiedostoja 2 ja 3). Lisäksi tunnistimme 16 geenejä, jotka olivat läsnä sekä kannan 98-10 ja B128, mutta ei esiinny missään aiemmin sekvenssikannoissa (Additional tiedosto 4). Useat kannan erityinen ORF helikobakteeri kannat 98-10 ja B128 olivat < 100 nukleotidin pituisia, ja on epävarmaa, ovatko nämä hyvin lyhyt ORF todella käännetään proteiineja. Analyysi ainutlaatuinen kannan geenien kolmessa aiemmin sekvensoitu helikobakteeri genomit (26695, J99, ja HPAG1) paljasti samanlaisen useita ainutlaatuisia kannan geenit (taulukko 1), joka on kuvattu aiemmissa tutkimuksissa [ ,,,0],29-31]. tunnistaa mahdollisia toimintoja kannan suhteen spesifisistä geeneistä löytyy ainoastaan kannan 98-10 tai B128 (tai molemmat 98-10 ja B128), päätellyt proteiinisekvenssien käytettiin kyselyitä BLAST etsimistä koskevan NCBI-tietokanta ei-redundantti proteiini-sekvenssit (taulukko 4 ja muita tiedostoja 2, 3, 4). Suurin osa kannan suhteen spesifisistä proteiineista löytyy ainoastaan kannan 98-10 tai B128 eivät läheisesti tahansa tunnettujen proteiinien tai liittyivät proteiinien tietokantaan, jota varten tehtävät eivät ole tiedossa. Useat kanta-spesifisten geenien esiintyy ainoastaan kannan 98-10 tai B128 on aiemmin havaittu kannoissa H. pylori , joiden genomi-sekvenssejä ei ole määritetty. Kuten edellä on kuvattu, insertiosekvenssit ja transposaasia koodaavan geenien (IS607 ja ISHp608) tunnistettiin. Kaksi kannan suhteen spesifisiä geenejä H. pylori kanta B128 (HPB128_11g15 ja HPB128_11g23) koodatut proteiinit liittyvät tyypin IV eritys järjestelmän osat (VirB9 ja VirD4, vastaavasti). Geenit Tämän ryhmän (ulottuu HPB128_11g15 kohteeseen HPB128_11g23) ei havaittu alkuperäisessä genomista analyysit kantojen J99, 26695, tai HPAG1 [29-31], mutta sittemmin havaittiin kannan J99 ja useissa muissa Helikobakteeri kantoja [43] .table 4 Strain-erityisiä helikobakteeri geenien läsnä yksinomaan kannan 98-10 tai B128 | määrä geenien ilmoitettu kanta (l) a | 98-10 B128 98-10 ja B128 kokonaismäärä kannan erityisiä genesa 22 51 16 Toiminnallinen luokka transposaasi 2 3 6 Tyyppi IV eritystä geeni clusterb 0 7 0 Hypothetical 17 37 9 Ei tietokantaan ottelu 8 8 2 Lähin osuma puuttuu tunnetun funktion 9 29 7 Muut 3 4 1 Gene saaria sisältävä kanta-erityisiä genesc 2 11 3 aPresent osoitettuun kanta (s), mutta ei mitään muita neljän kannan, joiden genomit ovat saatavilla. bThis ryhmä geenejä ei havaittu alkuperäisen analyysin genomin kannasta J99, mutta sittemmin havaittu kannan J99 [43]. C; tämä analyysi, saari katsottiin olevan läsnä, jos kaksi tai useampi kanta-geenit olivat vierekkäin kromosomi loci. Mielenkiintoista, kanta B128 sisältää useita geenejä (HPB128_155g19, HPB128_156g11 , HPB128_156g12, HPB128_184g1, HPB128_190g1) ennustetaan koodaavat proteiineja, jotka liittyvät läheisemmin proteiineja koodaa H. acinonychis (Helicobacter lajin eristetty suuri kissat) [44], tai H. cetorum (a http://www.softberry.com/berry.phtml?topic=fgenesb&group=programs&subgroup=gfindb[56],
|