Genomisk karakterisering av en Helicobacter pylori
isolere fra en pasient med magekreft i Kina
Abstract
Bakgrunn
Helicobacter pylori
er godt kjent for sitt forhold til forekomsten av flere alvorlige mage sykdommer. Mekanismene for patogenesen utløst av H. pylori
er mindre kjent. I denne studien rapporterer vi genomsekvens og genomiske karakterisering av H. pylori
belastning HLJ039 som ble isolert fra en pasient med magekreft i den kinesiske provinsen Heilongjiang, hvor det er en høy forekomst av magekreft. For å undersøke mulige genomisk funksjoner som kan være involvert i patogenesen av karsinom, ble genomet sammenlignet med tre tidligere sekvenserte genomer i dette området.
Resultat
Vi fikk 42 contigs med en total lengde på 1.611.192 bp og spådde 1,687 kodende sekvenser . Sammenlignet med stammer isolert fra gastritt og magesår i dette området, ble 10 forskjellige regioner identifisert til å være unik for HLJ039; de i hovedsak kodet type II restriksjons-modifikasjon enzym, type II M6A metylase, DNA-cytosin metyltransferase, DNA metylase, og hypotetiske proteiner. En unik 547-bp fragment dele 93% identitet med et hypotetisk protein av Helicobacter cinaedi
ATCC BAA-847 var ikke til stede i noen andre tidligere H. pylori
stammer. Fylogenetisk analyse basert på kjernegenom enkeltnukleotidpolymorfi viser at HLJ039 er definert som hspEAsia gruppen, som tilhører den hpEastAsia gruppen.
Konklusjon
DNA metyleringer, varianter av genomiske regioner involvert i restriksjons og modifikasjonssystemer, er det " hot "områder som kan være relatert til den mekanismen av H. pylori
indusert magekreft. Den genomsekvens vil gi nyttig informasjon for den dype gruve av potensielle mekanismer knyttet til østasiatiske magekreft.
Nøkkelord
Helicobacter pylori
Magekreft Neste generasjons sekvense Genomisk har bakgrunn
Helicobacter pylori
, en Gram-negativ bakterie som koloniserer i magesekken hos mennesket, har blitt anerkjent som en sykdomsfremkallende bakterier er relatert til patogenesen av gastritt, magesår, og karsinom [1-3]. Den høye genetiske variasjon av H. pylori
driver sin dramatiske evne til å tilpasse seg den mage nisje [4-9]. Men selv om mange studier har blitt utført, dens mekanismer er fremdeles ikke godt belyst.
Med den raske utviklingen av neste generasjons sekvenseringsteknologi og reduserte kostnader, har det blitt mulig å utføre storskala genom sekvense prosedyrer for å få god informasjon om biologiske befolkningsstruktur og sykdomsmarkører. Over de siste årene har stadig flere H. pylori
stammer fra ulike geografiske regioner, etniske grupper, og sykdommer blitt sekvensert [10-12], og minst 50 genomsekvenser er for tiden tilgjengelig i offentlige databaser.
I en tidligere studie, publisert vi genomsekvenser av tre stammer utvinnes fra pasienter med magesår og atrofisk gastritt i Heilongjiang-provinsen [13]. Det er velkjent at H. pylori
stammer isolert fra ulike geografiske områder viser dramatiske genomisk mangfold [14]. Således, på det genomiske nivå, komparativ analyse blant stammene med forskjellige kliniske manifestasjoner bør først eliminere slike forstyrrelser. Komparativ genomisk sekvense analyse av stammer isolert fra enkeltpasienter kan være en pålitelig måte å eliminere slike forstyrrelser [15-17]. Imidlertid er det vanligvis vanskelig å følge en pasient og få stammer isolert fra ulike uforutsigbare manifestasjoner.
I denne studien, rapporterte vi et utkast genomsekvens av belastning HLJ039 som ble isolert fra en pasient med magekreft i Heilongjiang-provinsen. Etter integrasjon med de tre andre genomer fra samme område, ble første komparativ genomisk analyse utført for å undersøke genetiske trekk ved magekreft isolater.
Metoder
Strain utvalg
HLJ039 ble isolert fra en 84-åring mann med dårlig differensiert magen kroppen kreft. Selv om noen andre magekreft relaterte H. pylori
stammer isolert fra forskjellige områder, etnisitet og befolkninger i verden er til stede i offentlige databaser, gjorde vi ikke velge disse stammene for vår komparativ analyse. Komplekset belastningen bakgrunn vil gjøre det svært vanskelig å identifisere genomiske pålitelige egenskaper som kan være bidratt til en spesifikk sykdom som magekreft. Som sådan kan analysere et bestemt geografisk område, etnisitet, eller befolkningen være en mer fornuftig måte å finne potensielle ledetråder relatert til spesifikke sykdommer. Derfor, i denne studien, valgte vi bare tre stammer isolert fra Heilongjiang-provinsen for den komparative analysen. Disse stammer er svært representative fordi Heilongjiang-provinsen har en høy forekomst av magesykdommer i Kina, spesielt for magekreft. I tillegg den kinesiske Heilongjiang-provinsen nær Korea og Japan. Disse øst-asiatiske land velig har den høyeste forekomsten av magekreft i verden [18, 19] etikk godkjenning
Denne forskningen.
Ble godkjent av møtet etikk komité av Statens institutt for smittevern og forebygging, Kina CDC, ifølge kinesiske etikk lover og forskrifter. NO:. ICDC-2013001
genomsekvensering og annotering
belastningen ble isolert fra mageslimhinnen og dyrket på Columbia agarbase supplert med 5% saueblod. DNA ble ekstrahert som tidligere beskrevet [20]. For hver stamme, ble hel-genomsekvensering utført ved hjelp av en Illumina Hiseq 2000 ved å generere parvise end bibliotek (500 bp og 2 kb) etter produsentens anvisninger. Lese lengder var 90 bp og 50 bp for hvert bibliotek, der mer enn 100 Mb av høy kvalitet data ble generert. Den parvise end leser fra de to bibliotekene var de novo sammen til stillasene ved hjelp SOAPdenovo (http:... //Såpe genomikk org cn). Gene prediksjon ble utført ved hjelp av Glimmer. TRNA-gener ble søkt etter av tRNAScan-SE2, mens rRNA gener ble søkt etter av RNAmmer3. Protein BLAST4 ble kjørt ved hjelp av de oversatte sekvenser som en spørring mot referansesekvensen (H. pylori
belastning 51).
Genomet ble videre kommentert og funksjonelt kategorisert av Rapid Stempler hjelp Subsystem Technology (RAST). Et delsystem er et sett av funksjonelle roller som en annotator har besluttet er relatert. Delsystemer representerer ofte innsamling av funksjonelle roller som komponerer en metabolismeveien, kompleks, eller protein klasse [21].
Initial komparativ genomisk og fylogenetisk analyse
å identifisere mulige områder som kan være involvert i patogenesen av magekreft, MAUVE ble brukt til å sammenligne HLJ039 med ytterligere tre isolater utvinnes fra det samme området [22]. Som beskrevet tidligere, ble HLJ271 utvunnet fra en pasient med gastrisk sår. HLJ193 og HLJ256 ble gjenvunnet fra pasienter med atrofisk gastritt. Ulike regioner (DRS) av HLJ039 ble merket langs kromosom plassering. DRs referere til kodende sekvens (CDS) innsetting og sletting i HLJ039 i forhold til de tre andre genomer.
Å definere fylogenetisk karakterisering av HLJ039 hjelp av offentlig tilgjengelig H. pylori
genomsekvenser, 53 hele genomsekvenser ble hentet fra GenBank for fylogenetisk tre konstruksjon (tilleggsfiler 1). P12 ble brukt som en referanse genom. Sammenligninger ble gjort ved hjelp av nucmer programmet fra MUMMER3 implementert i Panseq [23]. Genomer ble fragmentert i 500-bp segmenter som måtte være til stede i alle 54 genomer som skal inkluderes i kjernen genomet. Horisontalt overførte gener har vanligvis høy genetisk diversitet blant forskjellige stammer, for eksempel, plastisitet soner, som koder for type IV sekresjons-systemer, R-M-systemer, eller overfør genomiske øyer. I henhold til prinsippet av multippel oppstilling ved anvendelse av Panseq, ville disse potensielle horisontale genene bli fjernet fra kjerne gener. Enkelt nukleotid (SNP) i kjerne genomer bestemmes og brukes til å generere en Phylip-formatert fil. Sammensatt SNPs i lengden på 29 259-bp ble brukt til å konstruere et fylogenetisk tre ved hjelp av nabo-sammenføyningsmetode i MEGA5. Bootstrap metoden ble brukt for å vurdere stabiliteten i fylogenetiske relasjoner.
Genomisk data deponering
Hele genomet hagle prosjektet har blitt deponert på DDBJ /EMBL /GenBank under tilgjengelighetsnummeret JAAA00000000, mens versjon JAAA01000000 er beskrevet i denne artikkelen.
Kvalitetssikring
genomisk DNA ble ekstrahert fra en ren dyrket H. pylori
belastning og bekreftet ved hjelp av konvensjonelle biokjemiske tester (positive for urease, katalase, og oksidase). Den RAST serveren ble brukt til å vurdere potensielle heterogene forurensing.
Innledende funn
Vi slutt innhentet 42 contigs med en total lengde på 1.611.192 bp og spådde 1,687 CDS innen utkastet genomet belastning HLJ039. Ytterligere informasjon er inkludert i sekvense rapporter om HLJ039 (tilleggsfiler 2). G + C-innholdet var 38,72%. Delsystemet fordeling og generell informasjon om potensiell funksjonell fordeling av HLJ039 er vist i figur 1. I forhold til de resterende tre HLJ genomer, HLJ039 har 10 ulike regioner (DRS). Detaljert informasjon om disse fragmentene er vist i tabell 1. Lokaliseringen av DR er merket i hele genomet (figur 2). Omtrent halvparten av disse sekvensene kodet hypotetiske proteiner. De fleste av DR-sekvenser som kodet for proteiner involvert i DNA-metylase og et restriksjonsenzym modifikasjon. Spesielt, var en unik 547-bp fragment (DR9) som deler 93% identitet med et hypotetisk protein av Helicobacter cinaedi
ATCC BAA-847 funnet som aldri hadde vært til stede i noen andre H. pylori
stammer tidligere, noe som indikerte en mulig horisontal genoverføring mellom H. pylori Hotell og H. cinaedi
. DR9, som ligger i stillas 5, settes inn i en 1371-bp-genet som koder for type III-restriksjonsendonuklease, som er ansvarlig for adenin-spesifikk DNA-metylase modifikasjoner. Figur 1 Subsystem fordelingsstatistikk av Helicobacter pylori belastning HLJ039 generert av den raske merknaden ved hjelp av delsystem teknologi server.
Tabell 1 Basis informasjon om de ulike regionene (DRS) i HLJ039
DR
start til
End
Gene beskrivelse
DR1
145736
180926
25 hypotetiske proteiner, VirB4, DNA topoisomerase i, para, Mobile element protein, First ORF i transposon ISC1904
DR2
618752
619703
Fucosyltransferase
DR3
740131
740654
Hypotetisk protein
DR4
1.200.420
1.202.309
Hypotetisk protein
DNA-cytosin metyltransferase
DR5
1.254.233
1256053
Hypotetisk protein
DR6
1.335.551
1.337.398
Type II M6A metylase (hinFIM)
hypAIVR
DR7
1.393.932
1.394.805
Hypotetisk protein
DR8
1.443.251
1.445.196
Type II DNA modifikasjon enzym
hypotetisk protein
DR9
1.484.058
1.484.604
hypotetisk protein dele 93% identitet med et fragment av Helicobacter cinaedi
ATCC BAA-847
DR10
1.538.060
1.539.662
Type IIG begrensning og modifikasjon enzym
Figur 2 Genome justering av magekreft isolere HLJ039 med ikke-karsinom isolater.
Alle de ovennevnte funnene fremheve den viktige rollen av DNA restriksjonsmodifikasjonssystemer i H. pylori
genomisk rekombinasjon. Totalt 29,259 kjerne SNPs ble funnet blant de 54 analyserte genomsekvenser. Med utgangspunkt i en kjerne genom SNP analyse av 54H. pylori
stammer fordelt i ulike verdensbasis regioner, ble et fylogenetisk tre generert for å vise HLJ039 subtype. Alle stammene ble klassifisert i ulike grupper som er definert av tidligere studier i henhold til multilocus sekvens typing [24, 25]. Figur 3 viser at HLJ039 ble definert som tilhører hspEAsia gruppen, som tilhørte den hpEastAsia gruppen. Figur 3 fylogenetisk analyse av 54 Helicobacter pylori stammer basert på deres kjernegenom enkeltnukleotidpolymorfi.
Merk: Ulike regioner (DRS) refererer til kodende sekvens innsetting og sletting i HLJ039 i forhold til de tre andre genomer
Fremtidige retninger
forekomst av magekreft i østasiatiske land er ganske høy [18, 19. ]. For å utforske de potensielle patogene mekanismer som kan bidra til dette fenomenet, mer østasiatiske H. pylori
stammer må først bli sekvensert. Stammene valgt for sekvensering bør være representative og eliminere geografisk variasjon. Våre fremtidige retninger vil fokusere på storskala genom sekvensering av ulike kliniske isolater fra områder med høy forekomst av magekreft. Mer detaljerte analyser som er involvert i DNA metylering samt begrensning og modifikasjons systemer ville være den mest attraktive retninger for studier av H. pylori
indusert magekreft.
Samtykke
Skriftlig informert samtykke ble innhentet fra pasienten for publiseringen av denne rapporten og eventuelle vedlagte bilder.
tilgjengelighet for å støtte data
Andre data som støtter resultatene som presenteres her, er inkludert i de andre filene
Erklæringer
Takk.
dette arbeidet ble støttet av et fond for Kina Mega-Project for Infectious Disease (2011ZX10004-001) og et stipend fra National Technology R &. D Program i det 12. femårsplan for Kina (2012BAI06B02)
Elektronisk supplerende materiale
13099_2014_126_MOESM1_ESM. doc tilleggsfiler 1: Generell informasjon for de offentlig tilgjengelige genomer (DOC 60 KB) 13099_2014_126_MOESM2_ESM.doc tilleggsfiler. 2:. Assembly informasjon for HLJ039 (DOC 27 KB) Forfattere 'originale legges filer for Images Nedenfor er linker til forfatternes opprinnelige legges filer for bilder. 13099_2014_126_MOESM3_ESM.tiff Forfatteroriginalfilen for figur 1 13099_2014_126_MOESM4_ESM.tiff Forfatteroriginalfilen for figur 2 13099_2014_126_MOESM5_ESM.tiff Forfatteroriginalfilen for figur 3 konkurrerende interesser
Forfatterne hevder at de ikke har noen konkurrerende interesser.
Forfattere ' bidrag
YY utførte bioinformatikk analyse og skrev manuskriptet; MZ og LH var ansvarlige for bakterier isolering og identifikasjon; LL, XH og YZ utført genomisk sekvensering; JZ og PN designet studien og gitt økonomisk støtte til dette arbeidet. Alle forfattere lese og godkjent den endelige manuskriptet.