Genomisk karakterisering af en Helicobacter pylori
isolere fra en patient med mavekræft i Kina
Abstrakt
Baggrund
Helicobacter pylori
er kendt for sit forhold til forekomsten af flere alvorlige mavesygdomme. Mekanismerne i patogenese udløst af H. pylori
er mindre kendt. I denne undersøgelse rapporterer vi genomet sekvens og genomiske karakterisering af H. pylori
stamme HLJ039 der blev isoleret fra en patient med gastrisk cancer i den kinesiske provins Heilongjiang, hvor der er en høj forekomst af mavekræft. For at undersøge potentielle genomiske funktioner, der kan være involveret i patogenesen af carcinom, blev genomet sammenlignet med tre tidligere sekventeret genomer på dette område.
Resultat
Vi opnåede 42 contigs med en samlet længde på 1.611.192 bp og forudsagde 1.687 kodende sekvenser . Sammenlignet med stammer isoleret fra gastritis og mavesår på dette område blev 10 forskellige regioner identificeret som værende unikt for HLJ039; de primært kodet type II restriktion-modifikation enzym, type II m6A methylase, DNA-cytosin methyltransferase, DNA-methylase, og hypotetiske proteiner. En unik 547-bp fragment deler 93% identitet med et hypotetisk protein af Helicobacter cinaedi
ATCC BAA-847 ikke var til stede i andre tidligere H. pylori
stammer. Fylogenetisk analyse baseret på centrale genom enkelt nukleotid polymorfier viser, at HLJ039 defineres som hspEAsia undergruppe, som hører til hpEastAsia gruppen.
Konklusion
DNA methyleringer, variationer af de genomiske regioner er involveret i begrænsning og modifikation systemer, er det " hot "områder, der kan være relateret til den mekanisme af H. pylori
induceret mavekræft. Genomet sekvens vil give nyttige oplysninger om den dybe udvinding af potentielle mekanismer relateret til østasiatiske mavekræft.
Nøgleord
Helicobacter pylori
mavekræft Næste generation sekventering Genomic funktioner Baggrund
Helicobacter pylori
, en gram-negativ bakterie, der koloniserer i den humane mave, er blevet bredt anerkendt som en sygdomsfremkaldende bakterier i forbindelse med patogenesen af gastritis, mavesår og carcinom [1-3]. Den høje genetiske variabilitet af H. pylori
driver sin dramatiske evne til at tilpasse sig den gastriske niche [4-9]. Men selv om der er udført mange undersøgelser, dets mekanismer er stadig ikke godt belyst.
Med den hurtige udvikling af den næste generation sekventering teknologi og reducerede omkostninger, er det blevet muligt at udføre skala genom sekventering procedurer store at opnå rigelig information om biologiske populations struktur og sygdomsmarkører. I løbet af de sidste par år, har i stigende grad mere H. pylori
stammer fra forskellige geografiske regioner, etniske grupper, og sygdomme blevet sekventeret [10-12], og mindst 50 genom-sekvenser er i øjeblikket tilgængelige i offentlige databaser.
In en tidligere undersøgelse, offentliggjorde vi genom sekvenser af tre stammer inddrives fra patienter med mavesår og atrofisk gastritis i Heilongjiang provinsen [13]. Det er velkendt, at H. pylori
stammer isoleret fra forskellige geografiske områder viser dramatisk genomisk mangfoldighed [14]. Således ved genomisk niveau, sammenlignende analyse blandt stammer med forskellige kliniske manifestationer bør i første omgang fjerne en sådan interferens. Sammenlignende genomisk sekventering analyse af stammer isoleret fra enkelte patienter kan være en pålidelig måde at fjerne sådan indblanding [15-17]. Imidlertid er det normalt vanskeligt at følge en patient og opnå stammer isoleret fra forskellige uforudsigelige manifestationer.
I denne undersøgelse har vi rapporteret et udkast genomsekvens af stamme HLJ039 som blev isoleret fra en patient med gastrisk cancer i Heilongjiang provinsen. Efter integration med de tre andre genomer fra det samme område, blev indledende komparativ genomisk analyse udført for at undersøge de genetiske egenskaber mavekræft isolater.
Metoder
Stammeudvælgelse
HLJ039 blev isoleret fra en 84-årig mand med dårligt differentieret mave krop kræft. Selv om nogle andre gastrisk karcinom-relaterede H. pylori
stammer isoleret fra forskellige områder, etniske grupper og befolkninger i verden er til stede i offentlige databaser, vi ikke vælge disse stammer til vores komparative analyse. Den komplekse belastning baggrund vil gøre det meget vanskeligt at identificere pålidelige genomiske egenskaber, der kan bidraget til en specifik sygdom som mavekræft. Som sådan kan analysere et bestemt geografisk område, etnicitet, eller befolkning være en mere fornuftig måde at finde potentielle spor relateret til specifikke sygdomme. Derfor, i dette studie, valgte vi kun tre stammer isoleret fra Heilongjiang provinsen for den sammenlignende analyse. Disse stammer er meget repræsentative, fordi Heilongjiang provinsen har en høj forekomst af gastrisk sygdomme i Kina, især for mavekræft. Derudover kinesiske Heilongjiang provinsen er nær Korea og Japan. Disse østasiatiske lande sigende har den højeste forekomst af mavekræft verdensplan [18, 19].
Etik godkendelse
Denne forskning blev godkendt af mødet etiske komité for national institut for kontrol med overførbare sygdomme og forebyggelse, Kina CDC, ifølge kinesiske etik love og regler. NO:. ICDC-2013001
Genome sekventering og annotation
stamme blev isoleret fra maveslimhinden og dyrket på Columbia-agar suppleret med 5% fåreblod. DNA blev ekstraheret som tidligere beskrevet [20]. For hver stamme, blev hel-genom-sekventering udføres med en Illumina Hiseq 2000 af generering parrede-end biblioteker (500 bp og 2 kb) efter producentens anvisninger. De læste længder var 90 bp og 50 bp for hvert bibliotek, hvorfra mere end 100 MB data af høj kvalitet blev genereret. Den parrede ende læser fra de to biblioteker var de novo samlet i stilladser ved hjælp SOAPdenovo (http:... //Sæbe genomforskning org cn). Gene forudsigelse blev udført ved anvendelse Glimmer. De tRNA gener blev søgt efter ved tRNAScan-SE2, mens rRNA-generne blev søgt efter ved RNAmmer3. Protein BLAST4 blev kørt ved hjælp af de oversatte sekvenser som en forespørgsel mod henvisningen sekvens (H. pylori
stamme 51).
Genomet blev yderligere kommenteret og funktionelt kategoriseret efter Rapid Annotation hjælp Subsystem Technology (RAST). Et delsystem er et sæt af funktionelle roller, som en annotator har besluttet er relateret. Delsystemer ofte repræsenterer samling af funktionelle roller der udgør en metabolisk vej, kompleks, eller protein klasse [21].
Indledende komparativ genomisk og fylogenetisk analyse
At identificere mulige områder, der kan være involveret i patogenesen af gastrisk kræft, MAUVE blev brugt til at sammenligne HLJ039 med yderligere tre isolater inddrives fra det samme område [22]. Som tidligere beskrevet, blev HLJ271 udvundet fra en patient med mavesår. HLJ193 og HLJ256 blev udvundet fra patienter med atrofisk gastritis. Forskellige regioner (DRS) af HLJ039 blev mærket langs dens kromosom placering. DRs se kodende sekvens (CDS) indsættelse og deletion i HLJ039 sammenlignet med de andre tre genomer.
Vil definere det fylogenetiske karakterisering af HLJ039 anvende den offentligt tilgængelige H. pylori
genomsekvenser, 53 hele genomet sekvenser blev ekstraheret fra GenBank for fylogenetisk træ konstruktion (Ekstra fil 1). P12 blev anvendt som en reference-genom. Sammenligninger blev foretaget under anvendelse af nucmer program fra MUMMER3 implementeret i Panseq [23]. Genomer blev opsplittet i 500-bp segmenter, der måtte være til stede i alle 54 genomer, der skal indgå i kernen genomet. Horisontalt overførte gener har sædvanligvis høj genetisk mangfoldighed blandt forskellige stammer, for eksempel, plasticitet zoner, der koder type IV sekretionssystemer, R-M-systemer eller omsættelige genomiske øer. Ifølge princippet om multiple alignment ved anvendelse af Panseq, ville disse potentielle horisontale gener fjernes fra de centrale gener. Single-polymorfismer (SNP'er) i de centrale genomer bestemmes og anvendes til at generere et Phylip-formateret fil. Sammenkædede SNP'er i længden af 29.259 bp blev anvendt til at konstruere et fylogenetisk træ ved hjælp af nabo-sammenføjning metode i MEGA5. Bootstrap metode blev anvendt til at vurdere stabiliteten af de fylogenetiske relationer.
Genomisk data aflejring
Denne hele genomet shotgun projekt er blevet deponeret på DDBJ /EMBL /GenBank under accessionsnummer JAAA00000000, mens versionen JAAA01000000 er beskrevet i dette dokument.
Kvalitetssikring
Det genomiske DNA blev ekstraheret fra en ren dyrket H. pylori
stamme og bekræftet ved anvendelse af traditionelle biokemiske tests (positive for urease, catalase, og oxidase). Den RAST-serveren blev anvendt til at evaluere potentielle heterogene forureninger.
Første resultater
Vi i sidste ende opnåede 42 contigs med en samlet længde på 1.611.192 bp og forudsagt 1.687 CDS inden udkastet genom stammen HLJ039. Yderligere oplysninger indgår i sekventering rapporter HLJ039 (Yderligere fil 2). G + C-indholdet var 38,72%. Delsystemet distribution og generelle oplysninger om den potentielle funktionelle fordeling af HLJ039 er vist i figur 1. Sammenlignet med de yderligere tre HLJ genomer, HLJ039 har 10 forskellige regioner (DRS). Detaljerede oplysninger om disse fragmenter er vist i tabel 1. Placeringen af disse DRs mærkes i hele genomet (figur 2). Ca. halvdelen af disse sekvenser kodet hypotetiske proteiner. De fleste af de DR-sekvenserne kodede proteiner er involveret i DNA-methylase og en begrænsning modifikation enzym. Især blev en unik 547-bp fragment (DR9) deling 93% identitet med et hypotetisk protein af Helicobacter cinaedi
ATCC BAA-847 findes der aldrig havde været til stede i alle andre H. pylori
stammer tidligere, som angivet en mulig horisontal genoverførsel mellem H. pylori
H. cinaedi
. DR9, beliggende i stillads 5, indsættes i et 1.371-bp gen, der koder type III restriktionsendonuklease, som er ansvarlig for adenin-specifik DNA-methylase modifikationer. Figur 1 delsystemet fordelingsstatistikker af Helicobacter pylori stammen HLJ039 genereret af den hurtige anmærkning ved hjælp delsystemsteknologi server.
Tabel 1 Grundlæggende informationer om de forskellige regioner (DRS) i HLJ039
DR myHotelVideo.com: Start myHotelVideo.com: End
Gene beskrivelse
DR1
145.736
180.926
25 hypotetiske proteiner, VirB4, DNA topoisomerase i, para, Mobile element protein, First ORF i transposon ISC1904
DR2
618.752
619.703
fucosyltransferase
DR3
740.131
740.654
Hypotetisk protein
DR4
1.200.420
1.202.309
Hypotetisk protein
DNA-cytosin methyltransferase
DR5
1.254.233
1.256.053
Hypotetisk protein
DR6
1.335.551
1.337.398
Type II m6A methylase (hinFIM)
hypAIVR
DR7
1.393.932
1.394.805
Hypotetisk protein
DR8
1.443.251
1.445.196
Type II DNA modifikation enzym
hypotetisk protein
DR9
1.484.058
1.484.604
hypotetisk protein deler 93% identitet med et fragment af Helicobacter cinaedi
ATCC BAA-847
DR10
1.538.060
1.539.662
Type IIG begrænsning og ændring enzym
figur 2 Genome tilpasning af gastrisk karcinom isolere HLJ039 med ikke-carcinom isolater.
Alle de ovennævnte resultater fremhæve den vigtige rolle DNA begrænsning modifikation systemer i H. pylori
genomisk rekombination. Der blev fundet i alt 29,259 centrale SNPs blandt de 54 analyserede genom sekvenser. Baseret på en kerne genom SNP analyse af 54H. pylori
stammer fordelt i forskellige regioner verden over, blev et fylogenetisk træ genereret for at vise HLJ039 undertype. Alle stammer blev klassificeret i forskellige grupper defineret af tidligere undersøgelser ifølge multilocus sekvens typebestemmelse [24, 25]. Figur 3 viser, at HLJ039 blev defineret som hørende til hspEAsia undergruppe, som tilhørte den hpEastAsia gruppen. Figur 3 fylogenetisk analyse af 54 Helicobacter pylori stammer baseret på deres kerne genom enkelt nukleotid polymorfier.
Bemærk: Forskellige regioner (DRS) refererer til kodende sekvens indsættelse og sletning i HLJ039 forhold til de andre tre genomer
Fremtidige retninger
Forekomsten af gastrisk karcinom i østasiatiske lande er ganske høj [18, 19. ]. At udforske de potentielle patogene mekanismer, der kan bidrage til dette fænomen, mere østasiatisk H. pylori
stammer skal først sekventeret. De udvalgte til sekventering stammer skal være repræsentative og fjerne geografisk variation. Vores fremtidige retninger vil fokusere på storstilet genomisk sekventering af forskellige kliniske isolater fra områder med en høj forekomst af mavekræft. Mere detaljerede analyser er involveret i DNA-methylering samt begrænsning og modifikation systemer ville være de mest attraktive retninger for studier af H. pylori
induceret mavekræft.
Samtykke
Skriftligt informeret samtykke blev opnået fra en patient for offentliggørelsen af denne rapport og de ledsagende billeder.
Tilgængeligheden af understøttende data
yderligere data understøtter resultaterne rapporteret her er inkluderet i de ekstra filer.
erklæringer
Tak
dette arbejde blev støttet af en fond for Kina Mega-projekt for smitsomme sygdomme (2011ZX10004-001) og en bevilling fra National Technology R &. D Program i det 12. femårsplan Kina (2012BAI06B02) | Electronic supplerende materiale
13099_2014_126_MOESM1_ESM. doc Yderligere fil 1: Generel information til de offentligt tilgængelige genomer (DOC 60 KB) 13099_2014_126_MOESM2_ESM.doc Yderligere fil 2:.. Assembly information til HLJ039 (DOC 27 KB) Forfattere 'oprindelige indsendt filer til Images of Nedenfor er links til forfatternes oprindelige indsendt filer til billeder. 13099_2014_126_MOESM3_ESM.tiff Forfatternes oprindelige fil til figur 1 13099_2014_126_MOESM4_ESM.tiff Forfatternes oprindelige fil til figur 2 13099_2014_126_MOESM5_ESM.tiff Forfatternes oprindelige fil til figur 3 konkurrerende interesser
Forfatterne erklærer, at de ikke har nogen konkurrerende interesser.
Forfattere ' bidrag
YY udførte den bioinformatik analyse og skrev manuskriptet; MZ og LH var ansvarlige for bakterier isolation og identifikation; LL, XH og YZ udført genomisk sekventering; JZ og PN designet undersøgelsen og ydet finansiel støtte til dette arbejde. Alle forfattere læst og godkendt den endelige manuskript.