Baza ljudskog raka želuca (DBGC) je sveobuhvatna baza podataka koja integrira razne ljudske rak želuca povezanih podataka resursa. Ljudski rak želuca vezane transkriptomika projekti, proteomika projekti, mutacije, biomarkeri i lijek osjetljivih gena iz različitih izvora su skupljene i ujedinjeni u ovoj bazi podataka. Štoviše, epidemiološke statistika pacijenata s rakom želuca u Kini i kliničkopatološkim informacija označeni slučajeva raka želuca su također integrirani u DBGC. Vjerujemo da je ova baza podataka će uvelike olakšati istraživanje u vezi ljudskog raka želuca u mnogim područjima. DBGC je dostupan besplatno na http://bminfor.tongji.edu.cn/dbgc/index.do pregled
Izvor: Wang C, Zhang J, Cai M, Zhu Z, Gu W, Yu Y, et al , (2015) DBGC: Baza podataka o ljudskim karcinoma želuca. PLoS ONE 10 (11): e0142591. doi: 10,1371 /journal.pone.0142591 pregled
Urednik: Arun Sreekumar, Baylor College of Medicine, Sjedinjene Američke Države pregled
Primljeno: 18. veljače 2015. godine; Prihvaćeno: 24. listopada 2015; Objavljeno: 13 studeni 2015 pregled
Copyright: © 2015 Wang et al. Ovo je otvoreno pristupa članak distribuirati pod uvjetima Creative Commons Imenovanje License, koja omogućuje neograničeno korištenje, distribuciju i reprodukciju u bilo kojem mediju, pod uvjetom da je izvorni autor i izvor su zaslužan pregled
Podaci Dostupnost: Podaci su availabe preko Datadryad (https://datadryad.org). Jedinstveni pristupni broj je: doi:. 10,5061 /dryad.271dk pregled
Financiranje: Ovaj rad je djelomično podržan od strane potpore iz Nacionalne zaklade prirodoslovni Kine (81172329, 31571363, 81372644, 81372645 i 8157111077), kineski National High Tech program (2012AA02A504 i 2012AA02A203), Međunarodni zajednički projekt iz Šangaja znanosti i tehnologije komisije (12410706400), inovacije Zaklade Translational medicine Šangaj Jiao Tong University School of medicine (15ZH1002 i 15ZH3001), Fong Shu Fook Tong Foundation i karcinoma probavnog sustava Biobank Projekt Shanghai Jiao Tong University School of medicine. U financijeri nisu imali ulogu u studiju dizajna, prikupljanja i analize podataka, Odluka o objavi, ili pripremu rukopisa pregled
U konkurenciji interese.. Autori su izjavili da ne postoje suprotstavljeni interesi pregled
Uvod pregled
Kao jedan od najčešćih oblika raka, raka želuca je treći najveći smrtnosti i četvrti najviši pobol od svih vrsta raka u svijetu [1]. Prema statističkim podacima GloboCan u 2012. godini, novih slučajeva raka želuca broji gotovo milijun (952.000), a više od 700.000 smrtnih slučajeva su uzrokovane rakom želuca; gotovo polovica tih pacijenata dolazi iz Kine (405,000 novih slučajeva i 325.000 smrti) [1, 2]. Iako su obje smrtnost i pobol od raka želuca smanjen u posljednjih nekoliko godina, stopa preživljavanja od 5 godina i dalje je vrlo niska. [3] Stoga, karcinom želuca ostat će jedan od najtežih izazova za istraživača i liječnika za dugo vremena. [4] pregled
Znanstvenici širom svijeta su završile mnoge genomike, transkriptomika, proteomika, kao i epidemiološka istraživanja i klinička ispitivanja u vezi patogenezi i terapije iz rakom želuca [5-10]. Ova istraživanja su generirani ogromne količine podataka koji se odnose na rak želuca, a brzina ovih istraživanja ubrzava s brzim rastom znanja raka, smanjene troškove otkrivanje i računanja, i širenja Interneta [11]. Ti podaci sadrže važne informacije za istraživanje i liječenje raka želuca. Međutim, zbog ograničenog predznanja kliničara i temeljnih istraživačima, potencijalni tih podataka ne može se u potpunosti razvijen. Nove tehnologije i metode istraživanja i dalje zahtijevaju razvoj; Međutim, niska učinkovitost u upravljanju podacima je primarni ograničenje tog razvoja [12]. Zbog dugoročne akumulacije decentraliziranog istraživanja, ovi podaci i njihove formate samo zadovoljiti individualne potrebe, bez integraciju i standardizaciju i rezultiraju u diverzifikaciju, izomerizacije i seciranje podataka raka [13, 14]. Pregled
Trenutno, u izobilju klinička i temeljna studija o raka želuca se planiraju ili su u tijeku. Razne vrste podataka su pohranjeni u različitim sustavima baza podataka [13], bez dijeljenja ili komunikacije. Dakle, blisko povezan informacija ostaje izoliran, u onome što se naziva "informacijski otoci". S jedne strane, disekcija podaci povećava poteškoće data mining, dok s druge strane, ona sprečava kliničarima potpuno iskorištavanje ishoda temeljna istraživanja za razvoj kliničkih ispitivanja i aplikacije i čuva temeljne istraživače u obavljanju učinkovite istraživačke studije u kojima su navedene klinički relevantne informacije [15]. pregled
u ovoj situaciji, vraćajući sveobuhvatne informacije o raka želuca nije lagan zadatak, a dijelovi tih podataka može nestati u oceanu interneta, što će biti vrlo nesretni.
Ovo istraživanje je iskoristio resurse s interneta i publikacija iz kineske Centra za kontrolu i prevenciju bolesti (CDC) i rak želuca Centra za dijagnostiku i liječenje, Key Laboratory želučane neoplazmi u Šangaju. Ova studija se sustavno prikupljaju razne vrste želučanih podataka vezanih za rak, integrirana ovi podaci resurse nakon filtracije i standardizacije, te konačno formira prvu sveobuhvatnu bazu znanja za analizu raka želuca. Pregled
Materijali i metode
podaci resursi pregled
baza Human rak želuca (DBGC) ima integriran sljedeće želučanog raka povezanih resursa: pregled
Prikupljanje podataka
1) Epidemiološka statistike pacijenata s rakom želuca u Kini. pregled
CDC ima uspostavljen sustav izvješćivanja raka za mnogo godina, te je nakupila u izobilju epidemiološke podatke o oboljelima od raka u Kini. Epidemiološki statistike od raka želuca, uključujući i brojem predmeta, broj smrti, stope incidencije (sirova stopa, dobi prilagođena cijena i kumulativna stopa), stopa smrtnosti (sirova stopa, stopa dobi prilagođen i kumulativna stopa) i učestalosti (i smrtnost) raspodjela prema dobnoj skupini su ručno izdvojiti iz CDC publikacija. DBGC 1.0 pokriva sve epidemiološke statističke podatke za sve tipične dijelovima Kine iz godine 2004. do 2009., i dodatne statistike bit će uključeni u ažurirati na inačici. Pregled
2) kliničkopatološkim informacije o želučanog tkiva raka. Pregled
kliničkopatološkim informacije dao je Šangaj Ruijin bolnici. Metode klasifikacije i organizirajući se uglavnom koriste za dijagnosticiranje raka želuca su označeni pomoću želučane slučajeva dijagnosticiran rak na Ruijin bolnici. Tipični želučani tkiva raka različitih stadija i tipova su odabrani od raka želuca biobank da smo održava godinama. Sve informacije Pacijent je anonimne i de-identificirani prije naše analize. Pregled
3) Molekularne biološke podatke o rakom želuca iz javnih online resursa. Pregled
molekularne biologije podaci su izvađeni i kustos iz online izvora. Transkriptomika Podaci su prikupljeni od GEO baze podataka (http://www.ncbi.nlm.nih.gov/geo/) i EBI baze podataka (http://www.ebi.ac.uk/). Proteomika podaci su izvađeni iz objavljene literature putem ručnog čitanja i standardizacije [16, 17]. Mutacija Podaci su prikupljeni iz baze dbVar (http://www.ncbi.nlm.nih.gov/dbvar/), OMIM baze podataka (http://www.ncbi.nlm.nih.gov/omim/), HGMD baze podataka (http://www.hgmd.org/) i objavljenih znanstvenih radova [18, 19]. Svi podaci biomarkera su iz objavljene literature [20, 21]. geni ovisnicima su izvađeni iz baze PharmGKB (http://www.pharmgkb.org/), CancerDR baze podataka (http://crdd.osdd.net/raghava/cancerdr/) i objavljenoj literaturi [22, 23]. Osmislili smo detaljne standarde ekstrakcije za svaku vrstu molekularne biološke izvora podataka, a svaki postupak prikupljanja podataka morao slijediti ove standarde kako bi se osigurala koherentnost podataka. Detaljni postupak zbirka nalazi se u nastavku: Netlogu
transkriptomika podatke: pregled
Proteomika podaci: pregled
mutacija podaci:. pregled
biomarker podataka:.
Drug osjetljivih podataka. pregled
oznaceni svi geni i lijekova u ovoj bazi podataka kako bi se Korisnici bolje razumjeti i koristiti ove podatke resursa. Geni su označeni u skladu s NCBI (http://www.ncbi.nlm.nih.gov), HGNC (http://www.genenames.org/~~HEAD=pobj), Ensembl (http://feb2014.archive.ensembl.org /) i Gene kartice (http://www.genecards.org/). Lijekovi su označeni u skladu s DrugBank (http://www.drugbank.ca/). Pregled
Osim toga, mutacije otkrivene u projektu TCGA su također uključeni za obilježavanje gena u DBGC. Korisnici mogu pronaći sve mutacije u određenom genu otkriven u projektu TCGA. Ove mutacije su obrađeni ICGC (https://dcc.icgc.org) na temelju TCGA podataka i upućuje svaki mutacije u DBGC. Pregled
Osim toga, nekoliko rak želuca vezane uz temeljne istraživačke projekte provode se naš istraživački tim. opisi projekata i sirovi podaci nalaze se u DBGC za preuzimanje i daljnje analize. pregled
Baza Izgradnja pregled
DBGC je relacijska baza podataka sa MySQL podatkovnog sloja. User-friendly sučelje je dizajniran za organiziranje i prikaz podataka sredstva pomoću HTML i JavaScript. Interakcija između sloja podataka i web sučelja završena pomoću Java EE platformu. Pregled
Rezultati i rasprava pregled
Baza Opis pregled
Ova baza podataka sastoji se prvenstveno od tri uzdužne sustava za obradu podataka , epidemiološka, kliničkopatološkim i molekularnih bioloških podataka (slika 1). Biološki podaci Molekularni sastoji od želučanog karcinoma povezanih transkriptomika, proteomici, mutacija, biomarkera i podataka genskih lijekova osjetljivih. Ukupna statistika tih podataka navedeni su u tablici 1. Uz epidemioloških statistike oboljelih od raka želuca u Kini i kliničkopatološkim informacija označeni slučajeva raka želuca, svi ovi podaci su iz javnih baza podataka, publikacija i objavljenoj literaturi. Pregled
Baza podataka sučelja pregled
1) Brzo pretraživanje (Slika 2). Brzi pretraživač modul omogućuje identificiranje uloge gena ili proteina u karcinomu želuca mogući putem unosa riječi u okvir za pretraživanje koji se nalazi na navigacijskoj traci. Rezultat pretraživanja će vam reći da li je gen ili protein različito izražena u svim projektima ili proteomike projekata transkriptomika i da li je identificiran kao biomarker za rak želuca ili gena droge i mala slova. Štoviše, ako je gen ima bilo mutaciju koja je povezana s karcinomom želuca, detaljan popis će se prikazati na stranici s rezultatima. Na primjer, pomoću "EGFR" kao ključnu riječ, možemo zaključiti da je identificiran kao up-reguliranog gena u GSE51936 i GSE27342 i kao gen dolje regulirano u GSE29630. Odgovarajući protein EGFR gena je identificiran kao doregulirani proteina 3 proteomike projektima (PubMed ID brojevi 23.161.554, 24263233 i 24722433). EGFR je prijavljen kao faktor prognozi raka želuca i odnosi se na otpornosti na lijekove za irinotekan, što je uobičajeno lijek za liječenje karcinoma želuca. Četiri mutacije EGFR se odnose na rak želuca su izvijestili (c.2361G > A, c.2402A > G, c.2573T > G, c.2588G > A). Pregled
2) pregledavanje i pretraživanje (Sl 3). Koristeći navigaciju, korisnici mogu kliknuti odgovarajuće stavke za pregledavanje resurse podaci koji su navedeni u DBGC. Detaljne informacije će biti na popisu u nastavku. Također smo uspostavili nekoliko kriterija pretraživanja za svaki tip podataka resurs putem kojeg će biti prikazani svi podaci stavke koje ispunjavaju uvjete. Pregled
3) Naša baza podataka razlikuje od drugih online resursa, zbog uključivanja epidemiološkim statistike želuca pacijenata oboljelih od raka u Kini. Korisnici mogu uspoređivati statističke podatke po spolu (muške i ženske), područja (urbanih i ruralnih), te starosti u vrijeme dijagnoze ili smrti. Slučaj broj, broj smrti, incidencija stope i stopa mortaliteta u odabranom rasponu godine može se prikazati u obliku grafikona i tablice formatu (slika 4). pregled
Rasprava pregled
Rak želuca je vodeći rak u svijetu u oba mortaliteta i morbiditeta. Veća incidencija i smrtnost od raka želuca se promatraju u azijskim regijama, posebno u Kini. Epidemiološki statistički podaci raka želuca u ovoj bazi podataka dobiveni su prvenstveno iz publikacija CDC, koji je angažiran u malignih tumora studijama za nekoliko desetljeća, te je uspostavljena sveobuhvatne arhiva tumorskih pacijenata malignim u Kini. Ovi podaci su odigrali važnu ulogu u promicanju prevencije raka i zdravstvene za kreiranje politike u Kini [24-26]. Kroz dohvaćanje podataka rak želuca epidemiologija u ovoj bazi podataka, istraživači i kliničari mogu brzo odrediti epidemiološke trendove karcinoma želuca u Kini. Pregled
rak želuca vezane mutacije, biomarkeri, geni lijek osjetljivih, transkriptomika projekti i odgovarajuće diferencijalno izražene gene i proteomika eksperimenti i odgovarajuće različito izraženi proteini su ručno prikupljeni iz online baze podataka i objavljenoj literaturi. Brzo traženje funkcija osigurava DBGC omogućuje istraživačima da identificiraju ulogu gena ili proteina u raka želuca. Ove različito izražene geni i proteini sadrže obilje važne informacije o raka želuca, a mnoge analitičke studije mogu se provoditi pomoću njih. Pregled
Naš istraživački tim se bavi želučane istraživanju raka već dugi niz godina, te je nakupila veliko iskustvo u tumor epidemiološka istraživanja, rak želuca clinicopathology i biomarker istraživanja, biobank zgrada, molekularna istraživanja biološki mehanizam, bioinformatika analiza i velika izgradnja baze podataka [27-30]. Kako bi osigurao upit i alati za analizu koje su više prikladan i praktičan za želučane istraživače raka, konstruirali smo ovu bazu podataka. Trenutna verzija je 1.0. Budući da su velike količine podataka koje generira mnoge eksperimentalne platforme u različitim područjima uvelike su raspršeni i heterogeni, neke korisne informacije možda su propustili u našem procesu prikupljanja podataka. Mi ćemo i dalje pronalaženje tih podataka i ažuriranje najnovije podatke za dugo vremena kako bi se osigurala pravodobnost i potpunost podataka. U sljedećoj verziji, namjeravamo pokriti najnovije ljudska rak želuca vezane mutacije, biomarkera i gene droge i mala slova. Transkriptomika podaci će biti naglasak sljedeću verziju, u kojoj su svi transkriptomika projekti će se ponovno analiziranog izdvojiti različito izražene gene na različitim vrijednostima promjena puta. Dakle, korisnici mogu upita je li određeni gen različito izražava kroz konfiguriranje vrste uzorka i preklopite vrijednost promjene. Pregled
Zaključak pregled
Baza je opisano u ovom članku, na DBGC, je sveobuhvatan i web -accessible baza ljudskog karcinoma želuca. Ova baza podataka je integriran brojne izvore podataka koji se odnose na rak želuca i pod uvjetom da je nekoliko jednostavan za korištenje web-based funkcionalnih modula. Vjerujemo da će DBGC biti važan alat za želučane kliničarima rak, tumor temeljnih istraživanja znanstvenika, istraživača raka genoma, državne zdravstvene politike, a pacijenti s rakom želuca. Pregled