Stomach Health > želudac Zdravlje >  > Gastric Cancer > Rak želuca

PLoS ONE: DBGC: Baza podataka o ljudskim karcinoma želuca

Sažetak pregled

Baza ljudskog raka želuca (DBGC) je sveobuhvatna baza podataka koja integrira razne ljudske rak želuca povezanih podataka resursa. Ljudski rak želuca vezane transkriptomika projekti, proteomika projekti, mutacije, biomarkeri i lijek osjetljivih gena iz različitih izvora su skupljene i ujedinjeni u ovoj bazi podataka. Štoviše, epidemiološke statistika pacijenata s rakom želuca u Kini i kliničkopatološkim informacija označeni slučajeva raka želuca su također integrirani u DBGC. Vjerujemo da je ova baza podataka će uvelike olakšati istraživanje u vezi ljudskog raka želuca u mnogim područjima. DBGC je dostupan besplatno na http://bminfor.tongji.edu.cn/dbgc/index.do pregled

Izvor: Wang C, Zhang J, Cai M, Zhu Z, Gu W, Yu Y, et al , (2015) DBGC: Baza podataka o ljudskim karcinoma želuca. PLoS ONE 10 (11): e0142591. doi: 10,1371 /journal.pone.0142591 pregled

Urednik: Arun Sreekumar, Baylor College of Medicine, Sjedinjene Američke Države pregled

Primljeno: 18. veljače 2015. godine; Prihvaćeno: 24. listopada 2015; Objavljeno: 13 studeni 2015 pregled

Copyright: © 2015 Wang et al. Ovo je otvoreno pristupa članak distribuirati pod uvjetima Creative Commons Imenovanje License, koja omogućuje neograničeno korištenje, distribuciju i reprodukciju u bilo kojem mediju, pod uvjetom da je izvorni autor i izvor su zaslužan pregled

Podaci Dostupnost: Podaci su availabe preko Datadryad (https://datadryad.org). Jedinstveni pristupni broj je: doi:. 10,5061 /dryad.271dk pregled

Financiranje: Ovaj rad je djelomično podržan od strane potpore iz Nacionalne zaklade prirodoslovni Kine (81172329, 31571363, 81372644, 81372645 i 8157111077), kineski National High Tech program (2012AA02A504 i 2012AA02A203), Međunarodni zajednički projekt iz Šangaja znanosti i tehnologije komisije (12410706400), inovacije Zaklade Translational medicine Šangaj Jiao Tong University School of medicine (15ZH1002 i 15ZH3001), Fong Shu Fook Tong Foundation i karcinoma probavnog sustava Biobank Projekt Shanghai Jiao Tong University School of medicine. U financijeri nisu imali ulogu u studiju dizajna, prikupljanja i analize podataka, Odluka o objavi, ili pripremu rukopisa pregled

U konkurenciji interese.. Autori su izjavili da ne postoje suprotstavljeni interesi pregled

Uvod pregled

Kao jedan od najčešćih oblika raka, raka želuca je treći najveći smrtnosti i četvrti najviši pobol od svih vrsta raka u svijetu [1]. Prema statističkim podacima GloboCan u 2012. godini, novih slučajeva raka želuca broji gotovo milijun (952.000), a više od 700.000 smrtnih slučajeva su uzrokovane rakom želuca; gotovo polovica tih pacijenata dolazi iz Kine (405,000 novih slučajeva i 325.000 smrti) [1, 2]. Iako su obje smrtnost i pobol od raka želuca smanjen u posljednjih nekoliko godina, stopa preživljavanja od 5 godina i dalje je vrlo niska. [3] Stoga, karcinom želuca ostat će jedan od najtežih izazova za istraživača i liječnika za dugo vremena. [4] pregled

Znanstvenici širom svijeta su završile mnoge genomike, transkriptomika, proteomika, kao i epidemiološka istraživanja i klinička ispitivanja u vezi patogenezi i terapije iz rakom želuca [5-10]. Ova istraživanja su generirani ogromne količine podataka koji se odnose na rak želuca, a brzina ovih istraživanja ubrzava s brzim rastom znanja raka, smanjene troškove otkrivanje i računanja, i širenja Interneta [11]. Ti podaci sadrže važne informacije za istraživanje i liječenje raka želuca. Međutim, zbog ograničenog predznanja kliničara i temeljnih istraživačima, potencijalni tih podataka ne može se u potpunosti razvijen. Nove tehnologije i metode istraživanja i dalje zahtijevaju razvoj; Međutim, niska učinkovitost u upravljanju podacima je primarni ograničenje tog razvoja [12]. Zbog dugoročne akumulacije decentraliziranog istraživanja, ovi podaci i njihove formate samo zadovoljiti individualne potrebe, bez integraciju i standardizaciju i rezultiraju u diverzifikaciju, izomerizacije i seciranje podataka raka [13, 14]. Pregled

Trenutno, u izobilju klinička i temeljna studija o raka želuca se planiraju ili su u tijeku. Razne vrste podataka su pohranjeni u različitim sustavima baza podataka [13], bez dijeljenja ili komunikacije. Dakle, blisko povezan informacija ostaje izoliran, u onome što se naziva "informacijski otoci". S jedne strane, disekcija podaci povećava poteškoće data mining, dok s druge strane, ona sprečava kliničarima potpuno iskorištavanje ishoda temeljna istraživanja za razvoj kliničkih ispitivanja i aplikacije i čuva temeljne istraživače u obavljanju učinkovite istraživačke studije u kojima su navedene klinički relevantne informacije [15]. pregled

u ovoj situaciji, vraćajući sveobuhvatne informacije o raka želuca nije lagan zadatak, a dijelovi tih podataka može nestati u oceanu interneta, što će biti vrlo nesretni.

Ovo istraživanje je iskoristio resurse s interneta i publikacija iz kineske Centra za kontrolu i prevenciju bolesti (CDC) i rak želuca Centra za dijagnostiku i liječenje, Key Laboratory želučane neoplazmi u Šangaju. Ova studija se sustavno prikupljaju razne vrste želučanih podataka vezanih za rak, integrirana ovi podaci resurse nakon filtracije i standardizacije, te konačno formira prvu sveobuhvatnu bazu znanja za analizu raka želuca. Pregled

Materijali i metode

podaci resursi pregled

baza Human rak želuca (DBGC) ima integriran sljedeće želučanog raka povezanih resursa: pregled

  • Epidemiološke statistike pacijenata s rakom želuca u Kini iz CDC publikacija pregled
  • kliničkopatološkim informacije o želučanog tkiva raka nakon kirurške resekcije od bolesnika dijagnosticira u Šangaju Ruijin bolnici pregled
  • molekularne biologije podaci o raka želuca s javnih on-line resursa (uključujući rak želuca povezane s mutacijama, biomarkeri, geni lijek osjetljivih, transkriptomika projekata i odgovara različito izražene gene, a proteomika projekata i odgovara različito izražene proteine) pregled
  • Sirovine istraživanja podaci iz Shanghai Institute of digestivnu kirurgiju i Šangaj Key Laboratory želučane novotvorina

    Prikupljanje podataka

    1) Epidemiološka statistike pacijenata s rakom želuca u Kini. pregled

    CDC ima uspostavljen sustav izvješćivanja raka za mnogo godina, te je nakupila u izobilju epidemiološke podatke o oboljelima od raka u Kini. Epidemiološki statistike od raka želuca, uključujući i brojem predmeta, broj smrti, stope incidencije (sirova stopa, dobi prilagođena cijena i kumulativna stopa), stopa smrtnosti (sirova stopa, stopa dobi prilagođen i kumulativna stopa) i učestalosti (i smrtnost) raspodjela prema dobnoj skupini su ručno izdvojiti iz CDC publikacija. DBGC 1.0 pokriva sve epidemiološke statističke podatke za sve tipične dijelovima Kine iz godine 2004. do 2009., i dodatne statistike bit će uključeni u ažurirati na inačici. Pregled

    2) kliničkopatološkim informacije o želučanog tkiva raka. Pregled

    kliničkopatološkim informacije dao je Šangaj Ruijin bolnici. Metode klasifikacije i organizirajući se uglavnom koriste za dijagnosticiranje raka želuca su označeni pomoću želučane slučajeva dijagnosticiran rak na Ruijin bolnici. Tipični želučani tkiva raka različitih stadija i tipova su odabrani od raka želuca biobank da smo održava godinama. Sve informacije Pacijent je anonimne i de-identificirani prije naše analize. Pregled

    3) Molekularne biološke podatke o rakom želuca iz javnih online resursa. Pregled

    molekularne biologije podaci su izvađeni i kustos iz online izvora. Transkriptomika Podaci su prikupljeni od GEO baze podataka (http://www.ncbi.nlm.nih.gov/geo/) i EBI baze podataka (http://www.ebi.ac.uk/). Proteomika podaci su izvađeni iz objavljene literature putem ručnog čitanja i standardizacije [16, 17]. Mutacija Podaci su prikupljeni iz baze dbVar (http://www.ncbi.nlm.nih.gov/dbvar/), OMIM baze podataka (http://www.ncbi.nlm.nih.gov/omim/), HGMD baze podataka (http://www.hgmd.org/) i objavljenih znanstvenih radova [18, 19]. Svi podaci biomarkera su iz objavljene literature [20, 21]. geni ovisnicima su izvađeni iz baze PharmGKB (http://www.pharmgkb.org/), CancerDR baze podataka (http://crdd.osdd.net/raghava/cancerdr/) i objavljenoj literaturi [22, 23]. Osmislili smo detaljne standarde ekstrakcije za svaku vrstu molekularne biološke izvora podataka, a svaki postupak prikupljanja podataka morao slijediti ove standarde kako bi se osigurala koherentnost podataka. Detaljni postupak zbirka nalazi se u nastavku: Netlogu

    transkriptomika podatke: pregled

  • Pretraživanje GEO baze podataka koristeći sljedeće ključne riječi :( "trbuh novotvorina" [MeSH pojmovi] ili "rak želuca" [All Fields] ) i "Homo sapiens" [porgn]. pregled
  • Filtriranje rezultata ručno i odaberite dokumente vezane uz ljudske raka želuca za naknadno vađenje podataka. pregled
  • razvrstati programe po veličini uzorka i tipu uzorka . pregled
  • podatke Ekstrakt publikacija (naslov, vrijeme objavljivanja, tipa eksperiment, vrsta tkiva, količina uzorka, opis uzorka, uzorak eksperimenta, uzorak kontrole, platformi, GSE ID, GSM iskaznice, download links, i književnost citata ) ručno, pozivajući se na MIAME (minimum informacija o mikročipa eksperiment). pregled
  • Pre-obrađivati ​​RAW podataka (serija matrix datoteke u GEO bazi podataka) Korištenje Perl eliminirati razlike iz različitih platformi. pregled
  • Ekstrakt različito izražene gene korištenje R jezik

    Proteomika podaci: pregled

  • Traži sirove podatke u PubMed koristeći sljedeće ključne riječi: ( "proteomika" [MeSH pojmovi] ili "proteomika" [ ,,,0],Sve Polja]) i ( "trbuh neoplazme" [MeSH pojmovi] ili ( "trbuh" [All Fields] i "neoplazme" [Sva polja]) OR "trbuh neoplazme" [All Fields] ili ( "želuca" [All Fields] i "rak" [All Fields]) OR "rak želuca" [All Fields]). pregled
  • Filtriranje rezultata ručno i odaberite proteomika dokumente vezane uz ljudske raka želuca za naknadno vađenje podataka. pregled
  • Koristite ove radove kao sjeme književnost i opet filtrirati reference. pregled
  • klasificirati publikacija po veličini uzorka i tipu uzorka. pregled
  • Ručno čitati novine i ekstrakt informacije publikacije (naslov, vrijeme objave, uzorak količina, uzorak eksperiment, kontrolni uzorak, opis uzorka, metoda tehnologija koja se koristi, fold promjene, regulira prema gore količinu proteina, dolje regulira količinu proteina, a referenca) i odgovarajuće regulira prema gore proteina i proteina regulirana dolje (na temelju zaključaka sa autori)

    mutacija podaci:. pregled

  • Traži u OMIM, HGMD i dbVar bazama podataka pomoću ključnih riječi "rak želuca" i izvlačenje informacija mutaciju (gena, tip mutacije, opis cDNA , opis puni AA, opis AA i reference)
  • Traži u PubMed koristeći sljedeće ključne riječi:. ( "mutacija" [MeSH Uvjeti] ili "mutacija" [All Fields]) i ( "trbuh neoplazme "[MeSH Uvjeti] ili (" trbuh "[All Fields] i" novotvorina "[All Fields]) OR" trbuh neoplazme "[All Fields] ILI (" želuca "[All Fields] i" rak "[All Fields]) ILI "rak želuca" [All Fields]). pregled
  • Filtriranje rezultata ručno i odaberite papire vezane za ljudske raka želuca za naknadno vađenje podataka. pregled
  • Uzmi ove radove kao književnost sjemenki i filterom reference opet. pregled
  • Pročitajte ove papire i izvlačenje informacija mutaciju ručno (gen, tip mutacije, opis cDNA, opis punog AA, opis AA i referenca). pregled
  • Uklanjanje duplikata podataka iz četiri izvora

    biomarker podataka:.

  • Traži u PubMed koristeći sljedeće ključne riječi:
    ( "biološki markeri" [MeSH pojmovi] ili ( "biološko" [All polja] i "markere" [Sva polja]) OR "biološki markeri" [Sva polja] OR "biomarkera" [All Fields]) i ( "trbuh neoplazme" [MeSH pojmovi] ili ( "trbuh" [Sva polja] I " neoplazme "[Sva polja]) ili» u trbuhu neoplazme "[Sva polja] ILI (" želuca "[All Fields] i" rak "[All Fields]) OR" rak želuca "[All Fields]). pregled
  • filtriranje rezultata ručno i odaberite papire vezane za ljudske raka želuca za naknadno vađenje podataka. pregled
  • Uzmi ove radove kao sjeme književnost i opet filtrirati reference. pregled
  • Pročitajte ove papire i ekstrakt mutaciju informacije ručno (ime biomarkera, ime i prezime, vrstu, stupanj, opis, mehanizam, osjetljivost, specifičnost, a referenca). pregled
  • klasificirati biomarkera po vrsti biomarkera, fazi, specifičnost i osjetljivost.

    Drug osjetljivih podataka. pregled

  • Traži u PharmGKB koristite ključne riječi "rak želuca" i ručno izvlačenje informacija o drogama osjetljivih (naziv lijeka, naziv gena, vrsta gena, mehanizam i reference) pregled
  • Traži u PubMed koristeći sljedeće ključne riječi: "otpor" [All Fields] i ( "trbuh neoplazme" [MeSH pojmovi] ili ( "trbuh" [Sva polja] i "novotvorina" [Sva polja]) ili »u trbuhu neoplazme "[All Fields] ILI (" želuca "[All Fields] i" rak "[All Fields]) OR" rak želuca "[All Fields]) pregled
  • filtrirajte rezultate ručno i odaberite radovi u svezi s ljudski otpor rak želuca lijek za naknadno vađenje podataka. pregled
  • Uzmi ove radove kao sjeme književnost i opet filtrirati reference. pregled
  • Sažeti 19 lijekova obično koriste za kliničko liječenje karcinoma želuca (5- fluorouridin, kamptotecin, karboplatin, cisplatin, docetaksel, doksorubicin, doksorubicin hidroklorid, epirubicin, etopozid, fluoruracil, irinotekan, leukovorin, mitomicin c, oksaliplatin, paklitaksel, tamoksifen, trastuzumab, vinblastin, vinkristin i).
    Uzimajući "cisplatin" kao primjer, traži u PubMed pomoću ključnih riječi:
    ( "cisplatin" [MeSH pojmovi] ili "cisplatin" [All Fields]) i "otpor" [All Fields] i ( "trbuh novotvorina" [MeSH pojmovi] ili ( " trbuh "[All Fields] i" novotvorina "[All Fields]) OR" trbuh neoplazme "[All Fields] ILI (" želuca "[All Fields] i" rak "[All Fields]) OR" rak želuca "[Sve Polja ]). pregled
  • filtriranje rezultata ručno i odaberite papire vezane uz ljudskog otpora za naknadno vađenje informacija želučanog raka droga. pregled
  • Uzmi ove radove kao sjeme književnost i opet filtrirati reference.
  • Pročitajte ove papire i izvlačenje informacija o drogama osjetljiv na ručno (naziv lijeka, naziv gena, vrsta gena, mehanizam i reference).

    oznaceni svi geni i lijekova u ovoj bazi podataka kako bi se Korisnici bolje razumjeti i koristiti ove podatke resursa. Geni su označeni u skladu s NCBI (http://www.ncbi.nlm.nih.gov), HGNC (http://www.genenames.org/~~HEAD=pobj), Ensembl (http://feb2014.archive.ensembl.org /) i Gene kartice (http://www.genecards.org/). Lijekovi su označeni u skladu s DrugBank (http://www.drugbank.ca/). Pregled

    Osim toga, mutacije otkrivene u projektu TCGA su također uključeni za obilježavanje gena u DBGC. Korisnici mogu pronaći sve mutacije u određenom genu otkriven u projektu TCGA. Ove mutacije su obrađeni ICGC (https://dcc.icgc.org) na temelju TCGA podataka i upućuje svaki mutacije u DBGC. Pregled

    Osim toga, nekoliko rak želuca vezane uz temeljne istraživačke projekte provode se naš istraživački tim. opisi projekata i sirovi podaci nalaze se u DBGC za preuzimanje i daljnje analize. pregled

    Baza Izgradnja pregled

    DBGC je relacijska baza podataka sa MySQL podatkovnog sloja. User-friendly sučelje je dizajniran za organiziranje i prikaz podataka sredstva pomoću HTML i JavaScript. Interakcija između sloja podataka i web sučelja završena pomoću Java EE platformu. Pregled

    Rezultati i rasprava pregled

    Baza Opis pregled

    Ova baza podataka sastoji se prvenstveno od tri uzdužne sustava za obradu podataka , epidemiološka, ​​kliničkopatološkim i molekularnih bioloških podataka (slika 1). Biološki podaci Molekularni sastoji od želučanog karcinoma povezanih transkriptomika, proteomici, mutacija, biomarkera i podataka genskih lijekova osjetljivih. Ukupna statistika tih podataka navedeni su u tablici 1. Uz epidemioloških statistike oboljelih od raka želuca u Kini i kliničkopatološkim informacija označeni slučajeva raka želuca, svi ovi podaci su iz javnih baza podataka, publikacija i objavljenoj literaturi. Pregled

    Baza podataka sučelja pregled

    1) Brzo pretraživanje (Slika 2). Brzi pretraživač modul omogućuje identificiranje uloge gena ili proteina u karcinomu želuca mogući putem unosa riječi u okvir za pretraživanje koji se nalazi na navigacijskoj traci. Rezultat pretraživanja će vam reći da li je gen ili protein različito izražena u svim projektima ili proteomike projekata transkriptomika i da li je identificiran kao biomarker za rak želuca ili gena droge i mala slova. Štoviše, ako je gen ima bilo mutaciju koja je povezana s karcinomom želuca, detaljan popis će se prikazati na stranici s rezultatima. Na primjer, pomoću "EGFR" kao ključnu riječ, možemo zaključiti da je identificiran kao up-reguliranog gena u GSE51936 i GSE27342 i kao gen dolje regulirano u GSE29630. Odgovarajući protein EGFR gena je identificiran kao doregulirani proteina 3 proteomike projektima (PubMed ID brojevi 23.161.554, 24263233 i 24722433). EGFR je prijavljen kao faktor prognozi raka želuca i odnosi se na otpornosti na lijekove za irinotekan, što je uobičajeno lijek za liječenje karcinoma želuca. Četiri mutacije EGFR se odnose na rak želuca su izvijestili (c.2361G > A, c.2402A > G, c.2573T > G, c.2588G > A). Pregled

    2) pregledavanje i pretraživanje (Sl 3). Koristeći navigaciju, korisnici mogu kliknuti odgovarajuće stavke za pregledavanje resurse podaci koji su navedeni u DBGC. Detaljne informacije će biti na popisu u nastavku. Također smo uspostavili nekoliko kriterija pretraživanja za svaki tip podataka resurs putem kojeg će biti prikazani svi podaci stavke koje ispunjavaju uvjete. Pregled

    3) Naša baza podataka razlikuje od drugih online resursa, zbog uključivanja epidemiološkim statistike želuca pacijenata oboljelih od raka u Kini. Korisnici mogu uspoređivati ​​statističke podatke po spolu (muške i ženske), područja (urbanih i ruralnih), te starosti u vrijeme dijagnoze ili smrti. Slučaj broj, broj smrti, incidencija stope i stopa mortaliteta u odabranom rasponu godine može se prikazati u obliku grafikona i tablice formatu (slika 4). pregled

    Rasprava pregled

    Rak želuca je vodeći rak u svijetu u oba mortaliteta i morbiditeta. Veća incidencija i smrtnost od raka želuca se promatraju u azijskim regijama, posebno u Kini. Epidemiološki statistički podaci raka želuca u ovoj bazi podataka dobiveni su prvenstveno iz publikacija CDC, koji je angažiran u malignih tumora studijama za nekoliko desetljeća, te je uspostavljena sveobuhvatne arhiva tumorskih pacijenata malignim u Kini. Ovi podaci su odigrali važnu ulogu u promicanju prevencije raka i zdravstvene za kreiranje politike u Kini [24-26]. Kroz dohvaćanje podataka rak želuca epidemiologija u ovoj bazi podataka, istraživači i kliničari mogu brzo odrediti epidemiološke trendove karcinoma želuca u Kini. Pregled

    rak želuca vezane mutacije, biomarkeri, geni lijek osjetljivih, transkriptomika projekti i odgovarajuće diferencijalno izražene gene i proteomika eksperimenti i odgovarajuće različito izraženi proteini su ručno prikupljeni iz online baze podataka i objavljenoj literaturi. Brzo traženje funkcija osigurava DBGC omogućuje istraživačima da identificiraju ulogu gena ili proteina u raka želuca. Ove različito izražene geni i proteini sadrže obilje važne informacije o raka želuca, a mnoge analitičke studije mogu se provoditi pomoću njih. Pregled

    Naš istraživački tim se bavi želučane istraživanju raka već dugi niz godina, te je nakupila veliko iskustvo u tumor epidemiološka istraživanja, rak želuca clinicopathology i biomarker istraživanja, biobank zgrada, molekularna istraživanja biološki mehanizam, bioinformatika analiza i velika izgradnja baze podataka [27-30]. Kako bi osigurao upit i alati za analizu koje su više prikladan i praktičan za želučane istraživače raka, konstruirali smo ovu bazu podataka. Trenutna verzija je 1.0. Budući da su velike količine podataka koje generira mnoge eksperimentalne platforme u različitim područjima uvelike su raspršeni i heterogeni, neke korisne informacije možda su propustili u našem procesu prikupljanja podataka. Mi ćemo i dalje pronalaženje tih podataka i ažuriranje najnovije podatke za dugo vremena kako bi se osigurala pravodobnost i potpunost podataka. U sljedećoj verziji, namjeravamo pokriti najnovije ljudska rak želuca vezane mutacije, biomarkera i gene droge i mala slova. Transkriptomika podaci će biti naglasak sljedeću verziju, u kojoj su svi transkriptomika projekti će se ponovno analiziranog izdvojiti različito izražene gene na različitim vrijednostima promjena puta. Dakle, korisnici mogu upita je li određeni gen različito izražava kroz konfiguriranje vrste uzorka i preklopite vrijednost promjene. Pregled

    Zaključak pregled

    Baza je opisano u ovom članku, na DBGC, je sveobuhvatan i web -accessible baza ljudskog karcinoma želuca. Ova baza podataka je integriran brojne izvore podataka koji se odnose na rak želuca i pod uvjetom da je nekoliko jednostavan za korištenje web-based funkcionalnih modula. Vjerujemo da će DBGC biti važan alat za želučane kliničarima rak, tumor temeljnih istraživanja znanstvenika, istraživača raka genoma, državne zdravstvene politike, a pacijenti s rakom želuca. Pregled