støtte vektor maskin modell for diagnostisering av lymfeknutemetastaser i magekreft med multidetector computertomografi: en forstudie
Abstract
Bakgrunn
lymfeknutemetastase (LNM) av magekreft er en viktig prognostisk faktor om langsiktig overlevelse. Men flere avbildningsteknikker som vanligvis anvendes i mage kan ikke tilfredsstillende måte å vurdere den magekreft lymfeknute status. De kan ikke oppnå både høy sensitivitet og spesifisitet. Som en slags maskin-læringsmetoder, har Support Vector Machine potensial til å løse dette komplekse problemet.
Metoder
godkjent The Institutional Review Board denne retrospektive studien. 175 påfølgende pasienter med magekreft som gjennomgikk MDCT før operasjonen ble inkludert. Vi evaluerte tumor og lymfeknute indikatorene på CT-bilder, inkludert serøse invasjon, tumor klassifisering, tumor maksimal diameter, antall lymfeknuter, maksimal lymfeknute størrelse og lymfeknuter stasjonen, som reflekterte den biologiske oppførsel av magekreft. Univariat analyse ble brukt for å analysere forholdet mellom de seks bilde indikatorer med LNM. En SVM modellen ble bygget med disse indikatorene ovenfor som input indeksen. Utgangen indeksen var at lymfeknutemetastase av pasienten var positiv eller negativ. Det ble bekreftet ved operasjonen og histopatologi. En standard maskin-læring teknikk som kalles k-fold kryssvalidering (5 ganger i vår studie) ble brukt til å trene og teste SVM-modeller. Vi evaluerte den diagnostiske kapasiteten til SVM modeller i lymfeknutemetastase med mottakeren opererer karakteristiske (ROC) kurver. Og radiologen klassifisert lymfeknute metastasering av pasienter ved hjelp av maksimal lymfeknute størrelse på CT-bildene som kriterium. Vi sammenlignet områdene under ROC-kurven (AUC) av radiolog og SVM modeller.
Resultater
I 175 tilfeller, tilfeller av lymfeknutemetastaser var 134 og 41 tilfeller var det ikke. De seks bildeindikatorer alle hadde statistisk signifikante forskjeller mellom de LNM negative og positive grupper. Midlene for følsomhet, nøyaktighet og AUC av SVM modeller med 5-ganger kryssvalidering var 88,5%, 78,5% og 0,876, respektivt. Mens den diagnostiske makt radiolog klassifisere lymfeknutemetastase ved maksimal lymfeknute størrelse var bare 63,4%, 75,6% og 0,757. Hver SVM modell av 5-fold kryssvalidering utført betydelig bedre enn radiolog.
Konklusjoner
Basert på biologisk oppførsel informasjon om magekreft på MDCT bilder, kan SVM modell å diagnostisere lymfeknutemetastase preoperativt.
Bakgrunn
Magekreft kreft~~POS=HEADCOMP er en av de viktigste årsakene til kreft-relaterte dødsfall på verdensbasis [1]. Lymfeknute status er en viktig prognostisk faktor om langsiktig overlevelse [2]. TNM staging system basert på amerikanske Joint Committee on Cancer (AJCC) er allment akseptert nå [3]. Den 5-års overlevelse for pasienter i N0 scenen etter operasjonen var 86,1%, mens N1, N2 og N3 scenen pasienter falt til 58,1%, 23,3% og 5,9%, henholdsvis [4].
I dag mange avbildningsteknikker har blitt brukt til å vurdere magekreft, inkludert abdominal ultralyd, endoskopisk ultralyd (EUS), multi-slice spiral CT, konvensjonell MRI, og FDG-PET. Imidlertid kan disse billedmetodene ikke sikkert bekrefte eller utelukke tilstedeværelse av lymfeknutemetastase [1]. En meta-analyse viste at den gjennomsnittlige sensitivitet og spesifisitet i å bestemme LN metastaser var som følger: 39,9% og 81,8% for abdominal ultralyd, 70,8% og 84,6% for endoskopisk ultralyd, 80,0% og 77,8% for MDCT, 68,8% og 75,0% for konvensjonell MRI, 34,3% og 93,2% for FDG-PET, og 54,7% og 92,2% for FDG-PET /CT [2]. Enhver enkelt applikasjon av disse tenkelig verktøy kan ikke tilfredsstill vurdere magekreft lymfeknute status. Årsaken er at vi hovedsakelig diagnostisere LNM av størrelsen lymfeknuter. De diagnostiske kriterier varierer fra 5 mm til 10 mm [2]. Men de store lymfeknuter kan være forårsaket av betennelse og de små lymfeknuter kan være metastatisk. Mange studier har vist at magekreft LN metastase ble assosiert med tumorstørrelse, dybden av invasjon, histologisk type og patologisk lymfatiske engasjement [5-8]. Det er ingen egnet metode for å kombinere lymfeknute størrelse med flere faktorer som er beskrevet ovenfor for å lage en omfattende analyse. Hvordan integrere de komplekse faktorene som påvirker lymfeknuter og forbedre nøyaktigheten av diagnose LNM er tema for vår studie.
I det siste tiåret, maskinlæringsmetoder, komplementære til tradisjonelle statistiske metoder har blitt brukt til å forutsi komplekse biologiske fenomener . Support Vector Machine er en ny generasjon av læring algoritmer utviklet på grunnlag av statistisk teori. Den SVM algoritmen har en sterk teoretisk fundament, basert på ideene til VC (Vapnik Chervonenkis) dimensjon og strukturelle risikominimering. Det har oppfylt nøyaktighet [9]. SVM har vært brukt i noen medisinske anvendelser, hovedsakelig i molekylær biologi og neuroimaging [10-12]. Den kan brukes for klassifisering og regresjon. Gitt et sett av trenings eksempler, hver merket som tilhørende en av to kategorier, en SVM trening algoritmen bygger en modell som predikerer om et nytt eksempel faller inn i en kategori eller den andre.
Hensikten med denne studien er å bruke SVM metode for å analysere MDCT bilde informasjon knyttet til det biologiske oppførsel av magekreft og etablere matematiske modeller for å vurdere lymfeknutemetastaser preoperativt.
Metoder
Pasienter
Denne retrospektive studien ble godkjent av vår Institutional Review board. Mellom april 2006 og september 2008 ble 368 påfølgende pasienter med nylig diagnostisert magekreft gis preoperativ kontrast ekstrautstyr abdominal CT-undersøkelser og deretter fikk gastrektomi ved vårt sykehus. Pasientene tilsvarte inklusjons- og eksklusjonskriteriene nedenfor ble inkludert i denne studien inklusjonskriteriene.
Pasientene fikk radikal gastrektomi og D2 lymfeknuter disseksjon. De ble preoperativt undersøkt med multidetektor rad CT. Alle pasientene ble bekreftet som magekreft ved postoperativ histopatologi.
Eksklusjonskriterier
Pasientene fikk preoperativ neoadjuvant terapi. Fjernmetastaser ble funnet i preoperativ undersøkelse eller i driften
slutt 175 pasienter (125 menn, 50 kvinner, gjennomsnittsalder, 59,8 år, range, 30-85 år). Omfattet vår studie befolkning. Vi har innhentet informert samtykke fra alle utvalgte pasienter før rutinen kliniske forløpet av CT-undersøkelser
CT Protocol
MDCT ble utført ved hjelp av en 64-detektor rad CT-skanner (Light 64, GE Healthcare, Milwaukee, Wisconsin).. Hver pasient fastet i mer enn 8 timer før CT-undersøkelse. For å aktivere mage oppblåsthet og redusere gastrisk motilitet fikk pasientene 8 g gassproduserende krystaller muntlig og en intramuskulær injeksjon av 10 mg anisodamine 10-15 minutt før eksamen. De øvre mage unenhanced CT-skanning fra diaphragmatic kupler til 2 cm under den nedre grensen til luft-oppblåst mage kroppen ble kjøpt med en kollimering av 0,625 mm, 120-140 kVp, og 300-350 mas. Deretter ble totalt 100 ml iopromid (Ultravist; Schering, Berlin, Tyskland) ble administrert intravenøst gjennom en 18-gauge angiografisk kateter satt inn i en antecubital vene ved 3 ml /sek ved hjelp av en automatisk injektor. Kontrastforsterket CT-skanning ble utført i den arterielle fase (30 sekunder) og i portvene fase (70 sekunder). Vi har gjort multi-planar rekonstruksjon med portvene fase bilde.
Bildeanalyse
To radiologer, en med 3 år og den andre med 8 års erfaring i abdominal CT utført bildeanalyser i fellesskap til enighet. Hvis det var uenighet, de rådførte seg med en annen radiolog som hadde 20 års erfaring i abdominal CT til enighet ble oppnådd. Vi målte og telles de seks indikatorene på MDCT bilder av hender som følger:
Tumor maksimal diameter
Mål diameteren på magekreft i aksial, koronal og sagittal bilder basert MPR-bilder. Og bestemmer svulsten maksimal diameter.
Tumor klassifisering
Tidlig magekreft eller Borrmann klassifisering av avansert kreft i MPR-bildene ble bestemt.
Serøse invasjon
Axial og MPR-bilder ble samtidig undersøkt for å bestemme serøse invasjon. Hele jevning magesekken unormalt forbedret og lineær eller retikulære strukturer i fettlaget rundt magen indikert serøse invasjonen [13].
Antall lymfeknuter
antall av alle de synlige mage regionale lymfeknuter i MDCT bilder av grupper ble regnet [14].
Maksimal lymfeknute størrelse
korte aksen av de største lymfeknute påvist i CT-bilder ble målt.
lymfeknuter stasjonen
lymfeknuter stasjonen med MDCT bilder basert på den japanske klassifisering av magekreft ble bestemt [14].
Support vektor maskin
Support Vector Machine er en veiledet maskinlæring teknikk som er mye brukt i mønstergjenkjenning og klassifiseringsproblemer. SVM algoritmen utfører en klassifisering ved å konstruere en flerdimensjonal hyperplan som optimalt skiller mellom to klasser ved å maksimere margin mellom to dataklynger. Denne algoritmen oppnår høy diskriminerende effekt ved å bruke spesielle lineære funksjoner kalles kjerner å transformere innspill plass til en flerdimensjonal plass [15]. I denne studien ble et fritt tilgjengelig SVM programvare kalt LibSVM 2,89 brukes til å generere SVM modell [16]. Inngangs indeksene var de seks indikatorene samlet på MDCT bildene ovenfor. For disse indikatorene, kan måledataene skrives inn for å SVM modellen direkte. Mens telle data skal defineres som noen tall. For eksempel, var positiv serøse invasjon definert som en negativ og ble -1. Utgangen Indeksen var den lymfeknutemetastase av pasienten. Det ble bekreftet ved operasjonen og histopatologi. Hvis pasienten hadde en eller flere lymfeknuter metastaser, ble det ansett som positivt LNM. Vi definerte den positive LNM som en mens negative var -1. Vi valgte RBF Kernel for å bygge modellen. For å trene og teste vår SVM modell, brukte vi en standard maskin-læring teknikk som kalles k-fold kryssvalidering. Fordi hele utvalgsstørrelse med vår studie var ikke veldig stort, brukte vi fem-fold kryssvalidering. Hele data ble delt i 5 like og forskjellige undergrupper. Fire av disse undergrupper er kombinert og brukt til trening, og den resterende ett sett blir brukt for testing. Dette kryssvalideringsprosessen ble gjentatt 5 ganger, slik at hver undergruppe for å tjene en gang som testdatasettet Statistical Analysis.
En univariate statistiske analyser ved hjelp av SPSS /PC + statistisk programvarepakke versjon 11.5 (SPSS Inc, IL, Chicago, USA) ble utført for å evaluere forskjellene i seks bildeindikatorer mellom pasienter som hadde LNM eller ikke. De statistiske analysemetoder var Independent-samples t-test og Mann-Whitney U test. P < 0,05 ble betraktet som signifikant forskjell. Mottaker som opererer karakteristikk (ROC) kurve ble anvendt for å evaluere den diagnostiske resultatene av SVM modell. Den MedCalc programvareversjon 11.2 (MedCalc, MedCalc Software, Ghent, Belgia) ble brukt til å lage ROC kurver og sammenligne dem. I sammendrag, i gjennomsnitt vi arealet under kurven (AUC) av ROC-kurver av den 5-fold kryssvalidering. Vi telte også hjelp av sensitivitet og spesifisitet. For å sammenligne med SVM-modellen, bygget vi ROC-kurven for radiolog vurdering ved hjelp maksimal lymfeknute størrelse som kriterier for å klassifisere LNM. Sensitivitet og spesifisitet av de beste cut-off point ble talt.
Resultater
I disse 175 tilfellene var det 134 saker som hadde lymfeknutemetastaser og 41 tilfeller hadde ikke. Pasientenes clinicopathological funksjoner ble beskrevet i tabell 1. Vi har samlet de seks indikatorene på MDCT bilder. Resultatene av univariate statistiske analysen viste at alle seks indikatorer, inkludert serøse invasjon, tumor klassifisering, tumor maksimal diameter, antall lymfeknuter, maksimal lymfeknute størrelse og lymfeknuter stasjonen var signifikant forskjellig mellom de LNM positiv og negativ gruppe (P <0,001). Midlene for tumor maksimal diameter, antall lymfeknuter, og maksimal lymfeknutestørrelse i LNM positiv gruppe var 56,6 ± 19,5 mm, 10,0 ± 5,5 mm, og 12 ± 8, henholdsvis. De var alle høyere enn de av LNM negativ gruppe (tabell 2) .table 1 Pasient Kjennetegn
Clinicopathological funksjoner Book Verdi
No. av pasientene
175
Gjennomsnittlig alder (y)
59.8 (30-85)
Forhold av kvinner til menn
50: 125
Histopatologi
Adenocarcinoma
173 ( 98,9%)
Vel differensiert
6 (3,4%)
Moderat differensiert
91 (52%)
Dårlig differensiert
76 (43,5%)
Småcellet karsinom
2 (1,1%)
lymfeknutemetastase
Positive
134 (76,6%)
Negativ
41 (23,4%)
Merk .-- tall i parentes er områdene.
Tabell 2 pasient~~POS=TRUNC data~~POS=HEADCOMP: de 6 indikatorer 'data av MDCT bilder og resultater fra univariate statistiske analysen
pasient~~POS=TRUNC data~~POS=HEADCOMP
LNM (. -)
LNM (+)
P-verdi
pasient~~POS=TRUNC nummer~~POS=HEADCOMP
41/175 (23,4%)
134/175 (76,6%)
Måling data *
Tumor maksimal diameter (mm)
39,0 ± 17,0
56,6 ± 19,5
< 0,001
maksimal lymfeknute størrelse (mm)
6,5 ± 2,8
10,0 ± 5,5
< 0,001
Antall lymfeknuter
7 ± 4
12 ± 8
< 0,001
Count data #
serøse invasjon
< 0.001
Ja
15/175 (8,6%)
120/175 (68,6%)
Ingen
26/175 (14,8%)
14/175 (8%)
Tumor klassifisering
< 0,001
Tidlig magekreft
9/175 (5,1%)
1/175 (0,6%)
BorrmannI
2/175 (1,1%)
0/175
BorrmannII
3/175 (1,7%)
9/175 (5,1%)
Borrmann III
27/175 (15,4%)
121 /175 (69,1%)
Borrmann IV
0/175
3/175 (1,7%)
lymfeknuter stasjonen
< 0,001
Station1
29/175 (16,6 %)
44/175 (25,1%)
Station2
12/175 (6,9%)
54/175 (30,9%)
Station3
0/175
36 /175(20.5) product: * verdien av måledataene ble middelverdier ± standardavvik. Den p-verdi var fra Independent-samples t-test.
# Verdien av tellingen data var antall data. Den p-verdi var fra Mann-Whitney U-test.
Radiolog oppnådde en AUC på 0.757 som klassifisere lymfeknutemetastasering av pasienten ved maksimal lymfeknute størrelse. Den beste cut-off punktet for maksimal lymfeknute størrelse var 7,7 mm. Sensitiviteten og spesifisiteten var bare 63,4% og 75,6%. Den SVM midler en følsomhet, nøyaktighet og AUC med 5-ganger kryssvalidering var 88,5%, 78,5% og 0,876, respektivt (tabell 3). Sammenlignet med radiologen, hver AUC av de fem-gangers kryssvalidering SVM modeller utviklet seg vesentlig bedre (P < 0,05) enn radiologen (figur 1, tabell 3). Figur 1 ROC kurve for LNM. Mottaker opererer karakteristikk (ROC) kurve for lymfeknutemetastase med 5-fold kryssvalidering SVM modeller og radiolog. AUC for k1 til K5 SVM modellene var 0,862, 0866, 0,878, 0,900 og 0876, henholdsvis. Sammenlignet med radiologen, P-verdiene var alle mindre enn 0,05 (Tabell 3). For de fem SVM modellene, gjennomsnittet av AUC var 0,876. Og AUC for radiolog basert LN størrelsen var 0.757.
Tabell 3 AUC for SVM modell og radiolog
Model
K-fold
Sensitivity
Specificity
AUC*
P verdi (AUC sammenlignet med radiolog)
SVM
0,881
0.780
0,862 ± 0,038
0,002
K1 K2
0,866
0.780
0,866 ± 0,037
< 0,001
K3
0,858
0,805
0,878 ± 0,033
< 0,001
K4
0,933
0.780
0.900 ± 0,031
< 0,001
K5
0,888
0.780
0,876 ± 0,038
< 0,001
bety
0,885
0,785
0,876
radiolog
0,634
0,756
0,757 ± 0,042
sensitivitet, spesifisitet og AUC for 5-fold kryssvalidering SVM modeller og radiolog for diagnostisering lymfeknutemetastasering av pasienten. product: * verdien av dataene var AUC ± diskusjon
lymfeknutemetastase standardavvik.
påvirker kirurgisk behandling av pasienter med magekreft, og er også en viktig faktor i prognose. I dag er avhengig preoperative diagnose hovedsakelig av forskjellige avbildningsmetoder. Den standard for å bedømme lymfeknutemetastase er avhengig av morfologiske indikatorer. Lymfeknute størrelse er den dominerende indikatoren. Men Dorfman RE et al rapporterte at øvre grensene for normal for lymfeknute størrelse på mage computertomografi varierte fra 6 til 11 mm [17]. De delvis overlappet med ondartet lymfadenopati. Fukuya T et al viste at CT demping og lymfe-node konfigurasjon kan hjelpe i diagnostisering av ondartet adenopati [18]. Tvert imot, uttrykt Deutch SJ et al som størrelse, beliggenhet, kontur, tetthet ikke var nyttig å skille benign fra ondartet lymfadenopati [19]. Mangel på kriterier for å bedømme er den viktigste begrensende faktor for prediksjon av lymfeknutemetastase preoperativt.
Den biologiske oppførsel av magekreft reflekterer histopatologisk utførelsen av svulsten malignance og invasjon. Det påvirker lymfeknutemetastase direkte eller indirekte. Betongen manifestasjon av den biologiske oppførsel omfatter, for eksempel, tumor størrelse, dybde av invasjon, tumor invasjon av andre organer, lymfeknutemetastase og fjern metastase. MDCT kan tydelig vise disse patologiske forekomster. Noen studier har rapportert at nøyaktigheten av magekreft T oppsetningen med MDCT kombinert med 3D rekonstruksjon var 84-89% [20, 21]. Zhang XP et al rapporterte at antall lymfeknuter detektert av MDCT viste en signifikant forskjell mellom den lymfeknutemetastase gruppe og ingen metastase gruppe i hjerte kreft [22]. MDCT kan også indikere situasjonen i andre abdominale organer og bukhinnen. Derfor kan MDCT bildebehandling stemme overens med biologiske oppførselen til magekreft histopatologi. Univariat analyse i vår studie viste at de 6 indikatorer for magekreft og lymfeknuter informasjon for CT-bilder som alle har et forhold til LNM. Så vi bør vurdere disse biologiske atferdsfaktorer omfattende forutsi LNM.
Det var noen andre maskinlæringsmetoder som brukes i medisinske studier. Den hovedsakelig Fremgangsmåten var kunstig nevralt nettverk (ANN). ANN er ansett for å være en passende metode for medisinsk dataanalyse [23]. Bollschweiler et al påføres en enkeltlags perceptron, som er en slags ANN, å forutsi lymfeknutemetastase i magekreft. Nøyaktigheten av ANN var 79% [24]. Imidlertid ANN hadde noen ulemper. ANN modell var utsatt for overtilpassing. Det kreves lang tid og utvikling for å optimalisere. De var mer vanskelig å bruke i felt på grunn av beregnings krav [25]. I betraktning av de ovennevnte grunner, vi valgte SVM modell i stedet. Den SVM kunne produsere lavere prediksjonsfeil forhold til classifiers basert på andre metoder som nevralt nettverk [26]. Sammenlignet med ANN, kan SVM ha den samme enda bedre logisk evne [27, 28]. For tiden er det få rapporter om anvendelsen av SVM i magekreft lymfeknutemetastase. Som en foreløpig studie, våre resultater tyder på at SVM modellen har bedre diagnostisk mulighet for LNM enn de tradisjonelle LN størrelse kriterier. AUC har oppnådd en god diagnostisk makt. Med ytterligere forbedring, kan SVM bli en effektiv metode for å forutsi lymfeknute iscenesettelse av magekreft.
Konklusjoner
Basert på biologisk oppførsel informasjon om magekreft på MDCT bilder, kan SVM modell å diagnostisere lymfeknutemetastase preoperativt.
Erklæringer
Takk
Vi takker Jie Li Yong Cui, Li-Ping Qi, Xiao-Ting Li for redaksjonell støtte og Jun Shan, Ning Wang Ying Li Shun Yu Gao for gjennomgang av manuskriptet.
Prosjekt støttet av Natural Science Foundation National of China (Grant nr 30970825) og Beijing Municipal Natural Science Foundation (nr 7092020).
forfatternes opprinnelige innsendte filer for Images Nedenfor er linker til forfatterne 'opprinnelige innsendt filer for bilder. 12885_2010_2503_MOESM1_ESM.jpeg Forfatteroriginalfilen for figur 1 Konkurrerende interesser
Forfatterne hevder at de ikke har noen konkurrerende interesser.