Stomach Health > mave Sundhed >  > Stomach Knowledges > undersøgelser

Support vektor maskine model for diagnose af lymfeknude metastaser i mavekræft med multidetektor computertomografi: en foreløbig study

Support vektor maskine model for diagnose af lymfeknude metastaser i mavekræft med multidetektor computertomografi: en foreløbig undersøgelse
Abstract
Baggrund
lymfeknudemetastase (LNM) af mavekræft er en vigtig prognostisk faktor for langsigtet overlevelse. Men flere billeddannelsesteknikker, der almindeligvis anvendes i maven ikke på tilfredsstillende vurdere gastrisk cancer lymfeknude-status. De kan ikke opnå både høj sensitivitet og specificitet. Som en slags maskine-læringsmetoder, Support Vector Machine har potentialet til at løse dette komplekse spørgsmål.
Metoder
institutionelle Review Board godkendte denne retrospektiv undersøgelse. 175 konsekutive patienter med mavekræft, som gennemgik MDCT før operationen blev inkluderet. Vi evaluerede tumor og lymfeknude indikatorer for CT-billeder, herunder serøse invasion, tumor klassificering, tumor maksimal diameter, antal lymfeknuder, maksimal lymfeknude størrelse og lymfeknuder station, hvilket afspejlede den biologiske opførsel af mavekræft. Univariate analyse blev anvendt til at analysere forholdet mellem de seks billeddata indikatorer med LNM. En SVM model blev bygget med disse indikatorer ovenfor som input indeks. Outputtet indeks var, at lymfeknudemetastaser af patienten var positiv eller negativ. Det blev bekræftet af kirurgi og histopatologi. En standard maskine-learning teknik kaldet k-fold krydsvalidering (5-fold i vores undersøgelse) blev anvendt til at træne og test SVM modeller. Vi evaluerede diagnosticeringsevnen af ​​SVM modeller i lymfeknudemetastaser med modtageren opererer karakteristiske (ROC) kurver. Og radiologen klassificeret lymfeknudemetastase af patienter ved hjælp af maksimal lymfeknude størrelse på CT-billeder som kriterium. Vi sammenlignede de områder under ROC-kurver (AUC) af radiologen og SVM-modeller.
Resultater
I 175 tilfælde, de tilfælde af lymfeknude metastaser var 134 og 41 tilfælde ikke var. De seks billede indikatorer alle havde statistisk signifikante forskelle mellem LNM negative og positive grupper. Midlerne til den følsomhed, specificitet og AUC for SVM modeller med 5-fold krydsvalidering var 88,5%, 78,5% og 0,876 henholdsvis. Mens den diagnostiske magt radiologen klassificering lymfeknudemetastase ved maksimal lymfeknude størrelse var kun 63,4%, 75,6% og 0,757. Hver SVM model af 5-fold krydsvalidering udføres væsentligt bedre end radiologen.
Konklusioner
Baseret på biologisk adfærd information af mavekræft på MDCT billeder, kan SVM model hjælpe diagnosticere lymfeknude metastaser præoperativt.
Baggrund
Gastric kræft er en af ​​de førende årsager til kræft-relaterede dødsfald på verdensplan [1]. Lymfeknude status er en vigtig prognostisk faktor for langsigtet overlevelse [2]. Det TNM baseret på amerikanske fælles udvalg om kræft (AJCC) accepteres bredt nu [3]. Det 5-års overlevelsesraten for patienter i n0 scenen efter operationen var 86,1%, mens stadie patienter i N1, N2, og N3 faldet til 58,1%, 23,3% og 5,9%, henholdsvis [4].
På nuværende mange billeddannende teknikker er blevet anvendt til at vurdere gastrisk cancer, herunder abdominal ultralyd, endoskopisk ultralyd (EUS), multi-slice spiral CT, konventionel MRI, og FDG-PET. Imidlertid kan disse billeddannende metoder ikke pålideligt bekræfte eller udelukke forekomsten af ​​lymfeknudemetastase [1]. En meta-analyse viste, at den gennemsnitlige sensitivitet og specificitet ved bestemmelse LN metastase var som følger: 39,9% og 81,8% for abdominal ultralyd, 70,8% og 84,6% for endoskopisk ultralydsundersøgelse, 80,0% og 77,8% for MDCT, 68,8% og 75,0% til konventionel MRI, 34,3% og 93,2% for FDG-PET, og 54,7% og 92,2% for FDG-PET /CT [2]. Enhver enkelt anvendelse af disse billeddiagnostiske værktøjer kan ikke på tilfredsstillende vurdere mavekræft lymfeknude status. Årsagen er, at vi først og fremmest diagnosticere LNM af størrelsen af ​​lymfeknuder. De diagnostiske kriterier spænder fra 5 mm til 10 mm [2]. Men de store lymfeknuder kan være forårsaget af inflammation og de små lymfeknuder kan være metastatisk. Mange undersøgelser har vist, at gastrisk cancer LN metastase var forbundet med tumorstørrelse, dybde af invasion, histologisk type og patologisk lymfe inddragelse [5-8]. Der er ikke nogen egnet metode til at kombinere lymfeknude størrelse med de mange ovenfor beskrevne faktorer til at foretage en omfattende analyse. Hvordan at integrere de komplekse faktorer, der påvirker lymfeknuder og forbedre nøjagtigheden af ​​diagnosticering LNM er emnet for vores undersøgelse.
I det seneste årti, maskinfremstillede læringsmetoder, som supplerer de traditionelle statistiske metoder, der er anvendt til at forudsige komplekse biologiske fænomener . Support Vector Machine er en ny generation af læring algoritmer udviklet på grundlag af statistisk teori. Den SVM algoritmen har et stærkt teoretisk fundament, baseret på ideer VC (Vapnik Chervonenkis) dimension og strukturel risikominimering. Det har opfyldt nøjagtighed [9]. SVM har været anvendt i nogle medicinske anvendelser, hovedsagelig i molekylærbiologi og Neuroimaging [10-12]. Det kan bruges til klassificering og regression. Givet et sæt af uddannelse eksempler, hver markeret som tilhørende en af ​​to kategorier, en SVM uddannelse algoritme bygger en model, der forudsiger, om et nyt eksempel falder ind under en eller den anden kategori.
Formålet med denne undersøgelse er at bruge SVM metode til at analysere MDCT imaging oplysninger i forbindelse med biologiske adfærd mavekræft og etablere de matematiske modeller til vurdering af lymfeknude metastaser præoperativt.
Metoder
Patienter
Denne retrospektive undersøgelse blev godkendt af vores institutionelle review board. Mellem april 2006 og september 2008 blev 368 konsekutive patienter med nyligt diagnosticeret mavekræft administreret præoperative kontrast ekstraudstyr abdominal CT-undersøgelser og derefter modtog gastrektomi på vores hospital. Patienterne svarede til inklusions- og eksklusionskriterier nedenfor indgik i denne undersøgelse.
Inklusionskriterier
Patienterne modtog radikal gastrektomi og D2 lymfeknuder dissektion. De blev præoperativt undersøgt med multi detektor rækken CT. Alle patienter blev bekræftet som gastrisk kræft ved postoperativ histopatologi.
Eksklusionskriterier
Patienterne modtog præoperativ neoadjuverende terapi. Distant metastaser blev fundet i den præoperative undersøgelse eller i driften
Endelig 175 patienter (125 mænd, 50 kvinder, gennemsnitsalder, 59,8 år, range, 30-85 år). Omfattede vores studiepopulation. Vi opnåede informeret samtykke fra alle udvalgte patienter forud for rutinemæssig klinisk forløb CT undersøgelser
CT-protokollen
MDCT blev udført ved hjælp af en 64-detektor rækken CT-scanner (LightSpeed ​​64; GE Healthcare, Milwaukee, Wis).. Hver patient fastet i mere end 8 timer før CT undersøgelse. At muliggøre gastrisk distention og reducere gastrisk motilitet, patienterne modtog 8 g gasproducerende krystaller oralt og en intramuskulær injektion af 10 mg anisodamine 10-15 minutters før undersøgelsen. Øvre abdominal-forøgede CT-scanninger fra diafragma kupler til 2 cm under den nederste margin af air-udspilet gastrisk krop blev erhvervet med en kollimering af 0,625 mm, 120-140 kVp, og 300-350 mAs. Efterfølgende, i alt 100 ml iopromid (Ultravist, Schering, Berlin, Tyskland) blev administreret intravenøst ​​gennem en 18-gauge angiografisk kateter indsat i en antecubital vene ved 3 ml /s ved anvendelse af en automatisk injektor. Kontrast-forstærket CT-scanninger blev udført i de arterielle fase (30 sekunder) og i portalen venøse fase (70 sekunder). Vi gjort flere plane rekonstruktion med portalen venøse fase billede.
Billedanalyse
To radiologer, et med 3 år og den anden med 8 år erfaring i abdominal CT udførte billede analyser i fællesskab at aftale. Hvis der var uenighed, de høres med en anden radiolog, som havde 20 år erfaring i abdominal CT indtil der blev opnået enighed. Vi målte og tælles de seks indikatorer for MDCT billeder ved hænder som følger:
Tumor maksimal diameter
diameter maales mavekræft i aksial, koronale og sagittale billeder baseret MPR billeder. Og beslutte tumoren maksimale diameter.
Tumor klassifikation
Tidlig gastrisk kræft eller BORRMANN klassificering af fremskreden kræft i MPR billederne blev bestemt.
Serøse invasion
aksiale og MPR billeder blev samtidig vurderet til at bestemme serøse invasion. Hele fortykkelse mavevæggen unormalt forøget og lineær eller retikulære strukturer i fedtlaget omkring maven angivne serøse invasion [13].
Antal lymfeknuder
Antallet af alle de synlige gastriske regionale lymfeknuder i MDCT billeder af grupper blev talt [14].
Maksimal lymfeknude størrelse
korte akse af den største lymfeknude påvist i CT-billeder blev målt.
lymfeknuder station
lymfeknuder station med MDCT billeder baseret på det japanske klassifikation af gastrisk karcinom blev bestemt [14]. SEW-EURODRIVE Support vektor maskine
Support Vector Machine er en overvåget maskine learning teknik, der er almindeligt anvendt i problemer anerkendelse og klassificering mønster. SVM algoritmen udfører en klassificering ved at konstruere en flerdimensional hyperplan der optimalt skelner mellem to klasser ved at maksimere margin mellem to data klynger. Denne algoritme opnår høj diskriminerende effekt ved hjælp af særlige ulineære funktioner kaldet kerner at omdanne input plads i et flerdimensionalt rum [15]. I denne undersøgelse blev en fri tilgængelig SVM software kaldet LibSVM 2,89 anvendt til at generere SVM model [16]. Input indekser var de seks indikatorer, der indsamles på MDCT billeder ovenfor. For disse indikatorer, kunne de måledata indtastes til SVM model direkte. Mens tæller data skal defineres som nogle numre. For eksempel blev positiv serosale invasion defineret som 1 og negativ var -1. Udgangen indekset var lymfeknudemetastase af patienten. Det blev bekræftet af kirurgi og histopatologi. Hvis patienten havde en eller flere lymfeknuder metastase, blev det anset som positivt LNM. Vi definerede den positive LNM som 1, mens negative var -1. Vi valgte RBF Kernel at bygge modellen. At træne og teste vores SVM model, brugte vi en standard maskine-learning teknik kaldet k-fold cross-validering. Fordi hele stikprøvestørrelse på vores undersøgelse ikke var meget store, brugte vi 5-fold cross-validering. De hele data blev opdelt i 5 lige store og adskilte delmængder. Fire af disse delmængder kombineres og anvendes til træning, og den resterende sæt bruges til testen. Denne cross-valideringsprocessen blev gentaget 5 gange, så hver delmængde at tjene én gang som den indstillede test data.
Statistisk analyse
En univariat statistisk analyse ved hjælp af SPSS /PC + statistisk programpakke udgave 11.5 (SPSS Inc., IL, Chicago, USA) blev udført for at vurdere forskellene i seks billeddannende indikatorer mellem patienter, der havde LNM eller ej. De statistiske analysemetoder var de uafhængige-prøverne T test og Mann-Whitney U test. P < 0,05 blev betragtet som signifikant forskel. Receiver operating characteristic (ROC) kurve blev anvendt til at evaluere den diagnostiske ydeevne SVM model. Den MedCalc softwareversion 11.2 (MedCalc, MedCalc Software, Gent, Belgien) blev anvendt til at gøre ROC kurver og sammenligne dem. Sammenfattende vi gennemsnit arealet under kurven (AUC) af ROC kurver for 5-fold krydsvalidering. Vi tælles også midlerne til sensitivitet og specificitet. For at sammenligne med SVM model, vi konstrueret ROC kurven for radiolog vurdering ved hjælp af maksimal lymfeknude størrelse som kriterier for at klassificere LNM. Følsomheden og specificiteten af ​​de bedste cut-off punkt blev talt.
Resultater
I disse 175 tilfælde var der 134 tilfælde, som havde lymfeknude metastaser og 41 tilfælde ikke havde. Patienternes klinisk-patologiske funktioner blev beskrevet i tabel 1. Vi indsamlede de seks indikatorer for MDCT billeder. Resultaterne af den univariate statistiske analyse viste, at alle seks indikatorer, herunder serosale invasion, tumor klassificering, tumor maksimal diameter, antal lymfeknuder, maksimal lymfeknude størrelse og lymfeknuder station var signifikant forskellige mellem LNM positive og negative gruppe (P <0,001). Midlerne til tumor maksimal diameter, antal lymfeknuder, og maksimal lymfeknude størrelse i LNM positiv gruppe var 56,6 ± 19,5 mm, 10,0 ± 5,5 mm, og 12 ± 8, hhv. De var alle højere end LNM negative gruppe (tabel 2) .table 1 Patient Karakteristika
klinisk-patologisk træk
Value
No. af patienterne
175
Mean alder (y)
59,8 (30-85)
Ratio af kvinder til mænd
50: 125
Histopatologi
Adenocarcinom
173 ( 98,9%)
Nå differentieret
6 (3,4%)
Moderat differentieret
91 (52%)
Dårligt differentieret
76 (43,5%)
Lille celle karcinom
2 (1,1%)
lymfeknude metastaser
Positiv
134 (76,6%)
Negativ
41 (23,4%)
Bemærk .-- Tal i parentes er intervallerne.
tabel 2 Patient data: de 6 indikatorer data i MDCT billeder og resultaterne af univariat statistisk analyse
Patient data
LNM (. -)
LNM (+)
P-værdi
Patient nummer
41/175 (23,4%)
134/175 (76,6%)
Måling af data *
Tumor maksimal diameter (mm)
39,0 ± 17,0
56,6 ± 19,5
< 0,001
maksimal lymfeknude størrelse (mm)
6,5 ± 2,8
10,0 ± 5,5
< 0,001
Antal lymfeknuder
7 ± 4
12 ± 8
< 0,001
Count data #
serøse invasion
< 0.001
Ja
15/175 (8,6%)
120/175 (68,6%)
Ingen
26/175 (14,8%)
14/175 (8%)
Tumor klassificering
< 0,001
Tidlig mavekræft
9/175 (5,1%)
1/175 (0,6%)
BorrmannI
2/175 (1,1%)
0/175
BorrmannII
3/175 (1,7%)
9/175 (5,1%)
BORRMANN III
27/175 (15,4%)
121 /175 (69,1%)
BORRMANN IV
0/175
3/175 (1,7%)
lymfeknuder station
< 0,001
Station1
29/175 (16,6 %)
44/175 (25,1%)
Station2
12/175 (6,9%)
54/175 (30,9%)
Station3
0/175
36 /175(20.5)
* værdien af ​​måledata var middel ± standardafvigelse. Den p-værdi var fra uafhængige-prøver T-test.
# Værdien af ​​optællingen data var antallet af data. Den p-værdi var fra Wilcoxon Rank Sum.
Radiologen opnåede en AUC på 0,757 som klassificere lymfeknudemetastase af patienten ved maksimal lymfeknude størrelse. Den bedste afskæringspunkt af maksimal lymfeknude størrelse var 7,7 mm. Følsomheden og specificiteten var kun 63,4% og 75,6%. SVM s hjælp af følsomhed, specificitet og AUC med 5-fold krydsvalidering var 88,5%, 78,5% og 0,876 (tabel 3). Sammenlignet med radiologen, hver AUC for de 5-fold krydsvalidering SVM modeller væsentligt bedre (P < 0,05) end radiologen (figur 1, tabel 3). Figur 1 ROC-kurven for LNM. Receiver operating characteristic (ROC) kurve for lymfeknudemetastaser med 5-fold krydsvalidering SVM modeller og radiolog. AUC for k1 at K5 SVM modeller var 0,862, 0866, 0,878, 0,900 og 0876, hhv. Sammenlignet med radiologen, P-værdier blev alle mindre end 0,05 (tabel 3). For de fem SVM modeller, middelværdien af ​​AUC'er var 0,876. Og AUC for radiolog baseret LN størrelse var 0,757.
Tabel 3 AUC for SVM model og radiolog
Model

K-fold

Sensitivity

Specificity

AUC*

P værdi (AUC sammenlignet med radiolog)
SVM
K1
0,881
0.780
0,862 ± 0,038
0,002
K2
0,866
0.780
0,866 ± 0,037
< 0,001
K3
0,858
0,805
0,878 ± 0,033
< 0,001
K4
0,933
0.780
0.900 ± 0,031
< 0,001
K5
0,888
0.780
0,876 ± 0,038
< 0,001
betyde
0,885
0,785
0,876
radiolog
0,634
0,756
0,757 ± 0,042
følsomhed, specificitet og AUC af 5-fold krydsvalidering SVM modeller og radiolog til diagnosticering lymfeknude metastaser af patienten.
* værdien af data var AUC ± standardafvigelse.
diskussion
lymfeknudemetastase påvirker kirurgisk behandling af patienter med gastrisk cancer og er også en vigtig faktor i prognosen. På nuværende præoperativ diagnose afhænger hovedsagelig af forskellige billeddannende metoder. Standarden for at dømme lymfeknude metastaser afhængig morfologiske indikatorer. Lymfeknude størrelse er den dominerende indikator. Dorfman RE et al rapporterede dog, at øvre grænser for normal for lymfeknude størrelse ved abdominal computertomografi varierede fra 6 til 11 mm [17]. De delvist overlappet med den maligne lymfadenopati. Fukuya T et al viste at CT dæmpning og lymfe-node konfiguration kunne hjælpe med diagnose af malign adenopati [18]. Tværtimod Deutch SJ et al udtryk for, at størrelse, beliggenhed, kontur, tæthed ikke var nyttige i at skelne benigne fra maligne lymfadenopati [19]. Manglende kriterier for bedømmelsen er den vigtigste hindring for forudsigelse af lymfeknude metastaser præoperativt.
Den biologiske adfærd mavekræft afspejler den histopatologiske ydeevne tumorens malignance og invasion. Det påvirker lymfeknudemetastase direkte eller indirekte. Den konkrete manifestation af den biologiske adfærd omfatter fx, tumorstørrelse, dybde af invasion, tumor invasion af andre organer, lymfeknudemetastase og fjernt metastase. MDCT kan tydeligt vise disse patologiske forekomster. Nogle undersøgelser har rapporteret, at nøjagtigheden af ​​mavekræft T iscenesættelse med MDCT kombineret med 3D-rekonstruktion var 84-89% [20, 21]. Zhang XP et al rapporterede, at antallet af lymfeknuder detekteret af MDCT viste en signifikant forskel mellem lymfeknudemetastase gruppe og ingen metastaser gruppe i hjertets cancer [22]. MDCT kan også angive situationen i andre abdominale organer og bughinden. Derfor kan MDCT imaging præcist afspejler biologiske adfærd mavekræft histopatologi. Univariate analyser i vores undersøgelse viste, at de 6 indikatorer for mavekræft og lymfeknuder oplysninger om CT-billeder alle har en relation til LNM. Så vi bør overveje disse biologiske adfærd faktorer omfattende forudsige LNM.
Der var nogle andre maskinlæsbare læringsmetoder, der anvendes i medicinske undersøgelser. Den hovedsageligt metode var kunstigt neuralt netværk (ANN). ANN anses for at være en egnet metode til medicinsk dataanalyse [23]. Bollschweiler et al anvendt en single-layer perceptron, som er en slags ANN, at forudsige lymfeknudemetastase i gastrisk cancer. Nøjagtigheden af ​​ANN var 79% [24]. Imidlertid ANN havde nogle ulemper. ANN model var tilbøjelig til overfitting. Det krævede langvarig udvikling og tid til at optimere. De var mere vanskelige at anvende på området på grund af beregningsmæssige krav [25]. I betragtning af de ovennævnte grunde, valgte vi SVM model i stedet. SVM kunne producere lavere forudsigelsesfejl sammenlignet med klassificører baseret på andre metoder som kunstige neurale netværk [26]. Sammenlignet med ANN, kan SVM have samme endnu bedre prædiktiv evne [27, 28]. På nuværende tidspunkt er der kun få rapporter om anvendelsen af ​​SVM i gastrisk cancer lymfeknudemetastase. Som en foreløbig undersøgelse, vores resultater viser, at SVM model har bedre diagnostisk kapacitet til LNM end de traditionelle kriterier LN størrelse. AUC har opnået en god diagnostisk magt. Med yderligere forbedring, kan SVM blive en effektiv metode til at forudsige lymfeknude iscenesættelse af mavekræft.
Konklusioner
Baseret på biologisk adfærd information af mavekræft på MDCT billeder, kan SVM model hjælpe diagnosticere lymfeknude metastaser præoperativt.
erklæringer
Taksigelser
vi takker Jie Li, Yong Cui, Li-Ping Qi, Xiao-Ting Li til redaktionel støtte og Jun Shan, Ning Wang, Ying Li, Shun-Yu Gao for at gennemgå manuskriptet.
Projekt støttet af National Natural Science Foundation of China (Grant nr 30.970.825) og Beijing Municipal Natural Science Foundation (nr 7.092.020). originale filer indsendte
forfattere "for Images of Nedenfor er links til forfatterne 'original indsendt filer til billeder. 12885_2010_2503_MOESM1_ESM.jpeg Forfatternes oprindelige fil til figur 1 Konkurrerende interesser
Forfatterne erklærer, at de ikke har nogen konkurrerende interesser.

Other Languages