Support Vector Machine model voor de diagnose van lymfeklier metastase bij maagkanker met multidetector computertomografie: een voorstudie
De abstracte Achtergrond
lymfekliermetastase (LNM) van maagkanker is een belangrijke voorspellende factor met betrekking tot de lange termijn te overleven. Maar verscheidene beeldvormende technieken die gewoonlijk worden gebruikt in de maag kan niet bevredigend de maagkanker lymfklierstatus beoordelen. Ze kunnen zowel een hoge gevoeligheid en specificiteit niet bereiken. Als een soort van machine-leermethoden, Support Vector Machine heeft de potentie om dit complexe probleem op te lossen.
Methods Ondernemingen De Institutional Review Board goedgekeurd deze retrospectieve studie. 175 opeenvolgende patiënten met maagkanker die MDCT voor de operatie ondergingen werden opgenomen. We evalueerden de tumor en lymfeklieren indicatoren CT beelden zoals serosale invasie, tumorclassificatie, tumor maximale diameter, aantal lymfeklieren maximale lymfeknoop grootte en lymfeknopen station, dat het biologische gedrag van maagkanker gereflecteerd. Univariate analyse werd gebruikt om het verband tussen de zes beeld indicatoren LNM analyseren. Een SVM model werd gebouwd met deze indicatoren boven als input index. De output index was dat lymfklier uitzaaiing van de patiënt positief of negatief was. Werd bevestigd door de chirurgie en histopathologie. Een standaard-machine learning techniek genaamd k-voudige kruisvalidatieset (5-voudig in onze studie) werd gebruikt voor het trainen en testen SVM modellen. We evalueerden de diagnostische mogelijkheden van de SVM modellen in lymfklier metastase met de ontvanger operating characteristic (ROC) curves. En de radioloog ingedeeld de lymfeklier metastase van patiënten met behulp van de maximale lymfeklier grootte op CT-beelden als criterium. We vergeleken de gebieden onder ROC curves (AUC) van de radioloog en SVM modellen.
Resultaten
In 175 gevallen, de gevallen van lymfeklier metastase waren 134 en 41 gevallen die niet waren. De zes beeld indicators hadden statistisch significante verschillen tussen de LNM negatieve en positieve groepen. De middelen van de sensitiviteit, specificiteit en AUC van SVM modellen met 5-voudige kruisvalidatieset waren 88,5%, 78,5% en 0,876, respectievelijk. Terwijl de diagnostische kracht van de radioloog classificeren lymfeklier metastase door de maximale grootte van de lymfklieren waren slechts 63,4%, 75,6% en 0,757. Elk SVM model van het 5-voudige kruisvalidatieset scoorden aanzienlijk beter dan de radioloog.
Conclusies
basis van biologische gedrag informatie maagkanker op MDCT afbeeldingen kan SVM model diagnosticeren de lymfeknoop metastase preoperatief.
Achtergrond
Maagkanker is een van de belangrijkste oorzaken van kanker-gerelateerde sterfgevallen wereldwijd [1]. Lymfeklierstatus is een belangrijke voorspellende factor met betrekking tot de lange-termijn overleving [2]. De TNM-classificatie gebaseerd op Amerikaanse Joint Committee on Cancer (AJCC) wordt nu op grote schaal geaccepteerd [3]. De 5-jaarsoverleving van de patiënten in de N0 fase na de operatie was 86,1%, terwijl de N1, N2 en N3 stadium patiënten gedaald tot 58,1%, 23,3% en 5,9%, respectievelijk [4].
Op dit moment, vele beeldvormende technieken gebruikt om maagkanker, waaronder abdominale echografie, endoscopische echografie (EUS), multi-slice spiral CT, conventionele MRI en FDG-PET beoordelen. Toch kunnen deze beeldvormende technieken niet op een betrouwbare bevestiging of uitsluiting van de aanwezigheid van lymfklier metastase [1]. Een meta-analyse toonde aan dat de gemiddelde gevoeligheid en specificiteit bepalen LN metastase als volgt: 39,9% en 81,8% voor abdominale echografie, 70,8% en 84,6% voor endoscopische echografie, 80,0% en 77,8% voor MDCT, 68,8% en 75,0% conventionele MRI, 34,3% en 93,2% voor de FDG-PET, en 54,7% en 92,2% voor de FDG-PET /CT [2]. Een enkele toepassing van deze imaging-tools kunnen niet naar tevredenheid van de maagkanker lymfklierstatus beoordelen. De reden is dat we vooral de diagnose LNM door de grootte van de lymfeklieren. De diagnostische criteria variëren van 5 mm tot 10 mm [2]. Maar het grote lymfeklieren kan worden veroorzaakt door een ontsteking en de kleine metastatische lymfeknopen kan zijn. Vele studies hebben aangetoond dat maagkanker LN metastase geassocieerd met tumorgrootte, invasiediepte, weefseltype en pathologische lymfatische betrokkenheid [5-8]. Er is geen geschikte methode om lymfeklier formaat te combineren met de vele factoren die hierboven beschreven om een uitgebreide analyse te maken. Hoe de complexe factoren integreren invloed lymfeklieren en de nauwkeurigheid van diagnose LNM is het onderwerp van onze studie.
In het afgelopen decennium, machine-learning methoden, complementair aan traditionele statistische methoden zijn gebruikt om complexe biologische fenomenen te voorspellen . Support Vector Machine is een nieuwe generatie leeralgoritmen ontwikkeld op basis van statistische theorie. De SVM algoritme heeft een sterke theoretische basis, gebaseerd op de ideeën van VC (Vapnik Chervonenkis) dimensie en minimalisering structurele risico. Het heeft voldaan aan nauwkeurigheid [9]. SVM is gebruikt in een aantal medische toepassingen, vooral in de moleculaire biologie en beeldvormende [10-12]. Het kan worden gebruikt voor de indeling en regressie. Gegeven een set van de opleiding voorbeelden, elk gemarkeerd als behorend tot een van de twee categorieën, een SVM training algoritme bouwt een model dat voorspelt of een nieuw voorbeeld valt in één categorie of het ander.
Het doel van deze studie is om SVM gebruiken methode om de MDCT beeldvorming informatie met betrekking tot het biologisch gedrag van maagkanker te analyseren en vast te stellen de wiskundige modellen om lymfeklier metastase preoperatief te beoordelen.
Methods
Patiënten Inloggen Deze retrospectieve studie door onze institutionele Review board werd goedgekeurd. Tussen april 2006 en september 2008 werden 368 opeenvolgende patiënten met nieuw gediagnosticeerde maagkanker toegediend preoperatieve contrast enhancement abdominale CT-onderzoeken en ontving toen de gastrectomy in ons ziekenhuis. De patiënten kwam overeen met de in- en uitsluitingscriteria hieronder werden in deze studie.
Inclusiecriteria Ondernemingen De patiënten kregen rest gastrectomie en D2 lymfeklieren dissectie. Ze werden preoperatief onderzoek met multi-detector row CT. Alle patiënten werden bevestigd als maagkanker door postoperatieve histopathologie.
Uitsluitingscriteria
De patiënten kregen preoperatieve neo-adjuvante therapie. Metastasen op afstand werd gevonden in de preoperatieve onderzoek of de operatie
slot 175 patiënten (125 mannen, 50 vrouwen, gemiddelde leeftijd 59,8 jaar, bereik 30-85 jaar). Omvat studiepopulatie. We verkregen geïnformeerde toestemming van alle geselecteerde patiënten voorafgaand aan de routine klinisch beloop van CT-onderzoeken
CT Protocol
MDCT werd uitgevoerd met behulp van een 64-detector row CT-scanner (LightSpeed 64; GE Healthcare, Milwaukee, WI).. Elke patiënt gevast gedurende meer dan 8 uur voor het CT-onderzoek. Gastrische distensie inschakelen en verminderen gastrische motiliteit kregen de patiënten 8 g gasproducerende kristallen oraal en een intramusculaire injectie van 10 mg anisodamine 10-15 minuten voor het onderzoek. Bovenbuik onversterkte CT-scans van het middenrif koepels tot 2 cm onder de onderste rand van de lucht-uitgezette maag body werden verworven met een collimatie van 0,625 mm, 120-140 kVp en 300-350 mAs. Vervolgens werd een totaal van 100 ml iopromide (Ultravist, Schering, Berlijn, Duitsland) intraveneus toegediend via een 18-gauge angiografiekatheter in een anticubitale ader met 3 ml /sec ingebracht met behulp van een automatische injector. Contrast-versterkte CT-scans werden uitgevoerd in de arteriële fase (30 seconden) en in de portale veneuze fase (70 seconden). We maakten de multi-vlakke reconstructie imago van de portal veneuze fase.
Image Analysis
Twee radiologen, een met 3 jaar en de andere met 8 jaar ervaring in de buik CT uitgevoerd image analyseert gezamenlijk tot overeenstemming. Als er onenigheid, zij overleg met een andere radioloog die had 20 jaar ervaring in de buik CT totdat er een akkoord werd bereikt. We gemeten en telden de zes indicatoren op MDCT beelden door handen als volgt:
Tumor maximale diameter
Meet de diameter van maagkanker in de axiale, coronale en sagittale beelden op basis van de MPR beelden. En bepaal de tumor maximale diameter.
Tumor indeling
Vroege maagkanker of Borrmann indeling van vergevorderde kanker in de MPR beelden werd bepaald.
Serosal invasie
Axial en MPR beelden werden gelijktijdig geëvalueerd om de serosal bepalen invasie. De gehele maag verdikking muur abnormaal verbeterd en lineair of reticulaire structuren in de vetlaag rond de maag aangegeven serosal invasie [13].
Aantal lymfeklieren
Het aantal alle zichtbare maag regionale lymfeklieren in de MDCT beelden door groepen werd geteld [14].
maximum lymfklier grootte
de korte as van de grootste lymfeklier aangetroffen in CT-beelden werd gemeten.
lymfeklieren station Ondernemingen de lymfeklieren station met MDCT beelden gebaseerde op de Japanse indeling van maagcarcinoom werd bepaald [14].
Ondersteuning vector machine
Support vector machine is een bewaakte machine learning techniek die veel gebruikt wordt in patroonherkenning en classificatie problemen. SVM algoritme voert een classificatie door de aanleg van een multidimensionaal hypervlak die optimaal onderscheid tussen twee klassen door het maximaliseren van de marge tussen beide data clusters. Dit algoritme bereikt hoge onderscheidingsvermogen door speciale lineaire functies opgeroepen kernels met de ingang ruimte te transformeren in een multidimensionale ruimte [15]. In deze studie, een gratis ter beschikking SVM software genaamd libsvm 2,89 werd gebruikt om de SVM model [16] te genereren. De input indexen waren de zes indicatoren verzameld op MDCT bovenstaande afbeeldingen. Voor deze indicatoren, de meetgegevens kunnen worden aan SVM model direct ingevoerd. Terwijl het aantal gegevens moet worden gedefinieerd als een aantal nummers. Zo werd positief serosale invasie gedefinieerd als 1 en negatieve was -1. De outputindex was lymfekliermetastase van de patiënt. Werd bevestigd door de chirurgie en histopathologie. Als de patiënt had een of meer lymfeknopen metastasen, werd het beschouwd als positief LNM. We omschreven de positieve LNM als 1, terwijl de negatieve was -1. Wij selecteerden de RBF kernel om het model te bouwen. Om te trainen en testen onze SVM model, gebruikten we een standaard-machine learning techniek genaamd k-fold cross-validatie. Omdat de hele steekproefomvang van onze studie was niet erg groot, gebruikten we 5-voudig kruisvalidatie. De hele gegevens werden verdeeld in 5 gelijke en verschillende subgroepen. Vier van deze subgroepen worden gecombineerd en gebruikt voor de opleiding en de resterende set wordt gebruikt voor het testen. Deze cross-validatieproces werd 5 keer herhaald, zodat elke deelverzameling een keer te dienen als de test data set.
Statistische analyse
Een univariate statistische analyse met behulp van SPSS /PC + statistische softwarepakket versie 11.5 (SPSS Inc, IL, Chicago, USA) werd uitgevoerd om de verschillen in zes imaging indicatoren tussen de patiënten die niet hadden LNM of evalueren. De statistische analyse methoden waren de Independent-samples T-test en Mann-Whitney U test. P < 0,05 werd beschouwd als significant verschil. Receiver operating characteristic (ROC) curve werd gebruikt om de diagnostische waarde van de SVM model te evalueren. De MedCalc software-versie 11.2 (MedCalc, MedCalc Software, Gent, België) werd gebruikt om de ROC curves te maken en te vergelijken. Samenvattend gemiddeld we het gebied onder de curve (AUC) van de ROC curves van de 5-voudige kruisvalidatie. We telden ook dient gevoeligheid en specificiteit. Te vergelijken met de SVM model, gebouwd we de ROC curve voor radioloog beoordeling door het gebruik van de maximale lymfeklier grootte als criteria om de LNM classificeren. De gevoeligheid en specificiteit van de beste afkappunt werden geteld.
Resultaten
In deze 175 gevallen, waren er 134 gevallen die lymfeklier metastase gehad en 41 gevallen moest niet. clinicopathologische kenmerken van patiënten werden beschreven in de Tabel 1. We verzamelden de zes indicatoren over MDCT beelden. De resultaten van de univariate statistische analyse aan dat de zes indicatoren waaronder serosale invasie, tumorclassificatie, tumor maximale diameter, aantal lymfeklieren maximale lymfeknoop grootte en lymfeknopen station waren significant verschillend tussen de LNM positieve en negatieve groepen (P <0,001). De middelen van de tumor maximale diameter, aantal lymfeklieren en lymfeklieren maximale grootte in LNM positieve groep was 56,6 ± 19,5 mm, 10,0 ± 5,5 mm en 12 ± 8 respectievelijk. Ze waren allemaal hoger dan die van LNM negatieve groep (tabel 2) .table 1 patiëntkenmerken
clinicopathologische functies
Waarde
No. van de patiënten
175
gemiddelde leeftijd (y)
59,8 (30-85)
Verhouding van vrouwen aan mannen
50: 125
Histopathologie
Darmkanker
173 ( 98,9%)
Well gedifferentieerde
6 (3,4%)
Matig gedifferentieerd
91 (52%)
slecht gedifferentieerde
76 (43,5%)
Small cell carcinoma
2 (1,1%)
lymfekliermetastasen
Positieve
134 (76,6%)
Negatief
41 (23,4%)
Opmerking .-- aantallen tussen haakjes staan de marges.
Tabel 2 Patiënt gegevens: de 6 indicators 'gegevens van de MDCT beelden en de resultaten van univariate statistische analyses
Patiëntgegevens
LNM (. -)
LNM (+)
P waarde
Patiënt nummer
41/175 (23,4%)
134/175 (76,6%)
Meetgegevens *
Tumor maximale diameter (mm)
39,0 ± 17,0
56,6 ± 19,5 Restaurant < 0,001
maximum lymfeklier grootte (mm)
6,5 ± 2,8
10,0 ± 5,5 Restaurant < 0,001
Aantal lymfeklieren
7 ± 4
12 ± 8 Restaurant < 0,001
Count data #
serosal invasie Restaurant < 0.001
Ja
15/175 (8,6%)
120/175 (68,6%) verhuur No
26/175 (14,8%)
14/175 (8%)
Tumor indeling Restaurant < 0,001
Vroege maagkanker
9/175 (5,1%)
1/175 (0,6%)
BorrmannI
2/175 (1,1%)
0/175
BorrmannII
3/175 (1,7%)
9/175 (5,1%)
Borrmann III
27/175 (15,4%)
121 /175 (69,1%)
Borrmann IV
0/175
3/175 (1,7%)
lymfeklieren station Restaurant < 0,001
Station1
29/175 (16,6 %)
44/175 (25,1%)
Station2
12/175 (6,9%)
54/175 (30,9%)
Station3
0/175
36 /175(20.5)
* de waarde van de meetgegevens was gemiddelde ± standaardafwijking. De p-waarde werd uit onafhankelijke samples T-test.
# De waarde van de telgegevens was het aantal data. De p-waarde was van Mann-Whitney U test. Ondernemingen De radioloog een AUC van 0,757 bereikt als het classificeren lymfklier uitzaaiing van de patiënt door de maximale grootte van de lymfklieren. De beste cut-off punt van de maximale lymfeklier grootte was 7,7 mm. De gevoeligheid en specificiteit was slechts 63,4% en 75,6%. De SVM's via de sensitiviteit, specificiteit en AUC met 5-voudige kruisvalidatieset waren 88,5%, 78,5% en 0,876, respectievelijk (Tabel 3). Vergeleken met de radioloog, elk AUC van de 5-voudige kruisvalidatieset SVM modellen uitgevoerd significant beter (P < 0,05) dan de radioloog (Figuur 1, Tabel 3). Figuur 1 ROC curve voor LNM. Receiver operating characteristic (ROC) curve voor lymfekliermetastasen met 5-voudige cross-validatie SVM modellen en radioloog. De AUC van K1 tot K5 SVM modellen waren 0.862, 0.866, 0.878, 0.900 en 0876, respectievelijk. Vergeleken met de radioloog, de P-waarden waren minder dan 0,05 (Tabel 3). Voor de vijf SVM modellen, het gemiddelde van AUC's was 0,876. En de AUC van de radioloog gebaseerd LN grootte was 0,757.
Tabel 3 AUC van SVM model en radioloog
Model
K-fold
Sensitivity
Specificity
AUC*
P waarde (AUC in vergelijking met de radioloog)
SVM
K1
0,881
0.780
0,862 ± 0,038
0,002
K2
0,866
0.780
0,866 ± 0,037 Restaurant < 0,001
K3
0,858
0,805
0,878 ± 0,033 Restaurant < 0,001
K4
0,933
0.780
0.900 ± 0.031 Restaurant < 0,001
K5
0,888
0.780
0,876 ± 0,038 Restaurant < 0,001
betekenen
0,885
0,785
0,876
radioloog
0,634
0,756
0,757 ± 0,042
De sensitiviteit, specificiteit en AUC van 5-voudige cross-validatie SVM modellen en radioloog voor het diagnosticeren van lymfeklier metastase van patiënt.
* De waarde van de data was AUC ± standaardafwijking.
Discussie
lymfeklier invloed op de chirurgische behandeling van patiënten met maagkanker en is ook een belangrijke factor in de prognose. Momenteel preoperatieve diagnose hangt vooral af van verschillende beeldvorming. De maatstaf om lymfeklier steunt op morfologische indicatoren. Lymfklier grootte is de dominante indicator. Echter, RE Dorfman et al gemeld dat bovengrenzen van normaal lymfeknoop grootte van abdominale computertomografie varieerde van 6 tot 11 mm [17]. Zij gedeeltelijk overlapt met de maligne lymfadenopathie. Fukuya T et al toonden aan dat CT verzwakking en lymfe-knooppunt configuratie kan helpen bij de diagnose van kwaadaardige adenopathy [18]. Integendeel, Deutch SJ et al uitgedrukt dat de grootte, locatie, contour, dichtheid niet behulpzaam onderscheiden benigne en maligne lymfadenopathie [19]. Gebrek aan criteria voor het beoordelen is de belangrijkste beperkende factor bij het voorspellen van lymfekliermetastase preoperatief. Ondernemingen De biologische gedrag van maagkanker weerspiegelt de histopathologische prestaties van kwaadaardigheid en de invasie van de tumor. Het beïnvloedt lymfekliermetastase direct of indirect. De concrete manifestatie van het biologisch gedrag omvat bijvoorbeeld tumorgrootte, invasiediepte, tumorinvasie van andere organen, lymfeklier en metastases. MDCT is duidelijk deze pathologische gebeurtenissen weer te geven. Sommige studies hebben gemeld dat de nauwkeurigheid van maagkanker T staging met MDCT gecombineerd met 3D reconstructie was 84-89% [20, 21]. Zhang XP et al gemeld dat het aantal lymfklieren gedetecteerd door MDCT vertoonde een significant verschil tussen de lymfekliermetastase groep en geen metastasen groep cardiale kanker [22]. MDCT kunnen ook aangeven de situatie in andere abdominale organen en het buikvlies. Daarom kan MDCT beeldvorming nauwkeurig de biologische gedrag van maagkanker histopathologie. Univariate analyse in onze studie toonde aan dat de 6 indicatoren van maagkanker en lymfklieren gegevens over CT-beelden hebben een relatie tot LNM. Dus moeten we deze biologische gedrag factoren uitvoerig te overwegen in het voorspellen van LNM.
Er waren enkele andere machine learning methoden die worden gebruikt in de medische studies. De voornamelijk methode was kunstmatig neuraal netwerk (ANN). ANN wordt beschouwd als een geschikte methode voor medische gegevensanalyse [23]. Bollschweiler et al toegepast enkellaags perceptron, die een soort ANN te lymfekliermetastase voorspellen maagkanker. De nauwkeurigheid van ANN was 79% [24]. Echter, de ANN had een aantal nadelen. ANN's model was gevoelig voor overfitting. Het vereist lange ontwikkeling en tijd om te optimaliseren. Zij waren moeilijk te gebruiken op het gebied vanwege rekeneisen [25]. Met het oog op de hierboven genoemde redenen, hebben we gekozen voor de SVM model plaats. De SVM kan lagere voorspellingsfout produceren vergeleken met classifiers basis van andere methoden, zoals kunstmatige neurale netwerken [26]. Vergeleken met ANN kan SVM dezelfde nog beter voorspellend vermogen [27, 28] hebben. Momenteel zijn er weinig rapporten over de toepassing van SVM bij maagkanker lymfeklier. Als voorstudie, onze resultaten geven aan dat SVM model heeft een betere diagnostische mogelijkheden voor LNM dan de traditionele LN grootte criteria. Het AUC is een goede diagnostische macht bereikt. Na verdere verbetering kan SVM een effectieve methode voor lymfeklier staging maagkanker voorspellen geworden.
Conclusies
basis van biologische gedrag informatie maagkanker op MDCT afbeeldingen kan SVM model diagnosticeren de lymfeknoop metastase preoperatief.
verklaringen
Dankwoord
Wij danken Jie Li, Yong Cui, Li-Ping Qi, Xiao-Ting Li voor redactionele ondersteuning en juni Shan, Ning Wang, Ying Li, Shun-Yu Gao voor de herziening van het manuscript.
Project gesteund door de National Natural Science Foundation of China (Grant nr 30970825) en Beijing Municipal Natural Science Foundation (No. 7.092.020). origineel ingediende dossiers
Authors 'voor beelden
Hieronder staan de links naar de auteurs 'originele ingediende dossiers voor afbeeldingen. oorspronkelijke bestand 12885_2010_2503_MOESM1_ESM.jpeg Authors 'voor figuur 1 Concurrerende belangen Ondernemingen De auteurs verklaren dat ze geen concurrerende belangen.