modelo de máquina de vectores para el diagnóstico de metástasis en los ganglios linfáticos en el cáncer gástrico con la tomografía computarizada multidetector: un estudio preliminar
Resumen Antecedentes
metástasis de ganglios linfáticos (MNV) del cáncer gástrico es un factor pronóstico importante en cuanto a la supervivencia a largo plazo. Sin embargo, varias técnicas de imagen que se utilizan comúnmente en el estómago no pueden evaluar satisfactoriamente el estado de los ganglios linfáticos cáncer gástrico. No pueden lograr tanto la alta sensibilidad y especificidad. Como una especie de métodos de aprendizaje automático, la máquina de vectores de soporte tiene el potencial de resolver este problema complejo.
Métodos comentario El comité de revisión institucional aprobó este estudio retrospectivo. Se incluyeron 175 pacientes consecutivos con cáncer gástrico que se sometieron a la TCMD antes de la cirugía. Se evaluaron los indicadores de ganglios tumorales y los ganglios de las imágenes de TC, incluyendo la invasión serosa, la clasificación de tumores, el diámetro máximo del tumor, el número de ganglios linfáticos, el tamaño máximo de los ganglios linfáticos y la estación de ganglios linfáticos, lo que refleja el comportamiento biológico del cáncer gástrico. Se realizó un análisis univariante para analizar la relación entre los seis indicadores de imagen con MNV. Un modelo SVM fue construido con estos indicadores anteriores como el índice de entrada. El índice de producción fue que la metástasis de los ganglios linfáticos de la paciente fue positivo o negativo. Se confirmó por la cirugía y la histopatología. Una técnica de aprendizaje de máquinas estándar llamado k-veces validación cruzada (5 veces en nuestro estudio) fue utilizado para entrenar y SVM modelos de prueba. Se evaluó la capacidad de diagnóstico de los modelos SVM en la metástasis de los ganglios linfáticos con el receptor curvas características de funcionamiento (ROC). Y el radiólogo clasifica la metástasis ganglionar de los pacientes mediante el uso máximo de tamaño de los ganglios linfáticos en las imágenes de TC como criterio. Se compararon las áreas bajo las curvas ROC (AUC) de la SVM modelos radiólogo y.
: Resultados de la En 175 casos, los casos de metástasis en los ganglios linfáticos fueron 134 y 41 casos no lo eran. Los seis indicadores imagen todos tenían diferencias estadísticamente significativas entre los grupos negativos y positivos LNM. Los medios de la sensibilidad, la especificidad y el ABC de los modelos SVM con 5 veces la validación cruzada fueron 88,5%, 78,5% y 0,876, respectivamente. Mientras que el poder de diagnóstico del radiólogo clasificación de metástasis ganglionar por tamaño máximo de los ganglios linfáticos fuera sólo el 63,4%, 75,6% y 0.757. Cada modelo de la SVM-5 veces la validación cruzada se desempeñaron significativamente mejor que el radiólogo.
Conclusiones
basa en la información comportamiento biológico del cáncer gástrico en las imágenes MDCT, modelo SVM puede ayudar a diagnosticar la metástasis del nodo linfático antes de la operación.
Antecedentes
el cáncer gástrico es una de las principales causas de muerte por cáncer en todo el mundo [1]. el estado de los ganglios linfáticos es un importante factor pronóstico en cuanto a la supervivencia a largo plazo [2]. El sistema de estadificación TNM basado en American Joint Committee on Cáncer (AJCC) se acepta ampliamente ahora [3]. La tasa de supervivencia a 5 años de los pacientes en la etapa N0 después de la cirugía fue del 86,1%, mientras que los pacientes en estadio N1, N2, N3 y se redujo a 58,1%, 23,3% y 5,9%, respectivamente [4].
En la actualidad, muchas técnicas de imagen se han utilizado para evaluar el cáncer gástrico, incluyendo la ecografía abdominal, ecografía endoscópica (EUS), espiral multicorte computarizada, resonancia magnética convencional, y la FDG-PET. Sin embargo, estos métodos de imagen no pueden confirmar de forma fiable o descartar la presencia de metástasis en los ganglios linfáticos [1]. Un meta-análisis mostró que el promedio de sensibilidad y especificidad en la determinación de LN metástasis fueron los siguientes: 39,9% y 81,8% para la ecografía abdominal, 70,8% y 84,6% para la ecografía endoscópica, 80,0% y 77,8% para la TCMD, 68,8% y 75,0% para la resonancia magnética convencional, 34,3% y 93,2% para la PET-FDG, y el 54,7% y el 92,2% de la FDG-PET /CT [2]. Cualquier solicitud única de estas herramientas de imagen no puede evaluar satisfactoriamente el estado de los ganglios linfáticos cáncer gástrico. La razón es que diagnosticamos principalmente LNM por el tamaño de los ganglios linfáticos. Los criterios de diagnóstico intervalo de 5 mm a 10 mm [2]. Sin embargo, los ganglios linfáticos grandes pueden ser causados por la inflamación y los pequeños ganglios linfáticos pueden ser metastásico. Muchos estudios han demostrado que la metástasis gástrica LN cáncer se asoció con el tamaño del tumor, profundidad de la invasión, el tipo histológico y patológico afectación linfática [5-8]. No existe un método adecuado para combinar la linfa tamaño de los ganglios con los múltiples factores descritos arriba para hacer un análisis exhaustivo. Cómo integrar los complejos factores que afectan a los ganglios linfáticos y mejorar la exactitud de diagnóstico de MNV es el tema de nuestro estudio.
En la última década, los métodos de aprendizaje automático, complementarios a los métodos estadísticos tradicionales, se han utilizado para predecir los fenómenos biológicos complejos . Apoyo Vector Machine es una nueva generación de algoritmos de aprendizaje desarrollados sobre la base de la teoría estadística. El algoritmo SVM tiene un fuerte fundamento teórico, basado en las ideas de VC (Vapnik Chervonenkis) dimensión y la minimización del riesgo estructural. la precisión que se han cumplido [9]. SVM se ha utilizado en algunas aplicaciones médicas, principalmente en la biología molecular y de neuroimagen [10-12]. Se puede utilizar para la clasificación y la regresión. Dado un conjunto de ejemplos de entrenamiento, cada uno marcado como perteneciente a una de dos categorías, un algoritmo de entrenamiento de SVM construye un modelo que predice si un nuevo ejemplo cae en una u otra categoría. México La finalidad de este estudio es utilizar SVM método para analizar la información de las imágenes MDCT relacionada con el comportamiento biológico del cáncer gástrico y establecer los modelos matemáticos para evaluar la metástasis de ganglios linfáticos antes de la operación.
Métodos los pacientes
Este estudio retrospectivo fue aprobado por el comité de revisión institucional. Entre abril de 2006 y septiembre de 2008, 368 pacientes consecutivos con cáncer gástrico recién diagnosticado se administraron aumento del contraste exámenes de TC abdominal preoperatorios y luego recibieron la gastrectomía en nuestro hospital. Los pacientes correspondían a los criterios de inclusión y exclusión a continuación fueron incluidos en este estudio.
Los criterios de inclusión
los pacientes recibieron gastrectomía radical y D2 ganglios linfáticos disección. Fueron examinados antes de la operación con múltiples CT fila detector. Todos los pacientes fueron confirmados como cáncer gástrico por histopatología postoperatorio. Los criterios de exclusión Estados Unidos La pacientes recibieron terapia neoadyuvante preoperatoria. metástasis a distancia se encontró en el examen preoperatorio o en la operación
Finalmente, 175 pacientes (125 varones, 50 mujeres, edad media, 59,8 años, rango 30-85 años). comprendidas nuestra población de estudio. Se obtuvo el consentimiento informado de todos los pacientes seleccionados con anterioridad al curso clínico de rutina de exámenes de TC
Protocolo CT
TCMD se realizó con un 64 detectores escáner TC de hilera (LightSpeed 64, GE Healthcare, Milwaukee, WI).. Cada paciente ayunó durante más de 8 horas antes del examen de TAC. Para habilitar la distensión gástrica y reducir la motilidad gástrica, los pacientes recibieron 8 cristales productores de gas g por vía oral y una inyección intramuscular de 10 mg anisodamina 10-15 minutos antes del examen. TC sin contraste del abdomen superior de las cúpulas diafragmáticas a 2 cm por debajo del borde inferior del cuerpo gástrico con aire distendido fueron adquiridas con una colimación de 0.625 mm, 120-140 kVp y mAs 300-350. Posteriormente, un total de 100 ml de iopromida (Ultravist; Schering, Berlín, Alemania) se administró por vía intravenosa a través de un catéter angiográfico de calibre 18 insertada en una vena antecubital en 3 mL /seg mediante el uso de un inyector automático. TC con contraste se realizaron en la fase arterial (30 segundos) y en la fase venosa portal (70 segundos). Hicimos la reconstrucción multiplanar la imagen fase venosa portal con. Análisis de Imagen editorial
dos radiólogos, uno con 3 años y el otro con experiencia 8 años en el TC abdominal realizado análisis de imágenes de forma conjunta a un acuerdo. Si hay desacuerdo, se consultó con otro radiólogo que tenía 20 años de experiencia en la TC abdominal hasta que se logró un acuerdo. Medimos y cuentan los seis indicadores en las imágenes MDCT por las manos de la siguiente manera:
diámetro máximo del tumor
Medir el diámetro del cáncer gástrico en la dirección axial, coronal y sagital imágenes basa las imágenes MPR. Y decidir el diámetro máximo del tumor. Se determinó la clasificación de tumores
cáncer gástrico precoz o la clasificación Borrmann de cáncer avanzado en las imágenes MPR.
Serosal invasión
imágenes axiales y MPR se evaluaron de forma simultánea para determinar la serosa invasión. Toda la pared del estómago engrosamiento anormal mejorada y estructuras lineales o reticular en la capa de grasa que rodea el estómago indica invasión serosa [13].
Número de ganglios linfáticos comentario El número de todos los ganglios linfáticos regionales gástricos visibles en las imágenes MDCT por grupos se contó [14].
el tamaño máximo de los ganglios linfáticos
se midió el eje corto de los más grandes de los ganglios linfáticos detectado en las imágenes de TC
. ganglios linfáticos estación de México la estación de ganglios linfáticos con imágenes basadas MDCT se determinó en la clasificación japonesa de carcinoma gástrico [14].
máquina de vectores de soporte
máquinas de vectores soporte es una técnica de aprendizaje automático supervisado que se utiliza ampliamente en los problemas de reconocimiento de patrones y clasificación. algoritmo SVM realiza una clasificación mediante la construcción de un hiperplano multidimensional que discrimina de forma óptima entre dos clases, maximizando el margen entre dos grupos de datos. Este algoritmo logra un alto poder de discriminación mediante el uso de funciones no lineales especiales llamados núcleos de transformar el espacio de entrada en un espacio multidimensional [15]. En este estudio, un software SVM disponible libre llamado LibSVM 2.89 se utilizó para generar el modelo SVM [16]. Los índices de entrada fueron los seis indicadores recogidos en las imágenes MDCT anteriores. Para estos indicadores, los datos de medición se podrá incorporar al modelo SVM directamente. Si bien los datos de conteo deben ser definidos como algunos números. Por ejemplo, la invasión serosa positiva se definió como 1 y negativo fue -1. El índice de producción fue la metástasis de los ganglios linfáticos del paciente. Se confirmó por la cirugía y la histopatología. Si el paciente tiene uno o más nodos linfáticos metástasis, se consideró como positivo MNV. Definimos la MNV positivo como 1 mientras que el negativo fue -1. Elegimos el RBF kernel para construir el modelo. Para entrenar y probar nuestro modelo SVM, se utilizó una técnica de aprendizaje de máquinas estándar llamado k-veces la validación cruzada. Porque todo el tamaño de la muestra de nuestro estudio no era muy grande, hemos utilizado 5 veces la validación cruzada. Los datos enteros se dividieron en 5 subconjuntos iguales y distintos. Cuatro de estos subconjuntos se combinan y se utilizan para el entrenamiento, y el conjunto restante se utiliza para la prueba. Este proceso de validación cruzada se repitió 5 veces, permitiendo que cada subconjunto de servir a la vez como el conjunto de datos de prueba del análisis estadístico.
Un análisis estadístico univariado utilizando la estadística versión paquete de software 11.5 (SPSS Inc, IL SPSS /PC +, Chicago, EE.UU.) se realizó para evaluar las diferencias de seis indicadores de formación de imágenes entre los pacientes que tuvieron LNM o no. Los métodos de análisis estadísticos fueron las muestras independientes de prueba T y la prueba de Mann-Whitney. P < 0,05 se consideró diferencia significativa. característico (ROC) curva de funcionamiento del receptor se utilizó para evaluar el rendimiento diagnóstico del modelo SVM. El software de la versión 11.2 Medcalc (Medcalc, Medcalc Software, Gante, Bélgica) fue utilizado para hacer las curvas ROC y compararlas. En resumen, un promedio del área bajo la curva (AUC) de las curvas ROC de la 5-veces la validación cruzada. También contamos con los medios de sensibilidad y especificidad. Para comparar con el modelo SVM, se construyó la curva ROC para la evaluación del radiólogo mediante el uso máximo de tamaño de los ganglios linfáticos como criterios para clasificar la MNV. La sensibilidad y especificidad de la mejor punto de corte se contaron.
: Resultados de la En estos 175 casos, hubo 134 casos que tenían metástasis en los ganglios linfáticos y 41 casos no era así. características clínico-patológicas de los pacientes se detallan en la Tabla 1. Se recogieron los seis indicadores en las imágenes MDCT. Los resultados del análisis estadístico univariado indicaron que la todos los seis indicadores que incluyen invasión serosa, la clasificación de tumores, el diámetro máximo del tumor, el número de ganglios linfáticos, el tamaño máximo de los ganglios linfáticos y la linfa estación de nodos fueron significativas diferente entre el grupo positivo y negativo MNV (P < 0,001). Los medios de tumor de diámetro máximo, número de ganglios linfáticos y el tamaño de los ganglios linfáticos máxima en el grupo positivo MNV fueron 56,6 ± 19,5 mm, 10,0 ± 5,5 mm, y 12 ± 8, respectivamente. Todos eran mayores que las del grupo LNM negativo (Tabla 2) .table 1 Características de los pacientes
características clinicopatológicas
Valor
No. de los pacientes
175
media de edad (y)
59,8 (30-85)
proporción de mujeres y hombres de 50: 125
Histopatología
Adenocarcinoma
173 ( 98,9%)
bien diferenciado página 6 (3,4%)
moderadamente diferenciado
91 (52%)
pobremente diferenciado
76 (43,5%)
carcinoma de células pequeñas
2 (1.1%)
metástasis de ganglios linfáticos positivos
134 (76,6%) negativo
41 (23,4%)
Nota .-- los números entre paréntesis son los rangos.
Tabla 2 datos del paciente: los datos de los indicadores de 6 'de las imágenes MDCT y los resultados del análisis estadístico univariado
los datos del paciente
MNV (. -) guía empresas MNV (+)
valor de p
La paciente número
41/175 (23,4%)
134/175 (76,6%)
Los datos de medición *
diámetro máximo del tumor (mm)
39,0 ± 17,0 56,6 ± 19,5
Hotel < 0,001
El tamaño máximo de los ganglios linfáticos (mm)
6.5 ± 2.8
10.0 ± 5.5 Hotel < 0,001
número de ganglios linfáticos página 7 ± 4 12 ± 8
Hotel < 0,001
recuento de datos #
Serosal invasión Hotel < 0,001
Sí
15/175 (8,6%)
120/175 (68,6%)
Sin
26/175 (14,8%)
14/175 (8%)
clasificación de tumores Hotel < 0,001
cáncer gástrico precoz
9/175 (5,1%)
1/175 (0,6%)
BorrmannI
2/175 (1,1%)
0/175
BorrmannII
3/175 (1,7%)
9/175 (5,1%)
Borrmann III
27/175 (15,4%)
121 /175 (69,1%)
Borrmann IV
0/175
3/175 (1,7%)
ganglios linfáticos estación Hotel < 0,001
Station1
29/175 (16,6 %)
44/175 (25,1%)
Station2
12/175 (6,9%)
54/175 (30,9%)
Station3
0/175
36 /175(20.5)
* el valor de los datos de medición era la media ± desviación estándar. El valor de p fue de T para muestras independientes de pruebas.
# El valor de los datos de recuento fue la cantidad de datos. El valor de p fue de prueba de Mann-Whitney. México La radiólogo logra una AUC de 0,757 clasificar como metástasis de los ganglios linfáticos del paciente por tamaño máximo de los ganglios linfáticos. El mejor punto de corte del tamaño máximo de los ganglios linfáticos fue de 7,7 mm. La sensibilidad y especificidad fueron sólo 63,4% y 75,6%. medio de la sensibilidad, especificidad y AUC con 5 veces la validación cruzada de la SVM fueron 88,5%, 78,5% y 0,876, respectivamente (Tabla 3). En comparación con el radiólogo, cada AUC de los modelos SVM de validación cruzada de 5 veces realiza significativamente mejor (P < 0,05) que el radiólogo (Figura 1, Tabla 3). Figura 1 curva ROC para MNV. Curva de eficacia diagnóstica (ROC) para la metástasis en los ganglios linfáticos con 5 veces SVM modelos de validación cruzada y radiólogo. El AUC de K1 a K5 modelos SVM fueron 0,862, 0,866, 0,878, 0,900 y 0,876, respectivamente. En comparación con el radiólogo, los valores de p eran todos de menos de 0,05 (Tabla 3). Para los cinco modelos de SVM, la media de AUC era 0.876. Y el AUC de tamaño LN basado radiólogo era 0.757.
Tabla 3 AUC del modelo SVM y el radiólogo
Model
K-fold
Sensitivity
Specificity
AUC*
P valor (AUC en comparación con el radiólogo) guía empresas SVM
K1
0,881 0,780
0,862 ± 0,038 0,002
K2
0,866 0,780
0,866 ± 0,037 Hotel < 0,001
K3
0,858 0,805
0,878 ± 0,033 Hotel < 0,001
K4
0,933
0,780 0,900
± 0,031 Hotel < 0,001
K5
0,888 0,780
0,876 ± 0,038 Hotel < 0,001
significa
0,885
0,785 0,876
radiólogo
0,634 0,756
0,757 ± 0,042
La sensibilidad, la especificidad y el ABC de los modelos de validación cruzada SVM 5 veces y el radiólogo para el diagnóstico de metástasis en los ganglios linfáticos del paciente.
* El valor de los datos fue AUC ± desviación estándar.
nodo linfático metástasis Discusión
afecta el tratamiento quirúrgico de los pacientes con cáncer gástrico y es también un factor importante en el pronóstico. En la actualidad, el diagnóstico preoperatorio depende principalmente de varios métodos de imagen. El estándar para juzgar la metástasis de los ganglios linfáticos se basa en indicadores morfológicos. tamaño de los ganglios linfáticos es el indicador dominante. Sin embargo, Dorfman RE et al informaron de que los límites superiores de lo normal para el tamaño de los ganglios linfáticos en la tomografía computarizada abdominal variaron de 6 a 11 mm [17]. Ellos en parte se superponen con la linfadenopatía maligno. Fukuya T et al demostraron que la atenuación CT y la configuración de los ganglios linfáticos podrían ayudar en el diagnóstico de adenopatías malignas [18]. Por el contrario, Deutch SJ et al expresó que el tamaño, la ubicación, el contorno, la densidad no era útil para distinguir benigna de linfadenopatía maligna [19]. La falta de criterios para la evaluación es el principal obstáculo para la predicción de metástasis de ganglios linfáticos antes de la operación.
El comportamiento biológico del cáncer gástrico refleja el rendimiento histopatológico de malignidad y la invasión del tumor. Afecta a la metástasis de ganglios linfáticos, directa o indirectamente. La manifestación concreta del comportamiento biológico incluye, por ejemplo, el tamaño del tumor, profundidad de la invasión, invasión tumoral de otros órganos, la metástasis de los ganglios linfáticos y metástasis a distancia. TCMD puede mostrar claramente estos sucesos patológicos. Algunos estudios han informado de que la exactitud de la estadificación del cáncer gástrico T con TCMD combinado con reconstrucción 3D fue 84-89% [20, 21]. Zhang XP et al informaron que el número de ganglios linfáticos detectadas por TCMD mostró una diferencia significativa entre el grupo de metástasis en ganglios linfáticos y ningún grupo de metástasis en el cáncer cardíaca [22]. TCMD también puede indicar la situación en otros órganos abdominales y el peritoneo. Por lo tanto, las imágenes MDCT puede reflejar con precisión el comportamiento biológico de la histopatología cáncer gástrico. El análisis univariante en nuestro estudio mostró que los 6 indicadores de información sobre el cáncer gástrico y los ganglios linfáticos en todas las imágenes de la TC tienen una relación con MNV. Así que debemos tener en cuenta estos factores de comportamiento biológico integral en la predicción de MNV.
Hubo algunos otros métodos de aprendizaje de máquinas utilizadas en los estudios médicos. El método era principalmente la red neuronal artificial (ANN). ANN se considera que es un método apropiado para el análisis de datos médica [23]. Bollschweiler et al aplicar un perceptrón de una sola capa, que es una especie de ANN, para predecir los ganglios linfáticos de metástasis en el cáncer gástrico. La precisión de ANN fue del 79% [24]. Sin embargo, la ANN tenía algunas desventajas. El modelo de RNA es propenso a sobreajuste. Se requiere largo tiempo de desarrollo y optimizar. Ellos fueron más difíciles de utilizar en el campo debido a los requisitos computacionales [25]. En consideración de lo anterior, se seleccionó el modelo SVM lugar. La SVM podría producir error de predicción menor en comparación con los clasificadores basados en otros métodos como las redes neuronales artificiales [26]. En comparación con ANN, SVM puede tener la misma capacidad aún mejor predictivo [27, 28]. En la actualidad, hay pocos informes sobre la aplicación de SVM en gástrica linfático cáncer de metástasis en los ganglios. Como un estudio preliminar, nuestros resultados indican que el modelo SVM tiene mejor capacidad de diagnóstico en MNV que los criterios tradicionales de tamaño LN. Las AUC han logrado un buen poder de diagnóstico. Con nuevas mejoras, SVM puede llegar a ser un método eficaz para predecir los ganglios linfáticos estadificación del cáncer gástrico.
Conclusiones
Basado en información comportamiento biológico del cáncer gástrico en las imágenes MDCT, modelo SVM puede ayudar a diagnosticar la metástasis en los ganglios linfáticos antes de la operación.
Declaraciones
Agradecimientos agradecemos
Jie Li, Cui Yong, Li-Ping Qi, Xiao-Ting Li por su apoyo editorial y Jun Shan, Ning Wang, Li Ying, Shun-Yu Gao para revisar el manuscrito.
Proyecto apoyado por la Fundación Nacional de Ciencias Naturales de China (subvención Nº 30.970.825) y la Fundación Municipal de Beijing de Ciencias Naturales (Nº 7092020). archivos originales presentados
de los autores de las imágenes
a continuación se presentan los enlaces a los autores "original expediente sometido a las imágenes. 12885_2010_2503_MOESM1_ESM.jpeg archivo original de los autores para la figura 1 Conflicto de intereses México La autores declaran que no tienen intereses en competencia.