Este artigo tem aberto pares Análise dos relatórios disponíveis.
Como o Aberto de Pares trabalho Review?
Otimizando o poder de diagnóstico com gástrica cintilografia esvaziamento em vários pontos no tempo da arte abstracta
Background
Esvaziamento gástrico cintilografia (GES) em intervalos de mais de 4 horas após uma refeição radio-marcada padronizado é geralmente considerado como o padrão ouro para o diagnóstico de gastroparesia. Os objetivos deste estudo foram: 1) para investigar o melhor ponto de tempo e a melhor combinação de múltiplos pontos temporais para o diagnóstico de gastroparesia com medidas GES repetidas, e 2) para contrastar e cross validar-Linear Discriminante Análise de Fisher (LDA), um posto Distribuição abordagem baseada gratuito (DF), eo modelo de classificação e regressão Tree (CART).
Métodos
um total de 320 pacientes com medidas GES a 1, 2, 3 e 4 horas (h) depois de um padrão refeição usando um método padronizado foram coletados retrospectivamente. Área sob a (ROC) Receiver Operating Characteristic ea taxa de classificação errada através de canivete validação cruzada foram utilizados para comparação de modelos.
Resultados
Devido à forte correlação e uma anormalidade na distribuição de dados, nenhuma melhoria substancial no diagnóstico poder foi encontrado com a melhor combinação linear pela abordagem LDA mesmo com a transformação de dados. Com o método DF, a combinação linear de 4-H e 3-h aumentou a área sob a curva (AUC) e diminuíram o número de falsos classificações (0,87; 15,0%) ao longo de pontos de tempo individuais (0,83, 0,82; 15,6%, 25,3 %, para 4-h e 3-h, respectivamente), a um nível de sensibilidade mais elevada (sensibilidade = 0,9). O modelo CART usando 4 por hora medições GES junto com a idade do paciente era a ferramenta de diagnóstico mais preciso (AUC = 0,88, classificação errada = 13,8%). Os pacientes que têm a 4 h valor >gástrica retenção;. 10% eram 5 vezes mais propensos a ter gastroparesia (179/207 = 86,5%) do que aqueles com ≤10% (18/113 = 15,9%)
Conclusões
com um grupo misto de pacientes ou encaminhados com suspeita de gastroparesia ou investigada por outras razões, o modelo CART é mais robusto do que as abordagens LDA e DF, capaz de acomodar os efeitos covariáveis e pode ser generalizado para aplicações multi-institucional, mas poderia ser instável se tamanho da amostra é limitado.
Fundo
esvaziamento gástrico cintilografia em intervalos ao longo de 4 h após uma refeição padronizada é comumente considerada como o padrão ouro para medir o esvaziamento gástrico vezes. Na prática, uma medida horária simplificada do conteúdo gástrico residual é utilizada para o diagnóstico de gastroparesia definido como retardada Esvaziamento Gástrico (GE), na ausência de obstrução mecânica [1, 2]. A comida técnica mede o rádio-marcado remanescente no estômago em intervalos de uma hora após paciente ingere uma refeição padronizada [3] como um indicador da GE retardada. Devido às diferenças nos alimentos utilizados, técnicas utilizadas e desfechos medidos com GES, análise e interpretação dos resultados variam entre as instituições [4]. A maioria dos estudos anteriores mostraram que atrasou o esvaziamento gástrico pode ser melhor indicado com retenção gástrica de > 10% em 4 h após a refeição, que foi estabelecido como o percentil 95 na retenção gástrica com voluntários normais através de um estudo multicêntrico [5, 6] . Como sempre, uma decisão diagnóstica baseado em distribuição é arbitrária e pode inevitavelmente provocar o erro devido a erros de classificação. Relata-se que a abordagem simplificada tem uma especificidade de 62% e uma sensibilidade de 93% [7]. Outros usam a retenção por cento a 2 h como as medidas clínicas de rotina de [8] GES, sugerindo GES a 2-h ou 3 h pode ser o melhor ponto de tempo individual com maior poder diagnóstico. No entanto, as retenções gástricas por cento em momentos diferentes também podem estar sujeitos a idade e sexo do paciente [5]. A falta de padronização na condução de GES, juntamente com diferenças na análise quantitativa utilizados em diversas instituições podem limitar a utilidade clínica do teste e apresenta problemas se os dados multi-institucional precisam ser avaliados. Em 2008, em nome da neurogastroenterologia Americanos ea sociedade motilidade e da Sociedade de Medicina Nuclear, pesquisadores de 13 instituições americanas médicos em conjunto emitido uma declaração de consenso para a normalização dos GES entre as instituições [4]. Além disso, os problemas que requerem investigação foram identificados pelo consenso que incluem: 1) utilização de 3-h comparado com 2- e 4-h resultados para a detecção de GE retardada; e 2) o uso de múltiplos pontos de tempo (2 e 4 h) versus valores 2 ou 4 h individuais para uma maior compreensão do significado clínico dos resultados discordantes entre 2 e 4 h scans.
Metodologia sobre o uso diferentes marcadores de diagnóstico para detectar doenças ou avaliar os riscos relacionados com a saúde tem sido um campo ativo de pesquisa [9-11]. Com os rápidos avanços em tecnologias de genômica e proteômica, o foco na detecção da doença com base em biomarcadores e avaliação de risco mudou agora de um único biomarcador a um painel de biomarcadores uma vez que diferentes marcadores podem ser sensíveis a diferentes aspectos de uma doença [12]. Argumenta-se que, em comparação com um único marcador clínico ou genético, um painel de múltiplos marcadores podem conter um nível mais elevado de informação discriminatória, especialmente em grandes populações heterogéneas de pacientes e para doenças multicelulares complexos. Isto é importante porque o uso de vários marcadores simultaneamente pode levar a uma nova medida de diagnóstico com maior sensibilidade [11].
Quando vários marcadores são contínuas e normalmente distribuído, LDA de Fisher fornece a melhor combinação linear que maximiza a sensibilidade em toda a faixa especificidade uniformemente sob o modelo de distribuição normal multivariada [11]. Quando os valores de marcador desviar-se normal, uma transformação de energia de Box-Cox pode ser utilizado para melhorar o ajuste normais [13]. Esta abordagem foi encontrado eficaz em estimar as curvas ROC AUC e se os verdadeiros distribuições subjacentes, quer no original ou em uma escala transformada, estão perto de normal multivariada [11]. Caso contrário, uma abordagem livre de distribuição de classificação, com base pode ser aplicada. Os aspectos teóricos da melhor combinação linear para biomarcadores estão bem relatados [[9, 11, 14-19] e [20]]. LDA de Fisher é mais fácil de calcular, embora a abordagem DF é mais robusto ao desvio da distribuição normal, mas é computacionalmente proibitivo, se mais do que dois marcadores estão envolvidos [19]. Nós usamos as estimativas dos parâmetros de LDA como um ponto de partida para a pesquisa grade com DF se o espaço marcador vai além bilateral. O modelo de carrinho, por outro lado, oferece uma outra abordagem para optimizar o poder de diagnóstico quando os marcadores são multi-dimensional [21-23]. Em vez de criar uma nova medida de diagnóstico como LDA ou DF, CART utiliza um processo sequencial para identificar o conjunto de variáveis de previsão, em sua escala original, que melhor grupos de diferenciar entre a variável desfecho de interesse. É particularmente útil quando existem muitas variáveis de previsão que são altamente correlacionadas. É computacionalmente menos intensiva e fácil de interpretar, mas pode ser instável se o modelo não está suficientemente treinado com dados limitados.
Maioria dos estudos anteriores se concentrar em derivar a melhor combinação de marcadores que maximiza AUC para indivíduos cujo estado de doença era conhecida [11 , 14-20]. Não está claro se o poder de diagnóstico para uma tal combinação se estende para a população com valores de marcação conhecida, mas o estado da doença ou desconhecido para a população cujos valores marcador não são utilizados para derivar os parâmetros de diagnóstico. Com uma refeição padronizada (ver Materiais e Métodos) e a técnica horária GES (cinco sessões 2 minutos de imagem) durante período de 4 horas, é necessário menos tempo câmera enquanto resultados podem ser reprodutível de hospital para hospital. Este artigo avalia as opções estatísticos que otimizam o poder de diagnóstico com medidas GES em alguns momentos. Usando o diagnóstico clínico preliminar, definida por sintomas tais como náuseas, vómitos, saciedade precoce, plenitude pós-prandial, desconforto abdominal, e dor, em adição aos elementos de prova de esvaziamento gástrico retardado, na ausência de obstrução da saída gástrica mecânica, como o verdadeiro estado de gastroparesia , este estudo se concentra em encontrar os parâmetros da melhor combinação linear de GES em diferentes pontos de tempo com dados de treinamento, então, investiga e cross-valida seu desempenho em dados de teste que não foi utilizada para obter o modelo.
Métodos
a curva Receiver Operating Characteristic (ROC) e a área sob a curva, em particular, é uma medida simples e significativo para avaliar a utilidade de um marcador de diagnóstico (s) [10]. Ao longo deste trabalho, ROC e AUC são usados para comparar entre diferentes métodos e vários modelos para o melhor poder diagnóstico de gastroparesia. A soma de diagnósticos falsos positivos e falsos negativos ao longo de toda a amostra foi usado para contrastar o poder de diagnóstico entre LDA, DF e CART através de canivete (tomar um fora) validação cruzada.
Abordagem linear discriminante de Fisher (LDA)
Vamos w
ij
representa o i
th
valor marcador da j
th
sujeitos no grupo de doentes; e v
ik
ser o i
th
valor marcador do k
th
sujeitos no grupo de controlo; onde eu
= 1, ..., p; J
= 1, ..., m; e k
= 1, ..., n.
Suponhamos que X e Y são vectores de valores de marcação com distribuição normal multivariada para os grupos de doentes e de controlo, respectivamente, em seguida, (1) O vector de coeficiente, α
p × 1, para a melhor combinação linear do vector marcador combinados dos grupos de doentes e de controlo sob os critérios ROC é: (2) a AUC sob a curva ROC é: (3) Onde, Φ denota o padrão acumulativa . função de distribuição normal
a especificidade (F a (c)) e Sensibilidade (H a (c)) são: (4) (5) distribuição baseada Posto abordagem gratuito (DF)
sob a abordagem livre distribuição baseada classificação [19], a AUC pode ser calculada como a estatística de Mann-Whitney U [24]: (6) Note, para distribuição contínua, Pr (I
= 1/2) = 0.
Onde, w
ij
é o i
th valor marcador para o j
th sujeitos no grupo de doentes; v
ik
é o i
th valor marcador para o k
th sujeitos no grupo de controlo; i, j, k, m
, e n
tal como definido na secção anterior; AUC
(α
) é a área sob a curva de abordagem livre de distribuição com vetor de coeficientes ótimo (α). Desde ROC é invariante para monótona crescente transformação, as α coeficiente vetor
tanto LDA e abordagens DF pode ser redimensionada como (1, β 2 /β 1, β 3 /β 1, ... β i /β 1), onde β i /β 1 representa o peso para o i
th valor marcador relativo ao marcador 1 [19] modelo.
Classificação e Árvores de Regressão (CART)
ao contrário LDA ou DF, metodologia CART identifica o conjunto de preditores de todas as variáveis que melhor diferenciam classes no resultado de interesse em um processo sequencial. A cada passo (nó), o algoritmo CART primeiro identifica o melhor preditor de todas as variáveis candidatos e, em seguida, procura através de todos os valores para o melhor preditor, mas usa apenas um ponto de corte para dividir a amostra dentro do nó em dois sub-ramos. Em seguida, ele procura através de todas as variáveis de previsão e identifica o melhor ponto de corte do melhor preditor dentro de cada sub-ramo e repete o processo até a determinados critérios, tais como a variância mínima ou de um tamanho mínimo de grupo, em todos nós terminais é cumprida. Em cada nó, CART busca para classificar a amostra em grupos de tal forma que a homogeneidade máximo de nós filhos é atingido. Quando um nó terminal é alcançado, o modelo dá a probabilidade de pertença a uma categoria especial para todos os indivíduos restantes que se enquadram nesse nó. Na prática, o tamanho mínimo do nó é geralmente fixada em 10% da amostra de aprendizagem para evitar potencialmente ao longo do ajuste do modelo de modo que a árvore de decisão final é mais provável que seja útil para a classificação de populações com características semelhantes como a da amostra de aprendizagem, mas estava não usar para determinar o modelo CART. Em contraste com a abordagem LDA, carrinho pode ser especialmente útil quando os padrões de correlação entre as variáveis de previsão não são consistentes ao longo de toda a gama, uma vez que não é necessário para a mesma variável a ser óptimo para todos os nós de ramificação de toda a árvore de [22].
parâmetro de estimativa
para abordagem LDA, que escreveu um programa SAS /IML [25] para o cálculo da média (m), a variância (S) para os grupos de doentes e de controle, e todas as estimativas de parâmetros são descritos no método seção. Em primeiro lugar, os α coeficiente vetor
, a AUC para a combinação linear, bem como para os marcadores individuais, foi obtido com as equações (2) e (3) a partir dos dados de formação. Em seguida, o coeficiente α
foi aplicado aos dados de teste correspondentes a obter a pontuação combinação linear. Três valores de limiar correspondentes para os níveis de sensibilidade de 0,7, 0,8, e 0,9 para o marcador combinação linear foram obtidos com os dados utilizando gastroparesia na equação (5). Cada valor de limiar foi utilizado nos dados deixados de fora para classificar o caso em grupo, quer doente ou não doente. O estatuto previsto foi depois atravessar tabulados com a categoria doença conhecida.
A abordagem DF começou com um ponto de partida arbitrário e, em seguida, grade procurou os coeficientes que maximizam a estatística de Mann-Whitney com os dados de treinamento nas etapas seguintes.
1) a pontuação combinação linear para cada observação foi obtida multiplicando o marcador vector X com um vetor de coeficientes de partida, α
(1, α
). Página 2) a AUC correspondente a o vetor de coeficientes α
é calculada com a equação (6).
3) Repita as duas primeiras etapas para cada vetor de coeficientes possível e agregar o correspondente AUC e α
.
4) Selecione o coeficiente que maximizada a AUC e a identificar o valor de pontuação combinação linear crítica a 0,7, 0,8, 0,9 e os níveis de sensibilidade.
5) Aplicando o coeficiente do passo 4 para os dados de teste para se obter a melhor pontuação combinação linear.
6) Uso cada valor crítico a partir do passo 4 em dados de teste para prever cada caso em qualquer doente ou não doente grupo, depois de atravessar tabular com a categoria doença conhecida. Compra de modelo CART, foi utilizado o pacote de árvore dentro R [26] ambiente para cada uma das quatro medidas de hora em hora, e sua combinação, juntamente com a idade e sexo do paciente para identificar o melhor modelo. Validação cruzada com um tamanho mínimo de 10 indivíduos para cada nó terminal foi usado para otimizar o modelo de árvore de decisão usando todas as observações [27]. AUC para cada árvore de decisão otimizada foi calculado para comparar todos os modelos. Em seguida, uma observação foi feita a partir de toda a amostra, e os restantes objectos utilizados para construir a árvore de decisão, que por sua vez foi utilizado para prever o estado de doença da observação deixado de fora. Desempenho para cada árvore de decisão foi resumido com o número total de previsões erradas em toda a amostra.
Dados Gastroparesis
Um total de 320 prontuários de pacientes com idade entre 16 ~ 89 (42,8 ± 14,3 (média ± std)), 255 (79%) do sexo feminino, com as medidas GES em 1 h, 2 h, 3 h e 4 h após uma refeição padrão, utilizando um método padronizado (5) foram coletados retrospectivamente no The University of Kansas Medical Center (KUMC). O protocolo do estudo foi aprovado pelo Institutional Review Board (IRB) em KUMC. Durante a medição GES, a fracção de alimentação consumida e o tempo necessário para o consumo foi gravado. Indivíduos com alimentação por cento incomum consumido (por exemplo, < 20% da refeição) /tempo de consumo (por exemplo, > 30 minutos) foram excluídos. Todos os pacientes eram ou encaminhados com suspeita de gastroparesia ou investigada por outras razões por causa da auto relataram sintomas como náuseas, sensação de plenitude, saciedade precoce, vómitos e inchaço. Com base na avaliação global, além de medidas GES por hora, os médicos estudo diagnosticados 197 (62%) dos 320 pacientes com gastroparesia como a principal razão para os sintomas clínicos acima mencionados e os seus visitas ao hospital. Apesar das experiências médicas similares, excepto gastroparesia doenças foram considerados como os diagnósticos primários para os 123 pacientes restantes. Não houve diferença significativa na média de idade (p = 0,12, pelo teste t) e sexo (p = 0,99, por χ 2 de teste) foram encontrados entre os grupos com e sem gastroparesia. Para cada paciente, cintilografia esvaziamento gástrico foi realizada na manhã após um jejum de um dia para o outro com procinéticos parado durante pelo menos 3 dias. O método padronizado para o esvaziamento gástrico consiste em o equivalente a dois ovos mexidos (substituto de ovo) marcado com 99m Tc de enxofre-colóide, 2 pedaços de torrada com geléia, e 4 ml de água com um valor calórico total de 255 kcal. Anterior e imagens posterior do estômago foram tomadas imediatamente depois de comer, e depois de hora em hora durante 4 horas [28].
Resultados
durante a medição repetida de esvaziamento gástrico, por cento retenções do isótopo no estômago em 1-h, 2-h, 3-h e 4-h após a refeição diminuiu com o tempo e foram altamente correlacionados, especialmente para os machos e para os pacientes com gastroparesia. Coeficiente de correlação de Spearman variou de 0,34 (p < 0,001) entre 1-H e 4-H para pacientes sem gastroparesia a 0,93 (p < 0,001) entre os 3-H e 4-H para pacientes com gastroparesia. Em geral, a distribuição em percentagem de retenção desviado do normal, com os dois primeiros valores horários de inclinação para a extremidade inferior, e o segundo duas horas de inclinação para a extremidade superior (Figura 1). Figura retenção gástrica de 1 por cento a 1-H, 2-H, 3-H e 4-H após a refeição para caso (verde) vs. controlo (cinzento). 1-H-C, 2-H-C, 3-h-C, 4-H-C representa por cento de esvaziamento gástrico (GE) a 1-H, 2-H, 3-H e 4-H após a refeição para pacientes diagnosticados com gastroparesia; Bigode representa 70% intervalo interquartil.
Poderes de diagnóstico por LDA e abordagem DF
medidas de hora em hora em 3 h e 4-h foram previamente reportado como tendo o melhor utilitário de diagnóstico, que contrastava sua melhor combinação linear por ambos LDA ( Figura 2) e abordagens DF (Tabela 1). Primeiro, estimamos AUC para as duas medições, juntamente com o coeficiente ideal para a sua melhor combinação linear e os valores limite para a pontuação combinação linear de 0,7, 0,8, e 0,9 níveis de sensibilidade por tanto LDA e DF abordagens para todos, mas 1 em cada 320 assuntos. O coeficiente óptima, juntamente com os três valores de patamar, em seguida, foi aplicado ao indivíduo deixado de fora. Através da comparação dos valores de limiar com a pontuação combinação linear calculada, o estado gastroparetic previsto para o indivuo deixou-out foi gravado. As taxas de falso positivo negativo e falso foram obtidos repetindo o processo de canivete para todos os 320 indivíduos. Em seguida, uma transformação de energia de Box-Cox e aplicou-se a mesma análise foi repetida para os dados transformados. Figura 2 Operando Característica (ROC) Curva do Receiver para a retenção por cento horária em 2 h, 3 h, 4 h, e sua melhor combinação linear. Área Sob a Curva (AUC) aumentou de 2 a 4-h-h e maximizado com a melhor combinação linear de todas as três medições de hora em hora.
As estimativas dos parâmetros Tabela 1 (Área Sob a Curva (AUC) e o coeficiente de melhor combinação linear ) com Linear Análise de Fisher discriminante (LDA) e a distribuição gratuita (DF) se aproxima
página 4-h
3 h
combinação Linear combinação DF
Linear LDA
Raw
Tran
Raw
Tran
α
Raw
α
Tran
α
Raw
α
Tran
Mean
0.830
0.879
0.824
0.827
0.02
0.869
0.02
0.869
0.681
0.834
0.055
0.881
STD
0.002
0.001
0.002
0.002
0.00
0.001
0.00
0.001
0.032
0.002
0.002
0.001
Median
0.830
0.879
0.824
0.827
0.02
0.869
0.02
0.869
0.679
0.833
0.055
0.880
Range
0.013
0.009
0.011
0.009
0.00
0.008
0.00
0.008
0.284
0.012
0.017
0.009
Nota: Raw significa AUC para a medição em escala original;
Tran representa AUC para a medição em escala transformada;
α é o coeficiente para a melhor combinação linear para leituras no 3 h após a refeição
A melhor linear. combinações das duas medidas por hora aumentou o poder de diagnóstico de seus componentes individuais em ambas as abordagens (Tabela 2), mas o ganho foi limitado, 3,9% para o DF, e 0,4% para a abordagem LDA. Como esperado, a transformação de energia Box-Cox em marcadores individuais melhorou o poder diagnóstico pela melhor combinação linear com a abordagem LDA 4,7% do que a do measures.Table matéria-2 classificações Falsos (%) com canivete validação cruzada por discriminante linear de Fisher análise (LDA) e a distribuição gratuita (DF) se aproxima
3- h DF
4 h combinação DF
Linear combinação DF
Linear LDA
0,7
24 (19,5%)
59 ( 30,0%)
16 (13,0%)
59 (30,0%)
15 (12,2%)
58 (29,4%)
15 (12,2%)
64 (32,3% )
0,8
37 (30,1%)
39 (19,8%)
21 (17,1%)
40 (20,3%)
21 (17,1%)
40 ( 20,3%)
20 (16,3%)
46 (23,4%)
0,9
60 (48,8%)
21 (10,7%)
27 (21,9%)
23 (11,7%)
28 (22,8%)
20 (10,2%)
27 (22,0%)
22 (11,2%)
Nota:: modelo previu o estado da doença (1 para sim, 0 para não);
y
: status de diagnóstico da doença (1 para sim, 0 para não)
Com os dados em bruto, as diferenças na soma das taxas de falsos positivos e falsos negativos para o melhor. combinações lineares foram de 0,2%, 1,6% e -6,5% entre o DF e LDA abordagens aos 0,7, 0,8, e 0,9 níveis de sensibilidade. Enquanto as taxas de falsos negativos por parte da abordagem LDA mostrou grande desvio em relação ao correspondente aos níveis predefinidos limiares (≤3.0%), aqueles que pela abordagem DF estão relativamente perto (≤ ± 0,2%). A transformação de dados
melhorou o poder de diagnóstico das melhores combinações lineares para ambas as abordagens LDA e DF, diminuindo a soma de falsos negativos e taxas positivas falsas. As reduções são de 2,2%, 2,8%, 13,8% e -0,9%, -1,1%, 20,1% para as abordagens DF e LDA, respectivamente. Curiosamente, a maior melhoria no poder diagnóstico está no maior nível de sensibilidade para ambas as abordagens.
Poderes de diagnóstico com a abordagem CART
Sete modelos de árvore de decisão, incluindo o modelo completo (4 medições de hora em hora, juntamente com a idade do paciente), as combinações de 2-h e 4-h, 3-h e 4-h, juntamente com cada medidas de hora em hora, foram optimizadas através da árvore-poda com tamanho mínimo para o nó final de 10 sujeitos [26]. Para todos os modelos de ponto único tempo, a retenção por cento a 4-H tem a maior AUC de 0,865, seguido por 3-H, 2-H, e 1-H, respectivamente (Tabela 3). A taxa de diagnóstico falso pelo modelo de árvore de decisão com 4-h é de 14,4% (28 de 123 para pacientes sem gastroparesia, e 18 dos 197 para aqueles com gastroparesia), menos de metade das pessoas que seriam erroneamente diagnosticada por 1- h e pontos 2-h, e de 37% ((73-46) /73) menor do que 3 -at-h. Incluindo 2-h ou 3-H, juntamente com 4-h, com a árvore de decisão de não aumentar o número de diagnósticos correctos sobre o uso de 4-H sozinho, tal como indicado pela validação cruzada de canivete. Estes diferem dos resultados obtidos a partir de abordagens LDA e DF, em que a combinação linear de 3-H e 4-H apresentou ligeira melhoria em relação utilizando 4-H sozinho. No entanto, o modelo de árvore de decisão com qualquer um de 4 h sozinho ou sua combinação com 2-h ou 3 h não sofreu no utilitário de diagnóstico em comparação com os seus modelos de contrapartida identificados com qualquer LDA ou abordagem DF, independentemente de transformação de dados. O modelo CART usando todas as quatro medidas GES por hora, juntamente com a idade do paciente foi muito interessante. Para os critérios de retenção gástrica > 10%, a 4-H e < 53% em 2-H, pacientes > 47,5 anos de idade eram quase 2 vezes menos propensos a ter gastroparesia (probabilidade = 0,44) como aqueles com idade < 47.5 (probabilidade = 0,85) .table 3 falsos classificações (%) com canivete de validação cruzada, por Classificação otimizado e regressão Tree (CART) modelos
1-h
2 h
3 h
4 h
2 h + 4 h
3 h + 4 h
4 h + 3 h + 2 h + 1-h + Idade
76 (61,8%)
28 (22,8%)
29 (23,6%)
28 (22,8%)
28 (22,8%)
28 (22,8%)
26 (21,1%)
24 (12,2%)
69 (35,0%)
44 (22,3%)
18 (9,1%)
18 (9,1%)
18 (9,1%)
18 (9,1%)
total Misdiagnosis
100 (31,3%)
97 (30,3%)
73 (22,8%)
46 (14,4 %)
46 (14,4%)
46 (14,4%)
44 (13,8%)
AUC Para Otimizado Modelo
0,724
0,753
0,825
0,867
0,865
0,858
0,881
Nota:: modelo previu o estado da doença (1 para sim, 0 para não);
y
: diagnosticada estado da doença (1 para sim, 0 para nenhuma ).
Discussão
combinações lineares dos marcadores diagnósticos obtidos por LDA ou abordagem DF geralmente levam a poder discriminar mais elevados (maior AUC) do que com seus componentes individuais. Um estudo de simulação (resultados não mostram aqui) indicaram que quanto mais forte a correlação entre os marcadores individuais, quanto menor o aumento da AUC por sua combinação linear. O ganho potencial no poder diagnóstico, no entanto, diminui quando a correlação entre os marcadores individuais aumentar até 0,7 e acima. A eficácia da utilização de uma combinação linear diminui com o aumento em magnitude de desproporção em matrizes covariância entre os grupos de controlo e doentes.
Amostras de pequenas dimensões conduzir a grande variação nos coeficientes óptimas para melhor combinação linear e a AUC correspondentes, especialmente para o abordagem LDA. Como aumenta o tamanho da amostra, os coeficientes ideais e AUC por LDA ou métodos DF podem ou não podem aproximar-se uns aos outros, dependendo da distribuição de marcadores individuais. Os valores marcador
normal quando o valores de marcação são multivariada normal, as estimativas do LDA abordagem são muito próximo ao do método DF em termos de AUC, coeficientes óptimas, e o poder de diagnóstico, tal como indicado por simulação. Com distribuição normal e tamanho de amostra adequado, os dois primeiros momentos capturar parâmetro de localização e escala do marcador com pequena variação. Nesses casos, a abordagem LDA tem a vantagem na economia de tempo de computação (mais de 100 vezes menos) sem sofrer no poder preditivo do que a abordagem DF. No entanto, não pode superar LDA DF, enquanto a procura de grade coeficiente óptima com DF contém a estimativa pontual por LDA. Em outras palavras, a limitação com DF é em computação, em vez de metodologia.
Valores de marcação
não normal Quando a valores de marcação desviar distribuição normal, a abordagem DF sempre conduz a uma maior AUC para a melhor combinação linear, se a busca grelha para coeficientes ideais é bom o suficiente. O desempenho rebaixamento com a abordagem LDA é um resultado direto da utilização da técnica que é tendenciosa devido à anormalidade. distribuição exponencial, por exemplo, tende a ter uma longa cauda com um elevado grau de assimetria, que conduz a um significativo com uma polarização positiva. Como consequência, os desvios para marcadores são inflados e a AUC tende a ser menor. Mais importante, a melhor combinação linear obtida com a abordagem LDA tende a superestimar a taxa de falsos negativos e subestimar a taxa de falsos positivos no nível de sensibilidade mais baixa (Tabela 2), e fazer exatamente o oposto no nível de sensibilidade mais elevada. Pelo contrário, a melhor combinação linear pela abordagem DF é menos afetado por valores extremos e tende a ter maior poder diagnóstico, mantendo os níveis de sensibilidade pré-definidas. Isto é importante porque, na prática, uma taxa de falsos negativos fixo representa um limite crítico de tolerância na medicina de diagnóstico. Para além desse limite, a participação de sinistralidade-benefício iria aumentar, ou, pelo menos, a decisão de diagnóstico é menos rentável.
O efeito da transformação de dados
transformação de dados eficaz melhora o ajuste normal e estimativa, assim, parâmetro abordagem LDA, mas se esta melhoria vai realizar em novos dados que não está incluído para estimativa de parâmetros permanece obscuro. Validação cruzada com os dados gastroparesia indicou que a transformação de energia aumentou a AUC e estabilizado estimativas dos parâmetros nos conjuntos de treinamento e que esses ganhos se traduziria em maior poder diagnóstico nos conjuntos de teste (Tabela 2). transformação de dados diminuiu a diferença no poder de diagnóstico entre as melhores combinações lineares de LDA e DF se aproxima com os dados clínicos. Curiosamente, a abordagem DF mostrou uma melhoria consistente com a transformação através de todos os níveis de sensibilidade de 0,7, 0,8, e 0,9. A tendência com a abordagem LDA não é tão clara. Uma razão pode ser as retenções gástricas por cento medidos a 3 h e 4-h são tão distorcida que a transformação de energia não é suficiente para colocar as medições sobre a distribuição quase normal.
Otimizando o poder diagnóstico por medidas GES com o modelo CART
Ao contrário de pesquisas anteriores com voluntários normais, a nossa população do estudo foi constituída com um grupo misto de indivíduos quer encaminhados com suspeita de gastroparesia ou investigada por outras razões.
pesquisas
pesquisas
Other Languages