Stomach Health > Stomaco Salute >  > Stomach Knowledges > ricerche

Ottimizzazione del potere diagnostico con la scintigrafia gastrica svuotamento in più punti di tempo

Open Peer Review

Questo articolo ha rapporti di revisione aperto peer disponibili.

Come funziona Open Peer Review lavoro?
Ottimizzazione del potere diagnostico con lo svuotamento gastrico scintigrafia in più punti di tempo
astratta
sfondo
svuotamento gastrico scintigrafia (GES) ad intervalli più di 4 ore dopo un pasto radiomarcata standardizzato è comunemente considerato come il gold standard per la diagnosi di gastroparesi. Gli obiettivi di questo studio erano: 1) per indagare il miglior punto di tempo e la migliore combinazione di molteplici punti di tempo per la diagnosi di gastroparesi con misure GES ripetute, e 2) per contrastare e cross-validazione lineare Analisi Discriminante di Fisher (LDA), un rango distribuzione basata libero (DF) l'approccio, e il modello di classificazione e di regressione Albero (CART).
Metodi
un totale di 320 pazienti con misure GES a 1, 2, 3, e 4 ore (h) dopo uno standard pasto con un metodo standardizzato sono stati retrospettivamente raccolti. Area sotto la Caratteristica (ROC) della curva e il tasso di errore nella classificazione attraverso jackknife convalida incrociata Receiver Operating sono stati utilizzati per il confronto del modello.
Risultati
causa della forte correlazione e un'anomalia nella distribuzione dei dati, nessun miglioramento sostanziale nella diagnostica il potere è stato trovato con la migliore combinazione lineare approccio LDA anche con la trasformazione dei dati. Con il metodo DF, la combinazione lineare di 4 ore e 3 ore ha aumentato l'area sotto la curva (AUC) e diminuito il numero di falsi classificazioni (0,87; 15,0%) rispetto momenti individuali (0,83, 0,82, 15,6%, 25,3 %, per 4 ore e 3 ore, rispettivamente) ad un livello di sensibilità superiore (sensibilità = 0,9). Il modello CART con 4 misure GES orarie insieme con l'età del paziente era lo strumento diagnostico più accurato (AUC = 0.88, errore nella classificazione = 13,8%). I pazienti che hanno un valore di 4-H >ritenzione gastrica;. Il 10% sono stati 5 volte più probabilità di avere gastroparesi (179/207 = 86,5%) rispetto a quelli con ≤10% (18/113 = 15,9%)
Conclusioni
con un gruppo misto di pazienti o di cui con sospetta gastroparesi o indagato per altri motivi, il modello CART è più robusto rispetto agli approcci LDA e DF, in grado di accogliere effetti covariate e può essere generalizzata per applicazioni istituzionali croce, ma potrebbe essere instabile se dimensione del campione è limitata.
Sfondo
gastrico svuotamento scintigrafia a intervalli più di 4 ore dopo un pasto standardizzato è comunemente considerato come il gold standard per la misurazione gastrica volte lo svuotamento. In pratica, una misura oraria semplificata del contenuto gastrico residuo viene utilizzato per la diagnosi gastroparesi definito ritardato svuotamento gastrico (GE) in assenza di ostruzione meccanica [1, 2]. Il cibo misure tecnica radiomarcato rimanendo nello stomaco ad intervalli di un'ora dopo paziente ingerisce un pasto standardizzato [3] come indicatore di ritardo GE. A causa delle differenze nei prodotti alimentari utilizzati, le tecniche impiegate, ed endpoint misurati con GES, l'analisi e l'interpretazione dei risultati variano tra le istituzioni [4]. La maggior parte degli studi precedenti hanno dimostrato che ha ritardato svuotamento gastrico può essere meglio indicata con ritenzione gastrica di > 10% a 4- ore dopo il pasto, che è stato stabilito come il 95 ° percentile della ritenzione gastrica con volontari sani attraverso uno studio multicentrico [5, 6] . Come sempre, una decisione diagnostica di distribuzione-based è arbitraria e può indurre inevitabilmente errore a causa di errori di classificazione. È stato riferito che l'approccio semplificato ha una specificità del 62% e una sensibilità del 93% [7]. Altri usano il mantenimento per cento a 2-H come le misurazioni cliniche di routine di [8] GES, suggerendo GES a 2 ore o 3 ore potrebbe essere il miglior punto di tempo individuale con potere diagnostico superiore. Tuttavia, per cento ritenzioni gastrici in diversi momenti possono anche essere oggetto di età del paziente e di genere [5]. La mancanza di standardizzazione nella conduzione GES insieme con le differenze di analisi quantitativa utilizzati presso varie istituzioni può limitare l'utilità clinica del test, e presenta problemi se devono essere valutati i dati istituzionali trasversali. Nel 2008, per conto del neurogastroenterologia americano e la motilità Society e la Società di Medicina Nucleare, i ricercatori di 13 istituzioni mediche degli Stati Uniti congiuntamente rilasciato una dichiarazione di consenso per la standardizzazione di GES tra istituzioni [4]. Inoltre, le questioni che richiedono ulteriori indagini sono state individuate dal consenso che include: 1) l'uso di 3-H rispetto a 2 e 4 h risultati per il rilevamento di ritardo GE; e 2) utilizzo di più punti di tempo (2 e 4 h) rispetto a singoli valori a 2 o 4-H per la maggiore comprensione del significato clinico di risultati discordanti tra 2 e 4-H scansioni.
Metodologia sull'uso diversi marcatori diagnostici per rilevare malattie o valutare i rischi relativi alla salute è stato un tema di ricerca [9-11]. Con i rapidi progressi nelle tecnologie di genomica e proteomica, l'attenzione per il rilevamento della malattia biomarcatore-based e la valutazione dei rischi è ora spostato da un unico biomarcatore ad un pannello di biomarcatori da diversi marcatori possono essere sensibili a diversi aspetti di una malattia [12]. Si afferma che, rispetto ad un singolo marcatore clinico o genetica, un pannello di marcatori multipli può contenere un livello più elevato di informazioni discriminatorio, in particolare di una grande popolazione eterogenea di pazienti e malattie multistadio complesse. Questo è importante perché utilizzando marcatori multipli simultaneamente potrebbe portare ad una nuova misura diagnostica con maggiore sensibilità [11].
Quando più marcatori sono continui e normalmente distribuiti, LDA di Fisher offre la migliore combinazione lineare che massimizza la sensibilità su tutta la gamma di specificità uniformemente sotto il modello di distribuzione normale multivariata [11]. Quando i valori dei marker si discostano dal normale, una potenza di trasformazione di Box-Cox può essere utilizzata per migliorare la vestibilità normale [13]. Questo approccio è stato trovato efficace nel valutare le curve ROC AUC e se il sottostante veri distribuzioni, sia sul originale o su scala trasformato, sono vicini alla normale multivariata [11]. In caso contrario, un approccio libero distribuzione rango base può essere applicata. Gli aspetti teorici della migliore combinazione lineare di biomarcatori sono ben segnalati [[9, 11, 14-19] e [20]]. LDA di Fisher è più facile da calcolare, mentre l'approccio DF è più robusto di deviazione dalla distribuzione normale, ma è computazionalmente proibitivo se più di due marcatori sono coinvolti [19]. Abbiamo usato le stime dei parametri da LDA come punto di partenza per la ricerca a griglia con DF se lo spazio marcatore va oltre bilaterale. Il modello CART, d'altra parte, fornisce un altro approccio per migliorare il potere diagnostico quando marcatori sono multidimensionale [21-23]. Piuttosto che creare una nuova misura diagnostica come LDA o DF, CART utilizza un processo sequenziale per identificare l'insieme di variabili predittive, nella loro scala originale, che meglio differenziare i gruppi tra la variabile esito di interesse. E 'particolarmente utile quando ci sono molte variabili predittive che sono altamente correlati. E 'computazionalmente meno intensivo e facile da interpretare, ma può essere instabile se il modello è adeguatamente allenato con dati limitati.
Maggior parte degli studi precedenti si concentrano sulla deriva la migliore combinazione di marcatori che massimizza dell'AUC nei soggetti il ​​cui stato di malattia era noto [11 , 14-20]. Non è chiaro se il potere diagnostico per una tale combinazione si estende alla popolazione con i valori dei marker noto, ma lo stato della malattia o sconosciuta alla popolazione i cui valori marcatore non vengono utilizzati per ricavare i parametri diagnostici. Con un pasto standardizzato (vedi Materiali e Metodi) e la tecnica oraria GES (cinque sessioni di 2 minuti per immagini) su un periodo di 4 ore, meno tempo fotocamera è necessario mentre i risultati possono essere riproducibile da un ospedale all'altro. Questo documento valuta le opzioni statistici che ottimizzano il potere diagnostico con misure GES a pochi punti di tempo. Utilizzando la diagnosi clinica primaria, definita da sintomi quali nausea, vomito, sazietà precoce, pienezza postprandiale, disturbi addominali e dolore, oltre alla prova di ritardato svuotamento gastrico in assenza di meccanica ostruzione gastrica, come il vero stato di gastroparesi , questo studio si concentra sulla ricerca i parametri della migliore combinazione lineare di GES in diversi momenti con i dati di allenamento, poi, indaga e cross-convalida le sue prestazioni nei dati di prova che non è stata utilizzata per ricavare il modello.
Metodi
la caratteristica curva Receiver Operating (ROC) e l'area sotto la curva in particolare, è una misura semplice e significativo per valutare l'utilità di un marcatore diagnostico (s) [10]. In questo documento, ROC e AUC sono utilizzati per confrontare in diversi metodi e vari modelli per il migliore potere diagnostico della gastroparesi. La somma di false diagnosi positivi e falsi negativi su tutto il campione è stato utilizzato per contrastare la potenza diagnostica tra LDA, DF e CART attraverso jackknife (prendere uno fuori) la convalida incrociata.
Lineare discriminante approccio di Fisher (LDA)
Let w
ij
rappresenta l'i
th
valore dell'indicatore del j
th
soggetto nel gruppo malata; e v
ik
essere l'i
th
valore dell'indicatore del k
th
soggetti nel gruppo di controllo; dove i
= 1, ..., p; j
= 1, ..., m; e k
= 1, ..., n.
Supponiamo X e Y sono vettori di valori marcatori con distribuzione normale multivariata per i gruppi di malati e di controllo rispettivamente, allora (1) Il vettore dei coefficienti, α
p × 1, per la migliore combinazione lineare del vettore marcatore combinato dai gruppi malati e di controllo secondo i criteri Roc è: (2) l'AUC sotto la curva ROC è: (3) Se, Φ indica lo standard cumulativa . normale funzione di distribuzione
Il Specificità (F a (c)) e sensibilità (H a (c)) sono: (4) (5) distribuzione basato Classifica approccio libero (DF)
sotto l'approccio libero distribuzione basata rango [19], l'AUC può essere calcolato come la statistica di Mann-Whitney U [24]: (6) Nota, per la distribuzione continua, Pr (I
= 1/2) = 0.
Dove, w
ij
è l'i
th valore marcatore per la j
th soggetto nel gruppo malata; v
ik
è l'i
th valore marcatore per la k
th soggetti nel gruppo di controllo; i, j, k, m
, e n
come definito nel paragrafo precedente; AUC

) è l'area sotto la curva approccio libero di distribuzione con vettore dei coefficienti ottimale (α). Dal momento che ROC è invariante per monotona crescente trasformazione, le α coefficiente di vettore
sia LDA e gli approcci DF possono essere riscalati come (1, β 2 /β 1, β 3 /β 1, ... β I /β 1), dove β I /β 1 rappresenta il peso per l'i
th valore indicatore relativo al marcatore 1 [19]
. Classificazione e Regressione Alberi (CART) modello
differenza LDA o DF, metodologia CART identifica l'insieme di predittori da tutte le variabili che meglio differenziano classi nel risultato di interesse in un processo sequenziale. Ad ogni passo (nodo), algoritmo CART prima identifica il migliore predittore da tutte le variabili candidati e quindi cerca attraverso tutti i valori per il migliore predittore ma utilizza un solo punto di taglio per dividere il campione all'interno del nodo in due rami secondari. Si cerca quindi attraverso tutte le variabili predittive e identifica il miglior punto di taglio dal miglior predittore all'interno di ogni sotto-ramo e ripete il processo fino a determinati criteri, come ad esempio una variazione minima o di una dimensione minima di gruppo, in tutti i nodi terminali è soddisfatta. Ad ogni nodo, CART cerca di classificare il campione in gruppi in modo che la massima omogeneità dei nodi figlio è raggiunto. Quando si raggiunge un nodo terminale, il modello fornisce la probabilità di appartenenza ad una particolare categoria per tutti i rimanenti soggetti che rientrano in quel nodo. In pratica, la dimensione minima del nodo generalmente fissato al 10% del campione di apprendimento per evitare potenzialmente Overfitting modello tale che l'albero di decisione finale è più probabile che sia utile per classificare popolazioni con caratteristiche analoghe a quello del campione di apprendimento, ma era non utilizzato per ricavare il modello CART. In contrasto con l'approccio LDA, CART può essere particolarmente utile quando i modelli di correlazione tra variabili predittive non sono coerenti sull'intera gamma, perché non è necessario che la stessa variabile per essere ottimale per tutti i nodi ramo di tutto l'albero [22].
Parametro stima
per approccio LDA, abbiamo scritto un programma SAS /IML [25] per il calcolo della media (m), la varianza (S) per gruppi di malati e di controllo, e tutte le stime dei parametri sono descritti nel metodo sezione. Innanzitutto, le α coefficiente vettore
, AUC per la combinazione lineare così come per i singoli marcatori, è stato ottenuto con le equazioni (2) e (3) dai dati di addestramento. Poi, il coefficiente α
è stato applicato ai dati di prova corrispondenti per ottenere il punteggio combinazione lineare. Tre valori soglia corrispondenti ai livelli di sensibilità a 0.7, 0.8 e 0.9 per il punteggio combinazione lineare sono stati ottenuti con i dati gastroparesi utilizzando nell'equazione (5). Ogni valore di soglia è stato utilizzato sui dati lasciati fuori per classificare il caso in gruppo sia malato o non malato. Lo stato previsto è stato poi attraversare tabulati con la categoria malattia conosciuta.
L'approccio DF è iniziato con un punto di partenza arbitrario e quindi griglia cercato per i coefficienti che massimizzano la statistica di Mann-Whitney U con i dati di formazione nei seguenti passaggi.
1) un punteggio combinazione lineare per ogni osservazione è stata ottenuta moltiplicando il marcatore vettore X con un vettore di coefficienti di partenza, α
(1, α
).
2) l'AUC corrispondente il vettore dei coefficienti α
viene calcolato con l'equazione (6). Pagina 3) Ripetere i primi due passaggi per ogni possibile vettore dei coefficienti e aggregare i corrispondente AUC e α
.
4) Selezionare il coefficiente che massimizzato l'AUC e identificare il valore punteggio combinazione lineare critica a 0.7, 0.8 e 0.9 livelli di sensibilità.
5) l'applicazione del coefficiente di passaggio 4 per i dati di prova per ottenere il miglior punteggio combinazione lineare.
6) Uso ogni valore critico dal punto 4 nei dati di test per predire ogni singolo caso in sia malato o non malato di gruppo, poi attraversare tabulare con la categoria malattia conosciuta. Compra di modello CART, abbiamo usato il pacchetto ALBERO entro R [26] ambiente per ognuna delle quattro misure orarie, e la loro combinazione con l'età del paziente e genere per identificare il miglior modello. La convalida incrociata con una dimensione minima di 10 soggetti per ogni nodo terminale è stato utilizzato per ottimizzare il modello di albero delle decisioni usando tutte le osservazioni [27]. AUC per ogni albero decisionale ottimizzato è stato calcolato per confrontare tutti i modelli. Poi, una osservazione è stata presa dalla intero campione, ed i soggetti rimanenti utilizzato per costruire l'albero decisionale, che a sua volta è stato utilizzato per predire lo stato di malattia dell'osservazione lasciato fuori. Prestazioni per ogni albero di decisione è stata riassunta con il numero totale di previsioni sbagliate attraverso l'intero campione.
Dati Gastroparesi
un totale di 320 carte da pazienti di età compresa tra 16 ~ 89 (42,8 ± 14,3 (media ± std)), 255 (79%) di sesso femminile, con misure GES a 1 ora, 2 ore, 3 ore e 4 ore dopo un pasto standard utilizzando un metodo standardizzato (5) sono stati retrospettivamente raccolti presso l'Università di Kansas Medical center (KUMC). Il protocollo di studio è stato approvato dal Institutional Review Board (IRB) a KUMC. Durante la misura GES, la frazione di pasto consumato e il tempo necessario per il consumo è stato registrato. I soggetti con pasto per cento insolito consumati (ad esempio, < il 20% del pasto) /tempo di consumo (ad esempio > 30 minuti) sono stati esclusi. Tutti i pazienti sono stati entrambi indicati con sospetta gastroparesi o indagati per altri motivi a causa dei sintomi auto riportati come nausea, pienezza, sazietà precoce, vomito e gonfiore. Sulla base di valutazione complessiva, oltre a misure GES orarie, i medici di studio diagnosticati 197 (62%) dei 320 pazienti con gastroparesi come la ragione principale per i sintomi clinici di cui sopra e le loro visite in ospedale. Nonostante le esperienze mediche analoghe, malattie diverse gastroparesi sono stati considerati come le diagnosi principali per i rimanenti 123 pazienti. Nessuna differenza significativa in età media (p = 0,12, da t-test) e sesso (p = 0.99, per χ 2 test) sono stati trovati tra i gruppi con e senza gastroparesi. Per ogni paziente, la scintigrafia gastrica svuotamento è stata eseguita la mattina dopo un digiuno notturno con procinetici fermati per almeno 3 giorni. Il metodo standardizzato per lo svuotamento gastrico è costituito da l'equivalente di due uova strapazzate (uovo sostitutivi) marcati con 99m Tc zolfo colloidale, 2 pezzi di pane tostato con gelatina, e 4 ml di acqua con un valore calorico totale di 255 kcal. Anteriori e posteriori immagini dello stomaco sono state scattate subito dopo aver mangiato, e poi ogni ora per 4 ore [28].
Risultati
durante la misurazione ripetuta di svuotamento gastrico, ritenzioni per cento del isotopo nello stomaco a 1-H, 2-h, 3-h, e 4 ore dopo il pasto è diminuita con il tempo e sono stati altamente correlati, in particolare per i maschi e per i pazienti con gastroparesi. Spearman coefficiente di correlazione variava da 0,34 (p < 0,001) tra il 1-H e 4 ore per i pazienti senza gastroparesi a 0.93 (p < 0,001) tra 3 ore e 4 ore per i pazienti con gastroparesi. Complessivamente, la distribuzione della ritenzione percentuale deviato dal normale, con i primi due valori orari alterando verso l'estremità inferiore, e le seconde due ore, alterando verso l'estremità superiore (Figura 1). Figura 1 Percentuale di ritenzione gastrica a 1-H, 2-H, 3-H, e 4 ore dopo il pasto per caso (verde) rispetto al controllo (grigio). 1-h-c, 2-h-c, 3-h-C, 4 h-c rappresenta per cento svuotamento gastrico (GE) a 1-H, 2-H, 3-H, e 4 ore dopo il pasto per i pazienti con diagnosi di gastroparesi; Baffo rappresenta intervallo interquartile 70%
. Poteri diagnostici di LDA e l'approccio DF
misure orarie a 3 ore e 4 ore sono stati precedentemente segnalati come avente la migliore utility di diagnostica, abbiamo contrapposto la migliore combinazione lineare sia LDA ( Figura 2) e approcci DF (Tabella 1). In primo luogo, abbiamo stimato AUC per le due misure con il coefficiente ottimale per la loro migliore combinazione lineare e i valori di soglia per il punteggio combinazione lineare a 0.7, 0.8 e 0.9 livelli di sensibilità da parte sia LDA e DF approcci per tutti, ma 1 su 320 soggetti. Il coefficiente ottimale, insieme con i tre valori di soglia è stata poi applicata al soggetto sinistra fuori. Confrontando i valori di soglia con il punteggio combinazione lineare calcolato, è stato registrato lo stato gastroparetic previsto per il soggetto lasciato fuori. I tassi di falsi positivi negativi e falsi sono stati ottenuti ripetendo il processo di coltello a serramanico per tutti i 320 soggetti. Poi, una potenza trasformazione di Box-Cox è stato applicato e la stessa analisi è stata ripetuta per i dati trasformati. Figura 2 del receiver operating characteristic (ROC) Curva per la ritenzione per cento ogni ora a 2 ore, 3 ore, 4 ore, e la loro migliore combinazione lineare. Area sotto la curva (AUC) è aumentata da 2 ore a 4 ore e massimizzata con la migliore combinazione lineare di tutte e tre le misurazioni orarie.
Tabella 1 Le stime dei parametri (area sotto la curva (AUC) e il coefficiente per la migliore combinazione lineare ) con Linear Analisi discriminante di Fisher (LDA) e la distribuzione gratuita (DF) approcci
Pagina 4-h
3-h
combinazione lineare combinazione DF
lineare LDA

Raw

Tran

Raw

Tran

α

Raw

α

Tran

α

Raw

α

Tran

Mean
0.830
0.879
0.824
0.827
0.02
0.869
0.02
0.869
0.681
0.834
0.055
0.881
STD
0.002
0.001
0.002
0.002
0.00
0.001
0.00
0.001
0.032
0.002
0.002
0.001
Median
0.830
0.879
0.824
0.827
0.02
0.869
0.02
0.869
0.679
0.833
0.055
0.880
Range
0.013
0.009
0.011
0.009
0.00
0.008
0.00
0.008
0.284
0.012
0.017
0.009
Nota: Raw acronimo di AUC per la misura in scala originale;
Tran rappresenta AUC per la misurazione in scala trasformato;
α è il coefficiente per la migliore combinazione lineare per la misurazione in 3 ore dopo il pasto
sui migliori lineare. combinazioni delle due misure orarie aumentato il potere diagnostico dei suoi singoli componenti da entrambi gli approcci (Tabella 2), ma il guadagno era limitata, 3,9% per il DF, e 0,4% per l'approccio LDA. Come previsto, Box-Cox trasformazione di potenza sui singoli marcatori migliorato il potere diagnostico della migliore combinazione lineare con l'approccio LDA del 4,7% rispetto a quello del measures.Table grezzo 2 False classificazioni (%) con jackknife convalida incrociata da discriminante lineare di Fisher analisi (LDA) e la distribuzione gratuita (DF) approcci
Criteri
3- h DF
4 h combinazione DF
lineare combinazione DF
lineare LDA
0,7
24 (19,5%)
59 ( 30,0%)
16 (13,0%)
59 (30,0%)
15 (12,2%)
58 (29,4%)
15 (12,2%)
64 (32,3% )
0.8
37 (30,1%)
39 (19,8%)
21 (17,1%)
40 (20,3%)
21 (17,1%)
40 ( 20,3%)
20 (16,3%)
46 (23,4%)
0,9
60 (48,8%)
21 (10,7%)
27 (21,9%)
23 (11,7%)
28 (22,8%)
20 (10,2%)
27 (22,0%)
22 (11,2%)
Nota:: modello previsto lo stato di malattia (1 per Sì, 0 per no);
y
: stato diagnosticato la malattia (1 per sì, 0 per no)
Con i dati grezzi, le differenze nella somma di falsi tassi positivi e falsi negativi per il meglio. combinazioni lineari sono stati 0,2%, 1,6% e -6,5% tra il DF e LDA avvicina ai 0,7, 0,8, 0,9 e livelli di sensibilità. Mentre i tassi di falsi negativi per l'approccio mostrato LDA deviazione di grandi dimensioni da quelle corrispondenti ai livelli preimpostati di soglia (≤3.0%), quelli per l'approccio DF sono relativamente vicino (≤ ± 0,2%).
Trasformazione dei dati ha migliorato il potere diagnostico le migliori combinazioni lineari sia per il LDA e DF approcci diminuendo la somma di falsi positivi tassi negativi e falsi. Le riduzioni sono del 2,2%, 2,8%, 13,8% e -0,9%, -1,1%, 20,1% per gli approcci DF e LDA, rispettivamente. È interessante notare che il più grande miglioramento nella potenza diagnostica è al più alto livello di sensibilità per entrambi gli approcci.
Poteri diagnostici con il carrello approccio
modelli Sette albero decisionale, tra cui il modello completo (4 misurazioni orarie insieme con l'età del paziente), le combinazioni di 2 ore e 4 ore, 3 ore e 4 ore, insieme con ogni misure orarie, sono stati ottimizzati attraverso l'albero-potatura con dimensione minima per il nodo finale di 10 soggetti [26]. Per tutti i modelli di punti temporali singoli, ritenzione cento a 4-h ha la più grande AUC di 0,865, seguita da 3 ore, 2-h, e 1-h, rispettivamente (Tabella 3). Il tasso di falsi diagnosi per modello albero di decisione con 4-h è del 14,4% (28 su 123 per i pazienti senza gastroparesi, e 18 dei 197 per quelli con gastroparesi), meno della metà di quelli che sarebbero stati erroneamente diagnosticata da 1- h e punti 2-h, e il 37% ((73-46) /73) inferiore a quella -a 3 h. Compreso 2-ore o 3 ore con 4 h con l'albero di decisione non ha aumentato il numero di diagnosi corrette rispetto all'utilizzo di solo 4 ore, come indicato dalla convalida jackknife croce. Questi differiscono dai risultati ottenuti da LDA e DF approcci, in cui la combinazione lineare di 3 ore e 4 ore ha mostrato lieve miglioramento rispetto usando 4-h alone. Tuttavia, il modello albero di decisione sia con solo 4 ore o la sua combinazione con 2-H o 3-H non ha sofferto in utilità diagnostica rispetto ai suoi modelli controparte identificati sia con LDA o approccio DF, a prescindere dalla trasformazione dei dati. Il modello CART utilizzando tutte e quattro le misure GES orarie con l'età del paziente è stato molto interessante. Per i criteri di ritenzione gastrica > 10% a 4 ore e < 53% a 2-h, i pazienti > 47,5 anni sono stati quasi 2 volte meno probabilità di avere gastroparesi (probabilità = 0,44), come quelli con l'età < 47,5 (probabilità = 0.85) .table 3 False classificazioni (%) con coltello a serramanico convalida incrociata di classificazione ottimizzato e regressione Albero (CART) modelli
Tipo di diagnosi errata
1-h
2-h
3-h
4 h

2-h + 4 h
3-h + 4 h
4-h + 3 h + 2 h + 1-h + Age

76 (61,8%)
28 (22,8%)
29 (23,6%)
28 (22,8%)
28 (22,8%)
28 (22,8%)
26 (21,1%)
24 (12,2%)
69 (35,0%)
44 (22,3%)
18 (9,1%)
18 (9,1%)
18 (9,1%)
18 (9,1%)
totale Misdiagnosis
100 (31,3%)
97 (30,3%)
73 (22,8%)
46 (14.4 %)
46 (14,4%)
46 (14,4%)
44 (13,8%)
AUC per ottimizzare Modello
0,724 0,753

0,825
0,867
0.865
0,858 0,881

Nota:: modello previsto lo stato di malattia (1 per sì, 0 per no);
y
: lo stato di malattia diagnosticata (1 per sì, 0 per no )
. Discussione
combinazioni lineari dei marcatori diagnostici ottenuti da LDA o approccio DF di solito portano a maggiori poteri discriminare (AUC) più grande rispetto con i suoi singoli componenti. Una simulazione (risultati non mostrano qui) ha indicato che la forte correlazione tra i singoli marcatori, minore è l'aumento della AUC dalla loro combinazione lineare. Il guadagno potenziale potere diagnostico, tuttavia, diminuisce quando la correlazione tra i singoli marcatori aumentare fino a 0,7 e superiori. L'efficacia di utilizzare una combinazione lineare diminuisce con l'aumento della grandezza di sproporzione matrici di covarianza tra i gruppi malate e di controllo.
Campioni piccoli conducono a grandi variazioni dei coefficienti ottimali per la migliore combinazione lineare e la corrispondente AUC, soprattutto per il approccio LDA. Come dimensione del campione aumenta, coefficienti ottimali e AUC di LDA o metodi DF può o non può avvicinarsi l'un l'altro a seconda della distribuzione dei singoli marcatori.
Valori Marker normale
Quando i valori dei marker sono multivariata normale, le stime della approccio LDA sono molto vicino a quello del metodo DF in termini di AUC, coefficienti ottimali, e il potere diagnostico come indicato dalla simulazione. Con distribuzione normale e adeguata dimensione del campione, i primi due momenti catturano posizione e la scala del parametro di marcatore con una piccola variazione. In tali casi, l'approccio LDA ha il vantaggio di risparmiare tempo di calcolo (più di 100 volte meno) senza subire al potere predittivo rispetto all'approccio DF. Tuttavia, LDA non può superare DF finché la griglia ricerca per coefficiente ottimale con DF contiene la stima puntuale da LDA. In altre parole, la limitazione con DF è nella computazione, che della metodologia.
Valori Marcatori non normale Quando i valori dei marker discostano dalla distribuzione normale, l'approccio DF porta sempre ad una maggiore AUC per la migliore combinazione lineare se la ricerca griglia di coefficienti ottimali è abbastanza bene. Le prestazioni declassamento con approccio LDA è un risultato diretto con i mezzi che è polarizzata a causa di anomalie. Distribuzione esponenziale, per esempio, tende ad avere una lunga coda con un alto grado di asimmetria, portando ad un mezzo con una polarizzazione positiva. Di conseguenza, le varianze di marcatori sono gonfiati e la AUC tende ad essere più piccoli. Ancora più importante, la migliore combinazione lineare ottenuto con approccio LDA tende a sovrastimare il tasso di falsi negativi e sottovalutare il tasso di falsi positivi a livello di sensibilità più bassa (Tabella 2), e fare esattamente il contrario a livello di sensibilità maggiore. Al contrario, la migliore combinazione lineare approccio DF è meno influenzata dai valori estremi e tende ad avere potere diagnostico superiore mantenendo i livelli di sensibilità preimpostati. Questo è importante perché, in pratica, un tasso di falsi negativi fissa rappresenta un limite critico di tolleranza in medicina diagnostica. Al di là di tale limite, la quota del rapporto sinistri-benefici aumenterebbe, o, per lo meno, la decisione di diagnosi è meno redditizio.
L'effetto dei dati trasformazione
trasformazione dei dati efficace migliora la vestibilità normale e la stima quindi parametro approccio LDA, ma se questo miglioramento si terrà a nuovi dati che non è incluso per la stima dei parametri rimane poco chiaro. La convalida incrociata con i dati gastroparesi ha indicato che il potere di trasformazione ha aumentato l'AUC e stabilizzato stime dei parametri nei set di addestramento, e che tali guadagni si tradurrebbe in una maggiore potenza diagnostica nei set di test (Tabella 2). trasformazione dei dati ha chiuso il divario di potere diagnostico tra le migliori combinazioni lineari di LDA e DF si avvicina con i dati clinici. È interessante notare che l'approccio DF ha mostrato un miglioramento coerente con la trasformazione in tutti i livelli di sensibilità a 0.7, 0.8 e 0.9. Il trend con l'approccio LDA non è così chiara. Uno dei motivi potrebbe essere la percentuale ritenzioni gastrici misurati a 3 ore e 4 ore sono così distorta che il potere di trasformazione non è sufficiente a mettere le misure sulla distribuzione quasi normale.
Ottimizzazione del potere diagnostico mediante misure GES con il modello CARRELLO
a differenza dei precedenti ricerche con volontari sani, la nostra popolazione in studio consisteva di un gruppo misto di soggetti o di cui con sospetta gastroparesi o indagato per altre ragioni.

Other Languages