Stomach Health > Maag Gezondheid >  > Stomach Knowledges > onderzoeken

Het optimaliseren van de diagnostische vermogen met de maaglediging scintigrafie op meerdere tijdstippen

Open Peer Review

Dit artikel heeft Open Peer Review verslagen beschikbaar.

Hoe werkt Open Peer Review werk?
Het optimaliseren van het diagnostische vermogen met maaglediging scintigrafie op meerdere tijdstippen
De abstracte achtergrond
Maaglediging scintigrafie (GES) periodiek voor 4 uur na een gestandaardiseerde maaltijd radioactief gemerkte wordt algemeen beschouwd als de gouden standaard voor de diagnose gastroparese. De doelstellingen van dit onderzoek waren: 1) om de beste tijdstip en de beste combinatie van meerdere tijdstippen voor het diagnosticeren van gastroparese met herhaalde GES maatregelen te onderzoeken, en 2) om het contrast en cross-valideren Fisher's Linear Discriminant Analyse (LDA), een rang gebaseerde distributie Free (DF) aanpak, en de indeling en Regression Tree (CART) model.
Methods
een totaal van 320 patiënten met GES maatregelen op 1, 2, 3, en 4 uur (h) na een standaard maaltijd met behulp van een gestandaardiseerde methode werden retrospectief verzameld. Oppervlakte onder de Receiver Operating Characteristic (ROC) curve en het aantal valse classificatie door middel van jackknife cross-validatie werden gebruikt voor het model te vergelijken.
Resultaten
Wegens de sterke correlatie en een afwijking in de distributie van gegevens, geen substantiële verbetering in de diagnostische stroom werd gevonden met de beste lineaire combinatie door LDA benadering zelfs met data transformatie. Met DF werkwijze, de lineaire combinatie van 4-h en 3-h vergroot de oppervlakte onder de curve (AUC) en verminderde het aantal verkeerde classificaties (0,87, 15,0%) in sommige tijdstippen (0,83, 0,82, 15,6%, 25,3 %, voor 4-h en 3-h, respectievelijk) versneld gevoeligheidsniveau (gevoeligheid = 0,9). De CART-model met behulp van 4 per uur GES metingen samen met de leeftijd van de patiënt was de meest accurate diagnose-instrument (AUC = 0,88, valse classificatie = 13,8%). Patiënten met een 4-h maagretentie waarde >. 10% waren 5 keer meer kans om gastroparese (179/207 = 86,5%) dan die met ≤10% (18/113 = 15,9%) hebben
Conclusies
met een gemengde groep van patiënten ofwel aangeduid met een vermoedelijke gastroparese of onderzocht om andere redenen, de CART model is robuuster dan de LDA en DF benaderingen, die plaats bieden covariate effecten en kan worden gegeneraliseerd voor cross institutionele toepassingen, maar instabiel als zou kunnen zijn steekproefomvang beperkt. achtergrond
maaglediging scintigrafie periodiek voor 4 uur na een gestandaardiseerde maaltijd wordt algemeen beschouwd als de gouden standaard voor het meten maaglediging keer. In de praktijk wordt een vereenvoudigd uur mate van residuele maaginhoud gebruikt voor het diagnosticeren gastroparese gedefinieerd als vertraagde maaglediging (GE) in afwezigheid van mechanische obstructie [1, 2]. Het in de maag om het uur na patiënt techniek meet radioactief gemerkte voedsel opneemt een gestandaardiseerde maaltijd [3] als indicator voor vertraagde GE. Vanwege de verschillen in de voeding gebruikt, gebruikte technieken, en eindpunten gemeten met GES, analyse en interpretatie van de resultaten variëren tussen instellingen [4]. De meeste eerdere studies hebben aangetoond dat maaglediging vertraagde kan het best worden aangeduid met gastrische retentie van > 10% in 4 uur na de maaltijd, die was dus de 95 percentiel maagretentie normale vrijwilligers door een multicenter studie [5, 6] . Zoals altijd, een distributie-gebaseerde diagnostische beslissing is arbitrair en kunnen onvermijdelijk veroorzaken fout omdat misclassificatie. Het is gemeld dat de vereenvoudigde aanpak heeft een specificiteit van 62% en een gevoeligheid van 93% [7]. Anderen gebruiken het percentage retentie bij 2-uur als de routine klinische metingen van GES [8], wat suggereert GES bij 2-uur of 3-h kan het beste individuele tijdstip met een hogere diagnostische macht. Kan echter procent maag inhoudingen op verschillende tijdstippen ook onderhevig zijn aan de patiënt leeftijd en geslacht [5]. Het gebrek aan standaardisatie in het uitvoeren van GES samen met verschillen in de kwantitatieve analyse gebruikt bij verschillende instellingen kunnen de klinische bruikbaarheid van de test te beperken, en presenteert problemen als kruis institutionele gegevens moeten worden geëvalueerd. In 2008, in opdracht van de Amerikaanse Neurogastroenterology en de beweeglijkheid Society en de Society of Nuclear Medicine, onderzoekers uit 13 Amerikaanse medische instellingen gezamenlijk een consensus verklaring voor de standaardisatie van GES over instellingen [4]. Bovendien, punten die verder onderzoek door de als consensus waaronder: 1) het gebruik van 3-h vergelijking met 2- en 4-h resultaten voor detectie van vertraagde GE; en 2) het gebruik van meerdere tijdstippen (2- en 4-h) versus één 2- of 4-h-waarden voor een beter begrip van de klinische betekenis strijdige resultaten tussen 2- en 4-h scans.
Methodologie voor het gebruik verschillende diagnostische markers om ziektes op te sporen of de gezondheid gerelateerde risico's heeft een actief gebied van onderzoek [9-11] geweest. Met de snelle ontwikkelingen in genomics en proteomics-technologieën, is de focus op biomarker gebaseerde ziekte detectie en risicobeoordeling nu verschoven van een enkele biomarker aan een panel van biomarkers aangezien verschillende markers gevoelig zijn voor verschillende aspecten van een ziekte [12] kan zijn. Gesteld wordt dat, in vergelijking met een enkele klinische of genetische merker, een panel van meerdere markers kan een hoger niveau van discriminerende informatie, bevat in het bijzonder in grote heterogene patiëntenpopulaties en voor complexe meertraps ziekten. Dit is belangrijk omdat het gebruik van meerdere markers gelijktijdig kan leiden tot een nieuwe diagnostische test met hogere gevoeligheid [11].
Wanneer meerdere markers continu en normaal, Fisher LDA levert de beste lineaire combinatie die de gevoeligheid over het gehele bereik specificiteit maximaliseert gelijkmatig onder de multivariate normale verdeling model [11]. Wanneer teller waarden afwijken van normaal, een Box-Cox krachtomvormmiddelen worden gebruikt om de normale fit [13] te verbeteren. Deze benadering is effectief bij het schatten van de AUC en ROC curves als de onderliggende ware verdelingen, hetzij op de oorspronkelijke of een getransformeerde schaal gevonden, dicht normaal multivariate [11]. Anders kan een ranking op basis verdeling vrije benadering worden toegepast. De theoretische aspecten van de beste lineaire combinatie voor biomarkers zijn ook gerapporteerd [[9, 11, 14-19] en [20]]. Visser LDA gemakkelijker te berekenen, terwijl de DF benadering robuuster in afwijking van de normale verdeling, maar rekenkundig onbetaalbaar indien meer dan twee merkers betrokken zijn [19]. We gebruikten de parameterschattingen uit LDA als een startpunt voor raster zoeken met DF als marker ruimte gaat verder dan de bilaterale. De CART model, anderzijds, verschaft een benadering voor het diagnostische vermogen te optimaliseren als markers multidimensionaal [21-23]. In plaats van het creëren van een nieuwe diagnostische maatregel zoals LDA of DF, CART maakt gebruik van een sequentiële proces om de set voorspellende variabelen te identificeren, in hun oorspronkelijke schaal, die het beste te onderscheiden groepen onder de uitkomst variabele rente. Het is vooral handig wanneer er veel voorspellende variabelen die sterk gecorreleerd zijn. Het rekenkundig minder intensief en eenvoudig te interpreteren, maar kan instabiel zijn als het model onvoldoende getraind met beperkte gegevens.
Meeste eerdere studies gericht op het afleiden van de beste combinatie van merkers die AUC optimaliseert voor patiënten bij wie de ziekte staat bekend [11 , 14-20]. Het is onduidelijk of het diagnostisch vermogen voor een dergelijke combinatie strekt zich uit tot de bevolking met bekende marker waarden, maar een onbekende status ziekte of aan de bevolking wiens marker waarden worden niet gebruikt voor het afleiden van de diagnostische parameters. Met een gestandaardiseerde maaltijd (zie materialen en methoden) en het uurtarief GES techniek (vijf 2-minuten beeldvorming sessies) over periode van 4 uur, minder camera tijd nodig terwijl de resultaten reproduceerbaar kunnen worden uit het ziekenhuis naar het ziekenhuis. Deze paper beoordeelt de statistische opties die het diagnostisch vermogen met GES maatregelen te optimaliseren op enkele tijdstippen. Met het gewone klinische diagnose, gedefinieerd door symptomen zoals misselijkheid, braken, vroege verzadiging, postprandiale volheid, buikpijn en pijn, evenals aanwijzingen voor vertraagde maaglediging in afwezigheid van mechanische gastrische obstructie, de werkelijke status van gastroparese deze studie is gericht op het vinden van de parameters van de beste lineaire combinatie van GES op verschillende tijdstippen met trainingsgegevens dan onderzoekt en cross-valideert de prestaties op testgegevens die niet werd gebruikt voor het afleiden van een model.
Methods
de receiver operating characteristic curve (ROC) en het gebied onder de curve in het bijzonder is een eenvoudige en zinvolle maatregel om het nut van een diagnostische merker (s) [10] bepalen. In deze paper, ROC en AUC worden gebruikt om te vergelijken tussen verschillende methoden en verschillende modellen voor de beste diagnostische kracht van gastroparese. De som van vals-positieve en vals negatieve diagnoses over de gehele monster werd gebruikt om de diagnostische macht contrast tussen LDA, DF en CART door middel jackknife (neem een ​​out) kruis validatie.
Fisher's Linear Discriminant Approach (LDA)
Nu w
ij
vertegenwoordigt de i
e
marker waarde van de j
e
onderwerp in de zieke groep; en v
ik
zijn de i
e
marker waarde van de k
e
onderwerp in de controlegroep; waar ik
= 1, ..., p; j
= 1, ..., m; en k
= 1, ..., n.
Stel X en Y dragers van merker waarden multivariate normale verdeling voor de zieke en controlegroepen heffen, wordt (1) De coëfficiënt vector, α
p × 1, voor de beste lineaire combinatie van de gecombineerde marker vector van de zieke en controlegroepen onder de ROC criteria: (2) de AUC onder de curve is: (3) Indien Φ geeft de standaard cumulatieve . normale verdelingsfunctie Ondernemingen De specificiteit (F a (c)) en Sensitivity (H a (c)) zijn: (4) (5) Rank gebaseerd Distribution Gratis benadering (DF)
onder de ranking op basis distributie vrije aanpak [19], kan de AUC worden berekend als de Mann-Whitney u statistiek [24]: (6) Let op, voor continue distributie, Pr (I
= 1/2) = 0.
Wanneer w
ij
is de i
e marker waarde voor de j
e onderwerp in de zieke groep; v
ik
is de i
e marker waarde voor de k
e onderwerp in de controlegroep; i, j, k, m
en n
zoals gedefinieerd in de vorige paragraaf; AUC

) is het gebied onder de curve van de distributie vrij aanpak met een optimale coëfficiënt vector (α). Aangezien ROC is onveranderlijk kan toenemende transformatie monotoon, de coëfficiënt vector α
in zowel de LDA en DF benaderingen kunnen worden geschaald als (1, β 2 /β 1, β 3 /β 1, ... β i /β 1), waarin β i /β 1 staat voor het gewicht voor de i
e marker waarde ten opzichte van markeerdraad 1 [19].
Classificatie en Regressie Trees (CART) model
in tegenstelling tot de LDA of DF, CART methodologie identificeert de set van voorspellers van alle variabelen die het beste te onderscheiden klassen bij de uitkomst van belang in een sequentieel proces. Bij elke stap (knooppunt), CART algoritme identificeert eerst de beste voorspeller van alle kandidaat variabelen en vervolgens doorzoekt alle waarden voor de beste voorspeller maar gebruikt slechts een scheidingsfrequentie het monster binnen het knooppunt in twee zijtakken verdeeld. Daarna zoekt hij in alle onafhankelijke variabelen en identificeert de beste scheidingspunt van de beste predictor in elke sub-tak en herhaalt dit proces totdat een bepaalde criteria, zoals ten minste variantie of minimum groep in alle terminalknooppunten wordt voldaan. Bij elk knooppunt CART beoogt het monster in groepen zodanig dat de maximale homogeniteit van het kind knooppunten wordt bereikt classificeren. Wanneer een eindknoop is bereikt, geeft het model de waarschijnlijkheid van het behoren tot een bepaalde categorie voor alle overige onderwerpen die in dat knooppunt vallen. In de praktijk wordt de minimum bevindt grootte doorgaans op 10% van het leren monster mogelijk vallen te voorkomen passend model zodat de uiteindelijke beslissingsboom zal eerder handig voor het classificeren populaties met dezelfde kenmerken als die van het leren monster maar was niet gebruikt voor het afleiden van de CART-model. In tegenstelling tot LDA benadering kunnen CART bijzonder nuttig zijn wanneer correlatiepatronen onder predictoren niet consistent over het gehele bereik, omdat het niet noodzakelijk dezelfde variabele optimaal voor vertakkingsknooppunten van de gehele structuur [22] zijn.
Parameterschatting
voor LDA benadering schreven we een SAS /IML programma [25] voor het berekenen van het gemiddelde (m), de variantie (S) in zieke en controlegroepen en alle parameterschattingen zijn beschreven in de werkwijze sectie. Ten eerste, de coëfficiënt vector α
, AUC voor de lineaire combinatie en voor afzonderlijke markering, werd verkregen met vergelijkingen (2) en (3) van de trainingsgegevens. Vervolgens wordt de coëfficiënt α
werd op de overeenkomstige testgegevens om de lineaire combinatie score te verkrijgen. Drie drempelwaarden gevonden volgens gevoeligheidsniveaus bij 0,7, 0,8 en 0,9 voor de lineaire combinatie score verkregen met gastroparese gegevens met behulp van vergelijking (5). Elke drempelwaarde werd gebruikt op de weggelaten gegevens op dossier delen in zowel zieke of niet zieke groep. De voorspelde status werd vervolgens kruis tabel met de bekende categorie ziekte. Ondernemingen De DF aanpak begonnen met een willekeurig startpunt en dan net gezocht naar de coëfficiënten dat de Mann-Whitney U statistiek maximaliseren van de training data in de volgende stappen.
1) een lineaire combinatie score voor elke waarneming werd verkregen door het vermenigvuldigen van de marker vector X met een beginnend coëfficiënt vector, α
(1, α
). Pagina 2) de AUC overeenkomt met de coëfficiënt vector α
wordt berekend met vergelijking (6).
3) Herhaal de eerste twee stappen voor elke mogelijke coëfficiënt vector en voegen de overeenkomstige AUC en α
.
4) Selecteer de coëfficiënt die gemaximaliseerd de AUC en identificeren van de kritische lineaire combinatie score waarde op 0,7, 0,8, en 0,9 gevoeligheidsniveaus.
5) de toepassing van de coëfficiënt van stap 4 tot de testgegevens om de beste lineaire combinatie score te verkrijgen.
6) Gebruik elke kritische waarde van stap 4 in de testgegevens om per geval te voorspellen in een van beide zieke of niet-zieke groep, dan steekt tabelleer met de bekende categorie ziekte.
voor CART model, wij de BOOM pakket binnen R gebruikt [26] omgeving voor elk van de vier metingen op elk uur, en de combinatie met de patiënt leeftijd en geslacht het beste model te identificeren. Cross-validatie met een minimale grootte van 10 onderwerpen voor elke terminal knooppunt werd gebruikt om de beslisboom model met behulp van alle waarnemingen [27] te optimaliseren. AUC voor elke geoptimaliseerde beslisboom werd berekend om te vergelijken voor alle modellen. Vervolgens werd een waarneming genomen uit het gehele monster, en de resterende proefpersonen de beslisboom, die op zijn beurt werd gebruikt om de ziektestatus van de weggelaten waarneming voorspellen bouwen. Prestaties voor elke beslissing boom werd samengevat met het totale aantal foute voorspellingen over het gehele monster.
Gastroparese data
Een totaal van 320 kaarten van patiënten van 16 ~ 89 (42,8 ± 14,3 (gemiddelde ± std)), 255 (79%) vrouwen, met GES maatregelen op 1 uur, 2 uur, 3 uur en 4 uur na een standaard maaltijd met behulp van een gestandaardiseerde methode (5) werden retrospectief verzameld aan de Universiteit van Kansas Medical Center (KUMC). De studie protocol werd goedgekeurd door de Institutional Review Board (IRB) op KUMC. Tijdens GES meting de fractie meel verbruikt en de duur van de consumptie geregistreerd. Onderwerpen met ongewone procent maaltijd geconsumeerd (bijv. ≪ 20% van de maaltijd) /verbruik tijd (bijv. ≫ 30 minuten) werden uitgesloten. Alle patiënten waren ofwel aangeduid met een vermoedelijke gastroparese of onderzocht om andere redenen, want van zelf gerapporteerde klachten zoals misselijkheid, volheid, snelle verzadiging, braken, en een opgeblazen gevoel. Gebaseerd op de totale evaluatie, naast uur GES maatregelen, de studie artsen gediagnosticeerd 197 (62%) van de 320 patiënten met gastroparese als de primaire reden voor de bovengenoemde klinische symptomen en hun ziekenhuisbezoeken. Ondanks soortgelijke medische ervaringen werden andere dan gastroparese ziekten beschouwd als primaire diagnose voor de overige 123 patiënten. Geen significant verschil in gemiddelde leeftijd (p = 0,12 door t-test) en mannen (p = 0,99 door χ 2-test) werden gevonden tussen groepen met en zonder gastroparese. Voor elke patiënt werd maaglediging scintigrafie uitgevoerd in de ochtend na een nacht vasten met prokinetische gestopt gedurende ten minste 3 dagen. De gestandaardiseerde methode voor maaglediging bestaat uit het equivalent van twee roerei (eisubstituut) gelabeld met 99m Tc zwavel-colloïd, 2 stukken toast met gelei en 4 oz van water met een totale calorische waarde van 255 kcal. Anterieure en posterieure beelden van de maag werden onmiddellijk na het eten, en vervolgens elk uur gedurende 4 uur [28].
Resultaten
Bij herhaalde meting van maaglediging, percentage retentie van de isotoop in de maag 1-h, 2-h, 3-uur en 4-uur na de maaltijd af met de tijd en waren sterk gecorreleerd met name voor mannen en voor patiënten met gastroparese. Spearman correlatiecoëfficiënt varieerde van 0,34 (p < 0,001) tussen 1 en 4-h-h voor patiënten zonder gastroparese tot 0,93 (p < 0,001) tussen 3 en 4-h-h voor patiënten met gastroparese. Kortom, de verdeling in percentage retentie afgeweken normaal, de eerste twee uurlijkse waarden scheef tegen het ondereinde, en de tweede twee uur scheef tegen de bovenkant (Figuur 1). Figuur 1 Percentage maagretentie 1-h, 2-h, 3-uur en 4-uur na de maaltijd voor case (groen) versus controle (grijs). 1-H-C, 2-h-c, 3-H-C, 4-h-c vertegenwoordigt procent legen van de maag (GE) en 1-h, 2-h, 3-uur en 4-uur na een maaltijd voor patiënten met gastroparese; Bakkebaard vertegenwoordigt 70% interkwartielbereik.
Diagnostic bevoegdheden door LDA en DF aanpak
per uur maatregelen op 3 uur en 4-uur werden eerder gemeld als de beste diagnostische nut, we tegenover hun best lineaire combinatie van beide LDA ( figuur 2) en DF benaderingen (tabel 1). Ten eerste, we geschat AUC voor de twee metingen, samen met de optimale coëfficiënt voor hun best lineaire combinatie en de drempelwaarden voor de lineaire combinatie score op 0,7, 0,8, en 0,9 gevoeligheidsniveaus door zowel LDA en DF benaderingen voor alle, maar 1 van de 320 onderwerpen. De optimale coëfficiënt, samen met de drie drempelwaarden werd vervolgens aangebracht op de weggelaten onderwerp. Door het vergelijken van de drempelwaarden met de berekende lineaire combinatie score, de voorspelde gastroparetic status voor de weggelaten onderwerp werd opgenomen. De tarieven van vals-negatieve en vals positieve werden verkregen door het herhalen van de jackknife proces voor alle 320 proefpersonen. Vervolgens werd een Box-Cox krachtomvormmiddelen toegepast en dezelfde analyse werd herhaald voor de getransformeerde gegevens. Figuur 2 ontvanger operating characteristic (ROC) curve voor elk uur procent retentie op 2 uur, 3 uur, 4-h, en hun best lineaire combinatie. Gebied onder de curve (AUC) van 2-uur tot 4-uur en maximaal de beste lineaire combinatie van alle drie uurlijkse metingen.
Tabel 1 Parameterschattingen (gebied onder de curve (AUC) en de coëfficiënt voor de beste lineaire combinatie ) met Fisher's Linear Discriminant Analyse (LDA) en Distributie Gratis (DF) benaderingen
verhuur 4-h
3-h
Linear combinatie DF
Linear combinatie LDA

Raw

Tran

Raw

Tran

α

Raw

α

Tran

α

Raw

α

Tran

Mean
0.830
0.879
0.824
0.827
0.02
0.869
0.02
0.869
0.681
0.834
0.055
0.881
STD
0.002
0.001
0.002
0.002
0.00
0.001
0.00
0.001
0.032
0.002
0.002
0.001
Median
0.830
0.879
0.824
0.827
0.02
0.869
0.02
0.869
0.679
0.833
0.055
0.880
Range
0.013
0.009
0.011
0.009
0.00
0.008
0.00
0.008
0.284
0.012
0.017
0.009
Opmerking: Raw staat voor AUC voor metingen in de originele schaal;
Tran vertegenwoordigt AUC voor de meting in getransformeerde schaal;
α is coëfficiënt voor de beste lineaire combinatie voor meting bij 3 uur na de maaltijd Ondernemingen De beste lineair. combinaties van de twee metingen op elk uur verhoogde de diagnostische vermogen van de delen van beide benaderingen (tabel 2), maar de winst beperkt, 3,9% voor DF en 0,4% voor de LDA benadering. Zoals verwacht, Box-Cox macht transformatie van individuele markers verbeterde de diagnostische macht door de beste lineaire combinatie met de LDA aanpak met 4,7% dan die van de ruwe measures.Table 2 False classificaties (%) met jackknife cross-validatie door Fisher's Linear Discriminant analyse (LDA) en Distributie Gratis (DF) benaderingen
Criteria
3- h DF
4-h DF
Linear combinatie DF
Linear combinatie LDA
0.7
24 (19,5%)
59 ( 30,0%)
16 (13,0%)
59 (30,0%)
15 (12,2%)
58 (29,4%)
15 (12,2%)
64 (32,3% )
0.8
37 (30,1%)
39 (19,8%)
21 (17,1%)
40 (20,3%)
21 (17,1%)
40 ( 20,3%)
20 (16,3%)
46 (23,4%)
0,9
60 (48,8%)
21 (10,7%)
27 (21,9%)
23 (11,7%)
28 (22,8%)
20 (10,2%)
27 (22,0%)
22 (11,2%)
Opmerking:: model voorspelde ziekte-status (1 voor ja, 0 voor nee);
y extra's: de diagnose ziekte status (1 voor ja, 0 voor nee) hotels met de ruwe data, de verschillen in de som van vals-positieve en vals-negatieve tarieven voor de beste. lineaire combinaties waren 0,2%, 1,6% en -6,5% tussen de DF en LDA benaderingen op de 0,7, 0,8, en 0,9 gevoeligheidsniveaus. Terwijl de valse negatieve tarieven door de LDA aanpak toonde grote afwijking van die overeenkomt met de vooraf ingestelde drempelwaarden (≤3.0%), die door de DF aanpak relatief dicht (≤ ± 0,2%).
Data transformatie verbeterde de diagnostische kracht van de beste lineaire combinatie voor zowel de LDA en DF benadert door het verlagen van de som van vals-negatieve en vals positieve tarieven. De verlagingen zijn 2,2%, 2,8%, 13,8% en -0,9%, -1,1%, 20,1% voor de DF en LDA benaderingen, respectievelijk. Interessant is dat de grootste verbetering in diagnostische vermogen op de hogere gevoeligheid voor beide benaderingen.
Diagnostische bevoegdheden CART benadering
Seven beslissingsboom modellen, inclusief de volledige model (4 uurlijkse metingen, samen met de leeftijd van de patiënt), de combinaties van 2-uur en 4-h, 3 h en-4-h, samen met elke metingen op elk uur, werden geoptimaliseerd door bomen snoeien met minimum voor de laatste knoop van 10 patiënten [26]. Voor alle afzonderlijk tijdstip modellen, percentage retentie van 4-h heeft de grootste AUC van 0,865, gevolgd door 3-h, 2-h en 1-h, respectievelijk (Tabel 3). Het percentage fout diagnose door beslisboom model met 4-h is 14,4% (28 van de 123 patiënten zonder gastroparese, en 18 van de 197 voor mensen met gastroparese), minder dan de helft van de mensen die ten onrechte door 1- zou worden gediagnosticeerd h en 2 h-punten, en 37% ((73-46) /73) kleiner dan 3 -at-h. Zoals 2-h of 3-h met 4-h met de beslissingsboom niet het aantal correcte diagnose geen progressieve gebruikt 4-h staan ​​zoals aangegeven door jackknife kruisvalidatie. Deze verschillen van resultaten van LDA en DF benaderingen, waarbij de lineaire combinatie van 3-uur en 4-h toonde verbetering ten opzichte middels 4-h alleen. Echter, beslisboom model met ofwel 4-h alleen of de combinatie met een 2-uur of 3-uur niet te lijden in diagnostische nut in vergelijking met zijn tegenhanger modellen geïdentificeerd met ofwel LDA of DF aanpak, ongeacht de data transformatie. De CART-model met behulp van alle vier per uur GES maatregelen samen met de leeftijd van de patiënt was erg interessant. Voor de criteria van maagretentie > 10% bij 4-h en < 53% bij 2-uur, patiënten > 47,5 jaar oud waren bijna 2 maal minder kans op gastroparese (kans = 0,44), als die met de leeftijd <hebben; 47.5 (kans = 0,85) .table 3 False classificaties (%) met jackknife cross-validatie door geoptimaliseerde Classification And Regression Tree (CART) modellen
Type Verkeerde diagnose
1-h kopen van 2-h
3-h
4-h

2-h + 4-h
3-h + 4-h
4-h + 3-h + 2-h + 1-h + Age

76 (61,8%)
28 (22,8%)
29 (23,6%)
28 (22,8%)
28 (22,8%)
28 (22,8%)
26 (21,1%)
24 (12,2%)
69 (35,0%)
44 (22,3%)
18 (9,1%)
18 (9,1%)
18 (9,1%)
18 (9,1%)
Totaal Verkeerde diagnose
100 (31,3%)
97 (30,3%)
73 (22,8%)
46 (14.4 %)
46 (14,4%)
46 (14,4%)
44 (13,8%)
AUC voor optimale Model
0,724
0,753
0,825
0,867
0,865
0,858
0,881
Opmerking:: model voorspelde ziekte verlenen (1 voor ja, 0 voor nee);
y extra's: de diagnose ziekte status (1 voor ja, 0 voor geen enkele ).
Discussie
Lineaire combinaties van diagnostische markers verkregen door LDA of DF aanpak leiden meestal tot hogere discrimineren machten (grotere AUC) dan bij de afzonderlijke componenten. Een simulatiestudie (resultaten hier niet weergegeven) aan dat hoe sterker de correlatie tussen individuele merkmiddelen, hoe kleiner de toename in AUC van de lineaire combinatie. Het mogelijke diagnostische kracht echter afneemt wanneer de correlatie tussen afzonderlijke merkers te verhogen tot 0,7 of hoger. De effectiviteit van het gebruik van een lineaire combinatie afneemt met de toename in grootte van wanverhouding in covariantiematrices tussen de zieke en controlegroepen.
Klein steekproeven leiden tot grote verschillen in optimale coëfficiënten voor de beste lineaire combinatie en de overeenkomstige AUC, vooral voor de LDA aanpak. Zoals steekproefomvang toeneemt, optimale coëfficiënten en AUC van LDA of DF methodes wel of niet elkaar naderen, afhankelijk van de verdeling van de individuele markers.
Marker waarden normaal
Wanneer de marker waarden multivariate normaal, de ramingen van de LDA benadering zeer dicht bij die van de werkwijze DF in termen van AUC, optimale coëfficiënten en de diagnostische vermogen zoals aangegeven door simulatie. Met normale verdeling en een adequate steekproefgrootte, de eerste twee momenten vast te leggen marker De ligging en de schaal parameter met een kleine variatie. In dergelijke gevallen is de LDA benadering het voordeel in rekentijd (meer dan 100-voudig minder) zonder te lijden opslaan in voorspellende kracht dan de DF benadering. Niettemin kan LDA niet overtreffen DF zolang het zoeken grid voor optimale coëfficiënt met DF bevat de puntschatting van LDA. Met andere woorden, de beperking DF in berekeningen en niet methodiek.
Marker waarden niet normaal
Als marker waarden afwijken van de normale verdeling, de DF benadering altijd leidt tot hogere AUC voor de beste lineaire combinatie als het zoeken grid voor optimale coëfficiënten is fijn genoeg. De verlaging prestaties met LDA benadering is een direct gevolg van het gebruik van middelen die wordt voorgespannen door afwijkingen. Exponentiële verdeling bijvoorbeeld vaak een lange staart met een hoge mate van scheefheid hebben tot een gemiddeld met een positieve voorspanning. Bijgevolg de varianties voor markers opgeblazen en de AUC neiging kleiner te zijn. Belangrijker is dat de beste lineaire combinatie die wordt verkregen met LDA aanpak heeft de neiging om de valse negatieve rente te overschatten en onderschatten de foute positieve verhouding op het lagere gevoeligheid (tabel 2), en doen precies het tegenovergestelde aan de hogere gevoeligheid niveau. Integendeel, is de beste lineaire combinatie DF benadering minder beïnvloed door extreme waarden en meestal hoger diagnostische macht terwijl de vooraf ingestelde gevoeligheidsniveaus. Dit is belangrijk omdat in de praktijk een vast percentage vals negatieve een beslissende tolerantiegrens bij diagnostische geneeskunde. Beyond dergelijke beperking, zou de inzet van het verlies-batenverhouding te verhogen, of in ieder geval, de diagnostische beslissing is minder kosteneffectief.
Het effect van de transformatie data
Effectieve data transformatie verbetert de normale fit en dus parameterschatting door LDA aanpak, maar of deze verbetering in de nieuwe gegevens die niet is opgenomen voor parameterschatting zal houden blijft onduidelijk. Cross-validatie met de gastroparese gegevens blijkt dat de macht transformatie verhoogde AUC en gestabiliseerd parameterschattingen in de opleiding sets, en dat een dergelijke winst zou vertalen in hogere diagnostische macht in de test sets (tabel 2). Data transformatie sloot het gat in diagnostische macht tussen de beste lineaire combinatie van LDA en DF benaderingen met de klinische gegevens. Interessant is dat de DF benadering liet een consistente verbetering met transformatie op alle niveaus van gevoeligheid op 0,7, 0,8 en 0,9. De trend van de LDA aanpak is niet zo duidelijk. Een reden kan zijn het percentage gastrische retentie gemeten bij 3-uur en 4-h zo scheef dat krachtomvormmiddelen is niet voldoende om de metingen aan bijna normale verdeling gebracht.
Optimaliseren diagnostische vermogen met GES maatregelen CART model
In tegenstelling tot eerder onderzoek met gezonde vrijwilligers studiepopulatie bestond met een gemengde groep proefpersonen hetzij bedoelde vermoedelijke gastroparese of onderzocht om andere redenen.

Other Languages