В этой статье есть отчеты Обзор Open Peer доступные.
<Р> Как работает Open Peer обзора работы?
Оптимизация диагностическую с опорожнение желудка сцинтиграфия в различные моменты времени
Аннотация
Справочная информация
желудочное опорожнение сцинтиграфии (GES) с интервалами в течение 4-х часов после стандартизированного радиоактивно меченого еды обычно рассматривается как золотой стандарт для диагностики пареза желудка. Цели данного исследования были: 1) исследовать лучший момент времени, и наилучшее сочетание нескольких моментов времени для диагностики пареза желудка с повторными измерениями GES, и 2) для контраста и перекрестной проверки Фишера Линейный дискриминантный анализ (LDA), звание Распределение на основе Free (DF) подход, а модель (ВОЗ) Классификация и регрессия дерево.
Методы
в общей сложности 320 пациентов с мерами ГЭС на 1, 2, 3 и 4 часа (ч) после того, как стандарт прием пищи с использованием стандартизированного метода были ретроспективно собраны. Площадь под характеристической (ROC) кривой приемник Операционная и скорость ложной классификации посредством складного ножа перекрестной проверки были использованы для сравнения модели.
Результаты Из-за сильной корреляции и отклонения от нормы в распределении данных, без существенного улучшения диагностики мощность была найдена с лучшей линейной комбинации по LDA подхода даже с преобразованием данных. С помощью метода DF, линейная комбинация 4-х и 3-х часов увеличили площадь под кривой (AUC) и снижение числа ложных классификаций (0,87; 15,0%) по сравнению отдельных временных точках (0,83, 0,82; 15,6%, 25,3 %, в течение 4-х и 3-х ч, соответственно) на более высоком уровне (чувствительность = 0,9). Модель CART с помощью 4-часовые измерения GES наряду с возрастом пациента был наиболее точный диагностический инструмент (AUC = 0,88, ложной классификации = 13,8%). Пациенты, имеющие 4-х желудочный значение удержания &Гт. 10% были в 5 раз больше шансов иметь пареза желудка (179/207 = 86,5%), чем те, с ≤10% (18/113 = 15,9%)
Выводы <бр> со смешанной группой пациентов либо указанной с подозрением на гастропарезу или исследуемом по другим причинам, модель CART является более надежной, чем подходы LDA и DF, способные вместить ковариата эффекты и могут быть обобщены для перекрестных институциональных приложений, но может быть неустойчивым, если размер выборки ограничен.
фона
опорожнения желудка сцинтиграфию с интервалами в течение 4 ч после еды стандартизированной обычно рассматривается как золотой стандарт для измерения опорожнения желудка раз. На практике, упрощенная ежечасно мера остаточного желудочного содержимого используется для диагностики парез желудка, определенный как замедленное опорожнение желудка (GE) при отсутствии механического препятствия [1, 2]. Техника измеряет радио-меченых продуктов питания, оставаясь в желудке с часовыми интервалами после того, как пациент проглатывает стандартизированную пищу [3] в качестве индикатора задержки с GE. Из-за различий в пищевых продуктах, используемых, методов, используемых, а также конечных точек, измеренных с GES, анализа и интерпретации результатов различаются между учреждениями [4]. Большинство предыдущих исследований показали, что задержка опорожнения желудка лучше всего может быть показано с желудочным удержанием > 10% в 4- ч после еды, которая была создана в 95-процентиль в желудочном удержания с здоровых добровольцев через многоцентровое исследование [5, 6] , Как всегда, распределение на основе диагностических решений является произвольным и может неизбежно вызвать ошибку из-за неправильной классификации. Сообщается, что упрощенный подход имеет специфичность 62% и чувствительность 93% [7]. Другие используют процент удерживания в 2-ч в рутинных клинических измерений GES [8], предполагая GES в 2-ч или 3-Н может быть лучшая точка индивидуальное время с более высокой диагностической мощности. Тем не менее, процент желудка ретенции в различные моменты времени также могут быть подвержены возраста пациента и пола [5]. Отсутствие стандартизации в проведении GES наряду с различиями в количественном анализе, используемых в различных учреждениях может ограничить клиническое применение теста, и представляет проблемы, если необходимо оценить кросс институциональные данные. В 2008 году от имени американского Neurogastroenterology и моторики общества и общества ядерной медицины, исследователи из 13 американских медицинских учреждений совместно опубликовали заявление консенсуса по стандартизации GES через учреждений [4]. Кроме того, вопросы, требующие дальнейшего изучения, были определены консенсусом, которые включают в себя: 1) использование 3-ч по сравнению с 2- и 4-х результатов для обнаружения отсроченной GE; и 2) использование нескольких временных точках (2- и 4-ч) по сравнению с одиночными значениями 2- или 4-х для дальнейшего понимания клинического значения несогласованных результатов между 2- и 4-х сканов.
Методика по использованию различные диагностические маркеры для выявления заболеваний или прогнозировать риски, связанные со здоровьем является активным полем исследований [9-11]. С быстрым прогрессом в области геномных и протеомных технологий, акцент на биомаркеров на основе выявления заболевания и оценки риска в настоящее время перешли от одного биомаркера к панели биомаркеров, так как различные маркеры могут быть чувствительны к различным аспектам заболевания [12]. Утверждается, что, по сравнению с одним клиническим или генетического маркера, панель из нескольких маркеров может содержать более высокий уровень дискриминационного информации, особенно в больших популяциях пациентов гетерогенных и сложных многоступенчатых заболеваний. Это важно, потому что с помощью нескольких маркеров одновременно может привести к новой диагностической меры с более высокой чувствительностью [11].
Когда несколько маркеров непрерывны и распределены по нормальному закону, LDA Фишера обеспечивает наилучшую линейную комбинацию, которая максимизирует чувствительность во всем диапазоне специфичности равномерно по многомерной нормальной модели распределения [11]. Когда значения маркера отклоняются от нормального, степенного преобразования Бокса-Кокса может быть использован для улучшения нормального подгонку [13]. Этот подход был найден эффективным при оценке кривых АУК и ROC, если лежащих в основе истинных распределений, либо на оригинале или на преобразованном масштабе, близки к многомерным нормальным [11]. В противном случае, ранг на основе распределения свободный подход может быть применен. Теоретические аспекты наилучшей линейной комбинации для биомаркеров хорошо сообщили [[9, 11, 14-19], и [20]]. LDA Фишера легче вычислить, в то время как подход DF более устойчив к отклонению от нормального распределения, но является вычислительно непомерно высокой, если более двух маркеров вовлечены [19]. Мы использовали оценки параметров из LDA в качестве отправной точки для поиска сетки с DF, если маркер пространство выходит за рамки двусторонних. Модель ВОЗ, с другой стороны, обеспечивает другой подход к оптимизации диагностической мощности, когда маркеры являются многомерными [21-23]. Вместо того чтобы создавать новые диагностические меры, как LDA или DF, CART использует последовательный процесс для идентификации набора предикторов, в их первоначальном масштабе, что лучше всего дифференцировать группы среди переменного результата интереса. Это особенно полезно, когда есть много предикторов, которые сильно связаны между собой. Это вычислительно менее интенсивно и легко интерпретировать, но может быть неустойчивым, если модель недостаточно обучен с ограниченными данными.
Большинство предыдущих исследований сосредоточены на получении наилучшего сочетания маркеров, который максимизирует АУК для субъектов, чья болезнь статус был известен [11 , 14-20]. Остается неясным, если диагностическая мощность для такой комбинации распространяется на население с известными значениями маркеров, но с неизвестным статусом заболевания или населения, чьи значения маркера не используются для получения диагностических параметров. С помощью стандартизованной пищи (см Материалы и методы) и почасовой технику GES (пять сессий 2-х минут визуализации) в течение 4-часового периода, меньше времени камеры требуется в то время как результаты могут быть воспроизводимым из больницы в больницу. В этом документе дается оценка статистических параметров, которые оптимизируют диагностическую с GES мер в нескольких временных точках. Используя первичный клинический диагноз, определяемый такими симптомами, как тошнота, рвота, чувство быстрого насыщения, постпрандиальной полноты, дискомфорт в животе, и боли, в дополнение к доказательства замедленное опорожнение желудка при отсутствии механического желудка выпускной обструкции, как истинный статус гастропарезу , это исследование фокусируется на поиске параметров наилучшей линейной комбинации GES в различные моменты времени с подготовки данных, а затем, исследует и кросс-проверяет его производительность в тестовых данных, которые не были использованы для получения модели.
Методы <бр> характеристическая кривая приемника, работающего (ROC), а площадь под кривой, в частности, является простым и значимым показателем для оценки полезности диагностического маркера (ов) [10]. На протяжении всей работы, ROC и АУК используются для сравнения разных методов и различных моделей для лучшей диагностической мощности гастропарезу. Сумма ложноположительных и ложноотрицательных диагнозов по всей выборке был использован, чтобы противопоставить диагностической мощности между LDA, DF и CART через складной нож (возьмите одну из них) кросс-проверки.
Линейный дискриминантный подход Фишера (LDA)
Пусть ш
<подразделам> IJ
представляет я
й
маркера значения J
й
субъекта в пораженной группе; и v
<суб> ик
быть я
й
маркера значения к
й
субъекта в контрольной группе; где я
= 1, ..., р; J
= 1, ..., т; и к
= 1, ..., п.
Пусть X и Y являются векторами значений маркеров с многомерного нормального распределения для больных и контрольной группах соответственно, то (1) Коэффициент вектор, α
<суб> р × 1, для лучшей линейной комбинации объединенного вектора маркера из пораженной и контрольной групп по критериям РПЦ: (2) AUC под кривой ROC является: (3) где Φ обозначает стандартный кумулятивный . нормальная функция распределения
специфичность (F <суб> а (с)) и чувствительность (H <югу> а (с)), являются: (4) (5) Уровень распространения на основе Свободный подход (DF)
Под рангом распределения на основе свободного подхода [19], АУК может быть рассчитана как статистики Манна-Уитни U [24]: (6) Заметим, для непрерывного распределения, Pr (I
= 1/2) = 0.
Где ж
<подразделам> IJ
это я
го значения маркера для J
й предмет в пораженной группе; v
<суб> ик
это я
го значения маркера для K
й предмет в контрольной группе; I, J, K, M
, и п
как определено в предыдущем разделе; АУК
(α
) находится площадь под кривой распределения по свободный подход с оптимальным вектором коэффициентов (а). Так как РПЦ инвариантно к монотонно возрастающей трансформации, вектор коэффициентов α изображения в обоих LDA и DF подходы могут быть пересчитаны, как (1, β <югу> 2 /β <югу> 1, β <суб> 3 /β <югу> 1, ... β <югу> я /β <югу> 1), где β <югу> я /β <югу> 1 представляет собой вес для я
го значения маркера относительно маркера 1 [19].
Классификация и регрессия деревья (ВОЗ) модель
в отличие от LDA или DF, методология ВОЗ определяет множество предсказателей от всех переменных, которые наилучшим образом дифференцируются классы в исходе интерес в последовательном процессе. На каждом шаге (узел), алгоритм CART сначала идентифицирует лучший предсказатель от всех переменных-кандидатов, а затем производит поиск по всем значениям за лучший предсказатель, но использует только одну точку отсечки, чтобы разделить образец в пределах узла на две подотрасли. Затем он осуществляет поиск по всем переменным предсказателя и идентифицирует лучшую точку среза от лучшего предсказателя в каждой подотрасли и повторяет процесс до тех пор, определенные критерии, такие как минимальной дисперсией или минимального размера группы, во всех терминальных узлах не выполняется. На каждом узле, тележках стремится классифицировать выборку на группы таким образом, что максимальная однородность дочерних узлов достигается. Когда терминальный узел достигнут, модель дает вероятность принадлежности к той или иной категории для всех остальных предметов, которые попадают в этот узел. На практике, минимальный размер узла обычно устанавливается на уровне 10% от обучающей выборки, чтобы избежать потенциально более подгонки модели таким образом, что окончательное решение дерево, скорее всего, будет полезным для классификации популяций с аналогичными характеристиками, что и у обучающей выборки, но было не используется для получения модели CART. В отличие от LDA подхода, тележках может быть особенно полезно, когда модели корреляции между предикторов не последовательны по всему диапазону, так как он не является необходимым для той же переменной, оптимальной для всех узлов ветвления всего дерева [22].
оценка параметров
для LDA подхода, мы написали /IML программы SAS [25] для расчета среднего (м), дисперсия (S) для больных и контрольной групп, и все оценки параметров описаны в методе раздел. Во-первых, вектор коэффициентов α
, АУК для линейной комбинации, а также для отдельных маркеров, было получено с уравнениями (2) и (3) от обучающих данных. Тогда коэффициент α
был применен к соответствующим данным испытаний, чтобы получить линейную комбинацию балл. Три пороговых значения, соответствующие уровням чувствительности на 0,7, 0,8 и 0,9 для линейной комбинации балла были получены с данными гастропарезу с использованием в уравнении (5). Каждое пороговое значение было использовано на левом из данных, чтобы классифицировать случай ни в одну больную или не пораженной группы. Прогнозируемый статус был затем сшивают сведены в таблицу с известной категории заболевания.
Подход DF начал с произвольной начальной точке, а затем сетки искали коэффициентов, которые максимизируют статистики Манна-Уитни U с обучающих данных в следующих шагах.
1) линейная комбинация балл для каждого наблюдения была получена путем умножения маркера вектора X с начальным коэффициентом вектор, α
<югу> (1, α
).
2) АУК, соответствующий вектор коэффициент α
рассчитывается с уравнением (6).
3) Повторите первые два шага для каждого возможного вектора коэффициентов и агрегировать соответствующий АУК и а
.
4) Выберите коэффициент, максимально АУК и определить критическое значение линейной комбинации балла на 0,7, 0,8 и 0,9 чувствительность уровней.
5) Применение коэффициента с шага 4 для тестовых данных для получения наилучшего линейная комбинация счет.
6) Использование каждое критическое значение, начиная с шага 4 в тестовых данных, чтобы предсказать каждый случай в любой больной или не больной группы, затем пересечь табулирование с известной категории заболевания.
для CART модели мы использовали пакет в пределах R TREE [26] среда для каждого из четырех часовых мер, а также их комбинации наряду с возрастом пациента и пола, чтобы определить лучшую модель. Перекрестная проверка с минимальным размером 10 предметов для каждого оконечного узла был использован для оптимизации модели дерева решений с использованием всех наблюдений [27]. AUC для каждого оптимизированного дерева решений было рассчитано для сравнения всех моделей. Затем одно наблюдение вынимают из всей выборки, а остальные предметы используются для построения дерева решений, которое, в свою очередь, был использован для прогнозирования состояния болезни левого из наблюдения. Производительность каждого дерева решений была обобщена с общим количеством ошибочных предсказаний по всей выборке.
Данные Гастропарез
В общей сложности 320 диаграмм от пациентов в возрасте от 16 ~ 89 (42,8 ± 14,3 (среднее значение ± станд)), 255 (79%) женщин, с GES мер на 1 ч, 2 ч, 3 ч и 4 ч после стандартного приема пищи с использованием стандартного метода (5) были ретроспективно собранные в университете Канзаса медицинский центр (KUMC). Протокол исследования был одобрен Советом по институциональному (IRB) в KUMC. Во время измерения GES, доля пищи расходуется и время, необходимое для потребления было зафиксировано. Субъекты с необычной процент приема пищи потребляется (например, &л; 20% от приема пищи) /время потребление (например, > 30 минут) были исключены. Все пациенты были либо упоминается с подозрением на гастропарезу или исследовали по другим причинам из-за самостоятельной сообщаемых симптомов, таких как тошнота, полноты, раннее насыщение, рвота и вздутие живота. На основе общей оценки, в дополнение к почасовой мер GES, исследование врачи диагностировали 197 (62%) из 320 пациентов с гастропарезу в качестве основной причины для упомянутых выше клинических симптомов и их посещения больницы. Несмотря на аналогичные медицинские опытов, кроме гастропарезу заболевания рассматривались в качестве первичных поставленном диагнозе остальных 123 пациентов. Никаких существенных различий в среднем возрасте (р = 0,12, Т-тест) и пола (р = 0,99, по х 2 теста) не были найдены между группами с и без гастропарезу. Для каждого пациента, опорожнение желудка сцинтиграфию проводили утром после ночного голодания с прокинетики остановлен в течение не менее 3-х дней. Стандартизованный метод опорожнения желудка состоит из эквивалента двух яичницей (заменить яйцо), меченных 99m Tc серы коллоидной, 2 куска тоста с желе и 4 унции воды с общей калорийностью 255 ккал. Передние и задние изображения желудка были взяты сразу после еды, а затем каждый час в течение 4-х часов [28].
Результаты
Во время повторного измерения опорожнения желудка, процент ретенции изотопа в желудке при 1-ч, 2-х, 3-х, и 4-ч после приема пищи уменьшается со временем и сильно коррелировали, особенно у мужчин и у пациентов с гастропарезу. коэффициент корреляции Спирмена колебался от 0,34 (р &ЛТ; 0,001) между 1-Н и 4-х часов для пациентов без гастропарезу до 0,93 (р &ЛТ; 0,001) между 3-Н и 4-х часов для пациентов с гастропарезу. В целом, распределение удержания процентов отклоняется от нормального, с первых двух часовых значений перекос в сторону нижнего конца, а второй два часа перекос в сторону более высокого конца (рисунок 1). Рисунок 1 Процент удерживания желудка в 1-Н, 2-Н, 3-х и 4-х после приема пищи для случая (зеленый) по сравнению с контролем (серый). 1-Н-с, 2-Н-С, 3-Н-С, 4-H-C представляет собой процентное опорожнение желудка (GE) на 1-Н, 2-Н, 3-Н, и 4-ч после приема пищи у пациентов с диагнозом гастропарезу; Whisker представляет собой 70% межквартильный диапазон.
Диагностические полномочия от LDA и DF подход
Часовые меры на 3-х и 4-х ранее сообщалось как с лучшим диагностические утилиты, мы сопоставляли их наилучшую линейную комбинацию обоими LDA ( Рисунок 2) и подходы DF (таблица 1). Во-первых, мы оценили АУК для двух измерений наряду с оптимальным коэффициентом для их наилучшей линейной комбинации и пороговых значений для линейной комбинации балла на 0,7, 0,8 и 0,9 уровней чувствительности обоими LDA и DF подходит для всех, но 1 из 320 предметы. Оптимальный коэффициент, наряду с тремя пороговыми значениями был затем применен к левому из субъекта. Сравнивая пороговые значения с расчетной линейной комбинации балла, был зафиксирован прогнозируемый gastroparetic статус для левого из субъекта. Скорости ложных отрицательных и ложно положительных результатов были получены повторением процесса складного ножа для всех 320 субъектов. Тогда, степенного преобразования Бокса-Кокса применялась и тот же анализ был повторен для преобразованных данных. Рисунок 2 эксплуатационная характеристика (ROC) Кривая приемника для почасовой удержания процентов при 2-ч, 3-х, 4-х, и их наилучшая линейная комбинация. Площадь под кривой (AUC) увеличилась с 2-х часов до 4-х часов и развернутого с лучшей линейной комбинации всех трех часовых измерений.
Таблица 1 Оценки параметров (площадь под кривой (AUC) и коэффициент для лучшей линейной комбинации ) с линейным дискриминантного анализа Фишера (LDA) и распределения Free (DF) подходы
4-х
3-х
линейная комбинация DF
линейная комбинация LDA
<й>
Raw
Tran
Raw
Tran
α
Raw
α
Tran
α
Raw
α
Tran
Mean
0.830
0.879
0.824
0.827
0.02
0.869
0.02
0.869
0.681
0.834
0.055
0.881
STD
0.002
0.001
0.002
0.002
0.00
0.001
0.00
0.001
0.032
0.002
0.002
0.001
Median
0.830
0.879
0.824
0.827
0.02
0.869
0.02
0.869
0.679
0.833
0.055
0.880
Range
0.013
0.009
0.011
0.009
0.00
0.008
0.00
0.008
0.284
0.012
0.017
0.009
Примечание: Сырье означает АУК для измерения в оригинальном масштабе;
Tran представляет собой АУК для измерения в преобразованном масштабе;
α коэффициент для наилучшей линейной комбинации для измерения в 3-х часов после еды
наилучшая линейная. комбинации двух почасовой мер повысило диагностическую силу его отдельных компонентов с помощью обоих подходов (таблица 2), но прирост был ограничен, 3,9% для DF, и 0,4% для ЛД-подхода. Как и следовало ожидать, Бокса-Кокса преобразования мощности на отдельных маркеров улучшили диагностическую Лучшими линейной комбинации с подходом, LDA на 4,7%, чем у необработанного measures.Table 2 Ложные классификации (%) с складного ножа перекрестной проверки с помощью линейный дискриминантный Фишера Анализ (LDA) и распространения Free (DF) приближается
3- ч DF
4-х DF
Линейная комбинация DF
Линейная комбинация LDA
0.7
24 (19,5%)
59 ( 30,0%)
16 (13,0%)
59 (30,0%)
15 (12,2%)
58 (29,4%)
15 (12,2%)
64 (32,3% )
0,8
37 (30,1%)
39 (19,8%)
21 (17,1%) 40 (
20,3%)
21 (17,1%)
40 ( 20,3%)
20 (16,3%)
46 (23,4%)
0,9
60 (48,8%)
21 (10,7%)
27 (21,9%)
23 (11,7%)
28 (22,8%)
20 (10,2%)
27 (22,0%)
22 (11,2%)
Примечание:: модель предсказал статус заболевания (1 для да, 0 для нет);
у
: диагностировано статус заболевания (1 для да, 0, если нет)
С необработанных данных, различия в сумме ложноположительных и отрицательных ставок на лучшее. линейные комбинации были 0,2%, 1,6%, и -6,5% между DF и LDA подходов на уровнях чувствительности 0,7, 0,8 и 0,9. В то время как ложные отрицательные ставки на подходе LDA показали большое отклонение от соответствующих заданных пороговых уровней (≤3.0%), те, с помощью подхода DF относительно близки (≤ ± 0,2%).
Преобразование данных улучшила диагностические возможности из лучших линейных комбинаций для обоих LDA и DF подходы путем уменьшения суммы ложных отрицательных и ложных срабатываний. Сокращения являются 2,2%, 2,8%, 13,8% и -0.9%, -1.1%, 20,1% для подходов DF и LDA, соответственно. Интересно отметить, что самое большое улучшение диагностической мощности находится на более высоком уровне чувствительности для обоих подходов.
Диагностические силы с тележкой подхода
Семь моделей дерева решений, в том числе полной модели (4 почасовые измерения наряду с возрастом пациента), комбинации 2-х часов и 4-х, 3-х часов и 4-х часов, а также с каждой почасовой меры, были оптимизированы с помощью дерева-отсечение с минимальным размером для конечного узла 10 субъектов [26]. Для всех моделей с одним моментом времени, процент удерживания при 4-х имеет наибольшее АУК 0,865, а затем 3-Н, 2-ч и 1-ч соответственно (таблица 3). Скорость ложного диагноза на основании решения модели дерева с 4-ч составляет 14,4% (28 из 123 пациентов без гастропарезу, и 18 из 197 для тех, кто с гастропарезу), менее половины из тех, кто будет ошибочно диагностируется 1- ч и 2-з точки, и 37% ((73-46) /73) меньше, чем тот -AT 3-Н. В том числе и через 2 часа или 3-Н вместе с 4-ч с дерева решений не привела к увеличению количества правильных диагнозов по сравнению с использованием уже о 4-х, как указано посредством перекрестной проверки складного ножа. Они отличаются от результатов, полученных с LDA и пеленгации подходов, в которых линейная комбинация 3-Н и 4-х показали небольшое улучшение по сравнению с использованием 4-х в одиночку. Тем не менее, дерево решений модели либо только 4-х или его комбинации с 2-ч или 3-ч не страдал в диагностической полезности по сравнению с аналогичными моделями своих идентифицированных либо LDA или DF подход, независимо от преобразования данных. Модель CART используя все четыре почасовой GES меры наряду с возрастом пациента было очень интересно. Для критериев желудка удержания и GТ; 10% при 4-х и &ЛТ; 53% при 2-х, больных &GТ; 47,5 лет были почти в 2 раза меньше шансов гастропарез (вероятность = 0,44), как те, с возрастом и ЛТ; 47.5 (вероятность = 0,85) .table 3 Ложные классификации (%) с складного ножа перекрестной проверки оптимизированной классификации и регрессионного Tree (ВОЗ) модели
1-ч
2-х
3-х
4-х
<бр> 2-х + 4-х
3-х + 4-х
4-х + 3-х + 2-х + 1-ч + Возраст
76 (61,8%)
28 (22,8%)
29 (23,6%)
28 (22,8%)
28 (22,8%)
28 (22,8%) <бр> 26 (21,1%)
24 (12,2%)
69 (35,0%)
44 (22,3%)
18 (9,1%)
18 (9,1%)
18 (9,1%)
18 (9,1%)
Total Ошибочный диагноз
100 (31,3%)
97 (30,3%)
73 (22,8%)
46 (14,4 %)
46 (14,4%)
46 (14,4%)
44 (13,8%)
АУК для оптимизированной модели
0,724
0,753
0.825
0,867
0,865
0,858
0,881
Примечание:: модель не предсказывал статус заболевания (1, если да, 0 для нет);
у
: диагностировали статус заболевания (1 для да, 0 для нет ).
Обсуждение
Линейные комбинации диагностических маркеров, полученных с помощью LDA или DF подход, как правило, приводят к более высоким дискриминационный характер полномочий (больше, чем AUC) с ее отдельными компонентами. Исследование моделирование (результаты не показывают здесь) показали, что чем сильнее корреляция между отдельными маркерами, тем меньше увеличение AUC их линейной комбинации. Потенциальный выигрыш в диагностической мощности, однако, уменьшается, когда корреляция между отдельными маркерами увеличится до 0,7 и выше. Эффективность использования линейной комбинации уменьшается с увеличением величины несоразмерности в ковариационных матриц между больными и контрольной групп.
Небольшие размеры выборки приводят к большому изменению оптимальных коэффициентов для лучшей линейной комбинации и соответствующей AUC, особенно для LDA подход. По мере увеличения размера выборки, оптимальных коэффициентов и АУК LDA или методами DF могут или не могут приближаться друг к другу в зависимости от распределения отдельных маркеров.
Маркерных значений нормального
Когда значения маркера многомерным нормальным, то оценкам ЛДА подход очень близок к методу DF в терминах ППК, оптимальных коэффициентов и диагностической мощности, как показано с помощью моделирования. При нормальном распределении и адекватного размера выборки, первые два момента захвата расположение и масштабный параметр маркера с небольшим изменением. В таких случаях подход ДАЛ имеет преимущество в экономии времени вычислений (более чем в 100 раз меньше) без страданий в предсказательной силе, чем подход DF. Тем не менее, LDA не может опережать DF тех пор, пока поиск сетки для оптимального коэффициента с DF содержит точечную оценку по LDA. Другими словами, ограничение с DF в вычислениях, а не методологии.
Маркерных значений не нормальный
При маркерных значений отклонения от нормального распределения, подход DF всегда приводит к более высокой АУК для лучшей линейной комбинации если поиск сетки для оптимальных коэффициентов достаточно хорошо. Спектакль с LDA понижение подход является прямым результатом использования средств, которые смещена из-за отклонений от нормы. Экспоненциальное распределение, например, как правило, имеют длинный хвост с высокой степенью асимметричности, что приводит к среднему с положительным смещением. Как следствие, дисперсии для маркеров надувают и ППК имеет тенденцию быть меньше. Что еще более важно, лучшая линейная комбинация получается с LDA подхода характерна тенденция к завышению ложные отрицательные темпы и недооценивать ложных срабатываний на более низком уровне чувствительности (таблица 2), и делать ровно наоборот на более высоком уровне чувствительности. Напротив, наилучшая линейная комбинация по DF подход менее подвержена воздействию экстремальных значений и, как правило, имеют более высокие диагностические возможности при сохранении заданных уровней чувствительности. Это важно, потому что, на практике, фиксированная ложноотрицательный ставка представляет собой критический предел толерантности в диагностической медицине. Помимо такого предела, доля коэффициента потерь и выгод будет увеличиваться, или, по крайней мере, диагностическое решение является менее экономически эффективным.
Эффект преобразования данных
Эффективное преобразование данных улучшает нормальную посадку и, таким образом, оценивание параметров по LDA подход, будет ли, но это улучшение держать в новых данных, не включенные для оценки параметров остается неясным. Перекрестная проверка с данными гастропарезу показали, что преобразование мощности увеличилась АУК и стабилизированный оценки параметров в учебных комплектов, и, что такие выгоды будут привести к более диагностической мощности в тестовых наборов (таблица 2). Преобразование данных закрыли разрыв в диагностической мощности между лучшими линейными комбинациями по ЛДА и DF подходов с клиническими данными. Интересно отметить, что подход DF показал последовательное улучшение с трансформации на всех уровнях чувствительности на уровне 0,7, 0,8 и 0,9. Тенденция с подходом LDA не так очевидно. Одной из причин может быть процент желудка ретенции, измеренные в 3-х и 4-х настолько искажены, что преобразование мощности не достаточно, чтобы поставить измерения на почти нормального распределения.
Оптимизация диагностической мощности с помощью мер GES с тележкой модели <бр