Упрощение отношений правдоподобия

1 Получено из системы здравоохранения Вашингтонского университета Сиэтл-Пьюджет-Саунд, Сиэтл, Вашингтон.

Абстрактный

Отношения правдоподобия - один из лучших показателей диагностической точности, хотя они используются редко, потому что для их интерпретации требуется калькулятор для преобразования «вероятности» и «шанса» заболевания. В этой статье описывается более простой метод интерпретации отношений правдоподобия, позволяющий избежать использования калькуляторов, номограмм и преобразований в «шансы» болезни. Несколько примеров показывают, как врач может использовать этот метод для уточнения диагностических решений у постели больного.

Отношения правдоподобия (LR) представляют собой один из лучших способов измерения и выражения диагностической точности. Однако, несмотря на свои многочисленные преимущества, LR используются редко, в первую очередь потому, что для их интерпретации требуется калькулятор для преобразования между вероятностью заболевания (термин, знакомый всем клиницистам) и шансами заболевания (термин, загадочный для большинства людей, кроме статистиков). и эпидемиологи). Хотя номограммы могут обойти эти вычисления, 1, 2 эти номограммы редко доступны у постели больного и редко используются. В этой статье описывается более простой метод интерпретации LR, который позволяет избежать калькуляторов, номограмм и преобразований в шансы заболевания, а также показывает, как LR могут уточнить диагностические решения у постели больного.

ОПРЕДЕЛЕНИЕ LR

LR любого клинического результата - это вероятность такого обнаружения у пациентов с заболеванием, деленная на вероятность такого же обнаружения у пациентов без заболевания:

Например, среди пациентов с вздутием живота, которые проходят ультразвуковое исследование, физический признак «вздутие бока» присутствует у 80% пациентов с подтвержденным асцитом и у 40% пациентов без асцита (т. Е. Вздутие происходит из-за жира или газа). Таким образом, LR для «выпуклых боков» при обнаружении асцита составляет 2,0 (т. Е. 80%, деленное на 40%). Точно так же, если обнаружение «боковой тимпании» присутствует у 10% пациентов с асцитом, но у 30% пациентов с растяжением по другим причинам, LR для «боковой тимпании» при обнаружении асцита составляет 0,3 (т. Е. 10%, деленное на 30%). ).

LR может варьироваться от 0 до бесконечности. Результаты с LR больше 1 говорят в пользу интересующего диагноза; чем больше число, тем убедительнее вывод о том, что это заболевание. Результаты, LR которых лежат между 0 и 1, опровергают интересующий диагноз; чем ближе LR к 0, тем меньше вероятность заболевания. Результаты, у которых LR равен 1, не имеют диагностической ценности.

ОБЫЧНОЕ ПРИМЕНЕНИЕ LRS

Насколько обнаружение выпуклых боков (LR = 2,0) свидетельствует об асците, и насколько обнаружение боковой тимпании (LR = 0,3) - против этого? Чтобы ответить на эти вопросы традиционными методами, клиницисты должны сначала определить предварительную вероятность (или распространенность) асцита в своей практике, а затем выполнить 3 вычисления. Например, если примерно у 2 из 5 пациентов с вздутием живота есть асцит, вероятность предварительного тестирования составляет 40%. Традиционный способ применения обнаружения выпуклых боковых сторон (LR = 2,0) состоит в том, чтобы затем преобразовать вероятность предварительного тестирования (P pre ) в предварительные шансы (O pre ), используя O pre = P pre / (1 - P pre ), а затем умножить предварительные шансы (O предварительно) с помощью LR для вывода, чтобы получить шансы после тестирования (т.е. O post = LR × O pre ), а затем преобразовать шансы после тестирования обратно в вероятность после тестирования, используя P post = O post / (1 + O post ). Используя калькулятор для выполнения этих трех расчетов, мы обнаруживаем, что обнаружение выпуклых боков (LR = 2,0) увеличивает вероятность асцита с 40% до 57% (т. Е. Предварительные шансы = 0,4 / (1 - 0,4) = 0,667; посттест шансы = 0,667 × 2,0 = 1,333; вероятность после тестирования = 1,333 / (1 + 1,333) = 0,57 или 57%). Подобные расчеты показывают, что обнаружение барабанной перепонки снижает вероятность асцита с 40% до 17%.

ПРОСТОЙ СПОСОБ ПРИМЕНЕНИЯ LRS

Более простой метод позволяет избежать этих вычислений, используя оценки, приведенные в таблице 1. Согласно этим оценкам, которые не зависят от вероятности предварительного тестирования, обнаружение с LR 2,0 увеличивает вероятность заболевания примерно на 15%, а открытие с LR 0,3 снижает вероятность заболевания примерно на 25%. Следовательно, выпуклые бока увеличивают вероятность асцита с 40% до примерно 55% (т. Е. 40 + 15 = 55%, только на 2% ниже расчетного ответа), а тимпания по бокам снижает ее с 40% до примерно 15% (т. Е. , 40-25 = 15%, всего на 2% ниже расчетного ответа). Пока клиницист округляет оценки вероятности после тестирования от более 100% до четных 100% и от менее 0% до четных 0%, эти оценки будут точными с точностью до 10% от рассчитанного ответа для всех предварительных вероятностей от 10 до 10%. % и 90%.Средняя ошибка составляет всего 4%.

Таблица 1

Отношения правдоподобия и прикроватные оценки

Коэффициент правдоподобия Приблизительное изменение вероятности (%) *
Значения от 0 до 1 снижают вероятность заболевания.
 0,1-45
 0,2−30
 0,3−25
 0,4−20
 0,5−15
10
Значения больше 1 увеличивают вероятность заболевания
 2+15
 3+20
 4+25
 5+30
 6+35
 7
 8+40
 9
 10+45

В тексте описано, как легко вспомнить эти оценки.

Таблицу 1 легко вспомнить у постели больного, просто запомнив 3 конкретных LR - 2, 5 и 10 - и первые 3 числа, кратные 15 (т. Е. 15, 30 и 45). LR, равный 2, увеличивает вероятность на 15%, один из 5 увеличивает ее на 30%, а один из 10 увеличивает ее на 45%. Для тех значений LR от 0 до 1 врач просто инвертирует 2, 5 и 10 (т. Е. 1/2 = 0,5, 1/5 = 0,2, 1/10 = 0,1). Подобно тому, как LR 2,0 увеличивает вероятность на 15%, его обратное значение 0,5 снижает вероятность на 15%. Точно так же LR 0,2 (обратное 5) снижает вероятность на 30%, а LR 0,1 (обратное 10) снижает ее на 45%. Эти контрольные LR можно использовать для аппроксимации оставшейся части таблицы 1.

Хотя этот метод неточен для предварительных испытаний с вероятностями менее 10% или более 90%, это не является недостатком, поскольку эти полярные крайние значения вероятности указывают на диагностическую достоверность для большинства клинических проблем, что делает ненужным заказ дополнительных тестов (и применение дополнительных LR). ).

ВЫВОД ТАБЛИЦЫ 1

Оценки, представленные в таблице 1, согласуются с рассчитанными ответами, несмотря на игнорирование вероятности до теста и шансов заболевания из-за своеобразной S-образной связи между вероятностью и логарифмическими шансами * (рис. 1), которые между вероятностями 10% и 90%, почти линейный. Вспоминая уравнение O post = LR × O pre и его логарифмический эквивалент (log O post = log LR + log O pre ), простая замена линейного приближения из рисунка 1 показывает:

S-образная кривая описывает фактическую взаимосвязь между вероятностью и логарифмическими шансами, а прямая линия представляет собой оценку почти линейного участка этой кривой между вероятностями от 10% до 90%. S-образная кривая - это логистическая функция P = 1 / (1 + e −z), где z = логарифмические шансы.

Другими словами, независимо от предтестовой вероятности пациента, изменение вероятности от открытия аппроксимируется константой (0,19 × log LR). Эти оценки, округленные до ближайших 5% для облегчения вспоминания, представлены в таблице 1.

ЕЖЕДНЕВНОЕ ИСПОЛЬЗОВАНИЕ ЭТОГО МЕТОДА

Основное преимущество LR (по сравнению с другими показателями диагностической точности, такими как чувствительность и специфичность) состоит в том, что врачи могут использовать их для быстрого сравнения различных диагностических стратегий и, таким образом, уточнения клинической оценки. Некоторые типы этих сравнений представлены в таблице 2 и описаны ниже.

Таблица 2

Типы сравнений с использованием отношений правдоподобия

Находка Положительный LR Отрицательный LR
Сравните точность разных диагностических тестов для одного и того же диагноза
 Физические данные, обнаружение асцита 3, 4
  Выпуклые бока2.00,3
  Боковая тупость2.00,3
  Отек3.80,2
  Жидкая волна6.00,4
  Переходная тупость2,70,3
Сравните диагностическое воздействие положительного результата теста с его отрицательным результатом.
 Гиперрезонанс, обнаружение хронической обструкции дыхательных путей 55.1NS
 Плевритный компонент боли в груди, обнаруживающий инфаркт миокарда 60,21.3
Сравните точность одного и того же теста для разных определений болезни.
 Поздний систолический шум 7
  Выявление тяжелого стеноза аорты3.00,2
  Выявление стеноза аорты от средней до тяжелой степени24,20,3
Сравните точность разных уровней одного и того же теста для одного и того же диагноза
 Вопросы CAGE, выявление злоупотребления алкоголем и зависимости 8
  0 положительных0,1-
  1 положительныйNS-
  2 положительных4.5-
  3 положительных13,3-
  4 положительных101-
  1 или более баллов4,70,1
Сравните точность одного и того же теста для одного и того же диагноза в разных клинических условиях.
 Тахипноэ, выявление пневмонии у детей 9
  Все дети2.20,4
  Длительность заболевания NSNS
  Длительность заболевания от 3 до 5 дней.NSNS
  Длительность заболевания ≥6 дней3.50,1

Стандарты диагностики: при асците, перитонеальной жидкости при УЗИ; при хронической обструкции дыхательных путей ОФВ 1 / ОФВ

Определение результатов: CAGE задает 4 вопроса: стали ли вы меньше пить? Раздражали ли вы критику? Виновны ли вы в употреблении алкоголя? Пили ли вы когда-нибудь напитки, открывающие глаза ?; тахипноэ указывает на частоту дыхания>60 вдохов в минуту у детей 50 вдохов в минуту у детей в возрасте 2–12 месяцев и>40 вдохов в минуту у детей в возрасте ≥1 года.

NS, не значимо, т. Е. 95% доверительный интервал LR включает значение 1,0. Для других LR в таблице доверительные интервалы опущены для ясности, хотя все они исключают значение 1,0.

Самый распространенный тип сравнения - это разные тесты для одного и того же диагноза. Например, в таблице 2 показаны LR для различных физических признаков при обнаружении асцита. «Положительный LR» описывает, как изменяется вероятность заболевания при наличии находки; «Отрицательный LR» описывает, как изменяется вероятность заболевания, когда оно отсутствует. Достаточно взглянуть на эту таблицу, и клиницисты могут определить, что среди этих 5 физических признаков наиболее убедительным аргументом в пользу асцита (поскольку он имеет наибольшую LR) является положительная волна жидкости, которая увеличивает вероятность асцита примерно на 35% (LR = 6.0. ). Выпуклые бока (LR = 2,0), тупость по бокам (LR = 2,0), тупость смещения (LR = 2,7) и отек (LR = 3,8) также свидетельствуют о наличии асцита, хотя увеличение вероятности более скромное, всего 15 % до 25% для каждого вывода.Самый веский аргумент против диагноза асцита (поскольку его LR наиболее близок к нулю) - это отсутствие отека, которое снижает вероятность асцита примерно на 30% (отрицательный LR для отека = 0,2). Эти LR быстро указывают на то, что традиционные признаки асцита не являются диагностически эквивалентными, но вместо этого большая часть диагностического веса зависит от наличия волны жидкости (аргументируя болезнь) и отсутствия отека (аргументируя это). .большая часть диагностического веса связана с наличием волны жидкости (аргументируя это заболевание) и отсутствием отеков (аргументируя это возражением).большая часть диагностического веса связана с наличием волны жидкости (аргументируя это заболевание) и отсутствием отека (возражая против этого).

LR также указывают на то, что положительные и отрицательные результаты одного и того же теста часто изменяют вероятность асимметрично. Например, у пациентов с хронической одышкой обнаружение гиперрезонанса грудной клетки увеличивает вероятность хронической обструкции воздушного потока примерно на 30% (положительный LR 5.1; Таблица 2), однако противоположный результат, отсутствие гиперрезонанса, не имеет диагностической важности (отрицательный LR статистически равный 1,0). 5

В приведенных выше примерах положительные LR увеличивают вероятность, а отрицательные LR уменьшают ее, но это не всегда так. Например, у пациентов с острой болью в груди наличие плевритического компонента боли свидетельствует против инфаркта миокарда, снижая его вероятность примерно на 30% (положительный LR = 0,2). Дескриптор «положительный» (т. Е. «Положительный LR») указывает, что LR относится к наличию обнаружения; числовое значение LR, близкое к нулю, указывает на то, что обнаружение снижает вероятность заболевания.

Клиницисты могут также использовать LR для сравнения точности одного и того же теста для разных определений заболевания, что обычно дает важную информацию о ценности теста и его ограничениях. Например, среди пожилых пациентов с шумом аортального кровотока обнаружение шума с поздним обострением только скромно свидетельствует в пользу диагноза тяжелого стеноза аорты (LR = 3,0, возрастающая вероятность около 20%), однако тот же результат является практически диагностическим для комбинированного стеноз аорты от умеренной до тяжелой (LR = 24,2, вероятность увеличения около 60%). 7 Эти LR указывают на то, что шум с поздним пиком действительно отражает большую обструкцию, хотя он не является патогномическим признаком тяжелого стеноза аорты.

LR также могут сравнивать разные уровни результатов для одного и того же диагноза. Этот тип сравнения возможен, если результат можно измерить и поместить на 3 или более уровней (т. Е. Результат не просто «присутствует» или «отсутствует»). Когда уровни результатов сравниваются, каждый LR становится «положительным LR» для своего конкретного уровня, а термин «отрицательный LR» теряет смысл. Одним из примеров является анкета CAGE, предназначенная для выявления злоупотребления алкоголем и зависимости. Оценка 0 снижает вероятность алкоголизма примерно на 45% (LR = 0,1; Таблица 2), тогда как оценки 2, 3 или 4 увеличивают вероятность алкоголизма примерно на 30% (LR = 4,5), 50% (LR = 13,3). ) или 90% (LR = 101) соответственно. 8 Оценка CAGE, равная 1, не имеет доказанной диагностической ценности (т. Е. Ее LR статистически идентичен 1,0). Если бы вместо этого ответы были разделены только на 2 уровня (например,оценка CAGE 1 или более является «положительной» реакцией, а оценка 0 - «отрицательной»), тест по-прежнему различает пациентов с алкоголизмом и без него (положительный LR 4,7, отрицательный LR 0,1; Таблица 2), хотя эти LR затемнить тот факт, что большая часть диагностической значимости положительного ответа приходится на 3 и 4 балла.

Наконец, LR могут проверять диагностическую точность одного и того же теста для одного и того же заболевания, но применительно к разным клиническим условиям, сравнение, которое определяет, в какой группе пациентов тест является наиболее дискриминационным. Например, среди детей с острыми респираторными жалобами 9 обнаружение тахипноэ лучше всего различает детей с пневмонией и детей без него, когда оно применяется только к пациентам с симптомами, продолжающимися 6 или более дней (в этой группе тахипноэ увеличивает вероятность пневмонии. 25% при наличии и снижает его на 45% при отсутствии (положительный LR 3,5, отрицательный LR 0,1; Таблица 2). При применении к детям, которые болеют менее 6 дней, тахипноэ не имеет дискриминационной ценности (LR не значимы).

Бесчисленные опубликованные исследования, охватывающие тысячи пациентов с широким спектром заболеваний, изучали диагностическую ценность интервью с пациентом, физического осмотра и лабораторных исследований. Очень маловероятно, что какой-либо один врач лично столкнется с таким большим количеством пациентов, в то же время синтезируя диагностическое воздействие каждой части этой встречи. В одном количестве LR обеспечивают наилучшую меру диагностической точности, и, используя простой метод, описанный в этой статье, врачи могут легко воспользоваться этими LR и, таким образом, применить уроки и идеи из опубликованных исследований к своим собственным диагностическим решениям в клинике. прикроватная.

Благодарности

Автор благодарит д-ра. Яну Хиршманну и Эду Бойко за рецензию на рукопись и множество полезных комментариев.

ПОПУЛЯРНЫЕ СТАТЬИ