Допущения модели Кокса

Ранее мы описали основные методы анализа данных о выживаемости, а также методы пропорциональных рисков Кокса для ситуаций, когда на процесс выживания влияют несколько факторов.

Ранее мы описали основные методы анализа данных о выживаемости, а также методы пропорциональных рисков Кокса для ситуаций, когда на процесс выживания влияют несколько факторов.

В данной статье мы продолжаем серию описанием методов оценки обоснованности предположений модели Кокса.

Обратите внимание, что при ненадлежащем использовании статистические модели могут привести к неверным выводам. Следовательно, важно убедиться, что данная модель является подходящим представлением данных.

Диагностика для модели Кокса

Модель пропорциональных рисков Кокса делает несколько предположений. Таким образом, важно оценить, правильно ли подобранная регрессионная модель Кокса описывает данные.

Здесь мы обсудим три типа диагоники для модели Кокса:

  • Проверка предположения о пропорциональных опасностях.
  • Изучение важных наблюдений (или выбросов).
  • Обнаружение нелинейности во взаимосвязи между логарифмической опасностью и ковариатами.

Для проверки этих допущений модели используется метод остатков . Общие остатки для модели Кокса включают:

  • Остатки Шенфельда для проверки допущения о пропорциональных опасностях
  • Остаточный мартингейл для оценки нелинейности
  • Остаточное отклонение (симметричное преобразование остатков Мартингуале) для проверки важных наблюдений

Оценка валидности модели Кокса в R

Установка и загрузка необходимых пакетов R

Мы будем использовать два пакета R:

    выживаемостьдля вычисления анализов выживаемости

Survminerдля визуализации результатов анализа выживаемости

Установите пакеты

  • Загрузите пакеты

Вычисление модели Кокса

Мы будем использовать наборы данных о легких и функцию coxph () в пакете выживания.

Чтобы вычислить модель Кокса, введите следующее:

Проверка предположения о пропорциональных опасностях

Допущение пропорциональных рисков (PH) может быть проверено с помощью статистических тестов и графической диагностики на основе масштабированных остатков Шенфельда .

В принципе, остатки Шенфельда не зависят от времени. График, показывающий неслучайную зависимость от времени, свидетельствует о нарушении предположения PH.

Функция cox.zph () [в пакете выживания ] предоставляет удобное решение для проверки предположения о пропорциональных рисках для каждой ковариаты, включенной в подгонку модели рефрессии Кокса.

Для каждой ковариаты функция cox.zph () коррелирует соответствующий набор масштабированных остатков Шенфельда со временем, чтобы проверить независимость между остатками и временем. Кроме того, он выполняет глобальный тест для модели в целом.

Предположение о пропорциональной опасности подтверждается несущественной взаимосвязью между остатками и временем и опровергается значимой взаимосвязью.

Чтобы проиллюстрировать тест, мы начнем с вычисления модели регрессии Кокса с использованием набора данных о легких [в пакете выживания]:

Чтобы проверить предположение о пропорциональных рисках (PH), введите следующее:

Из результатов выше видно, что тест не является статистически значимым для каждой из ковариат, и глобальный тест также не является статистически значимым. Следовательно, мы можем предположить пропорциональные опасности.

Можно выполнить графическую диагностику, используя функцию ggcoxzph () [в пакете Survminer ], которая создает для каждой ковариаты графики масштабированных остатков Шенфельда в зависимости от преобразованного времени.

Допущения модели Кокса

На рисунке выше сплошная линия представляет собой сглаживающий сплайн, соответствующий графику, а пунктирные линии представляют собой полосу +/- 2 стандартных ошибок вокруг аппроксимации.

Обратите внимание, что систематические отклонения от горизонтальной линии указывают на непропорциональные опасности, поскольку пропорциональные опасности предполагают, что оценки \ (\ beta_1, \ beta_2, \ beta_3 \) не сильно меняются во времени.

При графическом осмотре закономерностей со временем нет. Предположение о пропорциональных опасностях, по-видимому, подтверждается для ковариат пола (который, напомним, является двухуровневым фактором, учитывающим две полосы на графике), потери веса и возраста.

Другим графическим методом проверки пропорциональности опасностей является построение графика зависимости log (-log (S (t))) от t или log (t) и поиск параллелизма. Это можно сделать только для категориальных ковариат.

Нарушение предположения о пропорциональных опасностях может быть устранено:

  • Добавление ковариант * время взаимодействия
  • Стратификация

Стратификация полезна для «мешающих» факторов, влияющих на результат, когда вы не заботитесь об оценке эффекта. Вы не можете исследовать эффекты переменной стратификации (Джон Фокс и Сэнфорд Вайсберг).

Чтобы узнать больше о том, как действовать в условиях непропорциональных опасностей, прочтите следующие статьи:

  • Ядвига Боруцка, PAREXEL, Варшава, Польша. Расширения модели Кокса для целей непропорциональных опасностей. 2013.
  • Джон Фокс и Сэнфорд Вайсберг. Регрессия пропорциональных рисков Кокса для данных о выживаемости в R.
  • Макс Гордон. Работа с непропорциональными опасностями в Р. 29 марта 2016 г.

Проверка влиятельных наблюдений

Чтобы проверить важные наблюдения или выбросы, мы можем визуализировать либо:

  • что девиации остатки или
  • в dfbeta значения

Функция ggcoxdiagnostics () [в пакете Survminer ] предоставляет удобное решение для проверки важных наблюдений. Упрощенный формат выглядит следующим образом:

  • fit: объект класса coxph.object
  • type: тип остатков, отображаемых на оси Y. Допустимые значения включают одно из c («мартингейл», «отклонение», «оценка», «schoenfeld», «dfbeta», «dfbetas», «scaledsch», «частичный»).
  • linear.predictions: логическое значение, указывающее, следует ли отображать линейные прогнозы для наблюдений (ИСТИНА) или просто индексированные наблюдения (ЛОЖЬ) по оси X.

Если указать аргумент type = «dfbeta» , по очереди будут построены предполагаемые изменения коэффициентов регрессии после удаления каждого наблюдения; аналогично type = «dfbetas» производит оценочные изменения коэффициентов, деленные на их стандартные ошибки.

Допущения модели Кокса

(Графики индекса dfbeta для регрессии Кокса времени до смерти в зависимости от возраста, пола и потери веса)

Приведенные выше графики индексов показывают, что сравнение величин наибольших значений dfbeta с коэффициентами регрессии предполагает, что ни одно из наблюдений не оказывает особого влияния индивидуально, даже несмотря на то, что некоторые значения dfbeta для возраста и потерь веса велики по сравнению с другими.

Также можно проверить выбросы, визуализировав остатки отклонения. Остаток отклонения - это нормализованное преобразование остатка мартингала. Эти остатки должны быть почти симметрично распределены относительно нуля со стандартным отклонением 1.

  • Положительные значения соответствуют людям, которые «умерли слишком рано» по сравнению с ожидаемым временем выживания.
  • Отрицательные значения соответствуют человеку, который «прожил слишком долго».
  • Очень большие или маленькие значения являются выбросами, которые плохо предсказываются моделью.

Пример остатков отклонения:

Допущения модели Кокса

Узор выглядит довольно симметричным относительно 0.

Проверка нелинейности

Часто мы предполагаем, что непрерывные ковариаты имеют линейную форму. Однако это предположение следует проверить.

Построение графика остатков Мартингейла относительно непрерывных ковариат - это распространенный подход, используемый для обнаружения нелинейности или, другими словами, для оценки функциональной формы ковариаты. Для данной непрерывной ковариаты закономерности на графике могут указывать на то, что переменная не подходит должным образом.

Нелинейность не является проблемой для категориальных переменных, поэтому мы исследуем только графики остатков мартингалов и частичных остатков по отношению к непрерывной переменной.

Остатки мартингейла могут иметь любое значение в диапазоне (-INF, +1):

  • Значение остатков мартингуале около 1 соответствует особям, которые «умерли слишком рано»,
  • а большие отрицательные значения соответствуют людям, которые «жили слишком долго».

Чтобы оценить функциональную форму непрерывной переменной в модели пропорциональных рисков Кокса, мы будем использовать функцию ggcoxfunctional () [в пакете Survminer R].

Функция ggcoxfunctional () отображает графики непрерывных ковариат против мартингальных остатков модели пропорциональных рисков нулевого Кокса. Это может помочь правильно выбрать функциональную форму непрерывной переменной в модели Кокса. Установленные линии с функцией lowess должны быть линейными, чтобы удовлетворять предположениям модели пропорциональных рисков Кокса.

Например, чтобы оценить функциональную форму возраста, введите следующее:

Допущения модели Кокса

Похоже, что здесь немного нелинейности.

Резюме

Мы описали, как оценить достоверность предположений модели Кокса, используя пакеты Survival и Survminer.

Информация

Этот анализ был выполнен с использованием программного обеспечения R(версия 3.3.2).

Понравилась эта статья? Я был бы очень благодарен, если бы вы помогли его распространению, отправив его другу по электронной почте или поделившись им в Twitter, Facebook или Linked In.

Покажи мне немного любви с кнопками «Нравится» ниже. Спасибо и, пожалуйста, не забывайте делиться и комментировать ниже !!

Avez vous aimé cet article? Je vous serais très recnaissant si vous aidiez à sa diffusion en l'envoyant par courriel à un ami or le partageant на Twitter, Facebook или Linked In.

Montrez-moi un peu d'amour avec les like ci-dessous. Merci et n'oubliez pas, s'il vous plaît, departager et de commenter ci-dessous!