Процедура Каплана-Мейера

Материал из MachineLearning.

Перейти к: навигация, поиск

Процедура Каплана-Мейера или процедура выживания (англ. Kaplan-Meier estimator) оценивает функцию выживаемости.

График оценки функции выживаемости представляет из себя серию убывающих горизонтальных ступенек, где берутся достаточно большые отрезки, приближающие реальные значения функции выживаемости для этой задачи. Значения функции выживаемости между точками наблюдений считаются константными.

Важным преимуществом процедуры Каплана-Мейера, является то, что этот метод справляется с цензурированными данными, т.е. учитывается, что пациенты могут выбывать в ходе эксперимента.

Преимущество метода Каплана-Мейера (по сравнению с методом таблиц жизни) состоит в том, что оценки не зависят от разбиения времени наблюдения на интервалы, т.е. от группировки. Метод множительных оценок и метод таблиц времен жизни приводят, по существу, к одинаковым результатам, если временные интервалы содержат, максимум, по одному наблюдению.

Содержание

Примеры задач

Пример 1(медицина)

Пациенты принимают некое лекарство. Нужно оценить долю пациентов, проживших после этого какой-то период времени.

Пример 2(экономика)

Оценить время, сколько человек будет безработным , после ухода с прежнего места работы.

Пример 3(машиностроение)

ценить время, пока какая-то часть автомобиля откажет.


Описание метода

Исходные данные

i\in\{1,\cdots,T\}

t_i - момент времени

R_i - число объектов, доживающих до момента времени t_i, исключая выбывших

d_i - число объектов, для которых произошёл исход в момент времени t_i

Оценка Каплана-Мейера

Для цензурированных, но не группированных наблюдений времен жизни, функцию выживания можно оценить непосредственно (без таблицы времен жизни). Перемножая вероятности выживания в каждом интервале, получим следующую формулу.

Оценка функции выживания равна

\hat{S}(t)=\prod_{i=1}^{T}\frac{R_i-d_i}{R_i},

где \frac{d_i}{R_i} - вероятность исхода

Данная оценка функции выживания, называемая множительной оценкой, впервые была предложена Капланом и Мейером (1958).


Доверительный интервал

\sigma_{\hat{S}}=\hat{S}(t)\sqrt{\sum_{i=0}^{t} \frac{d_i}{R_i(R_i-d_i)}}

Доверительный интервал с доверительной вероятностью 1-\alpha:

\hat{S}(t)\pm\sigma_{\hat{S}}\Phi_{\alpha},

где \Phi_{\alpha} - квантиль нормального распределения.


Литература

  • Стентон Гланц Медико-биологическая статистика. Электронная книга = Primer of BIOSTATISTICS. — 4-е изд. — М.: Практика, 1999. — С. 459.


См. также

Ссылки

Личные инструменты