Процедура Каплана-Мейера

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: Новая: Скоро здесь будет статья!)
Строка 1: Строка 1:
-
Новая: Скоро здесь будет статья!
+
'''Процедура Каплана-Мейера или процедура выживания''' (англ. Kaplan-Meier estimator) оценивает функцию выживаемости.
 +
 
 +
График оценки функции выживаемости представляет из себя серию убывающих горизонтальных ступенек, где берутся достаточно большые отрезки, приближающие реальные значения функции выживаемости для этой задачи. Значения функции выживаемости между точками наблюдений считаются константными.
 +
 +
Важным преимуществом процедуры Каплана-Мейера, является то, что этот метод справляется с цензурированными данными, т.е. учитывается, что пациенты могут выбывать в ходе эксперимента.
 +
 
 +
Преимущество метода Каплана-Мейера (по сравнению с методом таблиц жизни) состоит в том, что оценки не зависят от разбиения времени наблюдения на интервалы, т.е. от группировки. Метод множительных оценок и метод таблиц времен жизни приводят, по существу, к одинаковым результатам, если временные интервалы содержат, максимум, по одному наблюдению.
 +
 
 +
==Примеры задач==
 +
===Пример 1(медицина)===
 +
Пациенты принимают некое лекарство. Нужно оценить долю пациентов, проживших после этого какой-то период времени.
 +
 
 +
===Пример 2(экономика)===
 +
Оценить время, сколько человек будет безработным , после ухода с прежнего места работы.
 +
 
 +
===Пример 3(машиностроение)===
 +
ценить время, пока какая-то часть автомобиля откажет.
 +
==Описание метода==
 +
 
 +
==Описание метода==
 +
===Исходные данные===
 +
<tex>i\in\{1,\cdots,T\}</tex>
 +
 
 +
<tex>t_i</tex> - момент времени
 +
 
 +
<tex>R_i</tex> - число объектов, доживающих до момента времени <tex>t_i</tex>, исключая выбывших
 +
 
 +
<tex>d_i</tex> - число объектов, для которых произошёл исход в момент времени <tex>t_i</tex>
 +
 
 +
===Оценка Каплана-Мейера===
 +
Для цензурированных, но не группированных наблюдений времен жизни, функцию выживания можно оценить непосредственно (без таблицы времен жизни). Перемножая вероятности выживания в каждом интервале, получим следующую формулу.
 +
 
 +
'''Оценка функции выживания''' равна
 +
 
 +
<tex>\hat{S}(t)=\prod_{i=1}^{T}\frac{R_i-d_i}{R_i}</tex>,
 +
 
 +
где <tex>\frac{d_i}{R_i}</tex> - вероятность исхода
 +
 
 +
Данная оценка функции выживания, называемая множительной оценкой, впервые была предложена Капланом и Мейером (1958).
 +
 
 +
 
 +
==Доверительный интервал==
 +
 
 +
<tex>\sigma_{\hat{S}}=\hat{S}(t)\sqrt{\sum_{i=0}^{t} \frac{d_i}{R_i(R_i-d_i)}}</tex>
 +
 
 +
[[Доверительный интервал]] с доверительной вероятностью <tex>1-\alpha</tex>:
 +
 
 +
<tex>\hat{S}(t)\pm\sigma_{\hat{S}}\Phi_{\alpha}</tex>,
 +
 
 +
где <tex>\Phi_{\alpha}</tex> - квантиль нормального распределения.
 +
 
 +
 
 +
 
 +
== Литература ==
 +
* {{книга
 +
|автор = Стентон Гланц
 +
|заглавие = Медико-биологическая статистика. Электронная книга
 +
|оригинал = Primer of BIOSTATISTICS
 +
|ссылка =
 +
|издание = 4-е изд
 +
|место = М.
 +
|издательство = Практика
 +
|год = 1999
 +
|страницы = 459
 +
}}
 +
 
 +
 
 +
== См. также ==
 +
* [[Анализ выживаемости]]
 +
* [[функция выживаемости]]
 +
* [[логранговый критерий]]
 +
 
 +
== Ссылки ==
 +
*[http://en.wikipedia.org/wiki/Kaplan-Meier Kaplan-Meier estimator]
 +
 
 +
[[Категория: Прикладная статистика]][[Категория:Анализ выживаемости]]

Версия 07:55, 10 января 2009

Процедура Каплана-Мейера или процедура выживания (англ. Kaplan-Meier estimator) оценивает функцию выживаемости.

График оценки функции выживаемости представляет из себя серию убывающих горизонтальных ступенек, где берутся достаточно большые отрезки, приближающие реальные значения функции выживаемости для этой задачи. Значения функции выживаемости между точками наблюдений считаются константными.

Важным преимуществом процедуры Каплана-Мейера, является то, что этот метод справляется с цензурированными данными, т.е. учитывается, что пациенты могут выбывать в ходе эксперимента.

Преимущество метода Каплана-Мейера (по сравнению с методом таблиц жизни) состоит в том, что оценки не зависят от разбиения времени наблюдения на интервалы, т.е. от группировки. Метод множительных оценок и метод таблиц времен жизни приводят, по существу, к одинаковым результатам, если временные интервалы содержат, максимум, по одному наблюдению.

Содержание

Примеры задач

Пример 1(медицина)

Пациенты принимают некое лекарство. Нужно оценить долю пациентов, проживших после этого какой-то период времени.

Пример 2(экономика)

Оценить время, сколько человек будет безработным , после ухода с прежнего места работы.

Пример 3(машиностроение)

ценить время, пока какая-то часть автомобиля откажет.

Описание метода

Описание метода

Исходные данные

i\in\{1,\cdots,T\}

t_i - момент времени

R_i - число объектов, доживающих до момента времени t_i, исключая выбывших

d_i - число объектов, для которых произошёл исход в момент времени t_i

Оценка Каплана-Мейера

Для цензурированных, но не группированных наблюдений времен жизни, функцию выживания можно оценить непосредственно (без таблицы времен жизни). Перемножая вероятности выживания в каждом интервале, получим следующую формулу.

Оценка функции выживания равна

\hat{S}(t)=\prod_{i=1}^{T}\frac{R_i-d_i}{R_i},

где \frac{d_i}{R_i} - вероятность исхода

Данная оценка функции выживания, называемая множительной оценкой, впервые была предложена Капланом и Мейером (1958).


Доверительный интервал

\sigma_{\hat{S}}=\hat{S}(t)\sqrt{\sum_{i=0}^{t} \frac{d_i}{R_i(R_i-d_i)}}

Доверительный интервал с доверительной вероятностью 1-\alpha:

\hat{S}(t)\pm\sigma_{\hat{S}}\Phi_{\alpha},

где \Phi_{\alpha} - квантиль нормального распределения.


Литература

  • Стентон Гланц Медико-биологическая статистика. Электронная книга = Primer of BIOSTATISTICS. — 4-е изд. — М.: Практика, 1999. — С. 459.


См. также

Ссылки

Личные инструменты