Статистическое оценивание
Материал из MachineLearning.
(переработка-продолжение) |
м (→Состоятельность: терминология) |
||
Строка 20: | Строка 20: | ||
Одно из самых очевидных требований к точечной оценке заключается в том, чтобы можно было ожидать достаточно хорошего приближения к истинному значению параметра при достаточно больших значениях объема выборки <tex>n</tex>. Это означает, что оценка <tex>\widehat\theta_n</tex> должна сходиться к истинному значению <tex>\theta</tex> при <tex>n\to\infty</tex>. Это свойство оценки и называется '''состоятельностью'''. Поскольку речь идет о случайных величинах, для которых имеются разные виды сходимости, то и данное свойство может быть точно сформулировано по-разному: | Одно из самых очевидных требований к точечной оценке заключается в том, чтобы можно было ожидать достаточно хорошего приближения к истинному значению параметра при достаточно больших значениях объема выборки <tex>n</tex>. Это означает, что оценка <tex>\widehat\theta_n</tex> должна сходиться к истинному значению <tex>\theta</tex> при <tex>n\to\infty</tex>. Это свойство оценки и называется '''состоятельностью'''. Поскольку речь идет о случайных величинах, для которых имеются разные виды сходимости, то и данное свойство может быть точно сформулировано по-разному: | ||
- | + | * если <tex>\widehat\theta_n</tex> сходится к истинному значению <tex>\theta</tex> с вероятностью 1 (почти наверное), то тогда оценка называется '''сильно состоятельной'''; | |
- | + | * если имеет место [[сходимость по вероятности]] <tex>\widehat{\theta}_n\stackrel{P}{\longrightarrow}\theta</tex>, то тогда оценка называется '''слабо состоятельной'''. | |
+ | |||
+ | Когда употребляют просто термин ''состоятельность'', то обычно имеется в виду слабая состоятельность, т.е. сходимость по вероятности. | ||
Условие состоятельности является практически обязательным для всех используемых на практике оценок. Несостоятельные оценки используются крайне редко. | Условие состоятельности является практически обязательным для всех используемых на практике оценок. Несостоятельные оценки используются крайне редко. |
Версия 07:51, 11 ноября 2009
Содержание |
Постановка задачи
Задача статистического оценивания неизвестных параметров - одна из двух основных (наряду с задачей проверки статистических гипотез) задач математической статистики.
Предположим, что имеется параметрическое семейство распределений вероятностей (для простоты будем рассматривать распределение случайных величин и случай одного параметра). Здесь - числовой параметр, значение которого неизвестно. Требуется оценить его по имеющейся выборке значений, порожденной данным распределением.
Различают два основных типа оценок: точечные оценки и доверительные интервалы.
Точечное оценивание
Точечное оценивание - это вид статистического оценивания, при котором значение неизвестного параметра приближается отдельным числом. То есть необходимо указать функцию от выборки (статистику)
значение которой будет рассматриваться в качестве приближения к неизвестному истинному значению .
Ниже приводятся некоторые свойства, которыми могут обладать или не обладать точечные оценки.
Состоятельность
Одно из самых очевидных требований к точечной оценке заключается в том, чтобы можно было ожидать достаточно хорошего приближения к истинному значению параметра при достаточно больших значениях объема выборки . Это означает, что оценка должна сходиться к истинному значению при . Это свойство оценки и называется состоятельностью. Поскольку речь идет о случайных величинах, для которых имеются разные виды сходимости, то и данное свойство может быть точно сформулировано по-разному:
- если сходится к истинному значению с вероятностью 1 (почти наверное), то тогда оценка называется сильно состоятельной;
- если имеет место сходимость по вероятности , то тогда оценка называется слабо состоятельной.
Когда употребляют просто термин состоятельность, то обычно имеется в виду слабая состоятельность, т.е. сходимость по вероятности.
Условие состоятельности является практически обязательным для всех используемых на практике оценок. Несостоятельные оценки используются крайне редко.
Несмещенность
...to be continued...
К точечному оцениванию относятся метод моментов, метод минимального расстояния , метод максимального правдоподобия, метод наименьших квадратов.
Свойства точечных оценок
(оценка сходится по вероятности к параметру )
- где
(эффективная оценка обладает минимальной дисперсией среди всех несмещенных оценок)
- Статистика называется достаточной, если
Критерий факторизации
Теорема
Статистика является достаточной тогда и только тогда, когда
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
Ссылки
- Статистическое оценивание(Яндекс.Словари)
- Точечная оценка (Википедия)
- Point estimation (Wikipedia)
- Estimator (Wikipedia)