Статистическое оценивание

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м
(переработка)
Строка 1: Строка 1:
-
==Точечное оценивание==
+
==Постановка задачи==
-
Точечное оценивание - это вид [[Статистическое оценивание|статистического оценивания]], при котором значение параметра приближается числом.
+
-
К точечному оцениванию относятся [[Метод моментов|метод моментов]], [[Метод минимального расстояния хи-квадрат|метод минимального расстояния <tex>\chi^2</tex>]], [[Метод максимального правдоподобия|метод максимального правдоподобия]], [[Метод наименьших квадратов|метод наименьших квадратов]].
+
Задача '''статистического оценивания неизвестных параметров''' - одна из двух основных (наряду с задачей [[проверка_статистических_гипотез|проверки статистических гипотез]]) задач [[математическая_статистика|математической статистики]].
-
===Примеры===
+
Предположим, что имеется параметрическое семейство распределений вероятностей <tex>F(t,\theta)</tex> (для простоты будем рассматривать распределение [[случайная_величина|случайных величин]] и случай одного параметра). Здесь <tex>\theta\in\mathbb{R}</tex> - числовой параметр, значение которого неизвестно. Требуется оценить его по имеющейся [[выборка|выборке]] <tex>X^n=(X_1,\ldots,X_n)</tex> значений, порожденной данным распределением.
-
Ниже приведены примеры задач, в которых используется точечное оценивание
+
-
'''Пример 1'''
+
Различают два основных типа оценок: '''точечные оценки''' и '''доверительные интервалы'''.
-
Оценка средней скорости, дисперсии и средней кинетической энергии молекулы.
+
===Точечное оценивание===
 +
Точечное оценивание - это вид статистического оценивания, при котором значение неизвестного параметра <tex>\theta</tex> приближается отдельным числом. То есть необходимо указать функцию от выборки ([[статистика_(функция_выборки)|статистику]])
-
'''Пример 2'''
+
<center><tex>\widehat\theta_n=\widehat\theta_n(X^n)</tex>,</center>
-
Оценка числа частиц золота, взвешенного в воде, попадающих в некоторую определенную область.
+
значение которой будет рассматриваться в качестве приближения к неизвестному истинному значению <tex>\theta</tex>.
 +
Ниже приводятся некоторые свойства, которыми могут обладать или не обладать точечные оценки.
-
===Определение===
+
===Состоятельность===
-
Пусть выборка <tex>X^n=(X_1,\ldots,X_n)</tex> имеет распределение <tex>F(x,\theta)</tex>, где <tex>\theta</tex> - неизвестный параметр распределения.
+
''...to be continued...''
-
Будем считать, что <tex>\theta \in \mathbb{R}</tex>.
 
-
'''То́чечная оце́нка''' параметра <tex>\theta</tex> - это статистика <tex>\hat{\theta}_n=\hat{\theta}(X^n)</tex>
+
 
 +
 
 +
 
 +
К точечному оцениванию относятся [[Метод моментов|метод моментов]], [[Метод минимального расстояния хи-квадрат|метод минимального расстояния <tex>\chi^2</tex>]], [[Метод максимального правдоподобия|метод максимального правдоподобия]], [[Метод наименьших квадратов|метод наименьших квадратов]].
 +
 
===Свойства точечных оценок===
===Свойства точечных оценок===
* [[Состоятельная оценка|Cостоятельность]]: <tex>\hat{\theta}_n\stackrel{\mathbb{P}}{\longrightarrow}\theta</tex>
* [[Состоятельная оценка|Cостоятельность]]: <tex>\hat{\theta}_n\stackrel{\mathbb{P}}{\longrightarrow}\theta</tex>
Строка 54: Строка 57:
[[Категория:Прикладная статистика]]
[[Категория:Прикладная статистика]]
 +
[[Категория:Математическая статистика]]
[[Категория:Энциклопедия анализа данных]]
[[Категория:Энциклопедия анализа данных]]
{{stub}}
{{stub}}

Версия 14:28, 10 ноября 2009

Содержание

Постановка задачи

Задача статистического оценивания неизвестных параметров - одна из двух основных (наряду с задачей проверки статистических гипотез) задач математической статистики.

Предположим, что имеется параметрическое семейство распределений вероятностей F(t,\theta) (для простоты будем рассматривать распределение случайных величин и случай одного параметра). Здесь \theta\in\mathbb{R} - числовой параметр, значение которого неизвестно. Требуется оценить его по имеющейся выборке X^n=(X_1,\ldots,X_n) значений, порожденной данным распределением.

Различают два основных типа оценок: точечные оценки и доверительные интервалы.

Точечное оценивание

Точечное оценивание - это вид статистического оценивания, при котором значение неизвестного параметра \theta приближается отдельным числом. То есть необходимо указать функцию от выборки (статистику)

\widehat\theta_n=\widehat\theta_n(X^n),

значение которой будет рассматриваться в качестве приближения к неизвестному истинному значению \theta.

Ниже приводятся некоторые свойства, которыми могут обладать или не обладать точечные оценки.

Состоятельность

...to be continued...



К точечному оцениванию относятся метод моментов, метод минимального расстояния \chi^2, метод максимального правдоподобия, метод наименьших квадратов.

Свойства точечных оценок

(оценка сходится по вероятности к параметру \theta)

\mathsf{D}\hat{\theta}_n=\min\mathsf{D}\hat{\theta}_n', где \hat{\theta}'_n:\; \mathsf{E}\hat{\theta}'_n=\theta


(эффективная оценка обладает минимальной дисперсией среди всех несмещенных оценок)

F(X^n|T=t,\theta)=F(X^n|T=t)

Критерий факторизации

Теорема
Статистика T(X^n) является достаточной тогда и только тогда, когда

F(X^n,\theta)=g(T,\theta)h(X^n)

Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.

Ссылки

Личные инструменты