Проверка статистических гипотез

Материал из MachineLearning.

(Различия между версиями)

Версия 16:52, 7 августа 2008

Содержание

1 Методика проверки статистических гипотез
2 Ошибки первого и второго рода
3 Свойства статистических критериев
4 Типы статистических критериев
5 Литература
6 Ссылки

Статистическая гипотеза (statistical hypothesys) — это определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных.

Проверка статистической гипотезы (testing statistical hypotheses) — это процесс принятия решения о том, что рассматриваемая статистическая гипотеза не противоречит наблюдаемой выборке данных.

Статистический тест или статистический критерий — строгое математическое правило, по которому принимается или отвергается статистическая гипотеза.

Методика проверки статистических гипотез

Пусть задана случайная выборка $x^m = (x_1,\ldots,x_m)$ — последовательность $m$ объектов из множества $X$ . Предполагается, что на множестве $X$ существует некоторая неизвестная вероятностная мера $\mathbb{P}$ .

Методика состоит в следующем.

Формулируется нулевая гипотеза $H_0$ о распределении вероятностей на множестве $X$ . Гипотеза формулируется исходя из требований прикладной задачи. Чаще всего рассматриваются две гипотезы — основная или нулевая $H_0$ и альтернативная $H_1$ . Иногда альтернатива не формулируется в явном виде; тогда предполагается, что $H_1$ означает «не $H_0$ ». Иногда рассматривается сразу несколько альтернатив. В математической статистике хорошо изучено несколько десятков «наиболее часто встречающихся» типов гипотез, и известны ещё сотни специальных вариантов и разновидностей. Примеры приводятся ниже.
Задаётся некоторая статистика (функция выборки) $T:\: X^m \to \mathbb{R}$ , для которой в условиях справедливости гипотезы $H_0$ выводится функция распределения $F(T)$ и/или плотность распределения $p(T)$ . Вопрос о том, какую статистику надо взять для проверки той или иной гипотезы, часто не имеет однозначного ответа. Есть целый ряд требований, которым должна удовлетворять «хорошая» статистика $T$ . Вывод функции распределения $F(T)$ при заданных $H_0$ и $T$ является строгой математической задачей, которая решается методами теории вероятностей; в справочниках приводятся готовые формулы для $F(T)$ ; в статистических пакетах имеются готовые вычислительные процедуры.
Фиксируется уровень значимости — допустимая для данной задачи вероятность ошибки первого рода, то есть того, что гипотеза на самом деле верна, но будет отвергнута процедурой проверки. Это должно быть достаточно малое число $\alpha \in [0,1]$ . На практике часто полагают $\alpha=0.05$ .
На множестве допустимых значений статистики $T$ выделяется критическое множество $\Omega$ наименее вероятных значений статистики $T$ , такое, что $\mathbb{P}\{T\in\Omega\} = \alpha$ . Вычисление границ критического множества является строгой математической задачей, которая в большинстве практических случаев имеет готовое простое решение.
Собственно статистический тест (статистический критерий) заключается в проверке условия:
- если $T(X^m)\in\Omega$ , то делается вывод «данные противоречат нулевой гипотезе при уровне значимости $\alpha$ ».
- если $T(X^m)\notin\Omega$ , то делается вывод «данные не противоречат нулевой гипотезе при уровне значимости $\alpha$ ».

Замечание. Если данные не противоречат нулевой гипотезе, это ещё не значит, что гипотеза верна. Тому есть две причины.

По мере увеличения длины выборки нулевая гипотеза может сначала приниматься, но потом выявятся более тонкие несоответствия данных гипотезе, и она будет отвергнута.
Выбранная статистика $T$ может отражать не всю информацию, содержащуюся в гипотезе $H_0$ . В таком случае увеличивается вероятность ошибки второго рода — нулевая гипотеза может быть принята, хотя на самом деле она не верна. Допустим, например, что $H_0$ = «распределение нормально»; $T(X^m)$ = коэффициент асимметрии; тогда выборка с любым симметричным распределением будет признана нормальной. Чтобы избегать таких ошибок, следует пользоваться более мощными критериями.

Ошибки первого и второго рода

Ошибка первого рода или «ложная тревога» (англ. type I error, $\alpha$ error, false positive) — когда нулевая гипотеза отвергается, хотя на самом деле она верна.
Ошибка второго рода или «пропуск цели» (англ. type II error, $\beta$ error, false negative) — когда нулевая гипотеза принимается, хотя на самом деле она не верна.


		Верная гипотеза
		$H_0$	$H_1$
Результат применения критерия	$H_0$	$H_0$ верно принята	$H_1$ неверно отвергнута (Ошибка второго рода)
Результат применения критерия	$H_1$	$H_0$ неверно отвергнута (Ошибка первого рода)	$H_1$ верно принята

Свойства статистических критериев

Несмещённый критерий

Состоятельный критерий

Мощность критерия

Равномерно более мощный критерий

Типы статистических критериев

Критерии согласия

Критерии нормальности

Критерии равномерности

Критерии симметрии

Критерии однородности

Критерии случайности

Критерии стационарности

Статья в настоящий момент дорабатывается.
К.В.Воронцов 20:52, 7 августа 2008 (MSD)

Литература

Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.

Ссылки

Statistical hypothesis testing — статья в англоязычной Википедии.

Источник — «http://recognition.su/wiki/index.php?title=%D0%9F%D1%80%D0%BE%D0%B2%D0%B5%D1%80%D0%BA%D0%B0_%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D1%85_%D0%B3%D0%B8%D0%BF%D0%BE%D1%82%D0%B5%D0%B7»

Категории: Математическая статистика | Прикладная статистика | Популярные и обзорные статьи

@@ Строка 1: / Строка 1: @@
 {{TOCright}}
-'''Статистическая гипотеза''' (statistical hypothesys) — определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой [[выборка|выборки данных]].
+'''Статистическая гипотеза''' (statistical hypothesys) — это определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой [[выборка|выборки данных]].
-'''Проверка статистических гипотез''' (testing statistical hypotheses) — методология принятия решений о том, что рассматриваемая статистическая гипотеза не противоречит наблюдаемой [[выборка|выборке данных]].
+'''Проверка статистической гипотезы''' (testing statistical hypotheses) — это процесс принятия решения о том, что рассматриваемая статистическая гипотеза не противоречит наблюдаемой [[выборка|выборке данных]].
-Чаще всего рассматриваются две гипотезы — ''основная'' или ''нулевая'' <tex>H_0</tex> и альтернативная&nbsp;<tex>H_1</tex>.
-Иногда альтернатива не формулируется в явном виде; тогда предполагается, что&nbsp;<tex>H_1</tex> означает «не&nbsp;<tex>H_0</tex>».
-Иногда рассматривается сразу несколько альтернатив.
-== Методология ==
+'''Статистический тест''' или '''статистический критерий''' — строгое математическое правило, по которому принимается или отвергается ''статистическая гипотеза''.
-Пусть задана случайная [[выборка]] <tex>x^m = (x_1,\ldots,x_m)</tex> — последовательность <tex>m</tex> объектов из множества <tex>X</tex>, на котором существует (но не известна) вероятностная мера&nbsp;<tex>\mathbb{P}</tex>.
-Общая методика состоит в следующем.
+== Методика проверки статистических гипотез ==
+Пусть задана случайная [[выборка]] <tex>x^m = (x_1,\ldots,x_m)</tex> — последовательность <tex>m</tex> объектов из множества <tex>X</tex>.
+Предполагается, что на множестве <tex>X</tex> существует некоторая неизвестная вероятностная мера&nbsp;<tex>\mathbb{P}</tex>.
-# Формулируется ''нулевая'' гипотеза&nbsp;<tex>H_0</tex> о&nbsp;распределении вероятностей на множестве&nbsp;<tex>X</tex>. Собственно, это именно то, что мы собираемся проверить. Гипотеза формулируется исходя из требований прикладной задачи. В&nbsp;математической статистике хорошо изучено несколько десятков «наиболее часто встречающихся» типов гипотез, и известны ещё сотни специальных вариантов и разновидностей.
+Методика состоит в следующем.
-# Задаётся некоторая [[статистика]] <tex>T:\: X^m \to \mathbb{R}</tex>, для которой в условиях справедливости гипотезы <tex>H_0</tex> выводится [[функция распределения]] <tex>F(T)</tex> и/или [[плотность распределения]]&nbsp;<tex>p(T)</tex>. Вопрос о том, какую статистику надо взять для проверки той или иной гипотезы, часто не имеет однозначного ответа. Есть целый ряд требований, предъявляемых к «хорошей» статистике&nbsp;<tex>T</tex>. Задача получения функции распределения <tex>F(T)</tex> при заданных&nbsp;<tex>H_0</tex> и&nbsp;<tex>T</tex> является строго поставленной математической задачей, которая решается методами теории вероятностей; в справочниках приводятся готовые формулы; в статистических пакетах имеются готовые вычислительные процедуры.
-# Фиксируется ''[[уровень значимости]]''&nbsp;<tex>\alpha</tex> — число из отрезка <tex>[0,1]</tex>, которое можно интерпретировать как «достаточно малую вероятность». Её&nbsp;выбирают исходя из априорных соображений риска, допустимого для принимаемого решения в данной прикладной задаче. Часто полагают <tex>\alpha=0.05</tex>.
-# На множестве допустимых значений статистики&nbsp;<tex>T</tex> выделяется ''критическое множество''&nbsp;<tex>\Omega</tex> наименее вероятных значений&nbsp;<tex>T</tex> такое, что <tex>\Prob\{T\in\Omega\} = \alpha</tex>. Вычисление вида критического множества также является строгой математической задачей, решение которой для большинства практических случаев известно.
-# Статистический тест
-{{UnderConstruction|[[Участник:Vokov|К.В.Воронцов]] 23:18, 6 августа 2008 (MSD)}}
+# Формулируется ''нулевая'' гипотеза&nbsp;<tex>H_0</tex> о&nbsp;распределении вероятностей на множестве&nbsp;<tex>X</tex>. Гипотеза формулируется исходя из требований прикладной задачи. Чаще всего рассматриваются две гипотезы — ''основная'' или ''нулевая'' <tex>H_0</tex> и альтернативная&nbsp;<tex>H_1</tex>. Иногда альтернатива не формулируется в явном виде; тогда предполагается, что&nbsp;<tex>H_1</tex> означает «не&nbsp;<tex>H_0</tex>». Иногда рассматривается сразу несколько альтернатив. В&nbsp;математической статистике хорошо изучено несколько десятков «наиболее часто встречающихся» типов гипотез, и известны ещё сотни специальных вариантов и разновидностей. Примеры  приводятся ниже.
+# Задаётся некоторая [[статистика (функция выборки)]] <tex>T:\: X^m \to \mathbb{R}</tex>, для которой в условиях справедливости гипотезы <tex>H_0</tex> выводится [[функция распределения]] <tex>F(T)</tex> и/или [[плотность распределения]]&nbsp;<tex>p(T)</tex>. Вопрос о том, какую статистику надо взять для проверки той или иной гипотезы, часто не имеет однозначного ответа. Есть целый ряд требований, которым должна удовлетворять «хорошая» статистика&nbsp;<tex>T</tex>. Вывод функции распределения <tex>F(T)</tex> при заданных&nbsp;<tex>H_0</tex> и&nbsp;<tex>T</tex> является строгой математической задачей, которая решается методами теории вероятностей; в&nbsp;справочниках приводятся готовые формулы для&nbsp;<tex>F(T)</tex>; в&nbsp;статистических пакетах имеются готовые вычислительные процедуры.
+# Фиксируется ''[[уровень значимости]]'' — допустимая для данной задачи вероятность ''ошибки первого рода'', то есть того, что гипотеза на самом деле верна, но будет отвергнута процедурой проверки. Это должно быть достаточно малое число <tex>\alpha \in [0,1]</tex>. На&nbsp;практике часто полагают <tex>\alpha=0.05</tex>.
+# На множестве допустимых значений статистики&nbsp;<tex>T</tex> выделяется ''критическое множество''&nbsp;<tex>\Omega</tex> наименее вероятных значений статистики&nbsp;<tex>T</tex>, такое, что <tex>\mathbb{P}\{T\in\Omega\} = \alpha</tex>. Вычисление границ критического множества является строгой математической задачей, которая в большинстве практических случаев имеет готовое простое решение.
+# Собственно ''статистический тест'' (''статистический критерий'') заключается в проверке условия:
+#* если <tex>T(X^m)\in\Omega</tex>, то делается вывод «данные противоречат нулевой гипотезе при уровне значимости&nbsp;<tex>\alpha</tex>».
+#* если <tex>T(X^m)\notin\Omega</tex>, то делается вывод «данные не противоречат нулевой гипотезе при уровне значимости&nbsp;<tex>\alpha</tex>».
+'''Замечание.'''
+Если данные не противоречат нулевой гипотезе, это ещё не значит, что гипотеза верна.
+Тому есть две причины.
+* По&nbsp;мере увеличения длины выборки нулевая гипотеза может сначала приниматься, но потом выявятся более тонкие несоответствия данных гипотезе, и она будет отвергнута.
+* Выбранная статистика <tex>T</tex> может отражать не всю информацию, содержащуюся в гипотезе&nbsp;<tex>H_0</tex>. В&nbsp;таком случае увеличивается вероятность ошибки второго рода — нулевая гипотеза может быть принята, хотя на самом деле она не верна. Допустим, например, что <tex>H_0</tex> = «распределение нормально»; <tex>T(X^m)</tex> = [[коэффициент асимметрии]]; тогда выборка с любым симметричным распределением будет признана нормальной. Чтобы избегать таких ошибок, следует пользоваться более [[Мощность критерия|мощными критериями]].
+== Ошибки первого и второго рода ==
+* Ошибка первого рода или «ложная тревога» (англ. type I error, <tex>\alpha</tex>&nbsp;error, false positive) — когда нулевая гипотеза отвергается, хотя на самом деле она верна.
+* Ошибка второго рода или «пропуск цели» (англ. type II error, <tex>\beta</tex>&nbsp;error, false negative) — когда нулевая гипотеза принимается, хотя на самом деле она не верна.
+{| class = "standard"
+|+
+! colspan=2 rowspan=2|&nbsp;
+! colspan=2 |Верная гипотеза
+|-
+! |&nbsp;<tex>H_0</tex>&nbsp;
+! |&nbsp;<tex>H_1</tex>&nbsp;
+|-
+! rowspan=2 |Результат<br/>&nbsp;применения&nbsp;<br/>критерия
+! |&nbsp;<tex>H_0</tex>&nbsp;
+| style="background: #ddffdd;" | <tex>H_0</tex> верно принята
+| style="background: #ffdddd;" | <tex>H_1</tex> неверно отвергнута&nbsp;<br/>(Ошибка ''второго'' рода)
+|-
+! |&nbsp;<tex>H_1</tex>&nbsp;
+| style="background: #ffdddd;" | <tex>H_0</tex> неверно отвергнута&nbsp;<br/>(Ошибка ''первого'' рода)
+| style="background: #ddffdd;" | <tex>H_1</tex> верно принята
+|}
+== Свойства статистических критериев ==
+Несмещённый критерий
+Состоятельный критерий
+Мощность критерия
+Равномерно более мощный критерий
+== Типы статистических критериев ==
+Критерии согласия
+Критерии нормальности
+Критерии равномерности
+Критерии симметрии
+Критерии однородности
+Критерии случайности
+Критерии стационарности
+{{UnderConstruction|[[Участник:Vokov|К.В.Воронцов]] 20:52, 7 августа 2008 (MSD)}}
 == Литература ==
 # Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.:&nbsp;Большая российская энциклопедия, 2003. — 912&nbsp;с.
 # ''Кобзарь А. И.'' Прикладная математическая статистика. — М.:&nbsp;Физматлит, 2006.
+== Ссылки ==
+* [http://en.wikipedia.org/wiki/Statistical_hypothesis_testing Statistical hypothesis testing] — статья в англоязычной Википедии.
 [[Категория:Математическая статистика]]
 [[Категория:Прикладная статистика]]
+[[Категория:Популярные и обзорные статьи]]

Проверка статистических гипотез

Материал из MachineLearning.

Версия 16:52, 7 августа 2008

Содержание

Методика проверки статистических гипотез

Ошибки первого и второго рода

Свойства статистических критериев

Типы статистических критериев

Литература

Ссылки

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты