Проверка статистических гипотез
Материал из MachineLearning.
Vokov (Обсуждение | вклад)
(Новая: {{TOCright}} '''Статистическая гипотеза''' (statistical hypothesys) — определённое предположение о распределении вероя...)
К следующему изменению →
Версия 19:18, 6 августа 2008
|
Статистическая гипотеза (statistical hypothesys) — определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных.
Проверка статистических гипотез (testing statistical hypotheses) — методология принятия решений о том, что рассматриваемая статистическая гипотеза не противоречит наблюдаемой выборке данных.
Чаще всего рассматриваются две гипотезы — основная или нулевая и альтернативная
.
Иногда альтернатива не формулируется в явном виде; тогда предполагается, что
означает «не
».
Иногда рассматривается сразу несколько альтернатив.
Методология
Пусть задана случайная выборка — последовательность
объектов из множества
, на котором существует (но не известна) вероятностная мера
.
Общая методика состоит в следующем.
- Формулируется нулевая гипотеза
о распределении вероятностей на множестве
. Собственно, это именно то, что мы собираемся проверить. Гипотеза формулируется исходя из требований прикладной задачи. В математической статистике хорошо изучено несколько десятков «наиболее часто встречающихся» типов гипотез, и известны ещё сотни специальных вариантов и разновидностей.
- Задаётся некоторая статистика
, для которой в условиях справедливости гипотезы
выводится функция распределения
и/или плотность распределения
. Вопрос о том, какую статистику надо взять для проверки той или иной гипотезы, часто не имеет однозначного ответа. Есть целый ряд требований, предъявляемых к «хорошей» статистике
. Задача получения функции распределения
при заданных
и
является строго поставленной математической задачей, которая решается методами теории вероятностей; в справочниках приводятся готовые формулы; в статистических пакетах имеются готовые вычислительные процедуры.
- Фиксируется уровень значимости
— число из отрезка
, которое можно интерпретировать как «достаточно малую вероятность». Её выбирают исходя из априорных соображений риска, допустимого для принимаемого решения в данной прикладной задаче. Часто полагают
.
- На множестве допустимых значений статистики
выделяется критическое множество
наименее вероятных значений
такое, что
. Вычисление вида критического множества также является строгой математической задачей, решение которой для большинства практических случаев известно.
- Статистический тест
![]() | Статья в настоящий момент дорабатывается. К.В.Воронцов 23:18, 6 августа 2008 (MSD) |
Литература
- Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.