Медианный критерий
Материал из MachineLearning.
м (→Описание критерия) |
|||
(10 промежуточных версий не показаны.) | |||
Строка 1: | Строка 1: | ||
- | + | '''Медианный критерий''' — [[непараметрический статистический критерий]], относится к классу [[ранговый критерий| ранговых критериев]] сдвига. То есть проверяет гипотезу о том, что распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу. | |
- | + | == Описание критерия == | |
+ | Пусть <tex>X = (X_1,\ldots,X_m)</tex> и <tex>Y = (Y_1,\ldots,Y_n)</tex> - случайные выборки с плотностями <tex>f_1</tex> и <tex>f_2</tex> соответственно. | ||
- | Тест имеет низкую эффективность для диапазона выборок от умеренного до большого размера, и, в значительной степени, расценивается как устаревший. [[Критерий Уилкоксона-Манна-Уитни]] для двух выборок лучше работает в этом случае. Siegel & Castellan (1988, p. 124), считают, что медианному критерию нет никакой альтернативы, когда одно или более наблюдений находятся "за пределами шкалы". Существенное различие между двумя критериями состоит в том, что медианный критерий учитывает только положение каждого наблюдения относительно совокупной медианы, тогда как критерий Уилкоксона-Манна-Уитни принимает во внимание ранг каждого наблюдения. Таким образом из двух рассмотренных тестов, последний обычно более показателен. | + | '''[[Нулевая гипотеза]]''' <tex>H_0:\; f_1(x) = f_2(x)</tex>. |
+ | '''Альтернатива''' <tex>H_1:\; f_1(x) = f_2(x-\Delta), \Delta \neq 0</tex>. То есть плотности идентичны за исключением сдвига. | ||
+ | |||
+ | '''Статистика критерия:''' | ||
+ | * Строится общий [[вариационный ряд]] объединённой выборки <tex>Z_{(1)} \leq \cdots \leq Z_{(m+n)}</tex>. <tex>R _i</tex> - ранги элементов первой выборки в общем вариационном ряду. | ||
+ | * ''Форма 1'' | ||
+ | Находится медиана упорядоченной объединенной выборки <tex>Z</tex> и подсчитывается число наблюдений выборки <tex>X</tex>, превосходящих медиану (если <tex>(m+n)</tex> нечетно и медиана принадлежит выборке <tex>X</tex>, то это число увеличивается на <tex>\frac{1}{2}</tex>). Тогда статистика критерия может быть записана так: | ||
+ | ::<tex>S = \sum_{i=1}^{m}\frac{1}{2}[sign(R_i - \frac{m+n+1}{2} )+ 1]</tex> | ||
+ | |||
+ | При <tex>n,m > 10</tex> распределение статистики <tex>S</tex> удовлетворительно описывается [[нормальное распределение|нормальным]] со средним <tex>\mathbf{M}(S) = \frac{m}{2}</tex> и дисперсией | ||
+ | |||
+ | ::<tex>\mathbf{D}(S) = \frac{mn}{4(m+n-1)}</tex>, если <tex>m+n = 2k</tex> и | ||
+ | ::<tex>\mathbf{D}(S) = \frac{mn}{4(m+n)}</tex>, если <tex>m+n = 2k-1</tex> | ||
+ | |||
+ | Если | ||
+ | ::<tex>|S^*| = \frac{|S-\mathbf{M}(S)|}{ \sqrt{\mathbf{D}(S)}} < U_{1-\frac{\alpha}{2}}</tex>, | ||
+ | то с достоверностью <tex>\alpha</tex> гипотеза сдвига отклоняется. | ||
+ | * ‘’Форма 2’’ | ||
+ | Пусть <tex>A</tex> и <tex>C</tex> – количество элементов выборки <tex>X</tex>, соответственно больших и меньших медианы объединенной выборки, а <tex>B</tex> и <tex>D</tex> - аналогичные числа для выборки <tex>Y</tex>. | ||
+ | Тогда статистикой критерия сдвига является величина | ||
+ | ::<tex>\chi^2 = \frac{(n+m)(|AD-BC|-\frac{n+m}{2})^2}{(A+B)(C+D)+(A+C)(B+D)}</tex>, | ||
+ | |||
+ | Имеющая, при отсутствии сдвига, распределение хи-квадрат с 1 степенью свободы | ||
+ | |||
+ | == Замечания == | ||
+ | # Медианный критерий асимптотически оптимален, когда плотность <tex>f</tex> принадлежит симметрично-экспоненциальному типу. | ||
+ | #’Форма 2’ критерия применима только при <tex>n+m<40</tex> и <tex>A, B, C, D < 5</tex> | ||
+ | # Эффективность медианного критерия по сравнению с [[Критерий Стьюдента|критерием Стьюдента]] в случае нормального распределения равна <tex>\frac{2}{\pi} \approx 0,64</tex> | ||
+ | |||
+ | |||
+ | ==Сравнение с аналогичными критериями== | ||
+ | #Тест имеет низкую эффективность для диапазона выборок от умеренного до большого размера, и, в значительной степени, расценивается как устаревший. [[Критерий Уилкоксона-Манна-Уитни]] для двух выборок лучше работает в этом случае. Siegel & Castellan (1988, p. 124), считают, что медианному критерию нет никакой альтернативы, когда одно или более наблюдений находятся "за пределами шкалы". Существенное различие между двумя критериями состоит в том, что медианный критерий учитывает только положение каждого наблюдения относительно совокупной медианы, тогда как критерий Уилкоксона-Манна-Уитни принимает во внимание ранг каждого наблюдения. Таким образом из двух рассмотренных тестов, последний обычно более показателен. | ||
==Ссылки== | ==Ссылки== | ||
+ | * [http://en.wikipedia.org/wiki/Median_test Median test] — материал из Википедии | ||
+ | * [http://www.statsoft.ru/home/portal/applications/Multivariatadvisor/Nonparametrics/Kraskel-Uoliss.htm Дисперсионный анализ Краскела-Уоллиса и медианный тест] — учебник по статистике, StatSoft | ||
+ | |||
+ | ==Литература== | ||
+ | |||
+ | * Siegel, S., & Castellan, N. J. Jr. (1988, 2nd ed.). Nonparametric statistics for the behavioral sciences. New York: McGraw-Hill. | ||
+ | * Friedlin, B. & Gastwirth, J. L. (2000). Should the median test be retired from general use? ''The American Statistician, 54'', 161-164. | ||
+ | * Я.Гаек, З. Шидак Теория ранговых решений. "Наука" Москва 1971г. | ||
+ | * Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. М.:ФизМатЛит 2006г. | ||
+ | [[Категория:Статистические тесты]] | ||
+ | |||
+ | {{Задание|Евгения Одинокова|Vokov|29 января 2009}} |
Текущая версия
Медианный критерий — непараметрический статистический критерий, относится к классу ранговых критериев сдвига. То есть проверяет гипотезу о том, что распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу.
Содержание[убрать] |
Описание критерия
Пусть и
- случайные выборки с плотностями
и
соответственно.
Нулевая гипотеза .
Альтернатива
. То есть плотности идентичны за исключением сдвига.
Статистика критерия:
- Строится общий вариационный ряд объединённой выборки
.
- ранги элементов первой выборки в общем вариационном ряду.
- Форма 1
Находится медиана упорядоченной объединенной выборки и подсчитывается число наблюдений выборки
, превосходящих медиану (если
нечетно и медиана принадлежит выборке
, то это число увеличивается на
). Тогда статистика критерия может быть записана так:
При распределение статистики
удовлетворительно описывается нормальным со средним
и дисперсией
, если
и
, если
Если
,
то с достоверностью гипотеза сдвига отклоняется.
- ‘’Форма 2’’
Пусть и
– количество элементов выборки
, соответственно больших и меньших медианы объединенной выборки, а
и
- аналогичные числа для выборки
.
Тогда статистикой критерия сдвига является величина
,
Имеющая, при отсутствии сдвига, распределение хи-квадрат с 1 степенью свободы
Замечания
- Медианный критерий асимптотически оптимален, когда плотность
принадлежит симметрично-экспоненциальному типу.
- ’Форма 2’ критерия применима только при
и
- Эффективность медианного критерия по сравнению с критерием Стьюдента в случае нормального распределения равна
Сравнение с аналогичными критериями
- Тест имеет низкую эффективность для диапазона выборок от умеренного до большого размера, и, в значительной степени, расценивается как устаревший. Критерий Уилкоксона-Манна-Уитни для двух выборок лучше работает в этом случае. Siegel & Castellan (1988, p. 124), считают, что медианному критерию нет никакой альтернативы, когда одно или более наблюдений находятся "за пределами шкалы". Существенное различие между двумя критериями состоит в том, что медианный критерий учитывает только положение каждого наблюдения относительно совокупной медианы, тогда как критерий Уилкоксона-Манна-Уитни принимает во внимание ранг каждого наблюдения. Таким образом из двух рассмотренных тестов, последний обычно более показателен.
Ссылки
- Median test — материал из Википедии
- Дисперсионный анализ Краскела-Уоллиса и медианный тест — учебник по статистике, StatSoft
Литература
- Siegel, S., & Castellan, N. J. Jr. (1988, 2nd ed.). Nonparametric statistics for the behavioral sciences. New York: McGraw-Hill.
- Friedlin, B. & Gastwirth, J. L. (2000). Should the median test be retired from general use? The American Statistician, 54, 161-164.
- Я.Гаек, З. Шидак Теория ранговых решений. "Наука" Москва 1971г.
- Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. М.:ФизМатЛит 2006г.
![]() | Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |