Критерий асимметрии и эксцесса

Материал из MachineLearning.

Перейти к: навигация, поиск

Содержание

С помощью критерия асиметрии и эксцесса можно проверить гипотезу H_0: случайная величина имеет распределение, отличное от нормального. Если распределение нормально, то его коэффициент асимметрии \alpha_3=0 и коэффициент эксцесса \alpha_4=3. Так как значения \alpha_3=0 и \alpha_4=3 могут иметь место и для распределений, отличных от нормального, то этот критерий следует воспринимать как критерий установления отклонения от нормальности распределения, но не установления нормальности.

Описание критерия

Выборочные оценки коэффициентов асимметрии и эксцесса равны

\alpha_3=\frac{1}{ns^3}\sum_{i=1}^n(x_i-\overline{x})^3; \; \alpha_4=\frac{1}{ns^4}\sum_{i=1}^n(x_i-\overline{x})^4; \; s_2=\frac{1}{n}\sum_{i=1}^n(x_i-\overline{x})^2;.

Известно, что M(\alpha_3)=0; \; D(\alpha_3)=\frac{6(n-2)}{(n+1)(n+3)}\approx\frac{6}{n}\left(1-\frac{12}{2n+7}\right).

Распределение \alpha_3 достаточно быстро стремится к нормальному. Для \alpha_4 справедливы соотношения

M(\alpha_4)=3- \frac{6}{n+1}; \; D(\alpha_4)=\frac{24n(n-2)(n-3)}{(n+1)^(n+3)(n+5)}=\frac{24}{n}\left(1-\frac{225}{15n+224}\right).

Распределение \alpha_4 стремится к нормальному медленно.

Рассмотрим применение критерия \alpha_3 для установления отклонения эмпирического распределения от нормального. При n>200 можно использовать грубый критерий:

если
\alpha_3=\frac{1}{ns^3}\sum_{i=1}^n(x_i-\tilde{x})^3\ge \frac{6}{n},

то нормальность распределения отвергается.

На практике применяют нормальизующие преобразования для \alpha_3. Рассмотрим некоторые из них. Д'агостино и Пирсоном была предложена аппроксимация \xi=\delta\ln\left(x+\sqrt{x^2+1}\right), где x=\frac{\alpha_3}{\lambda}, которая при n\to\inf распределена как стандартная нормальная величина (коэффициенты \delta,\:\lambda заданы таблично).

Была предложена следующая нормализующая аппроксимация: если

y=\alpha_3\sqrt{\frac{(n+1)(n+3)}{6(n-2)}};\; \beta=\frac{3(n^2+27n-70)(n+1)(n+3)}{(n-2)(n+5)(n+7)(n+9)};\; \omega^2=-1+\sqrt{2(\beta-1)};\; \delta=\sart{\ln10};\; \alpha=\left(\frac{2}{\omega^2-1}\right)^{frac{1}{2}},

то величина z=\delta\ln\left\{\frac{y}{\alpha}+\sqrt{\left(\frac{y}{\alpha}\right)^2+1}\right\} уже при n>25 может быть аппроксимирована стандартным нормальным распределением.

Рассмотрим теперь преобразование для коэффициента эксцесса \alpha_4. Распределение \alpha_4 может быть аппроксимировано распределением \chi^2 с f степенями свободы при

a=6+\frac{8}{c}\left\{\frac{2}{c}+\left(1+\frac{4}{c^2}\left)^{\frac{1}{2}}\right\}, где c=\frac{6(n^2-5n+2)}{(n+7)(n+9)}\sqrt{\frac{6(n+3)(n+5)}{n()(n-3)}}.

Анскомбе и Глинном было предложено весьма эффективное нормализующее преобразование для коэффициента эксцесса. Алгоритм его построения заключается в следующем. Если x=\frac{\alpha_4-M(\alpha_4)}{\sqrt{D(\alpha_4)}}, то случайная величина

d=\left[1-\frac{2}{9f}-\left\{\frac{1-\frac{2}{f}}{1+x\sqrt{\frac{2}{f-4}}}\right\}^{\frac{1}{3}}\right]\left(\frac{2}{9f}\right)^{-\frac{1}{2}}

аппроксимируется стандартным нормальным распределением N(0,1) уже при n>20.

Нормализующие таблицы позволяют использовать таблицы (или аппроксимации) стандартного нормального распределения для проверки отклонения от нормальности.

Мощность критерия проверки отклонения от нормальности может быть повышена применением так называемого комбинированного K^2-критерия

K^2=X^2(\alpha_3)+X^2(\alpha_4),

где X(\alpha_3) и X(\alpha_4) —- стандартные нормальные эквиваленты распределений X\alpha_3 и \alpha_4.

Статистика K^2 имеет \chi^2-распределение с f=2 степенями свободы. Другая форма комбинированного критерия исследовалась Боуманом и Фолксом. Если q_1=2p(\alpha_3<a_3) и q_2=2p(\alpha_4<a_4)(a_3 и a_4 —- выборочные оценки параметров \alpha_3 и \alpha_4 соответственно), то статистика q=-2\ln q_1q_2 имеет \chi^2-распределение с f=4.

См. также

Ссылки

Wikipedia: Statistical Tests

Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 238 с.
  2. D'Agostino R. B., Pearson E. S. A further development of test departure from normality. — Biometrika, 1973, 60, №3 — p. 613-622.
Личные инструменты