Критерий Бартлетта

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м Критерий Бартлета» переименована в «Критерий Бартлетта»: исправление)

Версия 07:44, 11 января 2009

Критерий Бартлета позволяет проверять равенство дисперсий нескольких выборок. При этом объемы выборок могут быть различными. Критерий Бартлетта очень чувствителен к нарушению предположения о нормальности.


Содержание

Описание критерия

Имеется k выборок x^{n_1}_1, . . . , x^{n_k}_k объемом n_i (i=1,...,k ) каждая. Дисперсии выборок и выборочные оценки дисперсий обозначим через \sigma_i^2 и s_i^2 соответственно.

Дополнительные предположения

  • Выборки x^{n_1}_1, . . . , x^{n_k}_k являются нормальными. Критерий Бартлетта очень чувствителен к отклонениям от нормальности распределения исследуемых случайных величин. Если нет уверенности в нормальности распределения, им не рекомендуется пользоваться.

Нулевая гипотеза

Критерий Бартлетта проверяет гипотезу H_0 о том, что дисперсии всех k выборок одинаковы.

H_0: \sigma_1^2 = \sigma_2^2 =  . . . = \sigma_k^2

Альтернативная гипотеза H_1: существует, по крайней мере, две выборки i и j (i \neq j) с несовпадающими дисперсиями.

H_1: \sigma_i^2  \neq \sigma_j^2 (для некоторых i \neq j).


Статистика критерия Бартлетта

Статистика критерия Бартлетта вычисляется в соответствии с соотношением:

T  = \frac{M}{c}.

Здесь

M = (N-k) \cdot \ln(s^2_p) - \sum_{i=1}^k (n_i - 1) \cdot \ln(s^2_i),
c = 1 + \frac{1}{3\cdot (k-1)} \cdot \left(\sum_{i=1}^k \left(\frac{1}{n_i-1} \right) - \frac{1}{(N-k)} \right),

где N = \sum_{i=1}^k n_i и  s^2_p = \frac{1}{ N-k } \sum_{i=1}^k (n_i - 1) \cdot s^2_i – суммарная оценка дисперсий.

При n_i > 3 (i=1,...,k) и справедливости нулевой гипотезы статистика критерия Бартлетта имеет распределение \chi_{k-1}^2 хи-квадрат с (k-1) степенями свободы.

Критерий (при уровне значимости  \alpha)

Если  T > \chi_{k-1, \alpha}^2, то с достоверностью  \alpha нулевая гипотеза H_0 отвергается в пользу альтернативы H_1.

Примечание

При отклонении от нормальности рекомендуется вместо статистики T пользоваться ее модификацией:

T^*  = \frac{f_2 \cdot M}{f_1 \cdot \left(\frac{f_2^2}{f_2 (2-c) + c} - M \right)},

где f_1 = k-1, f_2 = \frac{k+1}{(c-1)^2}.

Статистика  T^* имеет F-распределение с f_1 и f_2 степенями свободы. Поэтому нулевую гипотезу следует отклонить, если T^* > F_{\alpha}(f_1, f_2).

Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.

См. также

Ссылки

Личные инструменты