Метод множественных сравнений Шеффе

Материал из MachineLearning.

Версия от 09:50, 11 января 2009; Елена Корнилина (Обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

Метод множественных сравнений Шеффе - это модификация t-критерия Cтьюдента. Это параметрический тест, который выявляет наличие статистически значимых различий между средними для нормально распределенных связных групп на основе дисперсионного анализа. Объемы выборок могут различаться. Нулевая гипотеза предполагает, что выборки бьются на две группы с равными средними. Метод Шеффе использует линейные комбинации средних по выборкам, в то время как метод Тьюки-Крамера рассматривает только попарные сравнения.

Содержание

[убрать]

Примеры задач

Пример 1

Компания по производству лакокрасочных изделий разработала новый вид краски для внешних (уличных) покрытий. Прежде чем выпускать новую продукцию на рынок, компания намерена проверить устойчивость новой краски к внешним воздействиям. Компания обладает соответствующим тестирующим оборудованием, которое воздействует на окрашенную поверхность специальными щетками и фиксирует количество воздействий, необходимых для полного стирания краски. С помощью этого оборудования были проведены испытания, в ходе которых сравнивалось качество краски, разработанной компанией, с аналогичными продуктами, предлагаемыми двумя конкурентами.

Необходимо проверить, различается ли оцениваемое качество продуктов (есть ли статистически значимое различие в качестве продуктов между компанией и конкурентом: Математические основы эмпирических социально-экономических исследований: Учебное пособие

Пример 2

Производитель компьютерной и оргтехники разработал новый продукт, позиционируемый преимущественно на использование в «домашних» условиях, а не в офисе. Организованы тестовые продажи продукта в магазинах, торгующих бытовой электроникой, универмагах и специализированных компьютерных магазинах (случайно отобрано по 5 торговых точек каждой категории).

Необходимо определить, в магазинах какого типа следует организовать основные продажи (выявить наличие или отсутствие статистически значимого различия между магазинами электроники и универмагами):Математические основы эмпирических социально-экономических исследований: Учебное пособие

Пример 3

Рассматривался один из методов биотестирования - метод корневого теста. Главный индикационный показатель при этом - длина корня тестобъекта. В качестве тест-объекта был выбран редис. Семена проращивали в рулонной культуре, с трехкратной повторностью, контролировали на дистиллированной воде. Методом множественных сравнений Шеффе подтверждено отличие выживаемости проростков на дистиллированной воде от значений этого показателя в остальных вариантах:Экология: от генов до экосистем (Материалы конференции молодых ученых)

Описание критерия

Имеется k выборок x^{n_1}_1, . . . , x^{n_k}_k, объемом n_i\; (i=1,...,k) каждая, где x^{n_i}_i=(x_{i,1},\ldots,x_{i,n_i}),\; x_{i,j}\in\mathbb{R}

Дополнительное предположение

Распределения выборок нормальны, выборки связные.

Нулевая гипотеза

Критерий Шеффе проверяет нулевую гипотезу H_0:\; \sum_{i=1}^{k}c_i\overline{X}_i=0,
где \sum_{i=1}^{k}c_i=0, \overline{X}_i - среднее арифметическое значение в группе с номером i.

Описание критерия

Алгоритм проверки критерия состоит из следующих шагов

  1. Упорядочить выборки по возрастанию средних значений \overline{X}_i
  2. Задать c_i,\; i=1,...,k

Пример

Пусть H_0:\; \frac{1}{5}\bigl( \overline{x}_1+\overline{x}_2+\overline{x}_3+\overline{x}_4+\overline{x}_5\bigr)=
\frac{1}{3}\bigl(\overline{x}_6+\overline{x}_7+\overline{x}_8\bigr)

Т.е. нулевая гипотеза состоит в том, что среднее арифметическое по первым пяти выборкам равно среднему арифметическому последующих трех.

Тогда следует выбрать следующие значения c_i:

c_i=\frac{1}{5},\;i=1\ldots 5 и c_i=-\frac{1}{3},\;i=6..8

Статистика критерия Шеффе

Вводим статистику

S=\frac{\Bigl(\sum_{i=1}^{k}c_i\overline{X}_i\Bigr)^2}{(k-1)S^2_{int}\sum_{i=1}^{k}\frac{c_i^2}{n_i}},

где S^2_{int} - внутригрупповая дисперсия, S^2_{int}=\frac{1}{n-k}\sum_{i=1}^k\sum_{j=1}^{n_i}\bigl(x_{ij}-\overline{X}_i\bigr)^2,\; n=\sum_{i=1}^k{n_i}

Статистика Шеффе имеет распределение Фишера с k-1 и n-k степенями свободы.

Критическая область

Для критерия Шеффе критическая область при уровне значимости \alpha - это область

\Omega_{\alpha}:\; S>F_{k-1,n-k,\alpha}

где F_{k-1,n-k,\alpha} - квантиль Фишера

Примечание

Это односторонний критерий. Он предполагает, что всего 2 различных значения средних. Если это неверно, рекомендуется воспользоваться, например, методом LSD.

Если использовать только попарное сравнение, то в методе Тьюки-Крамера результат несколько точнее, но в общем случае предпочтительнее метод Шеффе, т.к. он дает более широкий доверительный интервал.

Критерий Шеффе является грубым критерием и особенно пригоден в тех случаях, когда имеется подозрение о неравенстве дисперсий выборок между собой [1]

Литература


См. также

Ссылки

Личные инструменты