Участник:Василий Ломакин/Коэффициент корреляции Спирмена
Материал из MachineLearning.
Василий Ломакин (Обсуждение | вклад)
(Новая: {{TOCright}} ==Определение== Заданы две выборки <tex>x = (x_1,\ldots,x_n),\;\; y = (y_1,\ldots,y_n)</tex>. Обозначим через <tex>L_x</tex> — ...)
К следующему изменению →
Версия 16:25, 3 января 2010
|
Определение
Заданы две выборки .
Обозначим через — число связок в выборке
;
-
— число объектов в
-ой связке,
;
-
— число связок в выборке
;
-
— число объектов в
-ой связке,
;
Выборкам и
соответствуют последовательности рангов:
, где
— ранг
-го объекта в вариационном ряду выборки
;
, где
— ранг
-го объекта в вариационном ряду выборки
.
Коэффициент корреляции Спирмена равен
где
Коэффициент корреляции Спирмена изменяется от -1 до 1. Равенство
указывает на строгую линейную корреляцию,
указывает на отсутствие корреляции.
Статистическая проверка наличия корреляции
Гипотеза : Выборки
и
не коррелируют,
.
Статистика критерия:
,
где — распределение Стьюдента с
степенями свободы.
Критерий (при уровне значимости ):
- против альтернативы
: наличие корреляции
- если
, где
—
-квантиль распределение Стьюдента с
степенями свободы..
- если
Связь коэффициента корреляции Спирмена с коэффициентом корреляции Пирсона
В случае выборок из нормального распределения коэффициент корреляции Спирмена может быть использован для оценки коэффициента корреляции Пирсона
по формуле
Связь коэффициента корреляции Спирмена с коэффициентом корреляциии Кенделла
Выборкам и
соответствуют последовательности рангов:
, где
— ранг
-го объекта в вариационном ряду выборки
;
, где
— ранг
-го объекта в вариационном ряду выборки
.
Проведем операцию упорядочевания рангов.
Расположим ряд значений в порядке возрастания величины:
. Тогда последовательность рангов упорядоченной выборки
будет представлять собой последовательность натуральных чисел
. Значения
, соответствующие значениям
, образуют в этом случае некоторую последовательность рангов
.
(
— операция упорядочевания рангов).
Коэффициент корреляции Спирмена и коэффициент корреляции Кенделла
выражаются через ранги
следующим образом:
Коэффициент корреляции Спирмена учитывает насколько сильна неупорядоченность.
Утверждение. Если выборки и
не коррелируют (выполняется гипотеза
), то коэффициент корреляции между величинами
и
можно вычислить по формуле:
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
- Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003
См. также
Ссылки
- Коэффициент корреляции(Википедия)
- Корреляционный анализ (Википедия)