М-оценка

Материал из MachineLearning.

М-оценки — широкий класс статистических оценок, доставляющих минимум суммы каких-либо функций от данных:

$\hat{\theta}=\arg\min_{\displaystyle\theta}\sum_{i=1}^n\rho\left(x_i, \theta\right) \,\!$

М-оценками являются, в частности, оценки наименьших квадратов, а также многие оценки максимального правдоподобия.

Функция $\rho$ выбирается таким образом, чтобы обеспечить желаемые свойства оценки (несмещённость и эффективность) в условиях, когда данные взяты из известного распределения, и достаточную устойчивость к отклонениям от этого распределения.

M-оценки положения распределения

Для положения распределения М-оценки задаются следующим образом:

$\hat{\theta}=\arg\min_{\displaystyle\theta}\sum_{i=1}^n\rho\left(x_i - \theta\right), \,\!$

где функция $\rho$ должна удовлетворять требованиям

$\rho(0)=0, \;\; \rho(x)\geq 0 \forall x, \;\; \rho(-x)=\rho(x), \;\; \rho(x_1)\geq\rho(x_2)$ при $|x_1|>|x_2|.$

Среднее и медиана распределения минимизируют, соответственно, функции $\sum_{i=1}^n \left(x_i-\theta\right)^2$ и $\sum_{i=1}^n \left|x_i-\theta\right|$ ; примеры других функций $\rho$ , рассматриваемых в теории робастного оценивания, приведены в таблице ниже.

Если $\rho$ имеет производную $\psi$ , задача минимизации приводит к уравнению

$\sum_{i=1}^n \psi\left(x_i-\theta\right)=0.$

Чтобы сделать М-оценку независимой от коэффициента масштаба распределения, можно перейти к задаче

$\min_{\displaystyle\theta}\sum_{i=1}^n\rho\left(\frac{x_i - \theta}{s}\right), \,\!$

$\sum_{i=1}^n\psi\left(\frac{x_i - \theta}{s}\right)=0,$

где значение параметра $s$ можно находить вместе с $\theta$ , а можно считать в данной задаче известным, используя какую-либо оценку (например, абсолютное отклонение среднего).

Иногда от этой задаче переходят к задаче вида

$\sum_{i=1}^n w\left(r_i\right) r_i = 0,$

где $r_i=\frac{x_i - \theta}{s}$ , $w\left(r_i\right)=\frac{\psi\left(r_i\right)}{r_i}$ — весовая функция. Оценка параметра тогда получается как решение итерационно перевзвешиваемой задачи наименьших квадратов:

$\sum_{i=1}^n w\left(r_i^{(k-1)}\right)r_i^{(k)},$

где k — номер итерации.

Вид функции $\rho$ для некоторых популярных М-оценок.

М-оценка	$\rho(x)$	$\psi(x)$	$w(x)$
Huber	$\begin{cases}x^2/2, & \|x\|\leq k \\ k\left(\|x\|-k/2\right), & \|x\|>k \end{cases}$	$\begin{cases}x, & \|x\|\leq k \\ k\operatorname{sgn}(x), & \|x\|>k \end{cases}$	$\begin{cases}1, & \|x\|\leq k \\ \frac{k}{x}, & \|x\|>k\end{cases}$
"fair"	$c^2\left(\frac{\|x\|}{c}-\log\left(1+\frac{\|x\|}{c}\right)\right)$	$\frac{x}{1+\frac{\|x\|}{c}}$	$\frac{1}{1+\frac{\|x\|}{c}}$
Cauchy	$\frac{c}{2}\log\left(1+\left(x/c\right)^2\right)$	$\frac{x}{1+\left(x/c\right)^2}$	$\frac{1}{1+\left(x/c\right)^2}$
Geman-McClure	$\frac{x^2/2}{1+x^2}$	$\frac{x}{\left(1+x^2\right)^2}$	$\frac{1}{\left(1+x^2\right)^2}$
Welsch	$\frac{c^2}{2}\left(1-\exp\left(-\left(x/c\right)^2\right)\right)$	$x\exp\left(-\left(x/c\right)^2\right)$	$\exp\left(-\left(x/c\right)^2\right)$
Tukey	$\begin{cases}\frac{c^2}{6}\left(1-\left(1-\left(x/c\right)^2\right)^3\right), & \|x\|\leq c \\ \frac{c^2}{6}, & \|x\|>c \end{cases}$	$\begin{cases}x\left(1\left(x/c\right)^2\right)^2 , & \|x\|\leq c \\ 0 , & \|x\|>c \end{cases}$	$\begin{cases}\left(1\left(x/c\right)^2\right)^2, & \|x\|\leq c \\ 0, & \|x\|>c \end{cases}$
Andrews	$\begin{cases}k^2\left(1-\cos\left(x/k\right)\right), & \|x\|\leq k\pi \\ 2k^2, & \|x\|>k\pi \end{cases}$	$\begin{cases}k\sin\left(x/k\right), & \|x\|\leq k\pi \\ 0, & \|x\|>k\pi \end{cases}$	$\begin{cases}\frac{\sin\left(x/k\right)}{x/k}, & \|x\|\leq k\pi \\ 0, & \|x\|>k\pi \end{cases}$

Следующая таблица содержит значения параметров методов, подобранные таким образом, чтобы при применении к стандартному нормальному распределению оценки имели асимптотическую эффективность 95%.

М-оценка	Значение параметра
Huber	1.345
"fair"	1.3998
Cauchy	2.3849
Welsch	2.9846
Tukey	4.6851
Andrews	1.339

Ссылки

M-estimator - статья из английской Википедии

Это незавершённая статья. Вы поможете проекту, исправив и дополнив её.

Источник — «http://recognition.su/wiki/index.php?title=%D0%9C-%D0%BE%D1%86%D0%B5%D0%BD%D0%BA%D0%B0»

Категории: Прикладная статистика | Незавершённые статьи

М-оценка

Материал из MachineLearning.

M-оценки положения распределения

Ссылки

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты