Алгоритм AnyBoost

Материал из MachineLearning.

(Различия между версиями)

Перейти к: навигация, поиск

Версия 17:53, 7 февраля 2010

Данная статья является непроверенным учебным заданием.

Студент: Участник:Mordasova

Преподаватель: Участник:Константин Воронцов

Срок: 10 февраля 2010

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.

Алгоритм AnyBoost - класс алгоритмов, представляющих бустинг как процесс градиентного спуска. В основе алгоритма лежит последовательное уточнение функции, представляющей собой линейную комбинацию базовых классификаторов, с тем чтобы минимизировать функцию потерь. В класс AnyBoost входят практически все алгоритмы бустинг как частные случаи.

Описание алгоритма

Алгоритм AnyBoost

Рассмотрим задачу классификации, $\mathcal{F}$ - множество базовых классификаторов, все их линейные комбинации содержатся в множестве $\mathrm{lin}(\mathcal{F})$ . На каждом шаге алгоритма к текущему классификатору $F$ прибавляется базовый классификатор так, чтобы значение $C(F+\eps f)$ уменьшилось на некоторое значение $\eps$ . То есть в терминах функционального пространства для функции $f$ ищется направление, в котором функция $C(F+\eps f)$ быстрее уменьшается. Наибольшее уменьшение функции потерь наблюдается в случае, когда $f$ максимизирует $-\left \langle \nabla C(F),f \right \rangle$ .

Инициализация $F_0=0$ ;
Для всех пока не выполнено условие выхода из цикла;
1. Получение нового классификатора $f_{t+1}$ , увеличивающего значение $-\left \langle \nabla C(F_t), f_{t+1}\right \rangle$ ;
2. Если $-\left \langle \nabla C(F_t),f_{t+1}\right \rangle \le 0$ выходим из цикла и возвращаем $F_t$ ;
3. Выбор веса $w_{t+1}$
4. Уточнение классификатора $F_{t+1}=F_{t}+w_{t+1}f_{t+1}$
Возвращаем $F_{T+1}$

В случае бинарного классификатора $Y=\{-1;1\}$ . $X^l =\{(x_i,y_i)\}$ - обучающая выборка. Функция потерь $C=\frac{1}{m}\sum^{m}_{i=1}{c(y_iF(x_i))}$ определяется через дифференцируемую функцию выброса $c:\mathbb{R} \to \mathbb{R}$ . В этом случае $-\left \langle \nabla C(F),f \right \rangle = -\frac{1}{m^2}\sum^{m}_{i=1}{y_if(x_i)c'(y_iF(x_i))}$ , и нахождение классификатора на каждом шаге будет равносильно нахождению классификатора $f$ , минимизирующего взвешенную ошибку.

См. также

Литература

Mason L., Baxter J., Bartlett P., Frean M. Boosting algorithms as gradient descent. — Advances in Neural Information Processing Systems. — MIT Press, 2000. — T. 12. — 512--518 с.

Ссылки

Источник — «http://recognition.su/wiki/index.php?title=%D0%90%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC_AnyBoost»

Категории: Непроверенные учебные задания | Алгоритмические композиции | Методы голосования

@@ Строка 10: / Строка 10: @@
 # Инициализация <tex>F_0=0</tex>;
 # Для всех <tex>t=0,..,T</tex> пока не выполнено условие выхода из цикла;
-## Получение нового классификатора <tex>f_{t+1}</tex>, увеличивающего значение <tex>-\left \langle \nabla C(F_t), f_{t+1}\right \rangle</tex>; ## Если <tex>-\left \langle \nabla C(F_t),f_{t+1}\right \rangle \le 0</tex> выходим из цикла и возвращаем <tex>F_t</tex>;
+## Получение нового классификатора <tex>f_{t+1}</tex>, увеличивающего значение <tex>-\left \langle \nabla C(F_t), f_{t+1}\right \rangle</tex>;
+## Если <tex>-\left \langle \nabla C(F_t),f_{t+1}\right \rangle \le 0</tex> выходим из цикла и возвращаем <tex>F_t</tex>;
 ## Выбор веса <tex>w_{t+1}</tex>
 ## Уточнение классификатора <tex>F_{t+1}=F_{t}+w_{t+1}f_{t+1}</tex>

Алгоритм AnyBoost

Материал из MachineLearning.

Версия 17:53, 7 февраля 2010

Содержание

Описание алгоритма

См. также

Литература

Ссылки

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты