Однослойные сети RBF для решения задач регрессии (пример)
Материал из MachineLearning.
Строка 18: | Строка 18: | ||
<tex>w_j</tex>- веса компонент, <br /> | <tex>w_j</tex>- веса компонент, <br /> | ||
<tex>\theta_j=(\mu_j,\Sigma_j)</tex> - центры и дисперсия компонент, <br /> | <tex>\theta_j=(\mu_j,\Sigma_j)</tex> - центры и дисперсия компонент, <br /> | ||
- | <tex>y(\mu_j)=Y_j</tex> - значения | + | <tex>y(\mu_j)=Y_j</tex> - значения зависимой переменной в центрах компонент. <br /> |
Смесь распределений требуется восстановить с помощью EM-алгоритма с добавлением компонент. <br /> | Смесь распределений требуется восстановить с помощью EM-алгоритма с добавлением компонент. <br /> | ||
Таким образом решается задача [[регрессия|{{S|регрессии}}]] с помощью однослойной сети RBF, обучаемой с помощью [[EM-алгоритм|{{S|EM-алгоритма с добавлением компонент}}]]. | Таким образом решается задача [[регрессия|{{S|регрессии}}]] с помощью однослойной сети RBF, обучаемой с помощью [[EM-алгоритм|{{S|EM-алгоритма с добавлением компонент}}]]. | ||
Строка 35: | Строка 35: | ||
* [[EM-алгоритм]] | * [[EM-алгоритм]] | ||
* [[EM-алгоритм с последовательным добавлением компонент (пример)]] | * [[EM-алгоритм с последовательным добавлением компонент (пример)]] | ||
+ | |||
+ | === Восстановление регрессии === | ||
+ | |||
+ | Значения зависимой переменной в центрах компонент <br /> | ||
+ | <tex>Y_j=y(\mu_j)=</tex> | ||
Версия 11:20, 7 июня 2010
Радиальная функция — это функция , зависящая только от расстояния между x и фиксированной точкой пространства X.
В данной работе используются гауссианы
, которые можно представить в виде
где — нормировочный множитель,
— взвешенная евклидова метрика в n-мерном пространстве X:
,
.
Сеть радиальных базисных функций - нейронная сеть прямого распространения сигнала, которая содержит промежуточный (скрытый) слой радиально симметричных нейронов. Такой нейрон преобразовывает расстояние от данного входного вектора до соответствующего ему "центра" по некоторому нелинейному закону - с помощью радиальной функции. В данной статье мы рассмотрим применение этой нейронной сети к решению задачи регрессии с помощью восстановления смесей распределений.
Содержание |
Постановка задачи
Задана выборка — множество значений свободных переменных и множество
соответствующих им значений зависимой переменной. Предполагается, что на множестве объектов задана плотность распределения
, представимая в виде смеси распределений -
гауссиан с параметрами
и
:
Требуется решить задачу регрессии с помощью однослойной сети RBF, параметрами которой являются
, где
- число компонент смеси,
- веса компонент,
- центры и дисперсия компонент,
- значения зависимой переменной в центрах компонент.
Смесь распределений требуется восстановить с помощью EM-алгоритма с добавлением компонент.
Таким образом решается задача регрессии с помощью однослойной сети RBF, обучаемой с помощью EM-алгоритма с добавлением компонент.
Описание алгоритма
Разделение смеси рапределений
Настройка параметров RBF-сети происходит с помощью EM-алгоритма с добавлением компонент. Идея EM-алгоритма заключается во введении вспомогательного вектора скрытых переменных . С одной стороны, он может быть вычислен, если известны значения вектора параметров
, с другой стороны, поиск максимума правдоподобия сильно упрощается, если известны значения скрытых переменных.
EM-алгоритм состоит из итерационного повторения двух шагов. На E-шаге вычисляется ожидаемое значение (expectation) вектора скрытых переменных
по текущему приближению вектора параметров
. На М-шаге решается задача максимизации правдоподобия (maximization) и находится следующее приближение вектора
по текущим значениям векторов
и
.
Если число компонент смеси заранее неизвестно, то применяется EM-алгоритм с последовательным добавлением компонент. Его идея заключается в том, что если данные описаны смесью компонент, то можно добавить в смесь
-ю компоненту, построенную на элементах, описанных хуже всего (имеющих минимальное правдоподобие). Далее на смеси из
-ой компоненты запускается EM-алгоритм.
Для более подробного описания см.
Восстановление регрессии
Значения зависимой переменной в центрах компонент
![]() | Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |