Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 874, весна 2011

Материал из MachineLearning.

(Различия между версиями)

Версия 22:41, 2 марта 2011

Основная статья: Численные методы обучения по прецедентам (практика, В.В. Стрижов)

Перед выполнением заданий рекомендуются к прочтению

Задачи

Название задачи	Работу выполняет	Работу рецензирует
Прогнозирование с использованием теста Гренжера (пример)	Анастасия Мотренко
Выбор функции активации при прогнозировании нейронными сетями (пример)	Георгий Рудой	Николай Балдин
Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)	Любовь Леонтьева	Михаил Бурмистров
Прогнозирование функциями дискретного аргумента (пример)	Егор Будников	Александр Романенко
Исследование сходимости при прогнозировании нейронными сетями с обратной связью (пример)	Николай Балдин	Георгий Рудой
Непараметрическое прогнозирование: выбор ядра из набора, настройка параметров (пример)	Михаил Кокшаров
Экспоненциальное сглаживание и прогноз (пример)	Бурмистров Михаил
Выравнивание временных рядов: прогнозирование с использованием DTW (пример)	Романенко Александр	Егор Будников
Многомерная авторегрессия (пример)	Ямщиков Илья
Локальные методы прогнозирования,поиск метрики (пример)	Евгений Гребенников	Михаил Кокшаров
Локальные методы прогнозирования,поиск инвариантного преобразования (пример)	Юлия Хаспулатова
Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж)	Токмакова Александра	Будников Егор
Многомерная гусеница, выбор временных рядов при прогнозировании(пример)	Элина Торчинская
Прогнозирование и аппроксимация сплайнами	Мищенко Павел
ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)(пример)	Ганусевич Ирина
Прогнозирование и SVN – регрессия(пример)	Ситник Александр

В конце названия слово "(пример)" является ключевым и означает "пример работы алгоритма".

Краткое описание задач

Краткосрочное прогнозирование почасовых цен на электроэнергию (пример)

Описание задачи.

Задача 2: Экспоненциальное сглаживание и прогноз (пример)

Прогнозирование методом экспоненциальной регрессии является идейно простым алгоритмом прогнозирования временных рядов. Идея метода основана на учете предшествующих значений ряда с убывающими весами. В своей простейшей реализации алгоритм сильно сглаживает ряд и плохо учитывает тренды, сезонность и резкие изменения в тренде, а также необоснованно заметно реагирует на выбросы в данных. Предполагается изучение и реализация алгоритмов, пытающихся найти оптимальную модель путем минимизации ошибки на известном временном ряду.

Задача 3: Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж) (пример)

Целью проекта является нахождение закономерности в определённом процессе и сравнение базового алгоритма, проводящего прогнозирование с помощью скользящего среднего, с алгоритмом, учитывающим цикличность задачи. Также необходимо исследовать различные флуктуации входящих параметров и минимизировать при этом отклонения.

Данный алгоритм можно использовать при прогнозировании цен, объёмов продаж, туристических потоков – любых процессов, подразумевающих наличие временных рядов с периодической составляющей. Алгоритм не предусмотрен для работы в авральных ситуациях, таких как: промо-акции, праздники и т.д. - данные ситуации описываются отдельной задачей. Результатом проекта является оценка эффективности алгоритма, учитывающего цикличность задачи.

Задача 4: Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)

Требуется исследовать SSA-алгоритм (метод гусеницы) для многомерных временных рядов. Метод заключается в преобразовании ряда с помощью однопараметрической сдвиговой процедуры с последующим исследованием полученной траектории с помощью анализа главных компонент и восстановлением ряда по выбранным главным компонентам. В работе будет исследован вопрос выбора длины гусеницы и числа ее компонент, т.е. то, как определить по полученному разложению на компоненты, какие из них являются неинформативными (шумы). Также метод помогает увидеть и выделить разного рода закономерности в поведении временных рядов.

Результатом работы является выяснение эффективности работы алгоритма в зависимости от длины и числа компонент гусеницы, а также выяснение возможностей алгоритма и его области применимости.

Задача 7: Локальные методы прогнозирования,поиск метрики (пример)

Временной ряд делится на отдельные участки, каждому из которых сопоставляется точка в n-мерном пространстве признаков. Локальная модель рассчитывается в три последовательных этапа. Первый – находит k-ближайших соседей наблюдаемой точки. Второй – строит простую модель, используя только этих k соседей. Третий – используя даную модель, по наблюдаемой точке прогнозирует следующую. Многие исследователи, используют эвклидову метрику для измерения расстояний между точками. Данная работа призвана сравнить точность прогнозирования при использовании различных метрик. В частности, требуется исследовать оптимальный набор весов во взвешенной метрике для максимизации точности прогнозирования.

Задача 8: Локальные методы прогнозирования, поиск инвариантного преобразования (пример)

В проекте используются локальные методы прогнозирования временных рядов. Эти методы отказываются от нахождения представления временного ряда в классе заданных функций от времени. Вместо этого прогноз осуществляется на основе данных о каком-то участке временного ряда (используется локальная В данной работе подробно исследован следующий метод (обобщение классического «ближайшего соседа»).

Пусть ) ,..., ( ~

1 n f f f = – временной ряд, требуется продолжить его 1 1 t n n n f f f f g + + = . Предполагается, что такое продолжение определяется «предысторией» ) ,..., ( 1 n l n f f + - , т.е. в ряде нужно найти часть ) ,..., ( 1 k l k f f + - , которая после некоторого преобразования A «становится похожа» на ) ,..., ( 1 n l n f f + - : a k k l k k l k f f f f A B ~ , 1 1 min ) ) ,..., ( ), ,..., ( ( ® + - + - , здесь a~ – параметры преобразования A, B – функция близости двух отрезков временного ряда (например, евклидово расстояние между отрезками или взвешенное евклидово расстояние, которое «последним» точкам приписывает больший вес). Определив k , мы находим ближайшего соседа к нашей предыстории. Искомое продолжение запишется в виде ) ,..., ( 1 t k k f f A + + . В общем случае ищем несколько ближайших соседей. Продолжение запишется в виде их линейной комбинации å å = + + r r r t k k r c f f A c r r 1 , ) ,..., ( 1 .

Задача 9: Выравнивание временных рядов: прогнозирование с использованием DTW (пример)

Временным рядом называется последовательность упорядоченных по времени значений некоторой вещественной переменной $\mathbf{x}=\{x_{t}\}_{t=1}^T\in\mathbb{R}^T$ . Задача, сопутствующая появлению временных рядов, - сравнение одной последовательности данных с другой. Сравнение последовательностей существенно упрощается после деформации временного ряда вдоль одной из осей и его выравнивания. Dynamic time warping (DTW) представляет собой технику эффективного выравнивая временных рядов. Методы DTW используются при распознавании речи, при анализе информации в робототехнике, в промышленности, в медицине и других сферах.

Цель работы - привести пример выравнивания, ввести функционал сравнения двух временных рядов, обладающий естественными свойствами коммутативности, рефлексивности и транзитивностина. Функционал должен принимать на вход два временных ряда, а на выходе давать число, характеризующее степень их "похожести".

Задача 10: Выбор функции активации при прогнозировании нейронными сетями (пример)

Целью проекта является исследование зависимости качества прогнозирования нейронными сетями без обратной связи (одно- и многослойными перцептронами) от выбранной функции активации нейронов в сети, а также от параметров этой функции, при наличии таковых.

Функция активации определяет сигнал на выходе нейрона в зависимости от результата работы сумматора на входе нейрона. Как правило, функция активации имеет область определения $(-\infty; \infty)$ и область значений $[0; 1]$ . В простейшем случае, изначально предложенном и моделирующим биологический нейрон, функция активации представляет собой функцию Хевисайда:

$f(x) = \begin{cases}1 & x \geq x_0\\0 & x < x_0\end{cases}$

При дальнейшем развитии нейронных сетей оказалось полезным использование непрерывных функций, таких как логистическая функция $\sigma(x) = \frac{1}{1+e^{-tx}}$ и другие функции-сигмоиды ( $f(x) = \frac{x}{x+\alpha}$ ) и немонотонные функции, такие как тригонометрический синус.

Результатом проекта является оценка качества прогнозирования нейронными сетями в зависимости от типа и параметров функции активации.

Задача 12: Исследование сходимости при прогнозировании нейронными сетями с боратной связью (пример)

Цель проекта - иследовать зависимость сходимости прогнозирования от параметров нейронной сети. Понятие обратной связи характерно для динамических систем, в которой выходной сигнал некоторого элемента истемы оказыает влияние на входной сигнал этого элемента. Входной Сигнал $x_{j}(n)$ , внутренний сигнал $x_{j}^{'}(n)$ и выходной сигнал $y_{j}(n)$ связаны соотношениями

Задача 13: Многомерная гусеница, выбор временных рядов при прогнозировании(пример)

Работа посвящена исследованию одного из методов анализа многомерных временных рядов - метода "гусеницы", также известного как Singular Spectrum Analysis или SSA. Метод можно разделить на четыре этапа - представление временного ряда в виде матрицы при помощи сдвиговой процедуры, вычисление ковариационной матрицы выборки и сингулярное ее разложение, отбор главных компонент,относящихся к различным составляющим ряда (от медленно меняющихся и периодических до шумовых), и, наконец, восстановление ряда.

Областью применения алгоритма являются задачи как метеорологии и геофизики, так и экономики и медицины. Целью данной работы является выяснение зависимости эффективности алгоритма от выбора временных рядов, используемых в его работе.

Доклады и экзамен (возможны уточнения)

Доклад-1 6 апреля
Контрольная точка 18 мая
Экзамен 25 мая

Список задач, черновик

Непараметрическое прогнозирование (выбор ядра из набора, настройка параметров)
Прогнозирование и экспоненциальное сглаживание (набор временных рядов, исследование современного состояния)
Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж)
Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда)
Многомерная гусеница, выбор временных рядов при прогнозировании
Многомерная авторегрессия
Локальные методы прогнозирования, поиск метрики
Локальные методы прогнозирования, поиск инвариантного преобразования
Прогнозирование с использованием пути наименьшей стоимости (DTW)
Выбор функции активации при прогнозировании нейронными сетями
Выбор ядра при прогнозировании функциями радиального базиса
Исследование сходимости при прогнозировании нейронными сетями с обратной связью
Прогнозирование функциями дискретного аргумента
Прогнозирование с использованием теста Гренжера
Прогнозирование и SVN – регрессия
ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)
Прогнозирование и аппроксимация сплайнами

Источник — «http://recognition.su/wiki/index.php?title=%D0%A7%D0%B8%D1%81%D0%BB%D0%B5%D0%BD%D0%BD%D1%8B%D0%B5_%D0%BC%D0%B5%D1%82%D0%BE%D0%B4%D1%8B_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D1%8F_%D0%BF%D0%BE_%D0%BF%D1%80%D0%B5%D1%86%D0%B5%D0%B4%D0%B5%D0%BD%D1%82%D0%B0%D0%BC_%28%D0%BF%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D0%BA%D0%B0%2C_%D0%92.%D0%92._%D0%A1%D1%82%D1%80%D0%B8%D0%B6%D0%BE%D0%B2%29/%D0%93%D1%80%D1%83%D0%BF%D0%BF%D0%B0_874%2C_%D0%B2%D0%B5%D1%81%D0%BD%D0%B0_2011»

Категория: Учебные курсы