Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 874, весна 2011
Материал из MachineLearning.
(отменили глюки ок) |
|||
Строка 1: | Строка 1: | ||
{{Main|Численные методы обучения по прецедентам (практика, В.В. Стрижов)}} | {{Main|Численные методы обучения по прецедентам (практика, В.В. Стрижов)}} | ||
- | |||
- | |||
__NOTOC__ | __NOTOC__ | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
Перед выполнением заданий рекомендуются к прочтению | Перед выполнением заданий рекомендуются к прочтению | ||
- | |||
- | |||
* [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)|Численные методы обучения по прецедентам]] | * [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)|Численные методы обучения по прецедентам]] | ||
- | |||
- | |||
* [[Отчет о выполнении исследовательского проекта (практика, В.В. Стрижов)|Отчет о выполнении исследовательского проекта]] | * [[Отчет о выполнении исследовательского проекта (практика, В.В. Стрижов)|Отчет о выполнении исследовательского проекта]] | ||
- | |||
- | |||
* [[Автоматизация и стандартизация научных исследований (практика, В.В. Стрижов)|Автоматизация и стандартизация научных исследований]] | * [[Автоматизация и стандартизация научных исследований (практика, В.В. Стрижов)|Автоматизация и стандартизация научных исследований]] | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
== Задачи == | == Задачи == | ||
- | |||
- | |||
{| class="wikitable" | {| class="wikitable" | ||
- | + | |- | |
- | + | ||
- | | | + | |
- | + | ||
- | + | ||
! Название задачи | ! Название задачи | ||
- | |||
! Работу выполняет | ! Работу выполняет | ||
- | |||
! Работу рецензирует | ! Работу рецензирует | ||
- | |||
! Комментарии | ! Комментарии | ||
- | |||
|- | |- | ||
- | |||
| [[Прогнозирование с использованием теста Гренжера (пример)]] | | [[Прогнозирование с использованием теста Гренжера (пример)]] | ||
- | |||
| Анастасия Мотренко | | Анастасия Мотренко | ||
- | + | | | |
- | | | + | | |
- | + | ||
- | | | + | |
- | + | ||
|- | |- | ||
- | |||
| [[Выбор функции активации при прогнозировании нейронными сетями (пример)]] | | [[Выбор функции активации при прогнозировании нейронными сетями (пример)]] | ||
- | |||
| Георгий Рудой | | Георгий Рудой | ||
- | |||
| Николай Балдин | | Николай Балдин | ||
- | + | | | |
- | | | + | |
- | + | ||
|- | |- | ||
- | |||
| [[Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)]] | | [[Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)]] | ||
- | |||
| Любовь Леонтьева | | Любовь Леонтьева | ||
- | |||
| Михаил Бурмистров | | Михаил Бурмистров | ||
- | + | | | |
- | | | + | |
- | + | ||
|- | |- | ||
- | |||
| [[Прогнозирование функциями дискретного аргумента (пример)]] | | [[Прогнозирование функциями дискретного аргумента (пример)]] | ||
- | |||
| Егор Будников | | Егор Будников | ||
- | |||
| Александр Романенко | | Александр Романенко | ||
- | + | | | |
- | | | + | |
- | + | ||
|- | |- | ||
- | |||
| [[Исследование сходимости при прогнозировании нейронными сетями с обратной связью (пример)]] | | [[Исследование сходимости при прогнозировании нейронными сетями с обратной связью (пример)]] | ||
- | |||
| Николай Балдин | | Николай Балдин | ||
- | |||
| Георгий Рудой | | Георгий Рудой | ||
- | + | | | |
- | | | + | |
- | + | ||
|- | |- | ||
- | |||
| [[Непараметрическое прогнозирование: выбор ядра из набора, настройка параметров (пример)]] | | [[Непараметрическое прогнозирование: выбор ядра из набора, настройка параметров (пример)]] | ||
- | |||
| Михаил Кокшаров | | Михаил Кокшаров | ||
- | + | | | |
- | | | + | | |
- | + | ||
- | | | + | |
- | + | ||
|- | |- | ||
- | |||
|[[Экспоненциальное сглаживание и прогноз (пример)]] | |[[Экспоненциальное сглаживание и прогноз (пример)]] | ||
- | |||
|Бурмистров Михаил | |Бурмистров Михаил | ||
- | |||
| | | | ||
- | |||
| | | | ||
- | |||
|- | |- | ||
- | |||
|[[Выравнивание временных рядов: прогнозирование с использованием DTW (пример)]] | |[[Выравнивание временных рядов: прогнозирование с использованием DTW (пример)]] | ||
- | |||
|Романенко Александр | |Романенко Александр | ||
- | |||
|Егор Будников | |Егор Будников | ||
- | |||
| | | | ||
- | |||
|- | |- | ||
- | |||
|[[Многомерная авторегрессия (пример)]] | |[[Многомерная авторегрессия (пример)]] | ||
- | |||
|Ямщиков Илья | |Ямщиков Илья | ||
- | |||
| | | | ||
- | |||
| | | | ||
- | |||
|- | |- | ||
- | |||
|[[Локальные методы прогнозирования,поиск метрики (пример)]] | |[[Локальные методы прогнозирования,поиск метрики (пример)]] | ||
- | + | |Евгений Гребенников | |
- | |Евгений Гребенников | + | |
- | + | ||
|Михаил Кокшаров | |Михаил Кокшаров | ||
- | |||
| | | | ||
- | |||
|- | |- | ||
- | |||
|[[Локальные методы прогнозирования,поиск инвариантного преобразования (пример)]] | |[[Локальные методы прогнозирования,поиск инвариантного преобразования (пример)]] | ||
- | |||
|Юлия Хаспулатова | |Юлия Хаспулатова | ||
- | |||
| | | | ||
- | |||
| | | | ||
- | |||
|- | |- | ||
- | |||
|[[Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж)]] | |[[Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж)]] | ||
- | |||
|Токмакова Александра | |Токмакова Александра | ||
- | |||
|Будников Егор | |Будников Егор | ||
- | |||
| | | | ||
- | |||
|- | |- | ||
- | |||
|[[Многомерная гусеница, выбор временных рядов при прогнозировании(пример)]] | |[[Многомерная гусеница, выбор временных рядов при прогнозировании(пример)]] | ||
- | |||
|Элина Торчинская | |Элина Торчинская | ||
- | |||
| | | | ||
- | |||
| | | | ||
- | |||
|- | |- | ||
- | |||
|[[Прогнозирование и аппроксимация сплайнами]] | |[[Прогнозирование и аппроксимация сплайнами]] | ||
- | |||
|Мищенко Павел | |Мищенко Павел | ||
- | |||
| | | | ||
- | |||
| | | | ||
- | |||
|- | |- | ||
- | |||
|[[ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)(пример)]] | |[[ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)(пример)]] | ||
- | |||
|Ганусевич Ирина | |Ганусевич Ирина | ||
- | |||
| | | | ||
- | |||
| | | | ||
- | |||
|- | |- | ||
- | |||
|[[Прогнозирование и SVN – регрессия(пример)]] | |[[Прогнозирование и SVN – регрессия(пример)]] | ||
- | |||
|Ситник Александр | |Ситник Александр | ||
- | |||
| | | | ||
- | |||
| | | | ||
- | |||
|- | |- | ||
- | |||
|} | |} | ||
- | + | ||
{{tip|В конце названия слово "(пример)" является ключевым и означает "пример работы алгоритма".}} | {{tip|В конце названия слово "(пример)" является ключевым и означает "пример работы алгоритма".}} | ||
- | + | ||
+ | |||
==Краткое описание задач== | ==Краткое описание задач== | ||
- | |||
=== [[Краткосрочное прогнозирование почасовых цен на электроэнергию (пример)]] === | === [[Краткосрочное прогнозирование почасовых цен на электроэнергию (пример)]] === | ||
- | |||
Описание задачи. | Описание задачи. | ||
- | |||
=== Задача 2: [[Экспоненциальное сглаживание и прогноз (пример)]] === | === Задача 2: [[Экспоненциальное сглаживание и прогноз (пример)]] === | ||
- | |||
Прогнозирование методом экспоненциальной регрессии является идейно простым алгоритмом прогнозирования временных рядов. Идея метода основана на учете предшествующих значений ряда с убывающими весами. В своей простейшей реализации алгоритм сильно сглаживает ряд и плохо учитывает тренды, сезонность и резкие изменения в тренде, а также необоснованно заметно реагирует на выбросы в данных. Предполагается изучение и реализация алгоритмов, пытающихся найти оптимальную модель путем минимизации ошибки на известном временном ряду. | Прогнозирование методом экспоненциальной регрессии является идейно простым алгоритмом прогнозирования временных рядов. Идея метода основана на учете предшествующих значений ряда с убывающими весами. В своей простейшей реализации алгоритм сильно сглаживает ряд и плохо учитывает тренды, сезонность и резкие изменения в тренде, а также необоснованно заметно реагирует на выбросы в данных. Предполагается изучение и реализация алгоритмов, пытающихся найти оптимальную модель путем минимизации ошибки на известном временном ряду. | ||
- | + | ||
=== Задача 3: [[Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж) (пример)]] === | === Задача 3: [[Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж) (пример)]] === | ||
- | + | ||
Целью проекта является нахождение закономерности в определённом процессе и сравнение базового алгоритма, проводящего прогнозирование с помощью скользящего среднего, с алгоритмом, учитывающим цикличность задачи. Также необходимо исследовать различные флуктуации входящих параметров и минимизировать при этом отклонения. | Целью проекта является нахождение закономерности в определённом процессе и сравнение базового алгоритма, проводящего прогнозирование с помощью скользящего среднего, с алгоритмом, учитывающим цикличность задачи. Также необходимо исследовать различные флуктуации входящих параметров и минимизировать при этом отклонения. | ||
- | + | ||
- | Данный алгоритм можно использовать при прогнозировании цен, объёмов продаж, туристических потоков – любых процессов, подразумевающих наличие временных рядов с периодической составляющей. Алгоритм не предусмотрен для работы в авральных ситуациях, таких как: промо-акции, праздники и т.д. - данные ситуации описываются отдельной задачей. Результатом проекта является оценка эффективности алгоритма, учитывающего цикличность задачи. | + | Данный алгоритм можно использовать при прогнозировании цен, объёмов продаж, туристических потоков – любых процессов, подразумевающих наличие временных рядов с периодической составляющей. Алгоритм не предусмотрен для работы в авральных ситуациях, таких как: промо-акции, праздники и т.д. - данные ситуации описываются отдельной задачей. Результатом проекта является оценка эффективности алгоритма, учитывающего цикличность задачи. |
===Задача 4: [[Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)]]=== | ===Задача 4: [[Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)]]=== | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | + | Требуется исследовать SSA-алгоритм (метод гусеницы) для многомерных временных рядов. Метод заключается в преобразовании ряда с помощью однопараметрической сдвиговой процедуры с последующим исследованием полученной траектории с помощью анализа главных компонент и восстановлением ряда по выбранным главным компонентам. В работе будет исследован вопрос выбора длины гусеницы и числа ее компонент, т.е. то, как определить по полученному разложению на компоненты, какие из них являются неинформативными (шумы). Также метод помогает увидеть и выделить разного рода закономерности в поведении временных рядов. | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
+ | Результатом работы является выяснение эффективности работы алгоритма в зависимости от длины и числа компонент гусеницы, а также выяснение возможностей алгоритма и его области применимости. | ||
+ | |||
+ | ===Задача 7: [[Локальные методы прогнозирования,поиск метрики (пример)]]=== | ||
+ | Временной ряд делится на отдельные участки, каждому из которых сопоставляется точка в n-мерном пространстве признаков. Локальная модель рассчитывается в три последовательных этапа. | ||
+ | Первый – находит k-ближайших соседей наблюдаемой точки. | ||
+ | Второй – строит простую модель, используя только этих k соседей. | ||
+ | Третий – используя даную модель, по наблюдаемой точке прогнозирует следующую. | ||
+ | Многие исследователи, используют эвклидову метрику для измерения расстояний между точками. | ||
+ | Данная работа призвана сравнить точность прогнозирования при использовании различных метрик. | ||
+ | В частности, требуется исследовать оптимальный набор весов во взвешенной метрике для максимизации точности прогнозирования. | ||
+ | |||
===Задача 8: [[Локальные методы прогнозирования, поиск инвариантного преобразования (пример)]]=== | ===Задача 8: [[Локальные методы прогнозирования, поиск инвариантного преобразования (пример)]]=== | ||
В проекте используются локальные методы прогнозирования | В проекте используются локальные методы прогнозирования | ||
Строка 251: | Строка 135: | ||
В данной работе подробно исследован следующий метод (обобщение классического | В данной работе подробно исследован следующий метод (обобщение классического | ||
«ближайшего соседа»). | «ближайшего соседа»). | ||
- | Пусть | + | Пусть ) ,..., ( ~ |
- | «предысторией», т.е. в ряде нужно найти часть, которая после | + | 1 n f f f = – временной ряд, требуется продолжить его |
- | некоторого преобразования A «становится похожа» на | + | 1 1 t n n n f f f f g + + = . Предполагается, что такое продолжение определяется |
- | временного ряда ( | + | «предысторией» ) ,..., ( 1 n l n f f + - , т.е. в ряде нужно найти часть ) ,..., ( 1 k l k f f + - , которая после |
- | ближайших соседей. Продолжение запишется в виде их линейной комбинации. | + | некоторого преобразования A «становится похожа» на ) ,..., ( 1 n l n f f + - : |
+ | a k k l k k l k f f f f A B ~ , 1 1 min ) ) ,..., ( ), ,..., ( ( ® + - + - , | ||
+ | здесь a~ – параметры преобразования A, B – функция близости двух отрезков | ||
+ | временного ряда (например, евклидово расстояние между отрезками или взвешенное | ||
+ | евклидово расстояние, которое «последним» точкам приписывает больший вес). | ||
+ | Определив k , мы находим ближайшего соседа к нашей предыстории. Искомое | ||
+ | продолжение запишется в виде ) ,..., ( 1 t k k f f A + + . В общем случае ищем несколько | ||
+ | ближайших соседей. Продолжение запишется в виде их линейной комбинации | ||
+ | å å = + + | ||
+ | r | ||
+ | r | ||
+ | r | ||
+ | t k k r c f f A c r r 1 , ) ,..., ( 1 . | ||
=== Задача 9: [[Выравнивание временных рядов: прогнозирование с использованием DTW (пример)]] === | === Задача 9: [[Выравнивание временных рядов: прогнозирование с использованием DTW (пример)]] === | ||
+ | |||
+ | [[временной ряд|Временным рядом]] называется последовательность упорядоченных по времени значений некоторой вещественной переменной <tex>$\mathbf{x}=\{x_{t}\}_{t=1}^T\in\mathbb{R}^T$</tex>. Задача, сопутствующая появлению временных рядов, - сравнение одной последовательности данных с другой. Сравнение последовательностей существенно упрощается после деформации временного ряда вдоль одной из осей и его выравнивания. Dynamic time warping (DTW) представляет собой технику эффективного выравнивая временных рядов. Методы DTW используются при распознавании речи, при анализе информации в робототехнике, в промышленности, в медицине и других сферах. | ||
+ | |||
+ | Цель работы - привести пример выравнивания, ввести функционал сравнения двух временных рядов, обладающий естественными свойствами коммутативности, рефлексивности и транзитивностина. Функционал должен принимать на вход два временных ряда, а на выходе давать число, характеризующее степень их "похожести". | ||
+ | |||
+ | === Задача 10: [[Выбор функции активации при прогнозировании нейронными сетями (пример)]] === | ||
+ | |||
+ | Целью проекта является исследование зависимости качества прогнозирования нейронными сетями без обратной связи (одно- и многослойными перцептронами) от выбранной функции активации нейронов в сети, а также от параметров этой функции, при наличии таковых. | ||
+ | |||
+ | Функция активации определяет сигнал на выходе нейрона в зависимости от результата работы сумматора на входе нейрона. Как правило, функция активации имеет область определения <tex>(-\infty; \infty)</tex> и область значений <tex>[0; 1]</tex>. В простейшем случае, изначально предложенном и моделирующим биологический нейрон, функция активации представляет собой функцию Хевисайда: | ||
+ | |||
+ | <tex>f(x) = \begin{cases}1 & x \geq x_0\\0 & x < x_0\end{cases}</tex> | ||
+ | |||
+ | При дальнейшем развитии нейронных сетей оказалось полезным использование непрерывных функций, таких как логистическая функция <tex>\sigma(x) = \frac{1}{1+e^{-tx}}</tex> и другие функции-сигмоиды (<tex>f(x) = \frac{x}{x+\alpha}</tex>) и немонотонные функции, такие как тригонометрический синус. | ||
+ | |||
+ | Результатом проекта является оценка качества прогнозирования нейронными сетями в зависимости от типа и параметров функции активации. | ||
===Задача 12: [[Исследование сходимости при прогнозировании нейронными сетями с боратной связью (пример)]]=== | ===Задача 12: [[Исследование сходимости при прогнозировании нейронными сетями с боратной связью (пример)]]=== | ||
- | + | ||
- | + | Цель проекта - иследовать зависимость сходимости прогнозирования от параметров нейронной сети. Понятие обратной связи характерно для динамических систем, в которой выходной сигнал некоторого элемента истемы оказыает влияние на входной сигнал этого элемента. Входной Сигнал <tex>x_{j}(n)</tex>, внутренний сигнал <tex>x_{j}^{'}(n)</tex> и выходной сигнал <tex>y_{j}(n)</tex> связаны соотношениями | |
- | Цель проекта - иследовать зависимость сходимости прогнозирования от параметров нейронной сети. Понятие обратной связи характерно для динамических систем, в которой выходной сигнал некоторого элемента истемы оказыает влияние на входной сигнал этого элемента. Входной Сигнал <tex>x_{j}(n)</tex>, внутренний сигнал <tex>x_{j}^{'}(n)</tex> и выходной сигнал <tex>y_{j}(n)</tex> связаны соотношениями | + | |
- | + | ||
===Задача 13: [[Многомерная гусеница, выбор временных рядов при прогнозировании(пример)]]=== | ===Задача 13: [[Многомерная гусеница, выбор временных рядов при прогнозировании(пример)]]=== | ||
+ | |||
+ | Работа посвящена исследованию одного из методов анализа многомерных временных рядов - метода "гусеницы", также известного как Singular Spectrum Analysis или SSA. Метод можно разделить на четыре этапа - представление временного ряда в виде матрицы при помощи сдвиговой процедуры, вычисление ковариационной матрицы выборки и сингулярное ее разложение, отбор главных компонент,относящихся к различным составляющим ряда (от медленно меняющихся и периодических до шумовых), и, наконец, восстановление ряда. | ||
+ | |||
+ | Областью применения алгоритма являются задачи как метеорологии и геофизики, так и экономики и медицины. Целью данной работы является выяснение зависимости эффективности алгоритма от выбора временных рядов, используемых в его работе. | ||
+ | |||
+ | == Доклады и экзамен (возможны уточнения) == | ||
+ | * Доклад-1 6 апреля | ||
+ | * Контрольная точка 18 мая | ||
+ | * Экзамен 25 мая | ||
+ | |||
+ | == Список задач, черновик == | ||
+ | |||
+ | # Непараметрическое прогнозирование (выбор ядра из набора, настройка параметров) | ||
+ | # Прогнозирование и экспоненциальное сглаживание (набор временных рядов, исследование современного состояния) | ||
+ | # Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж) | ||
+ | # Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) | ||
+ | # Многомерная гусеница, выбор временных рядов при прогнозировании | ||
+ | # Многомерная авторегрессия | ||
+ | # Локальные методы прогнозирования, поиск метрики | ||
+ | # Локальные методы прогнозирования, поиск инвариантного преобразования | ||
+ | # Прогнозирование с использованием пути наименьшей стоимости (DTW) | ||
+ | # Выбор функции активации при прогнозировании нейронными сетями | ||
+ | # Выбор ядра при прогнозировании функциями радиального базиса | ||
+ | # Исследование сходимости при прогнозировании нейронными сетями с обратной связью | ||
+ | # Прогнозирование функциями дискретного аргумента | ||
+ | # Прогнозирование с использованием теста Гренжера | ||
+ | # Прогнозирование и SVN – регрессия | ||
+ | # ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию) | ||
+ | # Прогнозирование и аппроксимация сплайнами | ||
+ | [[Категория:Учебные курсы]] |
Версия 22:41, 2 марта 2011
Перед выполнением заданий рекомендуются к прочтению
- Численные методы обучения по прецедентам
- Отчет о выполнении исследовательского проекта
- Автоматизация и стандартизация научных исследований
Задачи
В конце названия слово "(пример)" является ключевым и означает "пример работы алгоритма". |
Краткое описание задач
Краткосрочное прогнозирование почасовых цен на электроэнергию (пример)
Описание задачи.
Задача 2: Экспоненциальное сглаживание и прогноз (пример)
Прогнозирование методом экспоненциальной регрессии является идейно простым алгоритмом прогнозирования временных рядов. Идея метода основана на учете предшествующих значений ряда с убывающими весами. В своей простейшей реализации алгоритм сильно сглаживает ряд и плохо учитывает тренды, сезонность и резкие изменения в тренде, а также необоснованно заметно реагирует на выбросы в данных. Предполагается изучение и реализация алгоритмов, пытающихся найти оптимальную модель путем минимизации ошибки на известном временном ряду.
Задача 3: Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж) (пример)
Целью проекта является нахождение закономерности в определённом процессе и сравнение базового алгоритма, проводящего прогнозирование с помощью скользящего среднего, с алгоритмом, учитывающим цикличность задачи. Также необходимо исследовать различные флуктуации входящих параметров и минимизировать при этом отклонения.
Данный алгоритм можно использовать при прогнозировании цен, объёмов продаж, туристических потоков – любых процессов, подразумевающих наличие временных рядов с периодической составляющей. Алгоритм не предусмотрен для работы в авральных ситуациях, таких как: промо-акции, праздники и т.д. - данные ситуации описываются отдельной задачей. Результатом проекта является оценка эффективности алгоритма, учитывающего цикличность задачи.
Задача 4: Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)
Требуется исследовать SSA-алгоритм (метод гусеницы) для многомерных временных рядов. Метод заключается в преобразовании ряда с помощью однопараметрической сдвиговой процедуры с последующим исследованием полученной траектории с помощью анализа главных компонент и восстановлением ряда по выбранным главным компонентам. В работе будет исследован вопрос выбора длины гусеницы и числа ее компонент, т.е. то, как определить по полученному разложению на компоненты, какие из них являются неинформативными (шумы). Также метод помогает увидеть и выделить разного рода закономерности в поведении временных рядов.
Результатом работы является выяснение эффективности работы алгоритма в зависимости от длины и числа компонент гусеницы, а также выяснение возможностей алгоритма и его области применимости.
Задача 7: Локальные методы прогнозирования,поиск метрики (пример)
Временной ряд делится на отдельные участки, каждому из которых сопоставляется точка в n-мерном пространстве признаков. Локальная модель рассчитывается в три последовательных этапа. Первый – находит k-ближайших соседей наблюдаемой точки. Второй – строит простую модель, используя только этих k соседей. Третий – используя даную модель, по наблюдаемой точке прогнозирует следующую. Многие исследователи, используют эвклидову метрику для измерения расстояний между точками. Данная работа призвана сравнить точность прогнозирования при использовании различных метрик. В частности, требуется исследовать оптимальный набор весов во взвешенной метрике для максимизации точности прогнозирования.
Задача 8: Локальные методы прогнозирования, поиск инвариантного преобразования (пример)
В проекте используются локальные методы прогнозирования временных рядов. Эти методы отказываются от нахождения представления временного ряда в классе заданных функций от времени. Вместо этого прогноз осуществляется на основе данных о каком-то участке временного ряда (используется локальная В данной работе подробно исследован следующий метод (обобщение классического «ближайшего соседа»).
Пусть ) ,..., ( ~
1 n f f f = – временной ряд, требуется продолжить его 1 1 t n n n f f f f g + + = . Предполагается, что такое продолжение определяется «предысторией» ) ,..., ( 1 n l n f f + - , т.е. в ряде нужно найти часть ) ,..., ( 1 k l k f f + - , которая после некоторого преобразования A «становится похожа» на ) ,..., ( 1 n l n f f + - : a k k l k k l k f f f f A B ~ , 1 1 min ) ) ,..., ( ), ,..., ( ( ® + - + - , здесь a~ – параметры преобразования A, B – функция близости двух отрезков временного ряда (например, евклидово расстояние между отрезками или взвешенное евклидово расстояние, которое «последним» точкам приписывает больший вес). Определив k , мы находим ближайшего соседа к нашей предыстории. Искомое продолжение запишется в виде ) ,..., ( 1 t k k f f A + + . В общем случае ищем несколько ближайших соседей. Продолжение запишется в виде их линейной комбинации å å = + + r r r t k k r c f f A c r r 1 , ) ,..., ( 1 .
Задача 9: Выравнивание временных рядов: прогнозирование с использованием DTW (пример)
Временным рядом называется последовательность упорядоченных по времени значений некоторой вещественной переменной . Задача, сопутствующая появлению временных рядов, - сравнение одной последовательности данных с другой. Сравнение последовательностей существенно упрощается после деформации временного ряда вдоль одной из осей и его выравнивания. Dynamic time warping (DTW) представляет собой технику эффективного выравнивая временных рядов. Методы DTW используются при распознавании речи, при анализе информации в робототехнике, в промышленности, в медицине и других сферах.
Цель работы - привести пример выравнивания, ввести функционал сравнения двух временных рядов, обладающий естественными свойствами коммутативности, рефлексивности и транзитивностина. Функционал должен принимать на вход два временных ряда, а на выходе давать число, характеризующее степень их "похожести".
Задача 10: Выбор функции активации при прогнозировании нейронными сетями (пример)
Целью проекта является исследование зависимости качества прогнозирования нейронными сетями без обратной связи (одно- и многослойными перцептронами) от выбранной функции активации нейронов в сети, а также от параметров этой функции, при наличии таковых.
Функция активации определяет сигнал на выходе нейрона в зависимости от результата работы сумматора на входе нейрона. Как правило, функция активации имеет область определения и область значений . В простейшем случае, изначально предложенном и моделирующим биологический нейрон, функция активации представляет собой функцию Хевисайда:
При дальнейшем развитии нейронных сетей оказалось полезным использование непрерывных функций, таких как логистическая функция и другие функции-сигмоиды () и немонотонные функции, такие как тригонометрический синус.
Результатом проекта является оценка качества прогнозирования нейронными сетями в зависимости от типа и параметров функции активации.
Задача 12: Исследование сходимости при прогнозировании нейронными сетями с боратной связью (пример)
Цель проекта - иследовать зависимость сходимости прогнозирования от параметров нейронной сети. Понятие обратной связи характерно для динамических систем, в которой выходной сигнал некоторого элемента истемы оказыает влияние на входной сигнал этого элемента. Входной Сигнал , внутренний сигнал и выходной сигнал связаны соотношениями
Задача 13: Многомерная гусеница, выбор временных рядов при прогнозировании(пример)
Работа посвящена исследованию одного из методов анализа многомерных временных рядов - метода "гусеницы", также известного как Singular Spectrum Analysis или SSA. Метод можно разделить на четыре этапа - представление временного ряда в виде матрицы при помощи сдвиговой процедуры, вычисление ковариационной матрицы выборки и сингулярное ее разложение, отбор главных компонент,относящихся к различным составляющим ряда (от медленно меняющихся и периодических до шумовых), и, наконец, восстановление ряда.
Областью применения алгоритма являются задачи как метеорологии и геофизики, так и экономики и медицины. Целью данной работы является выяснение зависимости эффективности алгоритма от выбора временных рядов, используемых в его работе.
Доклады и экзамен (возможны уточнения)
- Доклад-1 6 апреля
- Контрольная точка 18 мая
- Экзамен 25 мая
Список задач, черновик
- Непараметрическое прогнозирование (выбор ядра из набора, настройка параметров)
- Прогнозирование и экспоненциальное сглаживание (набор временных рядов, исследование современного состояния)
- Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж)
- Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда)
- Многомерная гусеница, выбор временных рядов при прогнозировании
- Многомерная авторегрессия
- Локальные методы прогнозирования, поиск метрики
- Локальные методы прогнозирования, поиск инвариантного преобразования
- Прогнозирование с использованием пути наименьшей стоимости (DTW)
- Выбор функции активации при прогнозировании нейронными сетями
- Выбор ядра при прогнозировании функциями радиального базиса
- Исследование сходимости при прогнозировании нейронными сетями с обратной связью
- Прогнозирование функциями дискретного аргумента
- Прогнозирование с использованием теста Гренжера
- Прогнозирование и SVN – регрессия
- ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)
- Прогнозирование и аппроксимация сплайнами