Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 874, весна 2011
Материал из MachineLearning.
Строка 116: | Строка 116: | ||
|Егор Будников | |Егор Будников | ||
- | |||
| | | | ||
- | + | ||
- | + | ||
|- | |- | ||
- | + | ||
- | + | ||
|[[Многомерная авторегрессия (пример)]] | |[[Многомерная авторегрессия (пример)]] | ||
- | + | ||
- | + | ||
|Ямщиков Илья | |Ямщиков Илья | ||
- | + | ||
- | + | ||
| | | | ||
- | + | ||
- | + | ||
| | | | ||
- | + | ||
- | + | ||
|- | |- | ||
- | + | ||
- | + | ||
|[[Локальные методы прогнозирования,поиск метрики (пример)]] | |[[Локальные методы прогнозирования,поиск метрики (пример)]] | ||
- | + | ||
- | + | ||
|Евгений Гребенников | |Евгений Гребенников | ||
- | + | ||
- | + | ||
|Михаил Кокшаров | |Михаил Кокшаров | ||
- | + | ||
- | + | ||
| | | | ||
- | + | ||
- | + | ||
|- | |- | ||
- | + | ||
- | + | ||
|[[Локальные методы прогнозирования,поиск инвариантного преобразования (пример)]] | |[[Локальные методы прогнозирования,поиск инвариантного преобразования (пример)]] | ||
- | + | ||
- | + | ||
|Юлия Хаспулатова | |Юлия Хаспулатова | ||
- | + | ||
- | + | ||
| | | | ||
- | + | ||
- | + | ||
| | | | ||
- | + | ||
- | + | ||
|- | |- | ||
- | + | ||
- | + | ||
|[[Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж)]] | |[[Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж)]] | ||
- | + | ||
- | + | ||
|Токмакова Александра | |Токмакова Александра | ||
- | + | ||
- | + | ||
|Будников Егор | |Будников Егор | ||
- | + | ||
- | + | ||
| | | | ||
- | + | ||
- | + | ||
|- | |- | ||
- | + | ||
- | + | ||
|[[Многомерная гусеница, выбор временных рядов при прогнозировании(пример)]] | |[[Многомерная гусеница, выбор временных рядов при прогнозировании(пример)]] | ||
- | + | ||
- | + | ||
|Элина Торчинская | |Элина Торчинская | ||
- | + | ||
- | + | ||
| | | | ||
- | + | ||
- | + | ||
| | | | ||
- | + | ||
- | + | ||
|- | |- | ||
- | + | ||
- | + | ||
|[[Прогнозирование и аппроксимация сплайнами]] | |[[Прогнозирование и аппроксимация сплайнами]] | ||
- | + | ||
- | + | ||
|Мищенко Павел | |Мищенко Павел | ||
- | + | ||
- | + | ||
| | | | ||
- | + | ||
- | + | ||
| | | | ||
- | + | ||
- | + | ||
|- | |- | ||
- | + | ||
- | + | ||
|[[ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)(пример)]] | |[[ARIMA и GARCH при прогнозировании высоковолатильных рядов с периодической составляющей (цен на электроэнергию)(пример)]] | ||
- | + | ||
- | + | ||
|Ганусевич Ирина | |Ганусевич Ирина | ||
- | + | ||
- | + | ||
| | | | ||
- | + | ||
- | + | ||
| | | | ||
- | + | ||
- | + | ||
|- | |- | ||
- | + | ||
- | + | ||
|[[Прогнозирование и SVN – регрессия(пример)]] | |[[Прогнозирование и SVN – регрессия(пример)]] | ||
- | |||
|Ситник Александр | |Ситник Александр | ||
- | |||
| | | | ||
- | + | ||
- | + | ||
| | | | ||
- | + | ||
- | + | ||
|- | |- | ||
- | + | ||
- | + | ||
|} | |} | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
{{tip|В конце названия слово "(пример)" является ключевым и означает "пример работы алгоритма".}} | {{tip|В конце названия слово "(пример)" является ключевым и означает "пример работы алгоритма".}} | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
==Краткое описание задач== | ==Краткое описание задач== | ||
- | + | ||
- | + | ||
=== [[Краткосрочное прогнозирование почасовых цен на электроэнергию (пример)]] === | === [[Краткосрочное прогнозирование почасовых цен на электроэнергию (пример)]] === | ||
- | + | ||
- | + | ||
Описание задачи. | Описание задачи. | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
=== Задача 2: [[Экспоненциальное сглаживание и прогноз (пример)]] === | === Задача 2: [[Экспоненциальное сглаживание и прогноз (пример)]] === | ||
- | |||
Прогнозирование методом экспоненциальной регрессии является идейно простым алгоритмом прогнозирования временных рядов. Идея метода основана на учете предшествующих значений ряда с убывающими весами. В своей простейшей реализации алгоритм сильно сглаживает ряд и плохо учитывает тренды, сезонность и резкие изменения в тренде, а также необоснованно заметно реагирует на выбросы в данных. Предполагается изучение и реализация алгоритмов, пытающихся найти оптимальную модель путем минимизации ошибки на известном временном ряду. | Прогнозирование методом экспоненциальной регрессии является идейно простым алгоритмом прогнозирования временных рядов. Идея метода основана на учете предшествующих значений ряда с убывающими весами. В своей простейшей реализации алгоритм сильно сглаживает ряд и плохо учитывает тренды, сезонность и резкие изменения в тренде, а также необоснованно заметно реагирует на выбросы в данных. Предполагается изучение и реализация алгоритмов, пытающихся найти оптимальную модель путем минимизации ошибки на известном временном ряду. | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
=== Задача 3: [[Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж) (пример)]] === | === Задача 3: [[Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж) (пример)]] === | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
Целью проекта является нахождение закономерности в определённом процессе и сравнение базового алгоритма, проводящего прогнозирование с помощью скользящего среднего, с алгоритмом, учитывающим цикличность задачи. Также необходимо исследовать различные флуктуации входящих параметров и минимизировать при этом отклонения. | Целью проекта является нахождение закономерности в определённом процессе и сравнение базового алгоритма, проводящего прогнозирование с помощью скользящего среднего, с алгоритмом, учитывающим цикличность задачи. Также необходимо исследовать различные флуктуации входящих параметров и минимизировать при этом отклонения. | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
Данный алгоритм можно использовать при прогнозировании цен, объёмов продаж, туристических потоков – любых процессов, подразумевающих наличие временных рядов с периодической составляющей. Алгоритм не предусмотрен для работы в авральных ситуациях, таких как: промо-акции, праздники и т.д. - данные ситуации описываются отдельной задачей. Результатом проекта является оценка эффективности алгоритма, учитывающего цикличность задачи. | Данный алгоритм можно использовать при прогнозировании цен, объёмов продаж, туристических потоков – любых процессов, подразумевающих наличие временных рядов с периодической составляющей. Алгоритм не предусмотрен для работы в авральных ситуациях, таких как: промо-акции, праздники и т.д. - данные ситуации описываются отдельной задачей. Результатом проекта является оценка эффективности алгоритма, учитывающего цикличность задачи. | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
===Задача 4: [[Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)]]=== | ===Задача 4: [[Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)]]=== | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
Требуется исследовать SSA-алгоритм (метод гусеницы) для многомерных временных рядов. Метод заключается в преобразовании ряда с помощью однопараметрической сдвиговой процедуры с последующим исследованием полученной траектории с помощью анализа главных компонент и восстановлением ряда по выбранным главным компонентам. В работе будет исследован вопрос выбора длины гусеницы и числа ее компонент, т.е. то, как определить по полученному разложению на компоненты, какие из них являются неинформативными (шумы). Также метод помогает увидеть и выделить разного рода закономерности в поведении временных рядов. | Требуется исследовать SSA-алгоритм (метод гусеницы) для многомерных временных рядов. Метод заключается в преобразовании ряда с помощью однопараметрической сдвиговой процедуры с последующим исследованием полученной траектории с помощью анализа главных компонент и восстановлением ряда по выбранным главным компонентам. В работе будет исследован вопрос выбора длины гусеницы и числа ее компонент, т.е. то, как определить по полученному разложению на компоненты, какие из них являются неинформативными (шумы). Также метод помогает увидеть и выделить разного рода закономерности в поведении временных рядов. | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
Результатом работы является выяснение эффективности работы алгоритма в зависимости от длины и числа компонент гусеницы, а также выяснение возможностей алгоритма и его области применимости. | Результатом работы является выяснение эффективности работы алгоритма в зависимости от длины и числа компонент гусеницы, а также выяснение возможностей алгоритма и его области применимости. | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
===Задача 7: [[Локальные методы прогнозирования,поиск метрики (пример)]]=== | ===Задача 7: [[Локальные методы прогнозирования,поиск метрики (пример)]]=== | ||
- | + | ||
- | + | ||
Временной ряд делится на отдельные участки, каждому из которых сопоставляется точка в n-мерном пространстве признаков. Локальная модель рассчитывается в три последовательных этапа. | Временной ряд делится на отдельные участки, каждому из которых сопоставляется точка в n-мерном пространстве признаков. Локальная модель рассчитывается в три последовательных этапа. | ||
- | + | ||
- | + | ||
Первый – находит k-ближайших соседей наблюдаемой точки. | Первый – находит k-ближайших соседей наблюдаемой точки. | ||
- | + | ||
- | + | ||
Второй – строит простую модель, используя только этих k соседей. | Второй – строит простую модель, используя только этих k соседей. | ||
- | + | ||
- | + | ||
Третий – используя даную модель, по наблюдаемой точке прогнозирует следующую. | Третий – используя даную модель, по наблюдаемой точке прогнозирует следующую. | ||
- | + | ||
- | + | ||
Многие исследователи, используют эвклидову метрику для измерения расстояний между точками. | Многие исследователи, используют эвклидову метрику для измерения расстояний между точками. | ||
- | + | ||
- | + | ||
Данная работа призвана сравнить точность прогнозирования при использовании различных метрик. | Данная работа призвана сравнить точность прогнозирования при использовании различных метрик. | ||
- | + | ||
- | + | ||
В частности, требуется исследовать оптимальный набор весов во взвешенной метрике для максимизации точности прогнозирования. | В частности, требуется исследовать оптимальный набор весов во взвешенной метрике для максимизации точности прогнозирования. | ||
- | + | ||
- | + | ||
===Задача 8: [[Локальные методы прогнозирования, поиск инвариантного преобразования (пример)]]=== | ===Задача 8: [[Локальные методы прогнозирования, поиск инвариантного преобразования (пример)]]=== |
Версия 22:34, 2 марта 2011
Перед выполнением заданий рекомендуются к прочтению
Задачи
В конце названия слово "(пример)" является ключевым и означает "пример работы алгоритма". |
Краткое описание задач
Краткосрочное прогнозирование почасовых цен на электроэнергию (пример)
Описание задачи.
Задача 2: Экспоненциальное сглаживание и прогноз (пример)
Прогнозирование методом экспоненциальной регрессии является идейно простым алгоритмом прогнозирования временных рядов. Идея метода основана на учете предшествующих значений ряда с убывающими весами. В своей простейшей реализации алгоритм сильно сглаживает ряд и плохо учитывает тренды, сезонность и резкие изменения в тренде, а также необоснованно заметно реагирует на выбросы в данных. Предполагается изучение и реализация алгоритмов, пытающихся найти оптимальную модель путем минимизации ошибки на известном временном ряду.
Задача 3: Непараметрическое прогнозирование рядов с периодической составляющей (по мотивам работ прогнозирования объемов продаж) (пример)
Целью проекта является нахождение закономерности в определённом процессе и сравнение базового алгоритма, проводящего прогнозирование с помощью скользящего среднего, с алгоритмом, учитывающим цикличность задачи. Также необходимо исследовать различные флуктуации входящих параметров и минимизировать при этом отклонения.
Данный алгоритм можно использовать при прогнозировании цен, объёмов продаж, туристических потоков – любых процессов, подразумевающих наличие временных рядов с периодической составляющей. Алгоритм не предусмотрен для работы в авральных ситуациях, таких как: промо-акции, праздники и т.д. - данные ситуации описываются отдельной задачей. Результатом проекта является оценка эффективности алгоритма, учитывающего цикличность задачи.
Задача 4: Многомерная гусеница, выбор длины и числа компонент гусеницы (сравнение сглаженного и несглаженного временного ряда) (пример)
Требуется исследовать SSA-алгоритм (метод гусеницы) для многомерных временных рядов. Метод заключается в преобразовании ряда с помощью однопараметрической сдвиговой процедуры с последующим исследованием полученной траектории с помощью анализа главных компонент и восстановлением ряда по выбранным главным компонентам. В работе будет исследован вопрос выбора длины гусеницы и числа ее компонент, т.е. то, как определить по полученному разложению на компоненты, какие из них являются неинформативными (шумы). Также метод помогает увидеть и выделить разного рода закономерности в поведении временных рядов.
Результатом работы является выяснение эффективности работы алгоритма в зависимости от длины и числа компонент гусеницы, а также выяснение возможностей алгоритма и его области применимости.
Задача 7: Локальные методы прогнозирования,поиск метрики (пример)
Временной ряд делится на отдельные участки, каждому из которых сопоставляется точка в n-мерном пространстве признаков. Локальная модель рассчитывается в три последовательных этапа.
Первый – находит k-ближайших соседей наблюдаемой точки.
Второй – строит простую модель, используя только этих k соседей.
Третий – используя даную модель, по наблюдаемой точке прогнозирует следующую.
Многие исследователи, используют эвклидову метрику для измерения расстояний между точками.
Данная работа призвана сравнить точность прогнозирования при использовании различных метрик.
В частности, требуется исследовать оптимальный набор весов во взвешенной метрике для максимизации точности прогнозирования.
Задача 8: Локальные методы прогнозирования, поиск инвариантного преобразования (пример)
В проекте используются локальные методы прогнозирования временных рядов. Эти методы отказываются от нахождения представления временного ряда в классе заданных функций от времени. Вместо этого прогноз осуществляется на основе данных о каком-то участке временного ряда (используется локальная В данной работе подробно исследован следующий метод (обобщение классического «ближайшего соседа»). Пусть имеется временной ряд, и стоит задача требуется продолжить его. Предполагается, что такое продолжение определяется «предысторией», т.е. в ряде нужно найти часть, которая после некоторого преобразования A «становится похожа» на ту часть, которую мы стремимся прогнозировать. Поиск такого преобразования A и есть цель данного проекта. Для определения степени «похожести» используется метрика B – функция близости двух отрезков временного ряда (подробнее об этом см.Локальные методы прогнозирования,поиск метрики (пример)). Так мы находим ближайшего соседа к нашей предыстории. В общем случае ищем несколько ближайших соседей. Продолжение запишется в виде их линейной комбинации.
Задача 9: Выравнивание временных рядов: прогнозирование с использованием DTW (пример)
Задача 12: Исследование сходимости при прогнозировании нейронными сетями с боратной связью (пример)
Цель проекта - иследовать зависимость сходимости прогнозирования от параметров нейронной сети. Понятие обратной связи характерно для динамических систем, в которой выходной сигнал некоторого элемента истемы оказыает влияние на входной сигнал этого элемента. Входной Сигнал , внутренний сигнал и выходной сигнал связаны соотношениями: ;