Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 974, весна 2012
Материал из MachineLearning.
(→Список задач) |
м (→Список задач) |
||
(18 промежуточных версий не показаны.) | |||
Строка 13: | Строка 13: | ||
|- | |- | ||
|CMARS: аппроксимация сплайнами | |CMARS: аппроксимация сплайнами | ||
- | | | + | |Влада Целых |
- | | | + | |Татьяна Шпакова |
- | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Celyh2012CMARS/ Celyh2012CMARS] | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Celyh2012CMARS/ Celyh2012CMARS] |
- | |[.] | + | |[.]сaipvdstrj(10) |
|- | |- | ||
|Алгоритмические основы построения банковских скоринговых карт | |Алгоритмические основы построения банковских скоринговых карт | ||
|Александр Адуенко | |Александр Адуенко | ||
- | | | + | |Алина Иванова |
- | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Aduenko2012economics/ Aduenko2012economics] | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Aduenko2012economics/ Aduenko2012economics] |
- | |[.]сaipvdstrj | + | |[.]сaipvdstrj(10) |
|- | |- | ||
|Использование метода главных компонент при построении интегральных индикаторов | |Использование метода главных компонент при построении интегральных индикаторов | ||
|Мария Медведникова | |Мария Медведникова | ||
|Светлана Цыганова | |Светлана Цыганова | ||
- | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Medvednikova2012PCA/ Medvednikova2012PCA] | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Medvednikova2012PCA/ Medvednikova2012PCA] |
|[r]сaipvdstrj(10) | |[r]сaipvdstrj(10) | ||
|- | |- | ||
Строка 33: | Строка 33: | ||
|Арсентий Кузьмин | |Арсентий Кузьмин | ||
|Анна Варфоломеева | |Анна Варфоломеева | ||
- | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Kuzmin2012TimeRows/ Kuzmin2012TimeRows] | + | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Kuzmin2012TimeRows/ Kuzmin2012TimeRows] |
- | |[ | + | |[r]сaipvdstjr(10) |
|- | |- | ||
|Локальные методы прогнозирования с выбором инвариантного преобразования | |Локальные методы прогнозирования с выбором инвариантного преобразования | ||
- | | | + | |Светлана Цыганова |
- | | | + | |Мария Медведникова |
- | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Tsyganova2012LocalForecast/ Tsyganova2012 LocalForecast] | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Tsyganova2012LocalForecast/ Tsyganova2012 LocalForecast] |
|[r]сaipvdstjr(10) | |[r]сaipvdstjr(10) | ||
+ | |- | ||
+ | |Прогноз квазипериодических многомерных временных рядов непараметрическими методами (пример) | ||
+ | |Егор Клочков | ||
+ | |Александр Шульга | ||
+ | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Klochkov2012Goods4Cast Klochkov2012Goods4Cast] | ||
+ | |[r]сaipvdstj.(10) | ||
+ | |- | ||
+ | |Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии (пример) | ||
+ | |Степан Лобастов | ||
+ | |Егор Клочков | ||
+ | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Lobastov2012FOSelection/ Lobastov2012FOSelection] | ||
+ | |[r]сaipvdstrj(10) | ||
|- | |- | ||
|Локальные методы прогнозирования с выбором метрики | |Локальные методы прогнозирования с выбором метрики | ||
|Анна Варфоломеева | |Анна Варфоломеева | ||
- | | | + | |Арсентий Кузьмин |
- | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Varfolomeeva2012LocForecastMetrics/ Varfolomeeva2012 LocForecastMetrics] | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Varfolomeeva2012LocForecastMetrics/ Varfolomeeva2012 LocForecastMetrics] |
- | |[ | + | |[r]сaipvdstjr(10) |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
|- | |- | ||
- | | | + | |Полиномы Чебышева и прогнозирование временных рядов |
- | | | + | |Валерия Бочкарева |
|Степан Лобастов | |Степан Лобастов | ||
- | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Bochkareva2012TimeSeriesPrediction Bochkareva2012TimeSeriesPrediction] | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Bochkareva2012TimeSeriesPrediction Bochkareva2012TimeSeriesPrediction] |
- | |[.] | + | |[.]сaipvdst-r(9) |
|- | |- | ||
- | | | + | |Кластеризация и составление словаря аминокислотных последовательностей |
- | | | + | |Татьяна Шпакова |
- | | | + | |Влада Целых |
- | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/ | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Shpakova2012Clustering/ Shpakova2012Clustering] |
- | |[ | + | |[.]сaipvdst..(9) |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
|- | |- | ||
- | | | + | |Векторная авторегрессия и управление макроэкономическими показателями |
|Александр Шульга | |Александр Шульга | ||
| | | | ||
- | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Shulga2012VAR Shulga2012VAR] | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Shulga2012VAR Shulga2012VAR] |
- | |[.] | + | |[.]сaipvds...(9) |
|- | |- | ||
- | | | + | |Аппроксимация эмпирических функций распределения |
- | | | + | |Алина Иванова |
- | |Адуенко | + | |Александр Адуенко |
- | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Ivanova2012ApproximateFunc/ Ivanova2012 ApproximateFunc] | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Ivanova2012ApproximateFunc/ Ivanova2012 ApproximateFunc] |
- | |[r] | + | |[r]сaipvd....(9) |
|- | |- | ||
+ | <!-- | ||
|[[Oblivious Decision Trees (пример) ]] | |[[Oblivious Decision Trees (пример) ]] | ||
|Кирилл Татунов | |Кирилл Татунов | ||
| | | | ||
- | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/ | + | |[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group974/Tatunov2012ObliviousDecisionTrees Tatunov2012ObliviousDecisionTrees] |
|с. | |с. | ||
|- | |- | ||
+ | --> | ||
|} | |} | ||
Строка 192: | Строка 194: | ||
== Черновой список задач == | == Черновой список задач == | ||
# Кластеризация и составление словаря аминокислотных последовательностей | # Кластеризация и составление словаря аминокислотных последовательностей | ||
- | # | + | # Oblivious decision trees: алгоритм Яндекс для системы Полигон |
# Сравнительный анализ регрессионных остатков в SVN-регрессии | # Сравнительный анализ регрессионных остатков в SVN-регрессии | ||
# Алгоритмы нахождения гауссовских смесей | # Алгоритмы нахождения гауссовских смесей | ||
- | |||
# Прогноз квазипериодических многомерных временных рядов непараметрическими методами | # Прогноз квазипериодических многомерных временных рядов непараметрическими методами | ||
# Многоуровневая классификация при обнаружении движения цен | # Многоуровневая классификация при обнаружении движения цен | ||
- | |||
# CMARS: аппроксимация сплайнами | # CMARS: аппроксимация сплайнами | ||
# Полиномы Чебышева и метод прогонки при прогнозировании временных рядов | # Полиномы Чебышева и метод прогонки при прогнозировании временных рядов | ||
Строка 207: | Строка 207: | ||
# Векторная авторегрессия и управление макроэкономическими показателями | # Векторная авторегрессия и управление макроэкономическими показателями | ||
# Построение рейтинга российских вузов по открытым данным об успешности карьеры их выпускников | # Построение рейтинга российских вузов по открытым данным об успешности карьеры их выпускников | ||
- | |||
== Ещё задачи == | == Ещё задачи == | ||
+ | # Анализ текста методами структурного обучения | ||
+ | # Аппроксимация эмпирических функций распределения | ||
# Алгоритмические основы построения банковских скоринговых карт | # Алгоритмические основы построения банковских скоринговых карт | ||
# Сингулярное разложение и поисковая машина | # Сингулярное разложение и поисковая машина | ||
Строка 222: | Строка 223: | ||
# Создание алгоритмов последовательной модификации моделей | # Создание алгоритмов последовательной модификации моделей | ||
# Порождение и выбор моделей классификации | # Порождение и выбор моделей классификации | ||
+ | |||
+ | == И еще задачи == | ||
+ | * Функция расстояния между формулами и поиск. | ||
+ | * Поиск объектов (техническая работа). | ||
+ | |||
+ | == + == | ||
+ | * Авторегрессия | ||
+ | * Векторная авторегрессия | ||
+ | * Экспоненциальное сглаживание | ||
+ | * Локальные методы, поиск метрики | ||
+ | * Локальные методы с инвариантами, метрика фиксирована | ||
+ | * ARIMA | ||
+ | * Многомерная гусеница, выбор длины гусеницы | ||
+ | * Многомерная гусеница, выбор рядов | ||
+ | * Прогнозирование с использованием DTW | ||
+ | * Скользящее среднее, выбор ядер | ||
+ | * Скользящее среднее с забыванием истории | ||
+ | * Скользящее среднее временных рядов с периодической составляющей | ||
+ | * Прогнозирование нейронными сетями | ||
+ | * Анализ качества прогноза | ||
+ | * Метаописание временных рядов | ||
+ | * Логическое прогнозирование | ||
+ | * SVN – регрессия | ||
+ | * Дискретное прогнозирование, музыка. | ||
== Составить == | == Составить == | ||
* Список типичных типографических ошибок | * Список типичных типографических ошибок | ||
* Список ошибок BibTeX | * Список ошибок BibTeX |
Текущая версия
Список задач
Название задачи | Автор | Рецензент | Ссылка на работу | Комментарии |
---|---|---|---|---|
CMARS: аппроксимация сплайнами | Влада Целых | Татьяна Шпакова | Celyh2012CMARS | [.]сaipvdstrj(10) |
Алгоритмические основы построения банковских скоринговых карт | Александр Адуенко | Алина Иванова | Aduenko2012economics | [.]сaipvdstrj(10) |
Использование метода главных компонент при построении интегральных индикаторов | Мария Медведникова | Светлана Цыганова | Medvednikova2012PCA | [r]сaipvdstrj(10) |
Многоуровневая классификация при обнаружении движения цен | Арсентий Кузьмин | Анна Варфоломеева | Kuzmin2012TimeRows | [r]сaipvdstjr(10) |
Локальные методы прогнозирования с выбором инвариантного преобразования | Светлана Цыганова | Мария Медведникова | Tsyganova2012 LocalForecast | [r]сaipvdstjr(10) |
Прогноз квазипериодических многомерных временных рядов непараметрическими методами (пример) | Егор Клочков | Александр Шульга | Klochkov2012Goods4Cast | [r]сaipvdstj.(10) |
Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии (пример) | Степан Лобастов | Егор Клочков | Lobastov2012FOSelection | [r]сaipvdstrj(10) |
Локальные методы прогнозирования с выбором метрики | Анна Варфоломеева | Арсентий Кузьмин | Varfolomeeva2012 LocForecastMetrics | [r]сaipvdstjr(10) |
Полиномы Чебышева и прогнозирование временных рядов | Валерия Бочкарева | Степан Лобастов | Bochkareva2012TimeSeriesPrediction | [.]сaipvdst-r(9) |
Кластеризация и составление словаря аминокислотных последовательностей | Татьяна Шпакова | Влада Целых | Shpakova2012Clustering | [.]сaipvdst..(9) |
Векторная авторегрессия и управление макроэкономическими показателями | Александр Шульга | Shulga2012VAR | [.]сaipvds...(9) | |
Аппроксимация эмпирических функций распределения | Алина Иванова | Александр Адуенко | Ivanova2012 ApproximateFunc | [r]сaipvd....(9) |
Общий план работ
Дата | Что делаем | Результат для обсуждения | code | |
---|---|---|---|---|
Февраль | 29 | Выбрана задача, найдены базовые публикации. | Аннотация, 600 знаков. | annotation |
Март | 14 | Собрана литература, она в bib; найдены данные. | Введение, примерно одна страница. | itroduction |
21 | Поставлена задача, собраны материалы по работе. Найдены публикации. | Постановка задачи, полстраницы. | problem | |
28 | Поставлен вычислительный эксперимент, получены первые результаты. | Визуализация данных. | visualizing | |
Апрель | 4 | Описание алгоритма, часть 1. | Теоретическая часть. | document |
11 | Описание алгоритма, часть 2. | Теоретическая часть завершена. | d | |
18 | Завершение вычислительного эксперимента. | Контрольная точка - показ статьи в целом. | show | |
25 | Доработка статьи; доклад, первая группа. | Доклад. | talk | |
25 | Доклад, вторая группа. | Подача статьи в журнал. | journal | |
Май | 3 | Доклад, третья группа. | Рецензия написана, [r]-рецензенту | review, [r] |
10 | Последний день для претендентов на оценки 10,9. | Зачет | (score) |
Аннотации
Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии
Логистическая регрессия – это статистическая модель, которая применяется для предсказания вероятности возникновения некоторого события по значениям множества признаков. Она находит применение, например, в медицине [1] и кредитном скроллинге. В реальных условиях число признаков обычно велико, и важнейшей задачей является выбор только существенных признаков , а также поиск объектов, которые по тем или иным причинам являются атипичными.
Ключевые слова: logit model, feature selection, boosting.
Использование метода главных компонент при построении интегральных индикаторов
В данной работе рассматривается использование метода главных компонент при построении интегральных индикаторов. Полученные результаты сравниваются с результатами, даваемыми методом расслоения Парето. Строится интегральный индикатор для российских вузов. Для этого используются биографии 30 богатейших бизнесменов России по версии журнала "Forbes" за 2011 год.
Ключевые слова: интегральный индикатор, экспертные оценки, веса параметров, метод главных компонент, метод расслоения Парето.
Аппроксимация эмпирических функций распределения
Работа посвящена методам аппроксимации функций для эффективного вычисления интегралов. В практических задачах обычно имеются данные в определенных точках времени или пространства. При построении предположений об остальных точках возникает необходимость аппроксимации функции распределения исследуемой величины, а также оценка соответствующей ошибки. Для ее расчета есть возможность использовать методы разной точности.
Ключевые слова: метод Монте-Карло, вычисление функцй распределения, эмпирические функции распределения.
Методы локального прогнозирования с выбором преобразования
Задачи прогнозирования временных рядов имеют множество приложений в различных областях, таких как экономика, физика, медицина. Их решением является прогноз на недалекое будущее по уже известным значениям прогнозируемого ряда в предыдущие моменты времени. В работе будет построен алгоритм локального прогнозирования с учетом преобразований, позволяющий без участия человека выявить визуально похожие участки временного ряда.
Ключевые слова: локальное прогнозирование, преобразование
Черновой список задач
- Кластеризация и составление словаря аминокислотных последовательностей
- Oblivious decision trees: алгоритм Яндекс для системы Полигон
- Сравнительный анализ регрессионных остатков в SVN-регрессии
- Алгоритмы нахождения гауссовских смесей
- Прогноз квазипериодических многомерных временных рядов непараметрическими методами
- Многоуровневая классификация при обнаружении движения цен
- CMARS: аппроксимация сплайнами
- Полиномы Чебышева и метод прогонки при прогнозировании временных рядов
- Сравнение методов ARMA и FLS при ретроспективном прогнозировании
- Локальные методы прогнозирования с выбором метрики
- Локальные методы прогнозирования с выбором инвариантного преобразования
- Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии
- Векторная авторегрессия и управление макроэкономическими показателями
- Построение рейтинга российских вузов по открытым данным об успешности карьеры их выпускников
Ещё задачи
- Анализ текста методами структурного обучения
- Аппроксимация эмпирических функций распределения
- Алгоритмические основы построения банковских скоринговых карт
- Сингулярное разложение и поисковая машина
- Сравнение алгоритмов многокритериальной оптимизации
- Уточнение экспертных оценок на данных в ранговых шкалах (интервальные, конусы, веса экспертов, копулы)
- Уточнение экспертных оценок при анализе работы механизма устойчивого развития энергетики
- Визуализация пространства параметров регрессионных моделей
- Восстановление регрессии методом главных компонент
- Оценка гиперпараметров путем сэмплирования
- Прореживание существенно нелинейных моделей с помощью гиперпараметров
- Фактор Оккама для параметрических моделей с известной областью определения параметров
- Создание алгоритмов последовательной модификации моделей
- Порождение и выбор моделей классификации
И еще задачи
- Функция расстояния между формулами и поиск.
- Поиск объектов (техническая работа).
+
- Авторегрессия
- Векторная авторегрессия
- Экспоненциальное сглаживание
- Локальные методы, поиск метрики
- Локальные методы с инвариантами, метрика фиксирована
- ARIMA
- Многомерная гусеница, выбор длины гусеницы
- Многомерная гусеница, выбор рядов
- Прогнозирование с использованием DTW
- Скользящее среднее, выбор ядер
- Скользящее среднее с забыванием истории
- Скользящее среднее временных рядов с периодической составляющей
- Прогнозирование нейронными сетями
- Анализ качества прогноза
- Метаописание временных рядов
- Логическое прогнозирование
- SVN – регрессия
- Дискретное прогнозирование, музыка.
Составить
- Список типичных типографических ошибок
- Список ошибок BibTeX