Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 774, осень 2012
Материал из MachineLearning.
(→Задачи) |
(→Задачи) |
||
(34 промежуточные версии не показаны) | |||
Строка 1: | Строка 1: | ||
{{Main|Прикладной регрессионный анализ (курс лекций, B.В. Стрижов)}} | {{Main|Прикладной регрессионный анализ (курс лекций, B.В. Стрижов)}} | ||
__NOTOC__ | __NOTOC__ | ||
- | |||
- | |||
'''Основная задача''' этой работы — предложить алгоритм выбора моделей, исследовать и проиллюстрировать его свойства, проанализировать его преимущества недостатки и особенности в сравнении с известными алгоритмами машинного обучения. | '''Основная задача''' этой работы — предложить алгоритм выбора моделей, исследовать и проиллюстрировать его свойства, проанализировать его преимущества недостатки и особенности в сравнении с известными алгоритмами машинного обучения. | ||
Строка 22: | Строка 20: | ||
! Ссылка SF | ! Ссылка SF | ||
! Дата доклада | ! Дата доклада | ||
- | ! | + | ! Доклад |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
|- | |- | ||
| Оценка параметров совместных распределений и использование копул при построении интегральных индикаторов | | Оценка параметров совместных распределений и использование копул при построении интегральных индикаторов | ||
- | | | + | | Кузнецов |
- | | | + | | Ивкин |
- | | | + | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Kuznetsov2012Copula Kuznetsov2012Copula] |
- | | | + | | 12.11 +2 |
- | | | + | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Kuznetsov2012Copula/doc/CopulaReview/Kuznetsov2012-presentation.pdf Kuznetsov2012Copula] |
|- | |- | ||
- | | | + | | Кластеризация смесей распределений в задачах тематического моделирования |
- | | | + | | Сунгуров |
- | | | + | | ? |
- | | | + | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Sungurov2012Clustering/ Sungurov2012Clustering] |
- | | | + | | 12.11 +2 |
- | | | + | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Sungurov2012Clustering/doc/Sungurov2012presentation.pdf Sungurov2012Clustering] |
+ | |- | ||
+ | | Совместный выбор объектов и признаков в задачах прогнозирования временных рядов | ||
+ | | Ивкин | ||
+ | | Кузнецов | ||
+ | | [https://svn.code.sf.net/p/mlalgorithms/code/Group774/Ivkin2012JointSelection/ 2012JointSelection] | ||
+ | | 26.11 +2 | ||
+ | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Ivkin2012JointSelection/report/Ivkin2012pres.pdf Ivkin2012Mixtures] | ||
|- | |- | ||
| Оценка максимума правдоподобия модели и его математического ожидания методом сэмплирования | | Оценка максимума правдоподобия модели и его математического ожидания методом сэмплирования | ||
- | | | + | | Джамтырова |
- | | | + | | ? |
- | | | + | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Dzhamtyrova12Sampling Dzhamtyrova2012Sampling] |
- | | | + | | 19.11 +2 |
- | | | + | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Dzhamtyrova12Sampling/doc/Dzhamtyrova12presentation.pdf Dzhamtyrova2012Sampling] |
|- | |- | ||
| Выбор оптимальных инвариантных преобразований в задачах тематического моделирования | | Выбор оптимальных инвариантных преобразований в задачах тематического моделирования | ||
- | | | + | | Кононенко |
- | | | + | | Животовский |
- | | | + | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Kononenko2012Invariants Kononenko2012Invariants] |
- | | | + | | 26.11 +2 |
- | | | + | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Kononenko2012Invariants/doc/GP/presentationGP.pdf Kononenko2012GP] |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
|- | |- | ||
| Порождающий и разделяющий подходы в задачах классификации с малыми выборками | | Порождающий и разделяющий подходы в задачах классификации с малыми выборками | ||
- | | | + | | Животовский |
- | | | + | | Кононенко |
- | | | + | | [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Group774/Zhivotovskiy2012GenVsDisc 2012GenVsDisc] |
- | | | + | | 19.11 +2 |
- | | | + | | [https://svn.code.sf.net/p/mlalgorithms/code/Group774/Zhivotovskiy2012GenVsDisc/doc/GenVsDisc.pdf GenVsDisc] |
+ | |- | ||
+ | | Факторизация матриц в задачах тематического моделирования | ||
+ | | Глушаченков | ||
+ | | ? | ||
+ | | 2012Covariance | ||
+ | | ? +0 | ||
+ | | | ||
|} | |} | ||
+ | |||
+ | == Оценки == | ||
+ | {| class="wikitable" | ||
+ | |- | ||
+ | |5 | ||
+ | |10 | ||
+ | |Статья в журнале WebOfScience или ScienceDirect | ||
+ | |- | ||
+ | | | ||
+ | |9 | ||
+ | | | ||
+ | |- | ||
+ | | | ||
+ | |8 | ||
+ | | | ||
+ | |- | ||
+ | |4 | ||
+ | |7 | ||
+ | |Статья в журнале из списка ВАК | ||
+ | |- | ||
+ | | | ||
+ | |6 | ||
+ | | | ||
+ | |- | ||
+ | | | ||
+ | |5 | ||
+ | |Статья в локальном журнале | ||
+ | |- | ||
+ | |3 | ||
+ | |4 | ||
+ | | | ||
+ | |- | ||
+ | | | ||
+ | |3 | ||
+ | |Заметка на заданную тему | ||
+ | |- | ||
+ | |} | ||
+ | Дополнительно: | ||
+ | * + 2 балла за доклад | ||
+ | * + 2 балла за экзамен, 84 <tex>\leq</tex> оценка <tex>\leq</tex> 100 | ||
+ | * + 1 балл за экзамен, 74 <tex>\leq</tex> оценка <tex> < </tex> 84 | ||
== Темы для 35-минутных докладов (~20 слайдов) == | == Темы для 35-минутных докладов (~20 слайдов) == | ||
Строка 86: | Строка 118: | ||
# Методы сэмплирования и вычисление интегралов функций распределения | # Методы сэмплирования и вычисление интегралов функций распределения | ||
# Методы оценки сложности моделей регрессии и классификации | # Методы оценки сложности моделей регрессии и классификации | ||
- | # Порождающий и разделяющий подходы с примерами применения и вероятностными предположениями и методами оценки параметров распределений | + | # Порождающий и разделяющий подходы с примерами применения и вероятностными предположениями, и c методами оценки параметров распределений |
# Гауссовские процессы в задачах регрессии и классификации, методы оценки параметров ковариационной функции | # Гауссовские процессы в задачах регрессии и классификации, методы оценки параметров ковариационной функции | ||
- | # | + | # Иерархические модели, оценка из параметров и примеры их использования |
+ | # Новинки в машинном обучении: structure learning, deep learning и другие | ||
== Расписание == | == Расписание == | ||
Строка 100: | Строка 133: | ||
|- | |- | ||
|Сентябрь | |Сентябрь | ||
- | | | + | |10 |
|Выбрана задача, рецензент | |Выбрана задача, рецензент | ||
|Запись в ML | |Запись в ML | ||
Строка 106: | Строка 139: | ||
|- | |- | ||
| | | | ||
- | | | + | |17 |
|Выбрана задача, найдены базовые публикации. | |Выбрана задача, найдены базовые публикации. | ||
|Аннотация, 600 знаков. | |Аннотация, 600 знаков. | ||
Строка 112: | Строка 145: | ||
|- | |- | ||
| | | | ||
- | | | + | |24 |
|Собрана литература, она в bib; найдены данные. | |Собрана литература, она в bib; найдены данные. | ||
|Введение, примерно одна страница. | |Введение, примерно одна страница. | ||
|'''I'''ntroduction | |'''I'''ntroduction | ||
|- | |- | ||
- | | | + | |Октябрь |
- | | | + | |8 |
|Поставлена задача, собраны все материалы по работе. Найдены публикации. | |Поставлена задача, собраны все материалы по работе. Найдены публикации. | ||
|Постановка задачи, полстраницы. | |Постановка задачи, полстраницы. | ||
|'''P'''roblem | |'''P'''roblem | ||
|- | |- | ||
- | | | + | | |
- | | | + | |15 |
|Поставлен вычислительный эксперимент, получены первые результаты. | |Поставлен вычислительный эксперимент, получены первые результаты. | ||
|Визуализация данных. | |Визуализация данных. | ||
Строка 130: | Строка 163: | ||
|- | |- | ||
| | | | ||
- | | | + | |22 |
|Описание алгоритма. | |Описание алгоритма. | ||
|Алгоритмическая часть (третий раздел). | |Алгоритмическая часть (третий раздел). | ||
Строка 136: | Строка 169: | ||
|- | |- | ||
| | | | ||
- | | | + | |29 |
|Теоретическая часть. | |Теоретическая часть. | ||
|Второй раздел. | |Второй раздел. | ||
|'''T'''heory | |'''T'''heory | ||
|- | |- | ||
- | | | + | |Ноябрь |
- | | | + | |5 |
|Завершение вычислительного эксперимента. | |Завершение вычислительного эксперимента. | ||
|Описание эксперимента и анализ ошибок. | |Описание эксперимента и анализ ошибок. | ||
Строка 148: | Строка 181: | ||
|- | |- | ||
| | | | ||
- | | | + | |12 |
|Контрольная точка - показ статьи в целом. | |Контрольная точка - показ статьи в целом. | ||
|Статья. | |Статья. | ||
|c'''H'''eck | |c'''H'''eck | ||
|- | |- | ||
- | | | + | | |
- | | | + | |19 |
|Доработка статьи; доклад, первая группа. | |Доработка статьи; доклад, первая группа. | ||
|Доклад. | |Доклад. | ||
Строка 160: | Строка 193: | ||
|- | |- | ||
| | | | ||
- | | | + | |26 |
|Доклад, вторая группа. | |Доклад, вторая группа. | ||
|Подача статьи в журнал. | |Подача статьи в журнал. | ||
|'''J'''ournal | |'''J'''ournal | ||
|- | |- | ||
- | | | + | |Декабрь |
- | | | + | |3 |
|Доклад, третья группа. | |Доклад, третья группа. | ||
|Рецензия написана, [r]-рецензенту | |Рецензия написана, [r]-рецензенту | ||
Строка 172: | Строка 205: | ||
|- | |- | ||
| | | | ||
- | | | + | |10 |
|Последний день для претендентов на оценки 10,9,8. | |Последний день для претендентов на оценки 10,9,8. | ||
|Экзамен | |Экзамен |
Текущая версия
Основная задача этой работы — предложить алгоритм выбора моделей, исследовать и проиллюстрировать его свойства, проанализировать его преимущества недостатки и особенности в сравнении с известными алгоритмами машинного обучения.
Практика состоит из задачи, разбитой на три подзадачи-эссе с отчетом и включает постановку задачи, описание алгоритма и вычислительный эксперимент-иллюстрацию.
Перед выполнением заданий рекомендуются прочитать статью «Численные методы обучения по прецедентам», а также все, что там по ссылкам, включая статью «Автоматизация научных исследований».
Результат практики: научная статья по выбранной теме, поданная для публикации
- в JMLDA или
- в английский журнал из списка Web Of Knowledge.
Идея практики: любой проект (вычислительный эксперимент) может быть разбит на части, каждая из которых занимает ровно один день и может быть сделана при этом от начала и до конца.
Задачи
Название задачи | Работу выполняет | Рецензент | Ссылка SF | Дата доклада | Доклад |
---|---|---|---|---|---|
Оценка параметров совместных распределений и использование копул при построении интегральных индикаторов | Кузнецов | Ивкин | Kuznetsov2012Copula | 12.11 +2 | Kuznetsov2012Copula |
Кластеризация смесей распределений в задачах тематического моделирования | Сунгуров | ? | Sungurov2012Clustering | 12.11 +2 | Sungurov2012Clustering |
Совместный выбор объектов и признаков в задачах прогнозирования временных рядов | Ивкин | Кузнецов | 2012JointSelection | 26.11 +2 | Ivkin2012Mixtures |
Оценка максимума правдоподобия модели и его математического ожидания методом сэмплирования | Джамтырова | ? | Dzhamtyrova2012Sampling | 19.11 +2 | Dzhamtyrova2012Sampling |
Выбор оптимальных инвариантных преобразований в задачах тематического моделирования | Кононенко | Животовский | Kononenko2012Invariants | 26.11 +2 | Kononenko2012GP |
Порождающий и разделяющий подходы в задачах классификации с малыми выборками | Животовский | Кононенко | 2012GenVsDisc | 19.11 +2 | GenVsDisc |
Факторизация матриц в задачах тематического моделирования | Глушаченков | ? | 2012Covariance | ? +0 |
Оценки
5 | 10 | Статья в журнале WebOfScience или ScienceDirect |
9 | ||
8 | ||
4 | 7 | Статья в журнале из списка ВАК |
6 | ||
5 | Статья в локальном журнале | |
3 | 4 | |
3 | Заметка на заданную тему |
Дополнительно:
- + 2 балла за доклад
- + 2 балла за экзамен, 84 оценка 100
- + 1 балл за экзамен, 74 оценка 84
Темы для 35-минутных докладов (~20 слайдов)
- Оценка параметров гетерогенных совместных распределений
- Копулы и их полезные свойства, вероятностные методы построения интегральных индикаторов
- Методы сэмплирования и вычисление интегралов функций распределения
- Методы оценки сложности моделей регрессии и классификации
- Порождающий и разделяющий подходы с примерами применения и вероятностными предположениями, и c методами оценки параметров распределений
- Гауссовские процессы в задачах регрессии и классификации, методы оценки параметров ковариационной функции
- Иерархические модели, оценка из параметров и примеры их использования
- Новинки в машинном обучении: structure learning, deep learning и другие
Расписание
Дата | Что делаем | Результат для обсуждения | Код | |
---|---|---|---|---|
Сентябрь | 10 | Выбрана задача, рецензент | Запись в ML | |
17 | Выбрана задача, найдены базовые публикации. | Аннотация, 600 знаков. | Annotation | |
24 | Собрана литература, она в bib; найдены данные. | Введение, примерно одна страница. | Introduction | |
Октябрь | 8 | Поставлена задача, собраны все материалы по работе. Найдены публикации. | Постановка задачи, полстраницы. | Problem |
15 | Поставлен вычислительный эксперимент, получены первые результаты. | Визуализация данных. | Visualizing | |
22 | Описание алгоритма. | Алгоритмическая часть (третий раздел). | Document | |
29 | Теоретическая часть. | Второй раздел. | Theory | |
Ноябрь | 5 | Завершение вычислительного эксперимента. | Описание эксперимента и анализ ошибок. | Comp |
12 | Контрольная точка - показ статьи в целом. | Статья. | cHeck | |
19 | Доработка статьи; доклад, первая группа. | Доклад. | Show | |
26 | Доклад, вторая группа. | Подача статьи в журнал. | Journal | |
Декабрь | 3 | Доклад, третья группа. | Рецензия написана, [r]-рецензенту | Review, [r] |
10 | Последний день для претендентов на оценки 10,9,8. | Экзамен | (score) |
Оформление
- Стилевой файл есть тут[1] (только не загружайте его обратно в репозиторий)
- Оформление графиков, JMLDA/Fig