Численные методы обучения по прецедентам (практика, В.В. Стрижов)
Материал из MachineLearning.
(→Работа с репозиотрием) |
(→Полезные материалы, сводный список ссылок) |
||
Строка 78: | Строка 78: | ||
*[[Matlab|Введение в Матлаб]] | *[[Matlab|Введение в Матлаб]] | ||
*[[Документирование функций Matlab|Документирование функций Matlab, соглашение об именах переменных и создание отчетов о вычислительных экспериментах]] | *[[Документирование функций Matlab|Документирование функций Matlab, соглашение об именах переменных и создание отчетов о вычислительных экспериментах]] | ||
+ | *[https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/ Содержимое корневой папки репозитория] | ||
+ | *[http://strijov.com/sources/demoDataGen.php Пример отчета с загрузкой модельных данных, который разбирался на лекции] | ||
[[Категория:Учебные курсы]] | [[Категория:Учебные курсы]] |
Версия 13:57, 11 февраля 2009
|
Московский физико-технический институт, Факультет управления и прикладной математики
’’Численные методы обучения по прецедентам’’ — практические занятия, включающие прикладные аспекты создания алгоритмов машинного обучения. Семестровый курс содержит 32 часа практических занятий. В ходе занятий студент получает несколько заданий на исследование свойств алгоритмов. Результатом практики являются отчеты о выполнении заданий.
Статья предназначена прежде всего для студентов группы 674, она будет наполняться в течение этого семестра. |
Содержание отчета
Отчет состоит из следующих материалов:
- статья на сайте machinelearning.ru,
- отчет о вычислительном эксперименте,
- исходный код алгоритма.
Статья на сайте machinelearning.ru
Статья должна иметь следующие разделы:
- Краткое введение в тему работы, содержащее определение алгоритма.
- Постановка задачи в математической нотации, содержащая обязательные слова «Дано» (задано), и «Найти» (требуется).
- Описание алгоритма в терминах поставленной задачи.
- Вычислительный эксперимент, поставленный для изучения свойств данного алгоритма.
- Ссылка на программную реализацию.
- Ссылка на список статей сайта machinelearning.ru по данной тематике (необязательно).
- Список литературы, откуда был взят алгоритм.
Рекомендуемые название разделов:
- (без названия)
- Постановка задачи
- Алгоритм (вариант — Описание алгоритма)
- Пример (вариант — Вычислительный эксперимент)
- Исходный код
- Смотри также
- Литература
Рекомендуемое название статьи: «Название вашего алгоритма (пример)».
Образец статьи: Логистическая регрессия (пример)
Вычислительный эксперимент
Вычислительный эксперимент состоит следующих шагов:
- Порождение модельных данных или загрузка реальных данных.
- Предобработка данных (если требуется).
- Визуализация данных (если требуется).
- Выполнение алгоритма, получение результатов.
- Исследование результатов работы алгоритма (если требуется).
- Визуализация результатов.
- Выводы.
Образец отчета о вычислительном эксперименте и способ его автоматического получения см. здесь. Отчет должен содержать цель исследования (она может отличаться от постановки задачи), результаты визуализации, полученные результаты и выводы. Основные элементы отчета (перечисленные в предыдущем предложении), наиболее важные строки кода и графики должны попасть в раздел «Вычислительный эксперимент» статьи на сайте machinelearning.ru.
Написание исходного кода
Работа с репозиотрием
Исходный код должен находится в репозитории [1]. О том, как работать с репозиторием, см. здесь.
В репозитории находятся следующие папки общего пользования:
- data – реальные данные для загрузки, общие для всех проектов (данные к конкретному заданию можно хранить в папке AlgorithmName или AlgorithmName\data),
- common – функции общего пользования, относящиеся к алгоритмам,
- utilities – вспомогательные функции общего пользования, относящиеся к вводу данных и рисованию графиков.
В репозитории нужно создать папку, название папки – название задания (алгоритма). В папке должен лежать основной файл demoAlgorithmName – файл отчета о вычислительном эксперименте (и, возможно, файл loadDataName – файл порождения модельных данных или загрузки реальных данных). Дополнительные файлы могут лежать в той же папке или в подпапках.
В процессе автоматической генерации отчета появляется папка html, которую, вместе с файлами .html и .gif, можно также загрузить в репозиторий.
Совет: не загружайте в репозиторий вспомогательный файл операционной системы Thumbs.db, он вам будет мешать. |
Программирование
Рекомендации программистам и введение в Матлаб см. здесь. Настоятельно рекомендуется прочесть соглашение об именах в статье Документирование функций Matlab. Там же рассказано о создании отчетов о вычислительных экспериментах.
Полезные материалы, сводный список ссылок
- Образец статьи о выполненном практическом задании
- Как написать статью на сайт machinelearning.ru
- Как работать с репозиторием алгоритмов
- Введение в Матлаб
- Документирование функций Matlab, соглашение об именах переменных и создание отчетов о вычислительных экспериментах
- Содержимое корневой папки репозитория
- Пример отчета с загрузкой модельных данных, который разбирался на лекции