Преподавание машинного обучения
Материал из MachineLearning.
(→Курсы) |
|||
Строка 1: | Строка 1: | ||
- | Данный [[:Категория:Виртуальные семинары|виртуальный семинар]] предназначен для обсуждения методических вопросов, связанных с преподаванием машинного обучения и смежных дисциплин в российских вузах. | + | {{TOCright}} |
+ | Данный [[:Категория:Виртуальные семинары|виртуальный семинар]] предназначен для обсуждения методических вопросов, связанных с преподаванием [[Машинное обучение|машинного обучения]] и смежных дисциплин в российских вузах. | ||
- | + | На данную страницу выносятся основные положения, результаты дискуссии и прочая хорошо структурированная информация. | |
- | + | Споры, как обычно, ведутся в [[Обсуждение:Преподавание машинного обучения|обсуждении]]. | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | == | + | Поскольку это семинар, на основной странице также можно высказывать личные мнения; |
+ | желательно сопровождать их подписью участника. | ||
+ | |||
+ | == Машинное обучение — математический или инженерный курс? == | ||
+ | |||
+ | Согласно международным рекомендациям по преподаванию информатики в университетах | ||
+ | ACM/IEEE Computing Curricula 2001 | ||
+ | [[информатика]] (computer science) | ||
+ | подразделяется на 14 областей, одна из которых — | ||
+ | [[интеллектуальные системы]] (intelligent systems). | ||
+ | Эта область, в свою очередь, имеет 10 разделов, один из них — | ||
+ | '''машинное обучение и нейронные сети''' (machine learning and neural networks). | ||
+ | Для непрофильных специальностей этот курс считается факультативным. | ||
+ | |||
+ | Типовые программы этого курса рассчитаны на расширение кругозора будущих IT-специалистов и, мягко говоря, поверхностны. | ||
+ | Они ни в коей мере не рассчитаны на будущего научного работника или разработчика новых методов машинного обучения. | ||
+ | Они лишь дают представление о том, | ||
+ | какие задачи возникают на практике, | ||
+ | какими методами их можно решать, | ||
+ | в чём их основные принципы, | ||
+ | какие существуют инструментальные средства, | ||
+ | иногда — какие подводные камни ждут будущего BI-аналитика. | ||
+ | Далеко не все методы освещаются. | ||
+ | Теория вообще не рассматривается. | ||
+ | |||
+ | '''Вопрос:''' стоит ли ориентироваться на этот международный стандарт? | ||
+ | |||
+ | Стандарт оставляет большую свободу творчества преподавателю. | ||
+ | Формально оставшись в рамках стандарта, можно сделать и полную профанацию, и удачный курс для инженеров, показывающий нетривиальные примеры реальных задач, процесс их решения, владение стандартным инструментарием. | ||
+ | Заодно можно зацепить и кучу действительно глубоких вопросов, используя реальные задачи в качестве мотивации. | ||
+ | Однако для преподавателя это на порядок сложнее. | ||
+ | |||
+ | '''Математический курс''' нужен узкому кругу специалистов, которые предположительно будут заниматься разработкой новых методов и решением принципиально новых задач. Потребность в таких специалистах — около 5%. (''[[Участник:Vokov|К.В.Воронцов]] 22:33, 10 июля 2008 (MSD)'') | ||
+ | |||
+ | '''Инженерный курс''' нужен широкому кругу специалистов, которые предположительно будут заниматься применением стандартных методов для решения более-менее типичных задач. Он также нужен будущим IT-руководителям, которые обязаны не только знать о возможностях современных методов анализа данных, но и уметь доносить своё понимание до лиц, принимающих решения. Потребность в таких специалистах — около 95%. Кстати, без этих 95% инженеров те 5% математиков вообще не имеют шансов найти работу по специальности. (''[[Участник:Vokov|К.В.Воронцов]] 22:33, 10 июля 2008 (MSD)'') | ||
+ | |||
+ | Курсов машинного обучения «для инженеров» в мире очень много. | ||
+ | Математических курсов очень мало, и они очень разные; каждый несёт на себе отпечаток конкретной школы. | ||
+ | Обычно это курсы на кафедрах соотвествующего профиля. | ||
+ | |||
+ | == Методика преподавания == | ||
+ | |||
+ | Предлагается обсуждать удачный и неудачный опыт. | ||
+ | * насколько повышается эффективность преподавания при использовании слайдов? | ||
+ | * используются ли наряду со слайдами раздаточные материалы? | ||
+ | * как строятся практикумы? | ||
+ | * какие задачи и вопросы даются для контроля знаний? | ||
+ | |||
+ | == Некоторые удачные методические приёмы == | ||
+ | Предлагается пополнять коллекцию. | ||
+ | |||
+ | * В начале курса посвятить одну лекцию описанию примеров разнообразных прикладных задач «из жизни». (''[[Участник:Vokov|К.В.Воронцов]] 22:33, 10 июля 2008 (MSD)'') | ||
+ | * В конце курса (например, на консультации перед экзаменом) нарисовать «карту курса», где показать взаимосвязи и сходства между различными методами. (''[[Участник:Vokov|К.В.Воронцов]] 22:33, 10 июля 2008 (MSD)'') | ||
+ | * Рассказав метод, в явном виде перечислить его достоинства и недостатки; затем рассказать о путях устранения недостатков. (''[[Участник:Vokov|К.В.Воронцов]] 22:33, 10 июля 2008 (MSD)'') | ||
+ | |||
+ | == Терминология == | ||
+ | Предлагается обсуждать список терминов, которые либо не понятно, как переводить на русский, либо «де факто» они уже переведены разными авторами по-разному, и необходимо приходить к единству. | ||
+ | |||
+ | Возможно, для этого обсуждения надо завести отдельную страницу... | ||
+ | |||
+ | * Business-intelligence — интеллектуальные бизнес-системы или бизнес-интеллект? | ||
+ | * Data mining — [[интеллектуальный анализ данных]] | ||
+ | * Optimal brain damage — ? | ||
+ | * Optimal brain surgery — [[оптимальное прореживание нейронных сетей]] | ||
+ | * Shatter coeffiсient — [[коэффициент разнообразия]] | ||
+ | * Target function — [[целевая зависимость]] или [[восстанавливаемая зависимость]]? [[Целевая функция]] вызывает ненужные ассоциации с оптимизируемым функционалом. | ||
+ | |||
+ | == Книги, которые можно выбрать за «скелет» курса == | ||
# {{П:Hastie 2001 The Elements of Statistical Learning}} | # {{П:Hastie 2001 The Elements of Statistical Learning}} | ||
+ | |||
+ | == Дополнительная литература == | ||
# {{П:Загоруйко 1999 Прикладные методы анализа данных и знаний}} | # {{П:Загоруйко 1999 Прикладные методы анализа данных и знаний}} | ||
# {{П:Журавлёв 2006 Распознавание}} | # {{П:Журавлёв 2006 Распознавание}} | ||
== Курсы == | == Курсы == | ||
+ | * [http://courses.csail.mit.edu/6.867/lectures.html Machine Learning (Fall 2007)] [http://people.csail.mit.edu/tommi Prof. Tommi Jaakkola], MIT. | ||
+ | * [https://www.seas.upenn.edu/~cis520/schedule.html Machine Learning (Fall 2007)] Prof. Lyle Ungar, University of Pennsylvania - School of Engineering & Applied Science. | ||
* [[Машинное обучение (курс лекций, К.В.Воронцов)]] | * [[Машинное обучение (курс лекций, К.В.Воронцов)]] | ||
* [[Машинное обучение (курс лекций, Н.Ю.Золотых)]] | * [[Машинное обучение (курс лекций, Н.Ю.Золотых)]] | ||
* [[Прикладная регрессия и оптимизация (курс лекций, B.В.Стрижов)]] | * [[Прикладная регрессия и оптимизация (курс лекций, B.В.Стрижов)]] | ||
+ | |||
{{stub}} | {{stub}} | ||
+ | |||
[[Категория:Виртуальные семинары]] | [[Категория:Виртуальные семинары]] | ||
[[Категория:Учебные курсы]] | [[Категория:Учебные курсы]] |
Версия 18:33, 10 июля 2008
|
Данный виртуальный семинар предназначен для обсуждения методических вопросов, связанных с преподаванием машинного обучения и смежных дисциплин в российских вузах.
На данную страницу выносятся основные положения, результаты дискуссии и прочая хорошо структурированная информация. Споры, как обычно, ведутся в обсуждении.
Поскольку это семинар, на основной странице также можно высказывать личные мнения; желательно сопровождать их подписью участника.
Машинное обучение — математический или инженерный курс?
Согласно международным рекомендациям по преподаванию информатики в университетах ACM/IEEE Computing Curricula 2001 информатика (computer science) подразделяется на 14 областей, одна из которых — интеллектуальные системы (intelligent systems). Эта область, в свою очередь, имеет 10 разделов, один из них — машинное обучение и нейронные сети (machine learning and neural networks). Для непрофильных специальностей этот курс считается факультативным.
Типовые программы этого курса рассчитаны на расширение кругозора будущих IT-специалистов и, мягко говоря, поверхностны. Они ни в коей мере не рассчитаны на будущего научного работника или разработчика новых методов машинного обучения. Они лишь дают представление о том, какие задачи возникают на практике, какими методами их можно решать, в чём их основные принципы, какие существуют инструментальные средства, иногда — какие подводные камни ждут будущего BI-аналитика. Далеко не все методы освещаются. Теория вообще не рассматривается.
Вопрос: стоит ли ориентироваться на этот международный стандарт?
Стандарт оставляет большую свободу творчества преподавателю. Формально оставшись в рамках стандарта, можно сделать и полную профанацию, и удачный курс для инженеров, показывающий нетривиальные примеры реальных задач, процесс их решения, владение стандартным инструментарием. Заодно можно зацепить и кучу действительно глубоких вопросов, используя реальные задачи в качестве мотивации. Однако для преподавателя это на порядок сложнее.
Математический курс нужен узкому кругу специалистов, которые предположительно будут заниматься разработкой новых методов и решением принципиально новых задач. Потребность в таких специалистах — около 5%. (К.В.Воронцов 22:33, 10 июля 2008 (MSD))
Инженерный курс нужен широкому кругу специалистов, которые предположительно будут заниматься применением стандартных методов для решения более-менее типичных задач. Он также нужен будущим IT-руководителям, которые обязаны не только знать о возможностях современных методов анализа данных, но и уметь доносить своё понимание до лиц, принимающих решения. Потребность в таких специалистах — около 95%. Кстати, без этих 95% инженеров те 5% математиков вообще не имеют шансов найти работу по специальности. (К.В.Воронцов 22:33, 10 июля 2008 (MSD))
Курсов машинного обучения «для инженеров» в мире очень много. Математических курсов очень мало, и они очень разные; каждый несёт на себе отпечаток конкретной школы. Обычно это курсы на кафедрах соотвествующего профиля.
Методика преподавания
Предлагается обсуждать удачный и неудачный опыт.
- насколько повышается эффективность преподавания при использовании слайдов?
- используются ли наряду со слайдами раздаточные материалы?
- как строятся практикумы?
- какие задачи и вопросы даются для контроля знаний?
Некоторые удачные методические приёмы
Предлагается пополнять коллекцию.
- В начале курса посвятить одну лекцию описанию примеров разнообразных прикладных задач «из жизни». (К.В.Воронцов 22:33, 10 июля 2008 (MSD))
- В конце курса (например, на консультации перед экзаменом) нарисовать «карту курса», где показать взаимосвязи и сходства между различными методами. (К.В.Воронцов 22:33, 10 июля 2008 (MSD))
- Рассказав метод, в явном виде перечислить его достоинства и недостатки; затем рассказать о путях устранения недостатков. (К.В.Воронцов 22:33, 10 июля 2008 (MSD))
Терминология
Предлагается обсуждать список терминов, которые либо не понятно, как переводить на русский, либо «де факто» они уже переведены разными авторами по-разному, и необходимо приходить к единству.
Возможно, для этого обсуждения надо завести отдельную страницу...
- Business-intelligence — интеллектуальные бизнес-системы или бизнес-интеллект?
- Data mining — интеллектуальный анализ данных
- Optimal brain damage — ?
- Optimal brain surgery — оптимальное прореживание нейронных сетей
- Shatter coeffiсient — коэффициент разнообразия
- Target function — целевая зависимость или восстанавливаемая зависимость? Целевая функция вызывает ненужные ассоциации с оптимизируемым функционалом.
Книги, которые можно выбрать за «скелет» курса
- Hastie, T., Tibshirani, R., Friedman, J. The Elements of Statistical Learning, 2nd edition. — Springer, 2009. — 533 p. (подробнее)
Дополнительная литература
- Загоруйко Н. Г. Прикладные методы анализа данных и знаний. — Новосибирск: ИМ СО РАН, 1999. — 270 с. — ISBN 5-86134-060-9 (подробнее)
- Журавлёв, Ю. И., Рязанов, В. В., Сенько, О. В. «Распознавание». Математические методы. Программная система. Практические применения. — М.: ФАЗИС, 2006. — 176 с. (подробнее)
Курсы
- Machine Learning (Fall 2007) Prof. Tommi Jaakkola, MIT.
- Machine Learning (Fall 2007) Prof. Lyle Ungar, University of Pennsylvania - School of Engineering & Applied Science.
- Машинное обучение (курс лекций, К.В.Воронцов)
- Машинное обучение (курс лекций, Н.Ю.Золотых)
- Прикладная регрессия и оптимизация (курс лекций, B.В.Стрижов)