Нейросетевые методы обработки изображений (В.В.Китов)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 3: Строка 3:
==О курсе==
==О курсе==
-
Спецкурс проходит на ф-те ВМиК в весеннем семестре и посвящен задаче автоматической стилизации изображений, в которой входное изображение необходимо отобразить в стиле, задаваемым другим изображением. Например, это может быть стилизация семейной фотографии под стиль известного художника, либо стилизация дневного фото в ночное, либо преобразование фотогрфии в схематичную книжную иллюстрацию. Для решения задачи существуют современные подходы переноса стиля (style transfer) и генеративно-состязательные сети (generative adversarial networks). Эта задача широко используется в индустрии разлечений (например, мобильное приложение Prisma было самым скачиваемым на Android в странах СНГ в течение 10 дней после выхода), при обработке фотографий и дизайне (функции стилизации были добавлены в Adobe Photoshop 2021), может применяться в мультипликации, наложении спецэффектов в фильмах, видеоиграх и средствах дополненной реальности, а также для более точной настройки методов машинного при обучении на одной предметной области, а применении модели к другой (transfer learning). Помимо изображений указанный подход применим для видеопоследовательностей и данных из других предметных областей (текст, речь и музыка). Основные методы стилизации были предложены в последние 7 лет и опираются на глубокие нейронные сети, базовому изучению которых посвящена начальная часть курса.
+
Спецкурс посвящён основам глубокого обучения, а также задачам классификации, сегментации и генерации изображений, используя нейросетевой перенос стиля (neural style transfer) и генеративно-состязательные сети (generative adversarial networks).
-
Занятия проходят в формате лекций. В процессе прохождения курса каждый студент должен сделать презентацию основных идей и подходов одной из недавних статей, посвященных стилизации изображений, а также представить свои идеи улучшений традиционных методов стилизации изображений и их обосновать.
+
Курс самодостаточный, основные понятия и задачи вводятся и подробно разбираются, поэтому спецкурс будет полезен слушателям, не имевшим предварительного знакомства с нейросетями.
-
Пройденный спецкурс вы можете позже перезачесть в учебной части на 4м курсе (по учебному плану вам тогда нужно проходить спецкурс по выбору). Спецкурс познакомит вас с нейросетями - их основными архитектурами (многослойный персептрон, сверточная сеть, автокодировщик, генеративно-состязательные сети), что может служить преимуществом при распределении на кафедры соответствующей направленности.
+
Спецкурс является практико-ориентированным: помимо теории большое внимание уделяется разбору практической реализации изучаемых архитектур. В этом смысле спецкурс является органичным дополнением обязательного курса “Глубокое машинное обучение”.
-
==Регистрация на курс==
+
В частности, разбираются основы работы с библиотекой PyTorch, реализации многослойного персептрона, автокодировщика, симаских сетей, RBF-сетей, свёрточных и генеративно-состязательных сетей.
-
Регистрация на курс происходит на самом спецкурсе по факту посещения, дополнительные действия не требуются.
+
-
==Лектор==
+
Для прохождения спецкурса необходимо сдать устный экзамен по основным теоретическим темам, а также сдать практикум.
-
[[Участник:Victor Kitov|Виктор Владимирович Китов]], к.ф.-м.н., преподаватель кафедры [[Mmp|математических методов прогнозирования]] [http://cmc.msu.ru ВМК МГУ].
+
-
Почта: v.v.kitov(at)yandex.ru.
+
Пройденный спецкурс вы можете позже перезачесть в учебной части на 4м курсе (по учебному плану вам тогда нужно проходить спецкурс по выбору).
-
==Время занятий==
+
==Требования к слушателям==
-
По понедельникам 16:50 - 18:20, ауд. 510.
+
Необходимы базовые знания по математическому анализу, линейной алгебре и теории вероятностей. Предварительных знаний по нейронным сетям и методам обработки изображений не требуется.
-
Первое занятие - 17.02.2025.
 
-
==Лекции 2025==
+
==Программа курса==
-
Будут расширены практическими занятиями по работе в PyToch (загрузка данных, операции с тензорами, основные архитектуры, их настройка и оценка качества)
+
* Введение в глубокое обучение.
 +
* Многослойный персептрон. Основные функции активации и функции потерь.
 +
* Автокодировщик.
 +
* Работа в среде Jupyter Lab, Jupyter Notebook. Средства отладки кода.
 +
* Методы оптимизации нейросетей.
 +
* Основы работы с PyTorch, автоматическое дифференцирование, реализация простейших нейросетей.
 +
* Операции свёртки и пулинга. Свёрточные нейросети для обработки текстов и изображений.
 +
* Основные свёрточные архитектуры для классификации изображений.
 +
* Реализация свёрточных сетей и использование предобученных сетей в PyTorch.
 +
* Сегментация изображений.
 +
* Реализация задачи супер-разрешения (super-resolution) и сиамских сетей в PyTorch.
 +
* Задача переноса стиля и её практическая реализация.
 +
* Генеративно-состязательные сети.
 +
* Реализация генеративно-состязательных сетей в PyTorch.
 +
==Практикум==
 +
В рамках практикума необходимо реализовать улучшенния базовых архитектур, разобранных на практических семинарах. От студентов второго курса дополнительно требуется сделать презентацию свежей статьи по теме компьютерного зрения и предложить идеи её улучшений.
-
==Лекции 2024==
+
==Регистрация на курс==
 +
Регистрация на курс происходит на самом спецкурсе по факту посещения, дополнительные действия не требуются.
-
[https://disk.yandex.ru/i/V2u_WSI3EhMETA Задачи глубокого обучения.]
+
==Лектор==
 +
[[Участник:Victor Kitov|Виктор Владимирович Китов]], к.ф.-м.н., преподаватель кафедры [[Mmp|математических методов прогнозирования]] [http://cmc.msu.ru ВМК МГУ].
-
[https://disk.yandex.ru/i/Sq3fbS8dcKzxWA Нейросети. Многослойный персептрон.]
+
Почта: v.v.kitov(at)yandex.ru.
-
[https://disk.yandex.ru/i/-mnCj8EseyXOUg Сверточные нейросети.]
+
==Время занятий==
-
[https://disk.yandex.ru/i/J9lZG_L9ZqVtcQ Расширение обучающей выборки.]
+
По понедельникам 16:50 - 18:20, ауд. 510.
-
[https://disk.yandex.ru/i/p_pzkp4U9dmknA Оптимизационный метод переноса стиля.]
+
Первое занятие - 17.02.2025.
-
 
+
-
[https://disk.yandex.ru/i/Q9TCAc5I0Uxx4g Трансформационный метод переноса стиля.]
+
-
 
+
-
[https://disk.yandex.ru/i/rcnl8o_q09dNiQ Патчевый метод переноса стиля.]
+
-
 
+
-
[https://disk.yandex.ru/i/zmo6vx8_6n3Z0Q Технические улучшения методов стилизации изображений.]
+
-
 
+
-
[https://disk.yandex.ru/i/j1nf8Ck13TCavQ Концептуальные улучшения методов стилизации изображений.]
+
-
 
+
-
[https://disk.yandex.ru/i/Ej2UQI4eiuNknw Мульти-стилевые трансформационные модели.]
+
-
 
+
-
[https://disk.yandex.ru/i/it6nzR-oULcZZA Стилизация видео-данных.]
+
-
 
+
-
[https://disk.yandex.ru/i/SjTwiaO-gh_DWQ Генеративно-состязательные сети.]
+
-
=Экзамен=
+
==Экзамен==
-
Оценка за спецкурс ставится только по результатам устного экзамена.
+
Оценка за спецкурс ставится только по результатам устного экзамена и сдачи практикума.
=Рекомендуемые ресурсы=
=Рекомендуемые ресурсы=

Версия 10:41, 19 марта 2025


О курсе

Спецкурс посвящён основам глубокого обучения, а также задачам классификации, сегментации и генерации изображений, используя нейросетевой перенос стиля (neural style transfer) и генеративно-состязательные сети (generative adversarial networks).

Курс самодостаточный, основные понятия и задачи вводятся и подробно разбираются, поэтому спецкурс будет полезен слушателям, не имевшим предварительного знакомства с нейросетями.

Спецкурс является практико-ориентированным: помимо теории большое внимание уделяется разбору практической реализации изучаемых архитектур. В этом смысле спецкурс является органичным дополнением обязательного курса “Глубокое машинное обучение”.

В частности, разбираются основы работы с библиотекой PyTorch, реализации многослойного персептрона, автокодировщика, симаских сетей, RBF-сетей, свёрточных и генеративно-состязательных сетей.

Для прохождения спецкурса необходимо сдать устный экзамен по основным теоретическим темам, а также сдать практикум.

Пройденный спецкурс вы можете позже перезачесть в учебной части на 4м курсе (по учебному плану вам тогда нужно проходить спецкурс по выбору).

Требования к слушателям

Необходимы базовые знания по математическому анализу, линейной алгебре и теории вероятностей. Предварительных знаний по нейронным сетям и методам обработки изображений не требуется.


Программа курса

  • Введение в глубокое обучение.
  • Многослойный персептрон. Основные функции активации и функции потерь.
  • Автокодировщик.
  • Работа в среде Jupyter Lab, Jupyter Notebook. Средства отладки кода.
  • Методы оптимизации нейросетей.
  • Основы работы с PyTorch, автоматическое дифференцирование, реализация простейших нейросетей.
  • Операции свёртки и пулинга. Свёрточные нейросети для обработки текстов и изображений.
  • Основные свёрточные архитектуры для классификации изображений.
  • Реализация свёрточных сетей и использование предобученных сетей в PyTorch.
  • Сегментация изображений.
  • Реализация задачи супер-разрешения (super-resolution) и сиамских сетей в PyTorch.
  • Задача переноса стиля и её практическая реализация.
  • Генеративно-состязательные сети.
  • Реализация генеративно-состязательных сетей в PyTorch.

Практикум

В рамках практикума необходимо реализовать улучшенния базовых архитектур, разобранных на практических семинарах. От студентов второго курса дополнительно требуется сделать презентацию свежей статьи по теме компьютерного зрения и предложить идеи её улучшений.

Регистрация на курс

Регистрация на курс происходит на самом спецкурсе по факту посещения, дополнительные действия не требуются.

Лектор

Виктор Владимирович Китов, к.ф.-м.н., преподаватель кафедры математических методов прогнозирования ВМК МГУ.

Почта: v.v.kitov(at)yandex.ru.

Время занятий

По понедельникам 16:50 - 18:20, ауд. 510.

Первое занятие - 17.02.2025.

Экзамен

Оценка за спецкурс ставится только по результатам устного экзамена и сдачи практикума.

Рекомендуемые ресурсы