Нейросетевые методы обработки изображений (В.В.Китов)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (Лекции)
Текущая версия (20:33, 17 февраля 2025) (править) (отменить)
 
(31 промежуточная версия не показана)
Строка 3: Строка 3:
==О курсе==
==О курсе==
-
Спецкурс проходит на ф-те ВМиК в весеннем семестре и посвящен задаче автоматической стилизации изображений, в которой входное изображение необходимо отобразить в стиле, задаваемым другим изображением. Например, это может быть стилизация семейной фотографии под стиль известного художника, либо стилизация дневного фото в ночное, либо преобразование зимней панорамы в летнюю. Для решения задачи предлагаются современные подгоды переноса стиля (style transfer) и генеративно-состязательные сети (generative adversarial networks). Эта задача широко используется в индустрии разлечений (например, мобильное приложение Prisma было самым скачиваемым на Android в странах СНГ в течение 10 дней после выхода), обработке фотографий и дизайне (функции стилизации были добавлены в Adobe Photoshop 2021), а также может применяться в мультипликации, наложении спецэффектов в фильмах, видеоиграх и средствах дополненной реальности, а также для более точной настройки методов машинного при обучении на одной предметной области, а применении модели к другой (transfer learning). Помимо изображений указанный подход применим для видеопоследовательностей и данных из других предметных областей (текст, речь и музыка). Основные методы стилизации были предложены в последние 7 лет и опираются на глубокие нейронные сети, базовому изучению которых посвящена начальная часть курса.
+
Спецкурс проходит на ф-те ВМиК в весеннем семестре и посвящен задаче автоматической стилизации изображений, в которой входное изображение необходимо отобразить в стиле, задаваемым другим изображением. Например, это может быть стилизация семейной фотографии под стиль известного художника, либо стилизация дневного фото в ночное, либо преобразование фотогрфии в схематичную книжную иллюстрацию. Для решения задачи существуют современные подходы переноса стиля (style transfer) и генеративно-состязательные сети (generative adversarial networks). Эта задача широко используется в индустрии разлечений (например, мобильное приложение Prisma было самым скачиваемым на Android в странах СНГ в течение 10 дней после выхода), при обработке фотографий и дизайне (функции стилизации были добавлены в Adobe Photoshop 2021), может применяться в мультипликации, наложении спецэффектов в фильмах, видеоиграх и средствах дополненной реальности, а также для более точной настройки методов машинного при обучении на одной предметной области, а применении модели к другой (transfer learning). Помимо изображений указанный подход применим для видеопоследовательностей и данных из других предметных областей (текст, речь и музыка). Основные методы стилизации были предложены в последние 7 лет и опираются на глубокие нейронные сети, базовому изучению которых посвящена начальная часть курса.
Занятия проходят в формате лекций. В процессе прохождения курса каждый студент должен сделать презентацию основных идей и подходов одной из недавних статей, посвященных стилизации изображений, а также представить свои идеи улучшений традиционных методов стилизации изображений и их обосновать.
Занятия проходят в формате лекций. В процессе прохождения курса каждый студент должен сделать презентацию основных идей и подходов одной из недавних статей, посвященных стилизации изображений, а также представить свои идеи улучшений традиционных методов стилизации изображений и их обосновать.
 +
 +
Пройденный спецкурс вы можете позже перезачесть в учебной части на 4м курсе (по учебному плану вам тогда нужно проходить спецкурс по выбору). Спецкурс познакомит вас с нейросетями - их основными архитектурами (многослойный персептрон, сверточная сеть, автокодировщик, генеративно-состязательные сети), что может служить преимуществом при распределении на кафедры соответствующей направленности.
 +
 +
==Регистрация на курс==
 +
Регистрация на курс происходит на самом спецкурсе по факту посещения, дополнительные действия не требуются.
==Лектор==
==Лектор==
-
[[Участник:Victor Kitov|Виктор Владимирович Китов]], к.ф.-м.н., преподаватель кафедры [[Mmp|математических методов прогнозирования]] [http://cmc.msu.ru ВМК МГУ]. Почта: v.v.kitov(at)yandex.ru.
+
[[Участник:Victor Kitov|Виктор Владимирович Китов]], к.ф.-м.н., преподаватель кафедры [[Mmp|математических методов прогнозирования]] [http://cmc.msu.ru ВМК МГУ].
 +
 
 +
Почта: v.v.kitov(at)yandex.ru.
==Время занятий==
==Время занятий==
-
Занятия проходят в удаленном формате по понедельникам 18-00 - 19-30 по [https://us06web.zoom.us/j/81357650774?pwd=RWZNZzl6VmJGNlo1eDJrZy9XN0xPQT09 ссылке].
 
-
Первое занятие 14 февраля.
 
-
==Лекции==
+
По понедельникам 16:50 - 18:20, ауд. 510.
-
[https://disk.yandex.ru/i/X92ZQYaDmJdMSA Нейросети. Многослойный персептрон.]
+
Первое занятие - 17.02.2025.
-
[https://disk.yandex.ru/i/ebaaTEilmOpmuw Оптимизация методами градиентного и стохастического градиентного спуска.]
+
==Лекции 2025==
-
[https://disk.yandex.ru/i/UwuewOCgomtK7Q DropOut, Batch-нормализация.]
+
Будут расширены практическими занятиями по работе в PyToch (загрузка данных, операции с тензорами, основные архитектуры, их настройка и оценка качества)
-
[https://disk.yandex.ru/i/1Myn1D-_A-nxRg Сверточные нейросети.]
 
-
[https://disk.yandex.ru/i/x9b8eq_JcWB_KQ Расширение выборки изображений.]
+
==Лекции 2024==
-
[https://disk.yandex.ru/i/ki9WMCubvdhdGA Архитектуры сверточных нейросетей для задачи классификации.]
+
[https://disk.yandex.ru/i/V2u_WSI3EhMETA Задачи глубокого обучения.]
-
[https://disk.yandex.ru/i/lZEK0TYOIg2Dhw Оптимизационный метод переноса стиля.]
+
[https://disk.yandex.ru/i/Sq3fbS8dcKzxWA Нейросети. Многослойный персептрон.]
-
[https://disk.yandex.ru/i/lLfe3zOC0IX28Q Трансформационный метод переноса стиля.]
+
[https://disk.yandex.ru/i/-mnCj8EseyXOUg Сверточные нейросети.]
-
[https://disk.yandex.ru/i/9jzeENMDEA3-eA Патчевый метод переноса стиля.]
+
[https://disk.yandex.ru/i/J9lZG_L9ZqVtcQ Расширение обучающей выборки.]
-
[https://disk.yandex.ru/i/ng48clrTsdE_6w Семантическая сегментация.]
+
[https://disk.yandex.ru/i/p_pzkp4U9dmknA Оптимизационный метод переноса стиля.]
-
[https://disk.yandex.ru/i/gN5hPPNT8V8EdQ Детекция объектов.]
+
[https://disk.yandex.ru/i/Q9TCAc5I0Uxx4g Трансформационный метод переноса стиля.]
-
[https://disk.yandex.ru/i/4RMfxk1Lg5eC9Q Технические улучшения методов стилизации изображений.]
+
[https://disk.yandex.ru/i/rcnl8o_q09dNiQ Патчевый метод переноса стиля.]
-
[https://disk.yandex.ru/i/GJQPwB02CJXoaA Концептуальные улучшения методов стилизации изображений.]
+
[https://disk.yandex.ru/i/zmo6vx8_6n3Z0Q Технические улучшения методов стилизации изображений.]
-
[https://disk.yandex.ru/i/f7D9e7dX-iOfjA Мульти-стилевые трансформационные модели.]
+
[https://disk.yandex.ru/i/j1nf8Ck13TCavQ Концептуальные улучшения методов стилизации изображений.]
-
[https://disk.yandex.ru/i/0nxeVzY-misuYw Стилизация видеоданных.]
+
[https://disk.yandex.ru/i/Ej2UQI4eiuNknw Мульти-стилевые трансформационные модели.]
-
[https://disk.yandex.ru/i/ps83_Hr5W_7P-g Генеративно-состязательные сети.]
+
[https://disk.yandex.ru/i/it6nzR-oULcZZA Стилизация видео-данных.]
-
[https://disk.yandex.ru/i/PuWnGsJKImCTqg Приложения генеративно-состязательных сетей.]
+
[https://disk.yandex.ru/i/SjTwiaO-gh_DWQ Генеративно-состязательные сети.]
-
Возможно добавление темы разнообразия результатов стилизации.
+
=Экзамен=
 +
Оценка за спецкурс ставится только по результатам устного экзамена.
=Рекомендуемые ресурсы=
=Рекомендуемые ресурсы=
-
* Примеры переноса стиля для видео: [https://www.youtube.com/watch?v=Khuj4ASldmU пример 1], [https://www.youtube.com/watch?v=vMyMUNvsGfQ пример 2], [https://www.youtube.com/watch?v=BcflKNzO31A пример 3].
+
* [https://deepmachinelearning.ru Глубокое машинное обучение], онлайн-учебник по машинному обучению и нейросетям.
-
* [https://arxiv.org/pdf/1705.04058.pdf Обзорная статья по переносу стиля для изображений.]
+
* [https://arxiv.org/pdf/1705.04058.pdf Обзорная статья по переносу стиля на изображениях.]
-
* [https://www.youtube.com/playlist?list=PL3FW7Lu3i5JvHM8ljYj-zLfQRF3EO8sYv Лекции курса в Стэнфорде по сверточным нейронным сетям.]
+
* [https://pytorch.org/tutorials/ Образовательные материалы по библиотеке PyTorch.]
-
* [http://www.pittnuts.com/2015/07/top-conferences-on-machine-learning-and-computer-vision/ Топовые конференции по машинному обучению и компьютерному зрению] (самые интересные статьи там)
+
* [https://scholar.google.ru/ Поиск google по статьям.]
* [https://scholar.google.ru/ Поиск google по статьям.]
-
* [https://pytorch.org/tutorials/ Образовательные материалы по библиотеке глубинного обучения PyTorch.]
 
-
* [http://d2l.ai/index.html Книга по глубинному обучению.]
 

Текущая версия


О курсе

Спецкурс проходит на ф-те ВМиК в весеннем семестре и посвящен задаче автоматической стилизации изображений, в которой входное изображение необходимо отобразить в стиле, задаваемым другим изображением. Например, это может быть стилизация семейной фотографии под стиль известного художника, либо стилизация дневного фото в ночное, либо преобразование фотогрфии в схематичную книжную иллюстрацию. Для решения задачи существуют современные подходы переноса стиля (style transfer) и генеративно-состязательные сети (generative adversarial networks). Эта задача широко используется в индустрии разлечений (например, мобильное приложение Prisma было самым скачиваемым на Android в странах СНГ в течение 10 дней после выхода), при обработке фотографий и дизайне (функции стилизации были добавлены в Adobe Photoshop 2021), может применяться в мультипликации, наложении спецэффектов в фильмах, видеоиграх и средствах дополненной реальности, а также для более точной настройки методов машинного при обучении на одной предметной области, а применении модели к другой (transfer learning). Помимо изображений указанный подход применим для видеопоследовательностей и данных из других предметных областей (текст, речь и музыка). Основные методы стилизации были предложены в последние 7 лет и опираются на глубокие нейронные сети, базовому изучению которых посвящена начальная часть курса.

Занятия проходят в формате лекций. В процессе прохождения курса каждый студент должен сделать презентацию основных идей и подходов одной из недавних статей, посвященных стилизации изображений, а также представить свои идеи улучшений традиционных методов стилизации изображений и их обосновать.

Пройденный спецкурс вы можете позже перезачесть в учебной части на 4м курсе (по учебному плану вам тогда нужно проходить спецкурс по выбору). Спецкурс познакомит вас с нейросетями - их основными архитектурами (многослойный персептрон, сверточная сеть, автокодировщик, генеративно-состязательные сети), что может служить преимуществом при распределении на кафедры соответствующей направленности.

Регистрация на курс

Регистрация на курс происходит на самом спецкурсе по факту посещения, дополнительные действия не требуются.

Лектор

Виктор Владимирович Китов, к.ф.-м.н., преподаватель кафедры математических методов прогнозирования ВМК МГУ.

Почта: v.v.kitov(at)yandex.ru.

Время занятий

По понедельникам 16:50 - 18:20, ауд. 510.

Первое занятие - 17.02.2025.

Лекции 2025

Будут расширены практическими занятиями по работе в PyToch (загрузка данных, операции с тензорами, основные архитектуры, их настройка и оценка качества)


Лекции 2024

Задачи глубокого обучения.

Нейросети. Многослойный персептрон.

Сверточные нейросети.

Расширение обучающей выборки.

Оптимизационный метод переноса стиля.

Трансформационный метод переноса стиля.

Патчевый метод переноса стиля.

Технические улучшения методов стилизации изображений.

Концептуальные улучшения методов стилизации изображений.

Мульти-стилевые трансформационные модели.

Стилизация видео-данных.

Генеративно-состязательные сети.

Экзамен

Оценка за спецкурс ставится только по результатам устного экзамена.

Рекомендуемые ресурсы

Личные инструменты