Нейросетевые методы обработки изображений (В.В.Китов)

Материал из MachineLearning.

Перейти к: навигация, поиск


О курсе

Спецкурс проходит на ф-те ВМиК в весеннем семестре и посвящен задаче автоматической стилизации изображений, в которой входное изображение необходимо отобразить в стиле, задаваемым другим изображением. Например, это может быть стилизация семейной фотографии под стиль известного художника, либо стилизация дневного фото в ночное, либо преобразование зимней панорамы в летнюю. Для решения задачи предлагаются современные подгоды переноса стиля (style transfer) и генеративно-состязательные сети (generative adversarial networks). Эта задача широко используется в индустрии разлечений (например, мобильное приложение Prisma было самым скачиваемым на Android в странах СНГ в течение 10 дней после выхода), обработке фотографий и дизайне (функции стилизации были добавлены в Adobe Photoshop 2021), а также может применяться в мультипликации, наложении спецэффектов в фильмах, видеоиграх и средствах дополненной реальности, а также для более точной настройки методов машинного при обучении на одной предметной области, а применении модели к другой (transfer learning). Помимо изображений указанный подход применим для видеопоследовательностей и данных из других предметных областей (текст, речь и музыка). Основные методы стилизации были предложены в последние 7 лет и опираются на глубокие нейронные сети, базовому изучению которых посвящена начальная часть курса.

Занятия проходят в формате лекций. В процессе прохождения курса каждый студент должен сделать презентацию основных идей и подходов одной из недавних статей, посвященных стилизации изображений, а также представить свои идеи улучшений традиционных методов стилизации изображений и их обосновать.

Лектор

Виктор Владимирович Китов, к.ф.-м.н., преподаватель кафедры математических методов прогнозирования ВМК МГУ. Почта: v.v.kitov(at)yandex.ru.

Время занятий

Занятия проходят в удаленном формате по понедельникам 18-00 - 19-30 по ссылке. Первое занятие 14 февраля.

Лекции

Нейросети. Многослойный персептрон.

Оптимизация методами градиентного и стохастического градиентного спуска.

DropOut, Batch-нормализация.

Сверточные нейросети.

Расширение выборки изображений.

Архитектуры сверточных нейросетей для задачи классификации.

Оптимизационный метод переноса стиля.

Патчевый метод переноса стиля.

Семантическая сегментация.

Детекция объектов.

Технические улучшения методов стилизации изображений.

Концептуальные улучшения методов стилизации изображений.

Трансформационный метод переноса стиля.

Мульти-стилевые трансформационные модели.

Стилизация видеоданных.

Генеративно-состязательные сети.

Приложения генеративно-состязательных сетей.

Рекомендуемые ресурсы