Участник:Andriygav

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Текущая версия (06:00, 10 сентября 2024) (править) (отменить)
 
(10 промежуточных версий не показаны.)
Строка 1: Строка 1:
-
== Личная информация ==
+
{{TOCright}}
-
*Грабовой Андрей
+
{| style="border:0px;"
-
*[[МФТИ]], [[ФУПМ]]
+
|-
-
*[[Интеллектуальные системы (кафедра МФТИ)|Интеллектуальные системы]]
+
|[[Изображение:GrabovoyFace.jpg|150px]]   
-
*Интеллектуальный анализ данных
+
|'''Грабовой Андрей Валериевич'''
-
*E-mail: grabovoy.av@phystech.edu, andriy.graboviy@mail.ru
+
-
== Весна 2018, 6й семестр ==
+
к.ф.-м.н.,
-
'''Автоматическое определение релевантности параметров нейросети'''<br/>
+
<br/>
-
''Работа посвящена оптимизации структуры нейронной сети. Предполагается, что число параметров нейросети можно существенно снизить без значимой потери качества и значимого повышения дисперсии функции ошибки. Предлагается метод прореживания параметров нейронной сети, основанный на автоматическом определении релевантности параметров. Для определения релевантности параметров предлагается проанализировать ковариационную матрицу апостериорного распределения параметров и удалить из нейросети мультикоррелирующие параметры. Для определения мультикорреляции используется метод Белсли. Для анализа качества представленного алгоритма проводятся эксперименты на выборке Boston Housing, а также на синтетических данных.'' <br/>
+
руководитель отдела исследований компании «[https://antiplagiat.ru Антиплагиат]»,
 +
<br/>
 +
доцента кафедры «Машинного обучения и цифровой гуманитаристики» [[МФТИ]],
 +
<br/>
 +
доцента кафедры «[https://intsystems.github.io/ru Интеллектуальные системы]» [[МФТИ]] ([[Интеллектуальные системы (кафедра МФТИ)|см.также]]),
 +
<br/>
 +
математик кафедры «[[Математические методы прогнозирования (кафедра ВМК МГУ)|Математические методы прогнозирования]]» [[ВМК МГУ]],
 +
|}
-
== Осень 2018, 7й семестр ==
+
* [https://orcid.org/0000-0002-4031-0025 Профиль ORCID = 0000-0002-4031-0025]
-
'''Численные методы оценки объема выборки в задачах регрессии и классификации'''<br/>
+
* [https://www.scopus.com/authid/detail.uri?authorId=57209653601 Профиль SCOPUS ID = 57209653601]
-
''Исследуется проблема снижения затрат на сбор данных, необходимых для построения адекватной модели. Решаются задачи регрессии и классификации. Для решения этих задач требуется, чтобы выборка содержала необходимое число объектов и не противоречила гипотезе порождения данных. Эта гипотеза состоит из предположений о составе выборки и свойствах модели, которая описывает ее оптимально, согласно принятому критерию. Адекватной называется модель, не противоречащая гипотезе порождения данных. Базовыми предположениями являются предположения о простоте и однородности выборки: выборка, необходимый объем которой требуется оценить, адекватно аппроксимируется одной обобщенно-линейной моделью. Предпочтительны те методы оценки объемы, которые позволяют строить адекватные модели по выборкам возможно меньшего объема. Данная работа анализирует численные свойства методов, используемых для оценки выборки на практике и предлагает пути их улучшения. В анализ включены как методы, оценивающие объем выборки исходя из гипотезы порождения данных, использующие эвристические предположения, так и методы, учитывающие структуру модели, которая будет построена. Вычислительный эксперимент включает часто используемые открытые выборки, а также синтетически сгенерированные выборки. '' <br/>
+
* [https://scholar.google.com/citations?user=ZtI9pgsAAAAJ Профиль Google Scholar]
 +
* [https://elibrary.ru/author_profile.asp?authorid=1221495 Профиль РИНЦ ID = 1221495]
 +
* [https://istina.msu.ru/profile/andriygav Профиль в системе ИСТИНА IRID = 609998735]
 +
* [https://www.mathnet.ru/php/person.phtml?personid=151213&option_lang=rus Профиль MathNet.ru]
-
== Весна 2019, 8й семестр ==
+
== Учебные материалы ==
-
'''Анализ свойств локальных моделей в задачах кластеризации временных рядов'''<br/>
+
=== Курсы лекций и семинаров ===
-
''Данная работа посвящена анализу периодических сигналов во временных рядах с целью распознавания физических действий человека с помощью акселерометра. Предлагается метод кластеризации точек временного ряда для поиска характерных квазипериодических сегментов временного ряда. Временные ряды являются объектами сложной структуры, для которых не задано исходное признаковое описание. В качестве признакового описания точек временного ряда рассматриваются главные компоненты локальной окрестности фазовой траектории вблизи данной точки. Для оценки близости двух точек временного ряда вычисляется расстояние между данными точками в построенном пространстве признаков. При помощи матрицы попарных расстояний между точками временного ряда выполняется кластеризация данных точек. Для анализа качества представленного алгоритма проводятся эксперименты на синтетических данных и данных полученных при помощи мобильного акселерометра. Проводится эксперимент с поиском начала квазипериодических сегментов внутри каждого кластера.'' <br/>
+
* [https://github.com/andriygav/PSAD Прикладной статистический анализ данных] — альтернативный семестровый курс, [[МФТИ]].
 +
* [https://github.com/andriygav/MachineLearningSeminars Машинное обучение (семинары к курсу лекций, К.В.Воронцов)] — годовой курс, [[МФТИ]].
 +
* [https://intsystems.github.io/course/rnd_in_ai/index.html Создание интеллектуальных систем] — семестровый курс, [[МФТИ]].
 +
* [https://intsystems.github.io/course/automation_scientific_research/index.html Моя первая научная статья] — семестровый курс, [[МФТИ]], [[ВМК МГУ]]([[ММП]]).
-
'''Ранее прогнозирования достаточного объема выборки'''<br/>
+
== Научная деятельность ==
-
''Исследуется проблема снижения затрат на сбор данных, необходимых для построения адекватной модели. Рассматриваются задачи линейной и логистической моделей. Для решения этих задач требуется, чтобы выборка содержала необходимое число объектов. Требуется предложить метод вычисления оптимального обьема данных, соблюдая при этом баланс между точностью модели и и трудозатратами при сборе данных. Предпочтительны те методы оценки объемы, которые позволяют строить адекватные модели по выборкам возможно меньшего объема. '' <br/>
+
=== Научные статьи ===
 +
* Artificially generated text fragments search in academic documents / G. M. Gritsay, A. V. Grabovoy, A. S. Kildyakov, Y. V. Chekhovich // Doklady Mathematics. — 2024.
 +
* Gritsay G., Grabovoy A. Automated text identification on languages of the iberian peninsula: Llm and bert-based models aggregation // Proceedings of the Iberian Languages Evaluation Forum (IberLEF 2024) co-located with the Conference of the Spanish Society for Natural Language Processing (SEPLN 2024). — Vol. 3756 of CEUR Workshop Proceedings. — CEUR-WS.org: 2024.
 +
* Chekhovich Y., Grabovoy A., Gritsai G. Generative ai models with their full reveal* // 2024 4th International Conference on Technology Enhanced Learning in Higher Education (TELE). — Vol. 1. — IEEE: 2024. — P. 17–22.
 +
* Image plagiarism detection pipeline for vast databases / M. Kaprielova, A. Grabovoy, K. Varlamova et al. // 2024 35th Conference of Open Innovations Association (FRUCT). — IEEE: 2024. — P. 328–335.
 +
* Gritsai G., Khabutdinov I., Grabovoy A. Multi-head span-based detector for ai-generated fragments in scientific papers // Proceedings of the Fourth Workshop on Scholarly Document Processing (SDP 2024). — Association for Computational Linguistics Bangkok, Thailand: 2024. — P. 220–225.
 +
* Rugector: Rule-based neural network model for russian language grammatical error correction / I. A. Khabutdinov, A. V. Chashchin, A. V. Grabovoy et al. // Programming and Computer Software. — 2024. — Vol. 50, no. 4. — P. 315–321.
 +
* Text reuse detection in handwritten documents / A. V. Grabovoy, M. S. Kaprielova, A. S. Kildyakov et al. // Doklady Mathematics. — 2024.
 +
* Asvarov A., Grabovoy A. The impact of multilinguality and tokenization on statistical machine translation // 2024 35th Conference of Open Innovations Association (FRUCT). — IEEE: 2024. — P. 149–157.
 +
* Automated text identification: Multilingual transformer-based models approach / G. Gritsay, A. Grabovoy, A. Kildyakov, Y. Chekhovich // Proceedings of the Iberian Languages Evaluation Forum (IberLEF 2023) co-located with the Conference of the Spanish Society for Natural Language Processing (SEPLN 2023). — Vol. 3496 of CEUR Workshop Proceedings. — CEUR-WS.org: 2023.
 +
* Varlamova K., Khabutdinov I., Grabovoy A. Automatic spelling correction for russian: Multiple error approach // 2023 Ivannikov Ispras Open Conference (ISPRAS). — IEEE: 2023. — P. 169–175.
 +
* Cross-language plagiarism detection: A case study of european languages academic works / O. Bakhteev, Y. Chekhovich, A. Grabovoy et al. // Academic Integrity: Broadening Practices, Technologies, and the Role of Students. — Vol. 4 of Ethics and Integrity in Educational Contexts. — New York: Springer International Publishing, 2023. — P. 143–161.
 +
* Avetisyan K., Gritsay G., Grabovoy A. Cross-lingual plagiarism detection: Two are better than one // Programming and Computer Software. — 2023. — Vol. 49, no. 4. — P. 346–354.
 +
* Ensembling models for the generation of queries to an altering search engine using reinforcement learning / D. Shodiev, I. Kopanichuk, A. Chashchin et al. // 2023 Ivannikov Ispras Open Conference (ISPRAS). — IEEE: 2023. — P. 144–149.
 +
* Hwr200: New open access dataset of handwritten texts images in russian / I. Potyashin, M. Kaprielova, Y. Chekhovich et al. // Proceedings of the International Conference “Dialogue. — Vol. 2023. — 2023.
 +
* Grashchenkov K., Grabovoy A., Khabutdinov I. A method of multilingual summarization for scientific documents // 2022 Ivannikov Ispras Open Conference (ISPRAS). — IEEE: 2022.
 +
* Bazarova A. I., Grabovoy A. V., Strijov V. V. Analysis of the properties of probabilistic models in expert-augmented learning problems // Automation and Remote Control. — 2022. — Vol. 83, no. 10. — P. 1527–1537.
 +
* Anti-distillation: Knowledge transfer from a simple model to the complex one / K. Petrushina, O. Bakhteev, A. Grabovoy, V. Strijov // 2022 Ivannikov Ispras Open Conference (ISPRAS). — IEEE: 2022.
 +
* Gritsay G., Grabovoy A., Chekhovich Y. Automatic detection of machine generated texts: Need more tokens // Ivannikov Memorial Workshop Proceedings 2022. — 2022.
 +
* Numerical methods of sufficient sample size estimation for generalised linear models / A. V. Grabovoy, T. T. Gadaev, A. P. Motrenko, V. V. Strijov // Lobachevskii Journal of Mathematics. — 2022. — Vol. 43, no. 9. — P. 2453–2462.
 +
* Grabovoy A. V., Strijov V. V. Probabilistic interpretation of the distillation problem // Automation and Remote Control. — 2022. — Vol. 83, no. 1. — P. 123–137.
 +
* Методы поиска почти-дубликатов рукописных документов в больших коллекциях текстов / О. Ю. Бахтеев, А. В. Грабовой, М. С. Каприелова и др. // Интеллектуализация обработки информации. 14-я Международная конференция. — Т. 14. — Москва: Российская академия наук, 2022. — С. 361–364.
 +
* Grabovoy A. V., Strijov V. V. Bayesian distillation of deep learning models // Automation and Remote Control. — 2021. — Vol. 82, no. 11. — P. 1846–1856.
 +
* Grabovoy A. V., Strijov V. V. Prior distribution selection for a mixture of experts // Computational Mathematics and Mathematical Physics. — 2021. — Vol. 61, no. 7. — P. 1140–1152.
 +
* Grabovoy A., Bakhteev O., Chekhovich Y. The automatic approach for scientific papers dating // Proceedings of the 2020 Ivannikov Ispras Open Conference. — Los Alamitos, CA, United States: IEEE Computer Society Press, 2021.
 +
* Грабовой А. В., Бахтеев О. Ю., Стрижов В. В. Ordering the set of neural network parameters // Информатика и ее применения. — 2020. — Vol. 14, no. 2.
 +
* Grabovoy A. V., Strijov V. V. Quasi-periodic time series clustering for human activity recognition // Lobachevskii Journal of Mathematics. — 2020. — Vol. 41, no. 3. — P. 333–339.
 +
* Грабовой А. В., Бахтеев О. Ю., Стрижов В. В. Estimation of the relevance of the neural network parameters // Информатика и ее применения. — 2019.
-
== Осень 2019, 9й семестр ==
+
=== Тезисы докладов ===
-
'''Введение отношения порядка на множестве параметров аппроксимирующих моделей'''<br/>
+
* Грабовой А. В., Хабутдинов И. Анализ работы bert-подобных моделей в задачах классификации грамматических ошибок на русском языке // Труды 65-й Всероссийской научной конференции МФТИ в честь 115-летия Л.Д.Ландау, 3–8 апреля 2023 г. Прикладная математика и информатика. — Физматкнига Москва: 2023. — С. 117.
-
''Исследуется проблема введения отношения порядка на множестве параметров сложных аппроксимирующих моделей. В качестве параметрических моделей исследуются линейные и нейросетевые модели. Порядок на множестве параметров задается при помощи ковариационной матрицы градиентов функции ошибки по параметрам модели. Предлагается использовать заданный порядок для фиксации параметров модели во время решения оптимизационной задачи. Предполагается, что после небольшого числа итераций алгоритма оптимизации некоторые параметры модели можно зафиксировать без значимой потери качества модели. Это позволит существенно понизить размерность задачи оптимизации. В вычислительном эксперименте сравниваются модели, в которых параметры фиксируются в соответствии с предложенным порядком с моделями, в которых параметры фиксируются произвольным образом.'' <br/>
+
* Грабовой А. В. Методы унификации исследовательского кода для повторяемости и масштабирования // Труды 65-й Всероссийской научной конференции МФТИ в честь 115-летия Л.Д.Ландау, 3–8 апреля 2023 г. Прикладная математика и информатика. — Физматкнига Москва: 2023. — С. 157–157.
 +
* Грицай Г., Грабовой А. Многозадачное обучение для распознавания машинно-сгенерированных текстов // Труды 65-й Всероссийской научной конференции МФТИ в честь 115-летия Л.Д.Ландау, 3–8 апреля 2023 г. Прикладная математика и информатика. — Физматкнига Москва: 2023. — С. 117–119.
 +
* Баязитов К. М., Грабовой А. В., Стрижов В. В. Дистилляция моделей глубокого обучения на многодоменных выборках // Интеллектуализация обработки информации: Тезисы докладов 14-й Международной конференции. — Москва: Российская академия наук, 2022. — С. 98–99.
 +
* Методы поиска почти-дубликатов рукописных документов в больших коллекциях текстов / О. Ю. Бахтеев, А. В. Грабовой, М. С. Каприелова и др. // Интеллектуализация обработки информации: Тезисы докладов 14-й Международной конференции. — Москва: Российская академия наук, 2022. — С. 361–362.
 +
* Cross-language plagiarism detection: a case study of european universities academic works / O. Bakhteev, Y. Chekhovich, G. Gorbachev et al. // EUROPEAN CONFERENCE ON ACADEMIC INTEGRITY AND PLAGIARISM. — Mendel University Brno: 2021. — P. 14–15.
 +
* Грабовой А. В., Стрижов В. В. Априорное распределение параметров в задачах выбора моделей глубокого обучения // Математические методы распознавания образов (ММРО-2021):Тезисы докладов 20-й Всероссийской конференции с международным участием. — Москва: Российская академия наук, 2021. — С. 142–143.
 +
* Грабовой А. В., Стрижов В. В. Байесовское выравнивание структур нейросетевых моделей // Труды 64-й Всероссийской научной конференции МФТИ 22-25 ноября 2021. Прикладная математика и информатика. — МФТИ Москва: 2021. — С. 148–149.
 +
* Многозадачное обучение в задаче рубрикации научных документов / О. В. Шевченко, К. В. Гращенков, А. В. Чащин, А. В. Грабовой // Математические методы распознавания образов (ММРО-2021):Тезисы докладов 20-й Всероссийской конференции с международным участием. — Москва: Российская академия наук, 2021. — С. 329–330.
 +
* Грабовой А. В., Стрижов В. В. Вероятностный подход к задаче привилегированного обучения и дистилляции // Труды 63-й Всероссийской научной конференции МФТИ. 23-29 ноября 2020 года. Прикладные математика и информатика. — М.: МФТИ, 2020. — С. 197–198.
 +
* Выбор моделей и ансамблей / В. В. Стрижов, А. А. Адуенко, О. Ю. Бахтеев и др. // Тезисы докладов 13-й Международной конференции Интеллектуализация обработки информации. — РАН Москва: 2020. — С. 16–17.
 +
* Грабовой А. В., Стрижов В. В. Задача обучения с экспертом для построение интерпретируемых моделей машинного обучения // Тезисы докладов 13-й Международной конференции Интеллектуализация обработки информации. — РАН Москва: 2020. — С. 16–17.
 +
* Базарова А. И., Грабовой А. В. Практическое применение математических методов и компьютерного зрения для железнодорожных задач распознавание фигур на изображении с помощью ансамбля моделей // Материалы Международного молодежного научного форума Ломоносов-2020 / Под ред. И. А. Алешковский, А. В. Андриянов, Е. А. Антипов. — Москва: ООО МАКС Пресс, 2020. — С. 137–138.
 +
* Грабовой А. В., Стрижов В. В. Анализ априорных распределений в задаче смеси экспертов // Труды 62-й Всероссийской научной конференции МФТИ. — Прикладные математика и информатика. — МФТИ М: 2019.
 +
* Грабовой А. В., Бахтеев О. Ю., Стрижов В. В. Введение отношения порядка на множестве параметров нейронной сети // Тезисы докладов 19-й Всероссийской конференции с международным участием. — Математические методы распознавания образов. — Москва: Российская академия наук, 2019. — С. 38–39.
 +
* Численные методы оценки оптимального объёма выборки для логистической и линейной регрессии / Т. Т. Гадаев, А. В. Грабовой, А. П. Мотренко, В. В. Стрижов // Тезисы докладов 19-й Всероссийской конференции с международным участием. — Математические методы распознавания образов. — Москва: Российская академия наук, 2019. — С. 40–41.
 +
* Грабовой А. В., Бахтеев О. Ю., Стрижов В. В. Определение релевантности параметров нейросети методом белсли // Тезисы докладов 12-й Международной конференции Интеллектуализация обработки информации (ИОИ-2018), Москва, Россия – Гаэта, Италия. — Интеллектуализация обработки информации. — TORUS PRESS: 2018. — С. 36–37.
 +
* Грабовой А. В., Бахтеев О. Ю., Стрижов В. В. Прореживание нейросетевых моделей методом Белсли // Труды 61-й всероссийской научной конференции МФТИ. — Прикладная математика и информатика. — МФТИ Москва: 2018. — С. 114–115.
-
'''Анализ выбора априорного распределения для смеси экспертов'''<br/>
+
=== Диссертации ===
-
''Данная работа посвящена анализу свойств смеси экспертов. Рассматриваются различные способы выбора априорного распределения. Анализируется случай, когда выбрано информативное и неинформативное априорные распределения параметров каждого эксперта. Экспертами рассматриваются линейные модели. Смесь экспертов это нейросеть с функцией softmax на последнем слое. Рассматривается задача поиска окружностей на изображении. Каждой окружности на изображении соответствует свой эксперт. Рассматривается два случая, с зависимыми и независимыми априорными распределениями параметрами локальных моделей~--- экспертов. Требуется найти на изображении синтетически сгенерированные окружности с разным уровнем шума. Сравнивается устойчивость к шуму смеси с заданными априорными распределениями на вектора параметров экспертов и без задания априорного распределения.'' <br/>
+
* Выпускная квалификационная работа (бакалаврская работа) под руководством В.В. Стрижова. Анализ свойств локальных моделей в задачах кластеризации временных рядов. 2019. МФТИ.
 +
* Выпускная квалификационная работа (магистерская работа) под руководством В.В. Стрижова. Обучение с экспертом для построения интерпретируемых моделей машинного обучения. 2021. МФТИ.
 +
* Кандидатская диссертация под руководством В.В. Стрижова. Априорное распределение параметров в задачах выбора моделей глубокого обучения. 2022. Д 002.073.05 ВЦ РАН.
-
== Весна 2020, 10й семестр ==
+
== Студенческие работы ==
-
'''Анализ моделей привилегированного обучения и дистилляции'''<br/>
+
-
''Данная работа посвящена методам понижения сложности аппроксимирующих моделей. Предлагается вероятностное обоснование методов дистилляции и привилегированного обучения. В работе приведены общие выводы для произвольной параметрической функции с наперед заданной структурой. Показано теоретическое обоснование для частных случаев: линейной и логистической регрессии. Теоретические результаты анализируются в вычислительном эксперименте на синтетических выборках и реальных данных. В качестве реальных данных рассматривается выборки FashionMNIST и Twitter Sentiment Analysis.
+
-
.'' <br/>
+
-
== Осень 2020, 11й семестр ==
+
===Бакалаврские диссертации===
-
'''Анализ свойств вероятностных моделей в задачах обучения с экспертом'''<br/>
+
# Игорь Игнашин. Байесовская дистилляция моделей на базе трансформеров. 2024. МФТИ.
-
''Данная работа посвящена построению интерпретируемых моделей в машинном обучении. Решается задача аппроксимации заданного набора фигур на контурном изображении. Вводятся предположения о том, что фигуры являются кривыми второго порядка. При аппроксимации фигур используется информация о типе, расположению и виде кривых, а также о множестве их возможных преобразований. Такая информация называется экспертной, а метод машинного обучения, основанный на экспертной информации, называется обучением с экспертом. Предполагается, что набор фигур аппроксимируется набором локальных моделей. Каждая локальная модель на основе экспертной информации аппроксимирует одну фигуру на контурном изображении. Для построение моделей предлагается отобразить кривые второго порядка в признаковое пространство, в котором каждая локальная модель является линейной моделью. Таким образом, кривые высших порядков расспознаются при помощи композиции линейных моделей. В качестве прикладной задачи рассматривается задача аппроксимации радужки глаза на контурном изображении.'' <br/>
+
# Никита Киселев. Байесовский подход к выбору оптимального размера выборки. 2024. МФТИ.
 +
# Алексей Орлов. Дистилляция моделей на мультидоменных выборках. 2024. МФТИ.
 +
# Анна Ремизова. Понижение размерности пространства обучаемых параметров в задаче адаптации модели к домену. 2024. МФТИ.
 +
# Анастасия Вознюк. Детекция машинно-сгенерированных фрагментов на базе анализа смены стиля текста. 2024. МФТИ.
 +
# Данил Дорин. Пространственно-временные характеристики в задаче декодирования временных рядов. 2024. МФТИ.
 +
# Камил Баязитов. Дистилляция моделей на многодоменных выборках. 2022. МФТИ. (научный консультант)
-
 
+
===Магистерские диссертации===
-
== Выступления на конференциях и семинарах ==
+
# Галина Кульдюшева. Исследование методов обработки юридических текстов с помощью NLP. 2024. МФТИ.
-
* 12 октября 2018. '''[[Интеллектуализация обработки информации (конференция)/2018|ИОИ-2018]]'''. '''[[Media:Grabovoy.pdf|Автоматическое определение релевантности параметров нейросети]]'''.
+
-
* 29 ноября 2018. '''61-я Всероссийская научная конференция МФТИ'''. '''Поиск оптимальной модели при помощи алгоритмов прореживания'''.
+
-
* 25 ноября 2019. '''62-я Всероссийская научная конференция МФТИ'''. '''Анализ априорных распределений в задаче смеси экспертов'''.
+
-
* 28 ноября 2019. '''[[Математические методы распознавания образов (конференция)/Программа ММРО-19|ММРО-2019]]'''. ''[[Media:GrabovoyMMPR201928.pdf|Введение отношения порядка на множестве параметров нейронной сети]]'''.
+
-
* 28 ноября 2020. '''63-я Всероссийская научная конференция МФТИ'''. '''Привилегированная информация и дистилляция моделей'''.
+
-
* 8 декабря 2020. '''[[Интеллектуализация обработки информации (конференция)/2020|ИОИ-2020]]'''. ''Задача обучения с экспертом для построение интерпретируемых моделей машинного обучения'''.
+
-
 
+
-
== Публикации ==
+
-
* Грабовой А.В., Бахтеев О.Ю., Стрижов В.В. Определение релевантности параметров нейросети // Информатика и ее применения, 2019, 13(2).
+
-
* Грабовой А.В., Бахтеев О. Ю., Стрижов В.В. Введение отношения порядка на множестве параметров аппроксимирующих моделей // Информатика и ее применения, 2020, 14(2).
+
-
* A. Grabovoy, V. Strijov. Quasi-periodic time series clustering for human. Lobachevskii Journal of Mathematics, 2020, 41(3).
+
-
* Грабовой А.В., Стрижов В.В. Анализ выбора априорного распределения для смеси экспертов // Журнал Вычислительной математики и математической физики, 2021. 61(5).
+
-
* Грабовой А.В., Стрижов В.В. Анализ моделей привилегированного обучения и дистилляции // Автоматика и телемеханика, 2021 (текущая работа, на рецензировании)
+

Текущая версия

Содержание

    Грабовой Андрей Валериевич

к.ф.-м.н.,
руководитель отдела исследований компании «Антиплагиат»,
доцента кафедры «Машинного обучения и цифровой гуманитаристики» МФТИ,
доцента кафедры «Интеллектуальные системы» МФТИ (см.также),
математик кафедры «Математические методы прогнозирования» ВМК МГУ,

Учебные материалы

Курсы лекций и семинаров

Научная деятельность

Научные статьи

  • Artificially generated text fragments search in academic documents / G. M. Gritsay, A. V. Grabovoy, A. S. Kildyakov, Y. V. Chekhovich // Doklady Mathematics. — 2024.
  • Gritsay G., Grabovoy A. Automated text identification on languages of the iberian peninsula: Llm and bert-based models aggregation // Proceedings of the Iberian Languages Evaluation Forum (IberLEF 2024) co-located with the Conference of the Spanish Society for Natural Language Processing (SEPLN 2024). — Vol. 3756 of CEUR Workshop Proceedings. — CEUR-WS.org: 2024.
  • Chekhovich Y., Grabovoy A., Gritsai G. Generative ai models with their full reveal* // 2024 4th International Conference on Technology Enhanced Learning in Higher Education (TELE). — Vol. 1. — IEEE: 2024. — P. 17–22.
  • Image plagiarism detection pipeline for vast databases / M. Kaprielova, A. Grabovoy, K. Varlamova et al. // 2024 35th Conference of Open Innovations Association (FRUCT). — IEEE: 2024. — P. 328–335.
  • Gritsai G., Khabutdinov I., Grabovoy A. Multi-head span-based detector for ai-generated fragments in scientific papers // Proceedings of the Fourth Workshop on Scholarly Document Processing (SDP 2024). — Association for Computational Linguistics Bangkok, Thailand: 2024. — P. 220–225.
  • Rugector: Rule-based neural network model for russian language grammatical error correction / I. A. Khabutdinov, A. V. Chashchin, A. V. Grabovoy et al. // Programming and Computer Software. — 2024. — Vol. 50, no. 4. — P. 315–321.
  • Text reuse detection in handwritten documents / A. V. Grabovoy, M. S. Kaprielova, A. S. Kildyakov et al. // Doklady Mathematics. — 2024.
  • Asvarov A., Grabovoy A. The impact of multilinguality and tokenization on statistical machine translation // 2024 35th Conference of Open Innovations Association (FRUCT). — IEEE: 2024. — P. 149–157.
  • Automated text identification: Multilingual transformer-based models approach / G. Gritsay, A. Grabovoy, A. Kildyakov, Y. Chekhovich // Proceedings of the Iberian Languages Evaluation Forum (IberLEF 2023) co-located with the Conference of the Spanish Society for Natural Language Processing (SEPLN 2023). — Vol. 3496 of CEUR Workshop Proceedings. — CEUR-WS.org: 2023.
  • Varlamova K., Khabutdinov I., Grabovoy A. Automatic spelling correction for russian: Multiple error approach // 2023 Ivannikov Ispras Open Conference (ISPRAS). — IEEE: 2023. — P. 169–175.
  • Cross-language plagiarism detection: A case study of european languages academic works / O. Bakhteev, Y. Chekhovich, A. Grabovoy et al. // Academic Integrity: Broadening Practices, Technologies, and the Role of Students. — Vol. 4 of Ethics and Integrity in Educational Contexts. — New York: Springer International Publishing, 2023. — P. 143–161.
  • Avetisyan K., Gritsay G., Grabovoy A. Cross-lingual plagiarism detection: Two are better than one // Programming and Computer Software. — 2023. — Vol. 49, no. 4. — P. 346–354.
  • Ensembling models for the generation of queries to an altering search engine using reinforcement learning / D. Shodiev, I. Kopanichuk, A. Chashchin et al. // 2023 Ivannikov Ispras Open Conference (ISPRAS). — IEEE: 2023. — P. 144–149.
  • Hwr200: New open access dataset of handwritten texts images in russian / I. Potyashin, M. Kaprielova, Y. Chekhovich et al. // Proceedings of the International Conference “Dialogue. — Vol. 2023. — 2023.
  • Grashchenkov K., Grabovoy A., Khabutdinov I. A method of multilingual summarization for scientific documents // 2022 Ivannikov Ispras Open Conference (ISPRAS). — IEEE: 2022.
  • Bazarova A. I., Grabovoy A. V., Strijov V. V. Analysis of the properties of probabilistic models in expert-augmented learning problems // Automation and Remote Control. — 2022. — Vol. 83, no. 10. — P. 1527–1537.
  • Anti-distillation: Knowledge transfer from a simple model to the complex one / K. Petrushina, O. Bakhteev, A. Grabovoy, V. Strijov // 2022 Ivannikov Ispras Open Conference (ISPRAS). — IEEE: 2022.
  • Gritsay G., Grabovoy A., Chekhovich Y. Automatic detection of machine generated texts: Need more tokens // Ivannikov Memorial Workshop Proceedings 2022. — 2022.
  • Numerical methods of sufficient sample size estimation for generalised linear models / A. V. Grabovoy, T. T. Gadaev, A. P. Motrenko, V. V. Strijov // Lobachevskii Journal of Mathematics. — 2022. — Vol. 43, no. 9. — P. 2453–2462.
  • Grabovoy A. V., Strijov V. V. Probabilistic interpretation of the distillation problem // Automation and Remote Control. — 2022. — Vol. 83, no. 1. — P. 123–137.
  • Методы поиска почти-дубликатов рукописных документов в больших коллекциях текстов / О. Ю. Бахтеев, А. В. Грабовой, М. С. Каприелова и др. // Интеллектуализация обработки информации. 14-я Международная конференция. — Т. 14. — Москва: Российская академия наук, 2022. — С. 361–364.
  • Grabovoy A. V., Strijov V. V. Bayesian distillation of deep learning models // Automation and Remote Control. — 2021. — Vol. 82, no. 11. — P. 1846–1856.
  • Grabovoy A. V., Strijov V. V. Prior distribution selection for a mixture of experts // Computational Mathematics and Mathematical Physics. — 2021. — Vol. 61, no. 7. — P. 1140–1152.
  • Grabovoy A., Bakhteev O., Chekhovich Y. The automatic approach for scientific papers dating // Proceedings of the 2020 Ivannikov Ispras Open Conference. — Los Alamitos, CA, United States: IEEE Computer Society Press, 2021.
  • Грабовой А. В., Бахтеев О. Ю., Стрижов В. В. Ordering the set of neural network parameters // Информатика и ее применения. — 2020. — Vol. 14, no. 2.
  • Grabovoy A. V., Strijov V. V. Quasi-periodic time series clustering for human activity recognition // Lobachevskii Journal of Mathematics. — 2020. — Vol. 41, no. 3. — P. 333–339.
  • Грабовой А. В., Бахтеев О. Ю., Стрижов В. В. Estimation of the relevance of the neural network parameters // Информатика и ее применения. — 2019.

Тезисы докладов

  • Грабовой А. В., Хабутдинов И. Анализ работы bert-подобных моделей в задачах классификации грамматических ошибок на русском языке // Труды 65-й Всероссийской научной конференции МФТИ в честь 115-летия Л.Д.Ландау, 3–8 апреля 2023 г. Прикладная математика и информатика. — Физматкнига Москва: 2023. — С. 117.
  • Грабовой А. В. Методы унификации исследовательского кода для повторяемости и масштабирования // Труды 65-й Всероссийской научной конференции МФТИ в честь 115-летия Л.Д.Ландау, 3–8 апреля 2023 г. Прикладная математика и информатика. — Физматкнига Москва: 2023. — С. 157–157.
  • Грицай Г., Грабовой А. Многозадачное обучение для распознавания машинно-сгенерированных текстов // Труды 65-й Всероссийской научной конференции МФТИ в честь 115-летия Л.Д.Ландау, 3–8 апреля 2023 г. Прикладная математика и информатика. — Физматкнига Москва: 2023. — С. 117–119.
  • Баязитов К. М., Грабовой А. В., Стрижов В. В. Дистилляция моделей глубокого обучения на многодоменных выборках // Интеллектуализация обработки информации: Тезисы докладов 14-й Международной конференции. — Москва: Российская академия наук, 2022. — С. 98–99.
  • Методы поиска почти-дубликатов рукописных документов в больших коллекциях текстов / О. Ю. Бахтеев, А. В. Грабовой, М. С. Каприелова и др. // Интеллектуализация обработки информации: Тезисы докладов 14-й Международной конференции. — Москва: Российская академия наук, 2022. — С. 361–362.
  • Cross-language plagiarism detection: a case study of european universities academic works / O. Bakhteev, Y. Chekhovich, G. Gorbachev et al. // EUROPEAN CONFERENCE ON ACADEMIC INTEGRITY AND PLAGIARISM. — Mendel University Brno: 2021. — P. 14–15.
  • Грабовой А. В., Стрижов В. В. Априорное распределение параметров в задачах выбора моделей глубокого обучения // Математические методы распознавания образов (ММРО-2021):Тезисы докладов 20-й Всероссийской конференции с международным участием. — Москва: Российская академия наук, 2021. — С. 142–143.
  • Грабовой А. В., Стрижов В. В. Байесовское выравнивание структур нейросетевых моделей // Труды 64-й Всероссийской научной конференции МФТИ 22-25 ноября 2021. Прикладная математика и информатика. — МФТИ Москва: 2021. — С. 148–149.
  • Многозадачное обучение в задаче рубрикации научных документов / О. В. Шевченко, К. В. Гращенков, А. В. Чащин, А. В. Грабовой // Математические методы распознавания образов (ММРО-2021):Тезисы докладов 20-й Всероссийской конференции с международным участием. — Москва: Российская академия наук, 2021. — С. 329–330.
  • Грабовой А. В., Стрижов В. В. Вероятностный подход к задаче привилегированного обучения и дистилляции // Труды 63-й Всероссийской научной конференции МФТИ. 23-29 ноября 2020 года. Прикладные математика и информатика. — М.: МФТИ, 2020. — С. 197–198.
  • Выбор моделей и ансамблей / В. В. Стрижов, А. А. Адуенко, О. Ю. Бахтеев и др. // Тезисы докладов 13-й Международной конференции Интеллектуализация обработки информации. — РАН Москва: 2020. — С. 16–17.
  • Грабовой А. В., Стрижов В. В. Задача обучения с экспертом для построение интерпретируемых моделей машинного обучения // Тезисы докладов 13-й Международной конференции Интеллектуализация обработки информации. — РАН Москва: 2020. — С. 16–17.
  • Базарова А. И., Грабовой А. В. Практическое применение математических методов и компьютерного зрения для железнодорожных задач распознавание фигур на изображении с помощью ансамбля моделей // Материалы Международного молодежного научного форума Ломоносов-2020 / Под ред. И. А. Алешковский, А. В. Андриянов, Е. А. Антипов. — Москва: ООО МАКС Пресс, 2020. — С. 137–138.
  • Грабовой А. В., Стрижов В. В. Анализ априорных распределений в задаче смеси экспертов // Труды 62-й Всероссийской научной конференции МФТИ. — Прикладные математика и информатика. — МФТИ М: 2019.
  • Грабовой А. В., Бахтеев О. Ю., Стрижов В. В. Введение отношения порядка на множестве параметров нейронной сети // Тезисы докладов 19-й Всероссийской конференции с международным участием. — Математические методы распознавания образов. — Москва: Российская академия наук, 2019. — С. 38–39.
  • Численные методы оценки оптимального объёма выборки для логистической и линейной регрессии / Т. Т. Гадаев, А. В. Грабовой, А. П. Мотренко, В. В. Стрижов // Тезисы докладов 19-й Всероссийской конференции с международным участием. — Математические методы распознавания образов. — Москва: Российская академия наук, 2019. — С. 40–41.
  • Грабовой А. В., Бахтеев О. Ю., Стрижов В. В. Определение релевантности параметров нейросети методом белсли // Тезисы докладов 12-й Международной конференции Интеллектуализация обработки информации (ИОИ-2018), Москва, Россия – Гаэта, Италия. — Интеллектуализация обработки информации. — TORUS PRESS: 2018. — С. 36–37.
  • Грабовой А. В., Бахтеев О. Ю., Стрижов В. В. Прореживание нейросетевых моделей методом Белсли // Труды 61-й всероссийской научной конференции МФТИ. — Прикладная математика и информатика. — МФТИ Москва: 2018. — С. 114–115.

Диссертации

  • Выпускная квалификационная работа (бакалаврская работа) под руководством В.В. Стрижова. Анализ свойств локальных моделей в задачах кластеризации временных рядов. 2019. МФТИ.
  • Выпускная квалификационная работа (магистерская работа) под руководством В.В. Стрижова. Обучение с экспертом для построения интерпретируемых моделей машинного обучения. 2021. МФТИ.
  • Кандидатская диссертация под руководством В.В. Стрижова. Априорное распределение параметров в задачах выбора моделей глубокого обучения. 2022. Д 002.073.05 ВЦ РАН.

Студенческие работы

Бакалаврские диссертации

  1. Игорь Игнашин. Байесовская дистилляция моделей на базе трансформеров. 2024. МФТИ.
  2. Никита Киселев. Байесовский подход к выбору оптимального размера выборки. 2024. МФТИ.
  3. Алексей Орлов. Дистилляция моделей на мультидоменных выборках. 2024. МФТИ.
  4. Анна Ремизова. Понижение размерности пространства обучаемых параметров в задаче адаптации модели к домену. 2024. МФТИ.
  5. Анастасия Вознюк. Детекция машинно-сгенерированных фрагментов на базе анализа смены стиля текста. 2024. МФТИ.
  6. Данил Дорин. Пространственно-временные характеристики в задаче декодирования временных рядов. 2024. МФТИ.
  7. Камил Баязитов. Дистилляция моделей на многодоменных выборках. 2022. МФТИ. (научный консультант)

Магистерские диссертации

  1. Галина Кульдюшева. Исследование методов обработки юридических текстов с помощью NLP. 2024. МФТИ.
Личные инструменты