Участник:Oleg Bakhteev
Материал из MachineLearning.
Бахтеев Олег Юрьевич
МФТИ, ФУПМ
Кафедра «Интеллектуальные системы»
Направление «Интеллектуальный анализ данных»
bakhteev@phystech.edu
Весна 2014, 8 семестр
Восстановление панельной матрицы и ранжирующей модели по метризованной выборке в разнородных шкалах
Работа посвящена восстановлению ежегодных изменений рейтингов студентов при собеседовании в учебный центр. Рассматривается выборка, состоящая з экспертных оценок студентов, проходивших собеседование в учебный центр в течение нескольких лет и итоговых рейтингов студентов. Шкалы экспертных оценок меняются из года в год, но шкала рейтингов остается неизменной. Требуется восстановить ранжирующую модель, не зависящую от времени. Задача сводится к восстановлению панельной матрицы (то есть матрицы объект–признак–год), ставящей во взаимное соответствие некоторого студента (или усредненный “портрет” студента) и его предполагаемую оценку на собеседованиях за каждый год, и исследованию ранжирующей модели, полученной на основе этой матрицы, а так же анализу ее устойчивости на протяжении нескольких лет. Предлагается метод восстановления панельной матрицы, основанный на решении многомерной задачи о назначениях. В качестве метода восстановления ранжирующей модели используется алгоритм многоклассовой классификации с отношением полного порядка на классах и алгоритм ранжирования, основанный на методе опорных векторов.
Публикация
Bakhteev O.Y., Strijov V.V. Panel matrix and ranking model recovery using
mixed-scale measured data // Central European Journal of Operations Research (CEJOR) (подано). PDF
Доклад на конференции
57-ая конференция МФТИ: доклад "Восстановление панельной матрицы и ранжирующей модели в разнородных шкалах"
Осень 2014, 9 семестр
Восстановление пропущенных значений в разнородных шкалах с большим числом пропусков
Рассматривается задача восстановления пропущенных значений в выборках, содер-
жащих значительное число пропусков. Вводится понятие устойчивости восстановления
пропуска, а также исследуется возможность применимости подхода для восстановления
пропущенных значений. Исследуется случай, когда восстановление производится по k бли-
жайшим соседям. Рассматриваются теоретические аспекты применимости данного под-
хода для сильно разреженных данных. Рассматривается вариант восстановления пропу-
щенных значений с использованием восстановленных значений в качестве источника для
восстановления других элементов.
Публикация
Бахтеев О.Ю. Восстановление пропущенных значений в
разнородных шкалах с большим числом пропусков (готовится к подаче).
PDF