Классификация пациентов с сердечно-сосудистыми заболеваниями (отчет)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Постановка задачи)
(Постановка задачи)
Строка 27: Строка 27:
== Постановка задачи ==
== Постановка задачи ==
-
Дана обучающая выборка <tex>X^l = (x_i, y_i)_{i=1}^l, ~ l = 66</tex>, где
+
Дана обучающая выборка <tex>X^l = (x_i, y_i)_{i=1}^l, ~~ l = 66</tex>, где
<tex>x_i \in \mathbb{R}^{20}</tex>, <tex>y_i \in \{A_1, A_3, B_1, B_2\}</tex>.
<tex>x_i \in \mathbb{R}^{20}</tex>, <tex>y_i \in \{A_1, A_3, B_1, B_2\}</tex>.
Требуется подобрать вектор параметров <tex>w</tex> алгоритма классификации
Требуется подобрать вектор параметров <tex>w</tex> алгоритма классификации

Версия 11:33, 3 февраля 2010

Введение в проект

Описание проекта

Цель проекта

Цель проекта - классификация пациентов с подозрением на сердечно-сосудистые заболевания по группам риска.

Обоснование проекта

Полученные результаты могут быть использованы для предварительной диагностики заболевания у пациентов.

Описание данных

Дан список 100 пациентов с указанием их группы риска(по экспертной оценке) и результатов их анализов по 20 параметрам.

Критерии качества

Критерием качества является общее количество ошибок классификации. При этом не допускается более 1 ошибки для пациентов групп риска A1(уже прооперированные больные) и A3(больные с высокой вероятностью заболевания).

Требования к проекту

Алгоритм не должен допускать более одной ошибки по группам риска A1 и A3, а также минимальное количество ошибок по остальным группам риска.

Выполнимость проекта

Особенностями данных, которые могут затруднить выполнение проекта, являются малое количество прецедентов по некоторым группам риска(в особенности A2) и наличие пропусков в данных.

Используемые методы

Предполагается использовать линейные алгоритмы классификации, в частности SVM.

Постановка задачи

Дана обучающая выборка X^l = (x_i, y_i)_{i=1}^l, ~~ l = 66, где x_i \in \mathbb{R}^{20}, y_i \in \{A_1, A_3, B_1, B_2\}. Требуется подобрать вектор параметров w алгоритма классификации RKM, который минимизирует функционал скользящего контроля: LOO(w,
X^l) = \sum_{i=1}^l [a(x_i, X^l\backslash x_i, w) \neq y_i]
\rightarrow \min_w.

Описание алгоритмов

Обзор литературы

Базовые предположения

Математическое описание

Варианты или модификации

Описание системы

  • Ссылка на файл system.docs
  • Ссылка на файлы системы

Отчет о вычислительных экспериментах

Визуальный анализ работы алгоритма

Анализ качества работы алгоритма

Анализ зависимости работы алгоритма от параметров

Отчет о полученных результатах

Список литературы

Данная статья является непроверенным учебным заданием.
Студент: Участник:Максим Панов
Преподаватель: Участник:В.В. Стрижов
Срок: 15 декабря 2009

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.