Теория Валианта

Материал из MachineLearning.

(Различия между версиями)

Перейти к: навигация, поиск

Версия 21:17, 1 января 2010

Данная статья является непроверенным учебным заданием.

Студент: Участник:DmitryKonstantinov

Преподаватель: Участник:Константин Воронцов

Срок: 8 января 2010

До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}.

См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.

Теория вероятно почти корректного обучения (теория Валианта, probably approximately correct, PAC-learning) — теория, предложенная Лесли Валиантом в 1984 году для математического анализа машинного обучения. Работа Валианта акцентирует внимание на том, что проблематика вычислительного обучения тесно связана также и с вопросам вычислительной сложности алгоритмов.

В теории вероятно почти корректного обучения обучаемый (learner) получает некоторый набор примеров и должен выбрать некоторую функцию (гипотезу) из определенного класса функций. Цель обучаемого состоит в том, чтобы с высокой вероятностью выбранная функция была, в некотором смысле, «похожа» на истинную гипотезу. Обучаемый должен быть эффективным (то есть использовать в процессе работы приемлемое количество вычислительных ресурсов).

Содержание

1 Вероятно почти корректное обучение
- 1.1 Основные понятия
- 1.2 Пример
2 Объем обучающей выборки (Sample complexity)
3 Вычислительная сложность обучения
4 Ссылки

Вероятно почти корректное обучение

Основные понятия

Обучаемый (learner) — объект, участвующий в процессе обучения. В данном контексте обучаемый — алгоритм.
Объекты на которых выполняется обучение назовём примерами. Поскольку нам будет важна вычислительная сложность, будем считать, что примеры задаются некоторым описанием — булевым вектором.
$X_n$ — множество примеров с описанием длины n.
$X = \bigcup_{n \geq 1} X_n$ — пространство примеров (instance space), множество всех возможных примеров.
$D: X_n \rightarrow [0,1]$ — (неизвестное) вероятностное распределение на пространстве примеров. x ~ D — означает, что x - случайная величина с распределением D.
Каждый пример имеет одну пометку, для простоты будем считать, что множество пометок состоит из двух элементов: {0,1}. Концепция(concept) — это функция, отображающая примеры на пометки. $F = \bigcup_{n \geq 1} F_n$ — семейство концепций, подмножество множества всех булевых функций, определенных на множестве X.
$f \in F_n$ — целевая концепция: то, что мы ищем в процессе обучения.
Гипотеза h — некоторая булева функция на множестве $X_n$ , которую выдает обучаемый. Гипотеза является предсказанием целевой концепции.
Ошибка гипотезы. $err_{f,D}(h)$ — вероятность того, что гипотеза h не совпадает с целевой концепцией f на случайном значении x ~ D: $err_{f,D}(h) = Pr_{x \sim D}[f(x) \neq h(x)]$ .

Пример

Объем обучающей выборки (Sample complexity)

Определение, теоремы

Вычислительная сложность обучения

Связь PAC-learning с классами сложности ( $P \neq NP$ ), математической криптографией (односторонние функции, криптосистемы)

Ссылки

Valiant L.G. A theory of the learnable // Communications of the ACM. — 1984 T. 27. — С. 1134-1142.

Источник — «http://recognition.su/wiki/index.php?title=%D0%A2%D0%B5%D0%BE%D1%80%D0%B8%D1%8F_%D0%92%D0%B0%D0%BB%D0%B8%D0%B0%D0%BD%D1%82%D0%B0»

Категория: Непроверенные учебные задания

@@ Строка 7: / Строка 7: @@
 == Вероятно почти корректное обучение ==
 ===Основные понятия ===
-* Обучаемый (learner)
+* Обучаемый (learner) — объект, участвующий в процессе обучения. В данном контексте обучаемый — алгоритм.
-* Пример, пространство примеров (instance space)
+* Объекты на которых выполняется обучение назовём примерами. Поскольку нам будет важна вычислительная сложность, будем считать, что примеры задаются некоторым описанием — булевым вектором.
-* Распределение примеров
+* <tex>X_n</tex> — множество примеров с описанием длины n.
-* Концепция(concept)
+* <tex>X = \bigcup_{n \geq 1} X_n</tex> — пространство примеров (instance space), множество всех возможных примеров.
-* Класс концепций
+* <tex>D: X_n \rightarrow [0,1]</tex> — (неизвестное) вероятностное распределение на пространстве примеров. x ~ D — означает, что x - случайная величина с распределением D.
-* Гипотеза
+* Каждый пример имеет одну пометку, для простоты будем  считать, что множество пометок состоит из двух элементов: {0,1}. Концепция(concept) — это функция, отображающая примеры на пометки. <tex>F = \bigcup_{n \geq 1} F_n</tex> — семейство концепций, подмножество множества всех булевых функций, определенных на множестве X.
-* Ошибка гипотезы
+* <tex>f \in F_n</tex> — целевая концепция: то, что мы ищем в процессе обучения.
-* Алгоритм вероятно почти корректного обучения
+* Гипотеза h — некоторая булева функция на множестве <tex>X_n</tex>, которую выдает обучаемый. Гипотеза является предсказанием целевой концепции.
+* Ошибка гипотезы. <tex>err_{f,D}(h)</tex> — вероятность того, что гипотеза h не совпадает с целевой концепцией f на случайном значении x ~ D: <tex>err_{f,D}(h) = Pr_{x \sim D}[f(x) \neq h(x)]</tex>.
 === Пример ===

Теория Валианта

Материал из MachineLearning.

Версия 21:17, 1 января 2010

Содержание

Вероятно почти корректное обучение

Основные понятия

Пример

Объем обучающей выборки (Sample complexity)

Вычислительная сложность обучения

Ссылки

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты