Обсуждение:Минимизация эмпирического риска
Материал из MachineLearning.
| Строка 1: | Строка 1: | ||
| - | Работа над статьёй велась в несколько этапов с использованием модели Gemini 3.1 Pro Preview. Поскольку старая версия статьи от 2008 года устарела и потеряла форматирование, было принято решение переписать её с нуля, совместив академическую строгость с понятностью для новичков. | + | Работа над статьёй велась в несколько этапов с использованием модели Gemini 3.1 Pro Preview. Поскольку старая версия статьи от 2008 года устарела и потеряла форматирование, было принято решение полностью переписать её с нуля, совместив академическую строгость с понятностью для новичков. |
| - | === Этап 1: | + | === Этап 1: Проектирование и RAG-контекст === |
| - | + | Для обеспечения максимального соответствия программе курса, в качестве контекста (Knowledge Base) модели на вход были поданы: | |
| + | 1. Исходный текст заготовки статьи от 2008 года на ML.ru. | ||
| + | 2. PDF-презентация первой лекции К.В. Воронцова "Основные понятия машинного обучения". | ||
| + | |||
| + | Был сформулирован следующий первый системный промпт: | ||
{{well|'''Роль:''' Ты — ведущий академический исследователь, эксперт на стыке машинного обучения (ML) и философии науки. | {{well|'''Роль:''' Ты — ведущий академический исследователь, эксперт на стыке машинного обучения (ML) и философии науки. | ||
| - | '''Задача:''' Написать глубокую и объемную статью "Минимизация эмпирического риска" (ERM) для энциклопедии MachineLearning.ru. | + | '''Задача:''' Написать глубокую и объемную статью "Минимизация эмпирического риска" (ERM) для энциклопедии MachineLearning.ru, опираясь на предоставленные материалы первой лекции и старую заготовку статьи. |
| - | '''Формат:''' MediaWiki-разметка. Математику строго оборачивать в теги <tex>...</tex>. | + | '''Формат:''' MediaWiki-разметка. Математику строго оборачивать в теги <nowiki><tex>...</tex></nowiki>. Модель: Gemini 3.1 Pro Preview. |
'''Ограничения и структура:''' | '''Ограничения и структура:''' | ||
| - | 1. Введение: | + | 1. Введение: связь эмпирической индукции и парадигмы обучения по прецедентам. |
| - | 2. Исторический контекст: Гаусс, Фишер, Вапник и Червоненкис. | + | 2. Исторический контекст: Гаусс, Рональд Фишер, Вапник и Червоненкис. |
| - | 3. Ожидаемый и эмпирический риск: прописать формулы | + | 3. Ожидаемый и эмпирический риск: прописать формулы ожидаемого риска R(a) и эмпирического Q(a, X^\ell) с функциями потерь. |
4. Переобучение и регуляризация (оценка VC-размерности). | 4. Переобучение и регуляризация (оценка VC-размерности). | ||
| - | 5. Основные типы функций потерь (для регрессии и классификации) и методы оптимизации (SGD).}} | + | 5. Основные типы функций потерь (для регрессии и классификации) и методы оптимизации (градиентный спуск, SGD).}} |
| - | === Этап 2: Адаптация текста | + | === Этап 2: Адаптация текста и уточнения === |
| - | Первая | + | Первая генерация получилась излишне академичной и тяжелой для восприятия. Модели был отправлен второй уточняющий запрос на упрощение языка и внедрение жизненных примеров для начинающих. |
{{well|Текст получился слишком сложным. Твоя задача — сделать Введение и раздел "Ожидаемый и эмпирический риск" более доступными для понимания. | {{well|Текст получился слишком сложным. Твоя задача — сделать Введение и раздел "Ожидаемый и эмпирический риск" более доступными для понимания. | ||
| - | 1. Добавь простую, интуитивно понятную аналогию из реальной жизни (например, подготовка к | + | 1. Добавь простую, интуитивно понятную аналогию из реальной жизни (например, подготовка школьника к ЕГЭ по математике по сборникам прошлых лет), которая объясняет разницу между истинным (ожидаемым) и эмпирическим риском. |
2. Сделай предложения короче, убери излишний канцелярит. | 2. Сделай предложения короче, убери излишний канцелярит. | ||
3. Сохрани всю строгую математику для профессионалов, но сопроводи её понятными текстовыми объяснениями.}} | 3. Сохрани всю строгую математику для профессионалов, но сопроводи её понятными текстовыми объяснениями.}} | ||
| - | === Этап 3: | + | === Этап 3: Попытка автоматического исправления разметки === |
| - | Модель частично проигнорировала | + | Модель частично проигнорировала правила форматирования формул MediaWiki. Был отправлен третий корректирующий промпт на расстановку тегов <nowiki><tex></nowiki>. |
| - | {{well|Ты проигнорировала правило | + | {{well|Проанализируй текст, который ты только что выдала. Ты проигнорировала правило о тегах <nowiki><tex></nowiki>! Из-за этого формулы отображаются на сайте как простой текст LaTeX. |
| - | 1. | + | Перепиши всю статью заново, выполнив требования: |
| - | 2. Выключные формулы | + | 1. Абсолютно все формулы, переменные (включая одиночные латинские буквы X, Y, a, w, M, h, l), индексы и математические знаки оберни в теги <nowiki><tex>...</tex></nowiki>. |
| - | 3. | + | 2. Выключные формулы начни с двойного двоеточия: ::<nowiki><tex>...</tex></nowiki> |
| + | 3. Замени все маркдаун-списки (-) на стандартные вики-звездочки (*).}} | ||
=== Этап 4: Ручная доработка === | === Этап 4: Ручная доработка === | ||
| - | + | Поскольку модель не смогла со 100% точностью расставить теги к одиночным переменным в тексте, финальная разметка была скорректирована человеком вручную: | |
| - | * | + | * Все пропущенные переменные и индексы (включая одиночные <tex>X</tex>, <tex>Y</tex>, <tex>a</tex>, <tex>w</tex>, <tex>M</tex>) были вручную обёрнуты в теги <nowiki><tex>...</tex></nowiki>. |
| - | * | + | * Греческие символы <tex>\lambda</tex> и <tex>\eta</tex> были заменены на лекционные обозначения <tex>\tau</tex> (коэффициент регуляризации) и <tex>h</tex> (темп обучения) для соответствия курсу МОИИ. |
| - | * Литература оформлена | + | * Маркеры списков (дефисы) заменены на стандартные звездочки (*). |
| + | * Расставлены внутренние вики-ссылки на статьи портала (викификация). | ||
| + | * Литература оформлена по шаблонам <nowiki>{{книга}}</nowiki>. | ||
| - | Polina Khadralinova 15: | + | Polina Khadralinova 15:35, 22 июня 2026 (MSD) |
Текущая версия
Работа над статьёй велась в несколько этапов с использованием модели Gemini 3.1 Pro Preview. Поскольку старая версия статьи от 2008 года устарела и потеряла форматирование, было принято решение полностью переписать её с нуля, совместив академическую строгость с понятностью для новичков.
Содержание |
Этап 1: Проектирование и RAG-контекст
Для обеспечения максимального соответствия программе курса, в качестве контекста (Knowledge Base) модели на вход были поданы: 1. Исходный текст заготовки статьи от 2008 года на ML.ru. 2. PDF-презентация первой лекции К.В. Воронцова "Основные понятия машинного обучения".
Был сформулирован следующий первый системный промпт:
Этап 2: Адаптация текста и уточнения
Первая генерация получилась излишне академичной и тяжелой для восприятия. Модели был отправлен второй уточняющий запрос на упрощение языка и внедрение жизненных примеров для начинающих.
Этап 3: Попытка автоматического исправления разметки
Модель частично проигнорировала правила форматирования формул MediaWiki. Был отправлен третий корректирующий промпт на расстановку тегов <tex>.
Этап 4: Ручная доработка
Поскольку модель не смогла со 100% точностью расставить теги к одиночным переменным в тексте, финальная разметка была скорректирована человеком вручную:
- Все пропущенные переменные и индексы (включая одиночные
,
,
,
,
) были вручную обёрнуты в теги <tex>...</tex>.
- Греческие символы
и
были заменены на лекционные обозначения
(коэффициент регуляризации) и
(темп обучения) для соответствия курсу МОИИ.
- Маркеры списков (дефисы) заменены на стандартные звездочки (*).
- Расставлены внутренние вики-ссылки на статьи портала (викификация).
- Литература оформлена по шаблонам {{книга}}.
Polina Khadralinova 15:35, 22 июня 2026 (MSD)

