Обсуждение:Принцип эмпирической индукции Бэкона в машинном обучении
Материал из MachineLearning.
Работа над статьёй велась последовательно, путём итеративного уточнения запросов к языковой модели.
Содержание |
Этап 1: Проектирование структуры и базовый промпт
Статья создавалась полностью с нуля, так как на портале отсутствовал материал по данной теме. На первом этапе был сформулирован подробный базовый промпт для определения структуры статьи, её связи с лекционным курсом и первоначального наброска математического аппарата:
| | Роль: Ты — ведущий академический исследователь, эксперт на стыке машинного обучения (ML) и философии науки.
Задача: Написать глубокую и объемную статью "Принцип эмпирической индукции Бэкона в машинном обучении" для энциклопедии MachineLearning.ru. Формат: MediaWiki-разметка. Математику строго оборачивать в теги <tex>...</tex>. Модель: Gemini 3.1 Pro Preview. Ограничения и структура: 1. Введение: связь эмпирической индукции и парадигмы обучения по прецедентам. 2. Исторический контекст: Фрэнсис Бэкон, "Таблицы открытия" как прообраз датасетов. 3. Формализация идей: описать переход от философии к математике (выборка X^\ell, признаки f_j(x)). 4. Минимизация эмпирического риска: ЯВНО прописать формулу эмпирического риска Q(w) и функции потерь \mathcal{L}. 5. Автоматизация научного метода: провести аналогию шагов познания (Верификация Бэкона -> Обучение/ERM; Фальсифицируемость Поппера -> Кросс-валидация и ошибка на тесте X^k). ОБЯЗАТЕЛЬНАЯ СТРУКТУРА СТАТЬИ И ТРЕБОВАНИЯ К ОФОРМЛЕНИЮ: В самом начале исходного кода строго выведи три строки: {{well|Статья написана с использованием LLM '''Gemini 3.1 Pro Preview''' и проверена участником ~~~~}} Промпт приводится полностью в Обсуждение:Принцип эмпирической индукции Бэкона в машинном обучении {{TOCright}} == Введение == Дай чёткое определение концепции. Напиши, что машинное обучение — это алгоритмическая автоматизация индуктивного метода (вывод общего правила из частного набора прецедентов). == Исторический контекст и «Таблицы открытия» == Расскажи про Фрэнсис Бэкона, его труд "Новый Органон" (1620) и критику дедукции Аристотеля. Подробно опиши его "Таблицы открытия" (таблицы присутствия, отсутствия и степеней) и покажи, как они концептуально предвосхитили современные датасеты (матрицы объект-признак, бинарную классификацию и регрессию). == Математическая формализация: от индукции к эмпирическому риску == Переведи философию Бэкона на строгий язык математики, используя обозначения из лекций К.В. Воронцова: 1. Задай обучающую выборку X^\ell = { (x_1, y_1), ..., (x_\ell, y_\ell) }. 2. Задай признаки объектов f_j(x) и параметрическое семейство моделей a(x, w). 3. Объясни, как поиск бэконовской "формы" (закона) сводится к принципу минимизации эмпирического риска (ERM). Выведи формулу эмпирического риска Q(w) через функцию потерь \mathcal{L}(a(x,w), y). == Автоматизация научного метода: от Бэкона к Попперу == Объясни, почему чистая индукция ведет к переобучению (overfitting). Покажи, как в современном ML решается конфликт между верификацией по Бэкону (обучение на train-выборке) и фальсифицируемостью по Карлу Попперу (проверка обобщающей способности на независимой test-выборке X^k). Выведи формулу ошибки на тесте Q_{test}(w). == См. также == Добавь ссылки на внутренние статьи портала: Минимизация эмпирического риска, Переобучение, Скользящий контроль. == Примечания == Добавь только тег. == Литература == Укажи 2-3 источника (Новый Органон Бэкона, лекции Воронцова). КРИТИЧЕСКИ ВАЖНЫЕ ПРАВИЛА ФОРМАТИРОВАНИЯ (MediaWiki):
|
Этап 2: Упрощение стиля и углубление структуры
Вторая версия статьи получилась излишне перегруженной сложной терминологией, а оглавление статьи выглядело слишком плоским. Был отправлен точный уточняющий промпт на реструктуризацию и упрощение языка:
Этап 3: Корректировка разметки
Модель частично проигнорировала правила форматирования MediaWiki. Был отправлен третий точный уточняющий промпт на исправление разметки:
Этап 4: Ручная доработка
Поскольку модель не смогла со 100% точностью расставить теги к одиночным переменным в тексте и упорно вставляла пробелы перед звёздочками списков, финальная разметка была скорректирована человеком вручную:
- Из списков "Таблицы открытия" и "Идолы разума" были удалены лидирующие пробелы, что позволило избавиться от некорректных синих рамок на предпросмотре.
- Оглавление перенесено на стандартную позицию слева.
- Все пропущенные переменные и индексы (включая одиночные
,
,
,
,
) были вручную обёрнуты в теги <tex>...</tex>.
- Раздел литературы оформлен с использованием шаблонов {{книга}}.
Polina Khadralinova 17:51, 28 июня 2026 (MSD)

