Проблема фрейма

Материал из MachineLearning.

(Различия между версиями)

Текущая версия

Проблема фрейма — одна из классических проблем искусственного интеллекта, логики и представления знаний, связанная с тем, как формально описывать изменения мира после выполнения действия, не перечисляя явно все свойства, которые при этом не изменились.

В узком техническом смысле проблема фрейма возникает при логическом описании действий: если система знает, что действие изменяет некоторое свойство мира, она также должна понимать, какие остальные свойства остаются прежними. В широком философском смысле проблема фрейма связана с вопросом о том, как интеллектуальная система выбирает релевантную информацию в сложной среде и не тратит вычислительные ресурсы на перебор всех возможных последствий и «не-последствий» каждого действия.^[1]

Проблема фрейма особенно важна для символического искусственного интеллекта, планирования действий, робототехники, автономных агентов и систем, которые должны рассуждать о последствиях своих действий в изменяющемся мире.

Содержание

1 История
2 Пример
3 Техническая проблема фрейма
4 Философская интерпретация
5 Основные подходы к решению
6 Связь с робототехникой и автономными агентами
7 Значение для современного ИИ
8 См. также
9 Примечания
10 Литература

История

Проблема фрейма была явно сформулирована Джоном Маккарти и Патриком Хейсом в статье «Some Philosophical Problems from the Standpoint of Artificial Intelligence» 1969 года.^[1] Эта работа рассматривала философские и логические основания искусственного интеллекта: как представить мир, действия, причинность, знание и способность агента достигать целей.

В статье Маккарти и Хейса проблема возникла в контексте логического описания действий. Если агент выполняет действие, например перемещает объект, то меняется положение объекта. Но множество других фактов обычно остаётся прежним: цвет объекта, его масса, принадлежность владельцу и так далее. При прямом логическом описании приходится добавлять специальные утверждения о том, что каждое действие не меняет каждое не затронутое им свойство. Такие утверждения стали называть фреймовыми аксиомами.

Проблема состоит в том, что при $n$ действиях и $m$ свойствах мира может потребоваться порядка $n \cdot m$ аксиом о неизменности. Это делает наивное логическое описание громоздким и плохо масштабируемым.

Пример

Пусть в начальном состоянии известно:

чашка стоит на столе;
чашка белая;
стол находится в комнате.

Агент выполняет действие: «переместить чашку на полку». После этого разумно заключить, что чашка находится на полке. Но также обычно предполагается, что чашка по-прежнему белая, стол по-прежнему находится в комнате, а многие другие факты не изменились.

Для человека такое рассуждение кажется очевидным: перемещение чашки обычно не меняет её цвет. Но в формальной логической системе это нужно каким-то образом выразить. Если система знает только эффект действия «переместить чашку», она не обязана автоматически выводить, что цвет чашки сохранился. Чтобы сделать такой вывод, ей нужны дополнительные правила или общий принцип инерции: свойства мира сохраняются, если нет оснований считать, что они изменились.

Техническая проблема фрейма

В техническом смысле проблема фрейма — это задача компактного и корректного описания того, какие свойства мира изменяются и какие остаются неизменными после действия.

Она тесно связана с несколькими понятиями:

состояние мира — совокупность фактов, истинных в данный момент;
действие — операция, которая переводит мир из одного состояния в другое;
флюент — свойство, значение которого может меняться от состояния к состоянию;
фреймовая аксиома — утверждение о том, что некоторый флюент не изменяется при выполнении некоторого действия.

Например, если действие $Move(x, y)$ перемещает объект $x$ в место $y$ , то фреймовая аксиома может утверждать, что цвет объекта после этого действия остаётся тем же. Проблема в том, что таких аксиом может быть очень много.

Главная трудность состоит не в том, что невозможно записать все эти аксиомы, а в том, что такое решение плохо подходит для больших предметных областей. Реальный или даже умеренно сложный искусственный агент имеет дело с тысячами свойств и действий. Поэтому требуется более общий способ представления инерции мира.

Философская интерпретация

В философии когнитивной науки проблема фрейма получила более широкое толкование. Здесь она означает не только техническую задачу записи фреймовых аксиом, но и общий вопрос: как разумная система понимает, какая информация релевантна для текущей задачи?

Например, если робот собирается взять книгу со стола, он не должен заново рассматривать все факты о мире: цвет стен, расстояние до Луны, температуру на улице, историю владельца книги и так далее. Но иногда кажущиеся нерелевантными факты могут оказаться важными: книга может быть приклеена к столу, стол может быть неустойчивым, рядом может быть препятствие.

Таким образом, широкая проблема фрейма связана с ограниченностью вычислительных ресурсов, здравым смыслом, вниманием, контекстом и выбором существенной информации. В этом смысле она близка к вопросам о том, как люди и машины используют фоновое знание, как ограничивают пространство поиска и как избегают комбинаторного взрыва.

Основные подходы к решению

Исчисление ситуаций

Одним из классических формализмов для описания действий является исчисление ситуаций — логический язык, в котором мир описывается через ситуации, действия и флюенты. Ситуация представляет состояние мира, а выполнение действия порождает новую ситуацию.

В ранних версиях исчисления ситуаций проблема фрейма проявлялась особенно явно: для каждого действия нужно было указывать не только его прямые эффекты, но и все свойства, которые оно не изменяет. Позднее были предложены более компактные способы записи, в частности через аксиомы состояния-после-действия (successor state axioms), развитые в работах Рэя Рейтера.^[1]

Идея состоит в том, чтобы для каждого изменяемого свойства указать условия, при которых оно становится истинным или ложным после действия. Всё остальное сохраняется по умолчанию. Такой подход позволяет существенно сократить число явных фреймовых аксиом.

Немонотонная логика и инерция

В классической монотонной логике добавление новых посылок не отменяет ранее сделанные выводы. Однако рассуждения здравого смысла часто имеют немонотонный характер: мы считаем, что объект остаётся на месте, пока не узнаём о действии, которое его переместило.

Поэтому проблема фрейма стала одним из стимулов для развития немонотонной логики. В таких логиках можно формализовать выводы «по умолчанию»: если нет информации об изменении свойства, считать его неизменным. Это соответствует интуитивному закону инерции: мир обычно сохраняет свои свойства, если нет причины для их изменения.

Circumscription и минимизация изменений

Джон Маккарти предложил метод circumscription как форму немонотонного рассуждения.^[1] Его общий смысл состоит в минимизации некоторых предикатов или отклонений от нормального случая. В контексте проблемы фрейма это позволяет считать, что изменений произошло как можно меньше, если только теория явно не требует обратного.

Позднее Маккарти применял circumscription к формализации знаний здравого смысла.^[1] Этот подход повлиял на развитие логического ИИ, хотя его применение к сложным динамическим областям требует аккуратной формализации исключений, косвенных эффектов и причинных зависимостей.

STRIPS-подобные представления действий

В практическом планировании действий большое влияние оказала система STRIPS, разработанная Ричардом Файксом и Нильсом Нильссоном в начале 1970-х годов.^[1] В STRIPS действие описывается через:

предусловия — что должно быть истинно до действия;
список добавления — какие факты становятся истинными;
список удаления — какие факты перестают быть истинными.

Все факты, не входящие в списки добавления и удаления, считаются неизменными. Это даёт простой и удобный инженерный способ обхода проблемы фрейма в ограниченных задачах планирования. Многие современные языки планирования, включая PDDL, наследуют эту идею.

Недостаток STRIPS-подобного подхода состоит в том, что он хорошо работает только при достаточно аккуратно заданной предметной области. В реальных средах действия могут иметь косвенные эффекты, вероятностные последствия, неполные наблюдения и взаимодействия с другими агентами.

Связь с робототехникой и автономными агентами

Для робототехники проблема фрейма имеет практическое значение. Робот, действующий в физической среде, должен постоянно обновлять представление о мире: где находятся объекты, какие действия возможны, какие препятствия появились, какие цели уже достигнуты.

Если робот будет после каждого действия пересчитывать все возможные свойства мира, планирование станет неэффективным. Но если он будет слишком грубо предполагать, что всё осталось неизменным, он может пропустить важные изменения: объект мог упасть, дверь могла закрыться, человек мог переместиться.

Поэтому современные системы часто сочетают несколько подходов:

явные модели действий и состояний;
вероятностные модели среды;
сенсорное обновление состояния;
планирование с неполной информацией;
обучение моделей динамики из данных;
эвристики внимания и выбора релевантных признаков.

В таких системах проблема фрейма уже не всегда формулируется в классическом логическом виде, но её центральная идея сохраняется: агент должен отличать существенные изменения от несущественных и поддерживать достаточно точную модель среды без полного перебора всех возможностей.

Значение для современного ИИ

В современном искусственном интеллекте проблема фрейма остаётся важной, хотя её форма изменилась. В логическом планировании и представлении знаний существуют развитые методы для работы с инерцией, действиями и состояниями. В этом узком техническом смысле многие варианты проблемы фрейма имеют известные решения, особенно для формально заданных предметных областей.^[1]

Однако широкая проблема релевантности остаётся открытой для многих классов интеллектуальных систем. Автономный агент должен не только хранить факты о мире, но и понимать, какие из них важны для текущего действия, какие можно игнорировать, а какие нужно проверить заново. Это особенно трудно в открытой среде, где заранее неизвестны все возможные объекты, действия и исключения.

Для больших языковых моделей проблема фрейма обсуждается осторожно. С одной стороны, LLM способны использовать огромный объём текстовых знаний, поддерживать контекст диалога и давать правдоподобные рассуждения о действиях и их последствиях. Это делает их полезными для задач объяснения, помощи в планировании и интерфейсов к агентным системам.

С другой стороны, языковая модель сама по себе обычно не имеет устойчивой модели физической среды, сенсорного контакта с миром и гарантированного механизма обновления состояния после действия. Исследователи по-разному оценивают, в какой мере такие модели обладают пониманием ситуаций. Например, Бендер и Коллер подчёркивают различие между обработкой языковой формы и пониманием значения,^[1] а Митчелл и Кракауэр описывают продолжающийся спор о том, можно ли говорить о понимании у больших языковых моделей в сильном смысле.^[1] Мюррей Шанахан также предупреждает о риске чрезмерной антропоморфизации LLM при описании их «знаний», «убеждений» и «мышления».^[1]

Поэтому некорректно утверждать, что современные LLM просто «решают» или «не решают» проблему фрейма. Более точная позиция состоит в том, что они могут помогать в рассуждениях о релевантности и действиях, но для надёжного поведения в среде обычно требуют внешних механизмов: памяти состояния, инструментов, планировщиков, сенсоров, проверки действий и обновления модели мира.

См. также

Примечания

Литература

McCarthy, John; Hayes, Patrick J. Some Philosophical Problems from the Standpoint of Artificial Intelligence // Machine Intelligence 4. — 1969. — С. 463—502.
McCarthy, John Circumscription — A Form of Non-Monotonic Reasoning // Artificial Intelligence. — 1980. — Т. 13. — № 1—2. — С. 27—39.
McCarthy, John Applications of Circumscription to Formalizing Common Sense Knowledge // Artificial Intelligence. — 1986. — Т. 28. — № 1. — С. 89—116.
Fikes, Richard E.; Nilsson, Nils J. STRIPS: A New Approach to the Application of Theorem Proving to Problem Solving // Artificial Intelligence. — 1971. — Т. 2. — № 3—4. — С. 189—208.
Reiter, Raymond The Frame Problem in the Situation Calculus: A Simple Solution (Sometimes) and a Completeness Result for Goal Regression // Artificial Intelligence and Mathematical Theory of Computation: Papers in Honor of John McCarthy. — 1991. — С. 359—380.
Shanahan, Murray Solving the Frame Problem: A Mathematical Investigation of the Common Sense Law of Inertia. — Cambridge, MA: MIT Press, 1997. — ISBN 978-0262193849
Shanahan, Murray The Frame Problem // Stanford Encyclopedia of Philosophy. 2004.
Bender, Emily M.; Koller, Alexander Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data // Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. — 2020. — С. 5185—5198.
Mitchell, Melanie; Krakauer, David C. The Debate Over Understanding in AI's Large Language Models // Proceedings of the National Academy of Sciences. — 2023. — Т. 120. — № 13.
Shanahan, Murray Talking About Large Language Models // Communications of the ACM. — 2024. — Т. 67. — № 2. — С. 68—79.

Источник — «http://recognition.su/wiki/index.php?title=%D0%9F%D1%80%D0%BE%D0%B1%D0%BB%D0%B5%D0%BC%D0%B0_%D1%84%D1%80%D0%B5%D0%B9%D0%BC%D0%B0»

@@ Строка 46: / Строка 46: @@
 Например, если робот собирается взять книгу со стола, он не должен заново рассматривать все факты о мире: цвет стен, расстояние до Луны, температуру на улице, историю владельца книги и так далее. Но иногда кажущиеся нерелевантными факты могут оказаться важными: книга может быть приклеена к столу, стол может быть неустойчивым, рядом может быть препятствие.
-Таким образом, широкая проблема фрейма связана с ограниченностью вычислительных ресурсов, [[Здравый смысл|здравым смыслом]], вниманием, контекстом и выбором существенной информации. В этом смысле она близка к вопросам о том, как люди и машины используют фоновое знание, как ограничивают пространство поиска и как избегают комбинаторного взрыва.
+Таким образом, широкая проблема фрейма связана с ограниченностью вычислительных ресурсов, здравым смыслом, вниманием, контекстом и выбором существенной информации. В этом смысле она близка к вопросам о том, как люди и машины используют фоновое знание, как ограничивают пространство поиска и как избегают комбинаторного взрыва.
 == Основные подходы к решению ==
@@ Строка 72: / Строка 72: @@
 === STRIPS-подобные представления действий ===
-В практическом [[Планирование|планировании действий]] большое влияние оказала система STRIPS, разработанная Ричардом Файксом и Нильсом Нильссоном в начале 1970-х годов.<ref>{{статья |автор=Fikes, Richard E.; Nilsson, Nils J. |заглавие=STRIPS: A New Approach to the Application of Theorem Proving to Problem Solving |ссылка=https://ai.stanford.edu/~nilsson/OnlinePubs-Nils/PublishedPapers/strips.pdf |издание=Artificial Intelligence |год=1971 |том=2 |номер=3—4 |страницы=189—208 |doi=10.1016/0004-3702(71)90010-5 |язык=en}}</ref> В STRIPS действие описывается через:
+В практическом планировании действий большое влияние оказала система STRIPS, разработанная Ричардом Файксом и Нильсом Нильссоном в начале 1970-х годов.<ref>{{статья |автор=Fikes, Richard E.; Nilsson, Nils J. |заглавие=STRIPS: A New Approach to the Application of Theorem Proving to Problem Solving |ссылка=https://ai.stanford.edu/~nilsson/OnlinePubs-Nils/PublishedPapers/strips.pdf |издание=Artificial Intelligence |год=1971 |том=2 |номер=3—4 |страницы=189—208 |doi=10.1016/0004-3702(71)90010-5 |язык=en}}</ref> В STRIPS действие описывается через:
 * предусловия — что должно быть истинно до действия;