Сегодня в рубрике внеклассное чтение — Agent Loop
Теоретические корни
Идея восходит к классическим архитектурам ИИ-агентов — Sense → Plan → Act (1980–90-е), а также к концепции OODA Loop (Observe, Orient, Decide, Act) военного теоретика Джона Бойда.
Современная формализация
• ReAct (2022) — статья Shunyu Yao et al. из Princeton/Google формализовала паттерн Reason + Act для LLM: модель рассуждает, совершает действие, наблюдает результат, и повторяет цикл. Это ближайший академический «первоисточник» современного агентского цикла.
• Toolformer (2023) — Meta AI показали, что модели могут обучаться самостоятельно вызывать инструменты.
• AutoGPT (2023) — Toran Bruce Richards популяризировал идею на практике, запустив волну автономных агентов.
Антропик
Anthropic развил и формализовал понятие именно как Agentic Loop применительно к Claude — цикл: получить задачу → спланировать → вызвать инструмент → получить результат → продолжить или завершить.
И тут мы подходим к важной вехе doom_loop от OpenCode. Замечали ли вы, что при решении задачи ChatGPT зацикливается и начинает ходить по кругу?
Это же применимо и к Agent Loop. Если вы снимаете ограничение на число циклов, то будьте готовы, что агент сможет вызывать тулз бесконечно и просто сожжет все ваши лимиты.

Добавить комментарий