Сегодня в рубрике внеклассное чтение — Agent Loop Теоретические корни Идея восходит к классическим

Сегодня в рубрике внеклассное чтение — Agent Loop

Теоретические корни

Идея восходит к классическим архитектурам ИИ-агентов — Sense → Plan → Act (1980–90-е), а также к концепции OODA Loop (Observe, Orient, Decide, Act) военного теоретика Джона Бойда.

Современная формализация

• ReAct (2022) — статья Shunyu Yao et al. из Princeton/Google формализовала паттерн Reason + Act для LLM: модель рассуждает, совершает действие, наблюдает результат, и повторяет цикл. Это ближайший академический «первоисточник» современного агентского цикла.
• Toolformer (2023) — Meta AI показали, что модели могут обучаться самостоятельно вызывать инструменты.
• AutoGPT (2023) — Toran Bruce Richards популяризировал идею на практике, запустив волну автономных агентов.

Антропик

Anthropic развил и формализовал понятие именно как Agentic Loop применительно к Claude — цикл: получить задачу → спланировать → вызвать инструмент → получить результат → продолжить или завершить.

И тут мы подходим к важной вехе doom_loop от OpenCode. Замечали ли вы, что при решении задачи ChatGPT зацикливается и начинает ходить по кругу?

Это же применимо и к Agent Loop. Если вы снимаете ограничение на число циклов, то будьте готовы, что агент сможет вызывать тулз бесконечно и просто сожжет все ваши лимиты.

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *