Сегодня в рубрике внеклассное чтение — Agent Loop Теоретические корни Идея восходит к классическим

Написано

Сегодня в рубрике внеклассное чтение — Agent Loop

Теоретические корни

Идея восходит к классическим архитектурам ИИ-агентов — Sense → Plan → Act (1980–90-е), а также к концепции OODA Loop (Observe, Orient, Decide, Act) военного теоретика Джона Бойда.

Современная формализация

• ReAct (2022) — статья Shunyu Yao et al. из Princeton/Google формализовала паттерн Reason + Act для LLM: модель рассуждает, совершает действие, наблюдает результат, и повторяет цикл. Это ближайший академический «первоисточник» современного агентского цикла.
• Toolformer (2023) — Meta AI показали, что модели могут обучаться самостоятельно вызывать инструменты.
• AutoGPT (2023) — Toran Bruce Richards популяризировал идею на практике, запустив волну автономных агентов.

Антропик

Anthropic развил и формализовал понятие именно как Agentic Loop применительно к Claude — цикл: получить задачу → спланировать → вызвать инструмент → получить результат → продолжить или завершить.

И тут мы подходим к важной вехе doom_loop от OpenCode. Замечали ли вы, что при решении задачи ChatGPT зацикливается и начинает ходить по кругу?

Это же применимо и к Agent Loop. Если вы снимаете ограничение на число циклов, то будьте готовы, что агент сможет вызывать тулз бесконечно и просто сожжет все ваши лимиты.

Сегодня в рубрике внеклассное чтение — Agent Loop Теоретические корни Идея восходит к классическим

Комментарии

Добавить комментарий Отменить ответ

Больше записей

Claude теперь управляет секс-игрушками гении с Reddit выкатили утилиту, которая дает полный контрол

GPT-Image 2 засветилась на lmarena Новая модель от OpenAI появилась на арене под кодовыми именеми m

Морозы накроют Москву на следующей неделе в столицу реально вернется зима! Пойдет мощный снег и зад

ну что, погнали дальше