Какую модель выбрать?
В комментах постоянно задают один и тот же вопрос: Какую модель выбрать? В то же время, вопрос среды в которой работает агент всегда оставляют за кадром.
Модель — это водитель, программный модуль — это средство передвижения. Ребята, вы пытаетесь найти самого лучшего водителя, и посадить его в старую убитую машину (или не хотите обращать внимание, какое у него авто) или пытаетесь новичка посадить в Феррари и ехать на нем по проселочной дороге.
Что такое Harness для агентов?
— это термин из области ИИ-агентов, то есть автономных систем на базе больших языковых моделей, которые не просто отвечают на вопросы, а самостоятельно выполняют задачи: пишут и запускают код, ищут информацию, работают с файлами, взаимодействуют с внешними сервисами.
Нашел в интернете вот такое определение, приведу в оригинале:
Harness = Tools + Knowledge + Observation + Action Interfaces + Permissions
• Tools: file I/O, shell, network, database, browser
• Knowledge: product docs, domain references, API specs, style guides
• Observation: git diff, error logs, browser state, sensor data
• Action: CLI commands, API calls, UI interactions
• Permissions: sandboxing, approval workflows, trust boundaries
И перевод:
Обвязка = Инструменты + Знания + Наблюдение + Интерфейсы действий + Разрешения
• Инструменты: работа с файлами, командная оболочка, сеть, база данных, браузер
• Знания: документация продукта, предметные справочники, спецификации API, руководства по стилю
• Наблюдение: вывод git diff, журналы ошибок, состояние браузера, данные датчиков
• Действие: команды командной строки, вызовы API, взаимодействие с интерфейсом
• Разрешения: изолированная среда (песочница), процедуры согласования, границы доверия
Практический смысл формулы такой: качество работы ИИ-агента определяется не только тем, насколько умна сама модель, но и тем, насколько грамотно собрана обвязка вокруг неё. Одна и та же модель с хорошей обвязкой справляется с задачей, а с плохой — буксует или совершает ошибки. Это актуальная тема для всех, кто сейчас строит рабочие процессы на базе Claude Code, Cursor, агентов OpenAI и подобных инструментов.
При этом, обвязка — это не только то, что вам дает Антропик (или другой производитель) из коробки, а это еще и тот воркфлоу, который вы создаете самостоятельно под решение своих задач.
Добавить комментарий