Какую модель выбрать В комментах постоянно задают один и тот же вопрос: Какую модель выбрать В то ж

Написано

Какую модель выбрать?

В комментах постоянно задают один и тот же вопрос: Какую модель выбрать? В то же время, вопрос среды в которой работает агент всегда оставляют за кадром.

Модель — это водитель, программный модуль — это средство передвижения. Ребята, вы пытаетесь найти самого лучшего водителя, и посадить его в старую убитую машину (или не хотите обращать внимание, какое у него авто) или пытаетесь новичка посадить в Феррари и ехать на нем по проселочной дороге.

Что такое Harness для агентов?

— это термин из области ИИ-агентов, то есть автономных систем на базе больших языковых моделей, которые не просто отвечают на вопросы, а самостоятельно выполняют задачи: пишут и запускают код, ищут информацию, работают с файлами, взаимодействуют с внешними сервисами.

Нашел в интернете вот такое определение, приведу в оригинале:

Harness = Tools + Knowledge + Observation + Action Interfaces + Permissions

• Tools: file I/O, shell, network, database, browser
• Knowledge: product docs, domain references, API specs, style guides
• Observation: git diff, error logs, browser state, sensor data
• Action: CLI commands, API calls, UI interactions
• Permissions: sandboxing, approval workflows, trust boundaries

И перевод:

Обвязка = Инструменты + Знания + Наблюдение + Интерфейсы действий + Разрешения

• Инструменты: работа с файлами, командная оболочка, сеть, база данных, браузер
• Знания: документация продукта, предметные справочники, спецификации API, руководства по стилю
• Наблюдение: вывод git diff, журналы ошибок, состояние браузера, данные датчиков
• Действие: команды командной строки, вызовы API, взаимодействие с интерфейсом
• Разрешения: изолированная среда (песочница), процедуры согласования, границы доверия

Практический смысл формулы такой: качество работы ИИ-агента определяется не только тем, насколько умна сама модель, но и тем, насколько грамотно собрана обвязка вокруг неё. Одна и та же модель с хорошей обвязкой справляется с задачей, а с плохой — буксует или совершает ошибки. Это актуальная тема для всех, кто сейчас строит рабочие процессы на базе Claude Code, Cursor, агентов OpenAI и подобных инструментов.

При этом, обвязка — это не только то, что вам дает Антропик (или другой производитель) из коробки, а это еще и тот воркфлоу, который вы создаете самостоятельно под решение своих задач.

Какую модель выбрать В комментах постоянно задают один и тот же вопрос: Какую модель выбрать В то ж

Комментарии

Добавить комментарий Отменить ответ

Больше записей

Судя по HumanEval Bench, те способности кодинга, что имела огромная GPT-4o 2 года назад, теперь имее

Лол: VK Игры начали требовать VPN юзер не смог запустить Atomic Heart, купленный на платформе. В п

Топ популярных вопросов по курсу Почему курс именно для разработчиков Потому что я сам разработчи

ПРОМТ, КОТОРЫЙ СОЗДАЁТ КРУТОЙ ОФФЕР В ЛЮБОЙ ИИ А ещё — нормально сегментирует ЦА, а не пишет женщ