Если можешь избегать Computer Use делай это. Думаю, такой кусок есть в промпте Codex CLI. Он не бу

«Если можешь избегать Computer Use – делай это».

Думаю, такой кусок есть в промпте Codex CLI. Он не будет делать что-то напрямую через UI, если видит альтернативу.

К такому выводу я пришёл в процессе тестов Computer Use на модели GPT-5.4.

Пара примеров, когда Codex старательно избегал Computer Use или максимально его упрощал:

Задача:

Вот тебе графический редактор. Нарисуй в нём детализированный горный пейзаж

Решение:

Окей. У меня есть доступ к браузеру. Сейчас найду бесплатный генератор картинок, сделаю там изображение, а потом открою его в графическом редакторе

В итоге пришлось проговаривать, что рисуешь инструментами внутри самого графического редактора в технике Pixel Art. После чего он пошёл в редактор, написал для себя скрипт на Python, чтобы использовать кисть в определённом порядке с заданными цветами. И с помощью скрипта «нарисовал» изображение целиком. Часть процесса рисования можете увидеть в видео к посту.

Задача:

Скачай Open Source движок для создания видеоигр. Используя этот движок, создай простую игру-платформер

Решение:

Написал локально всю игру на Godot. Вместе с графикой через примитивы. Залил на виртуальную машину, открыл в движке и через него запустил игру.

То есть технически задачу решил. Но Computer Use начисто проигнорировал.

И даже когда попросил полностью делать игру через редактор движка, он открыл gd-файлы и начал переносить туда код.

По поводу самого Computer Use. Всё-таки GPT-5.4 иногда промахивается мимо кнопок. Как правило, быстро это осознаёт и исправляется. Доводя, в конечном счёте, работу до конца. В интерфейсах сложных программ обязательно изучает все шорткаты. И использует их везде, где это возможно.

Вывод: Computer Use всё ещё вспомогательный инструмент. И таковым, скорее всего, останется. Просто потому что через скрипты+шорткаты+специализированные инструменты AI-агенты достигают результата кратно быстрее.

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *