«Если можешь избегать Computer Use – делай это».
Думаю, такой кусок есть в промпте Codex CLI. Он не будет делать что-то напрямую через UI, если видит альтернативу.
К такому выводу я пришёл в процессе тестов Computer Use на модели GPT-5.4.
Пара примеров, когда Codex старательно избегал Computer Use или максимально его упрощал:
Задача:
Вот тебе графический редактор. Нарисуй в нём детализированный горный пейзаж
Решение:
Окей. У меня есть доступ к браузеру. Сейчас найду бесплатный генератор картинок, сделаю там изображение, а потом открою его в графическом редакторе
В итоге пришлось проговаривать, что рисуешь инструментами внутри самого графического редактора в технике Pixel Art. После чего он пошёл в редактор, написал для себя скрипт на Python, чтобы использовать кисть в определённом порядке с заданными цветами. И с помощью скрипта «нарисовал» изображение целиком. Часть процесса рисования можете увидеть в видео к посту.
Задача:
Скачай Open Source движок для создания видеоигр. Используя этот движок, создай простую игру-платформер
Решение:
Написал локально всю игру на Godot. Вместе с графикой через примитивы. Залил на виртуальную машину, открыл в движке и через него запустил игру.
То есть технически задачу решил. Но Computer Use начисто проигнорировал.
И даже когда попросил полностью делать игру через редактор движка, он открыл gd-файлы и начал переносить туда код.
По поводу самого Computer Use. Всё-таки GPT-5.4 иногда промахивается мимо кнопок. Как правило, быстро это осознаёт и исправляется. Доводя, в конечном счёте, работу до конца. В интерфейсах сложных программ обязательно изучает все шорткаты. И использует их везде, где это возможно.
Вывод: Computer Use всё ещё вспомогательный инструмент. И таковым, скорее всего, останется. Просто потому что через скрипты+шорткаты+специализированные инструменты AI-агенты достигают результата кратно быстрее.
Добавить комментарий