Вайб-обзор на GPT-5.3 Codex, Opus 4.6 и (бонус) GPT-5.2 (22) Команды агентов Это фича больше Claud

Вайб-обзор на GPT-5.3 Codex, Opus 4.6 и (бонус) GPT-5.2 (2/2)

🟡 Команды агентов
Это фича больше Claude Code, но модель тут тоже имеет значение — в конце-концов, Anthropic тренирует свои модели на то, чтобы быть лучше как менеджер агентов.

Лучший результат достигается если:
● задача заранее декомпозирована на подзадачи
● подзадачи параллелизуемые и не конфликтующие
● разумно прописаны роли агентов

Если просто бросить в Claude Code задачу без планирования, то чего угодно можно ожидать, а цена одного эксперимента высоковата выходит.
Я в чате канала уже писал, что мне удалось за полчаса потратить 5-часовой лимит Claude Max за $100 🙂
Ну и в целом пока что нестабильно работает, стоит иметь в виду.

Кстати, в Codex-обвязку тоже скоро завезут нечто подобное, ждём!

🔴 Неправильные приоритеты
Я не знаю, как это лучше назвать, но это в принципе свойство моделей Claude с определенного релиза: с одной стороны, упускать важные нюансы, а с другой — делать то, чего не просили.
Как будто она в постоянном стрессе, когда качественно подумать не получается, а делать что-то всё равно надо.
Что вы там с ней делаете на посттрейне, а, Дарио?

🔴 Шустрее улетают лимиты
Цена за API-токены осталась та же, а вот в подписке, по всей видимости, лимиты понизили.
Встречал даже мнение о том, что подписка ChatGPT Plus за $20 даёт примерно столько же сделать, сколько Claude Max за $100 (тут стоит учесть, что сейчас и до 2 апреля в рамках подписки у Codex лимиты x2).

GPT-5.2

Я не писал обзор на 5.2, потому что с её выходом случилась та самая вайб-эйфория 🙂
Но лучше поздно, чем никогда, к тому же она незаменима в моей работе на текущий момент.
Всё, что было в обзоре на 5.1, справедливо и для 5.2 (только лучше), поэтому опишу лишь отличия.

🟢 Больше агентности
Раньше именно Codex-тюн этим отличался, но в 5.2 агентность сильно повысилась, и модель сама способна доводить до конца многоэтапные задачи, пусть и медленно.

🟢 Минимизация техдолга
Комплексная характеристика, но очень важная: если вам нужно предотвратить архитектурный дрифт или вернуть проект в нормальное состояние относительно желаемой архитектуры — нужно использовать 5.2 как для планирования изменений, так и контроля результата, и тут она стала лучше, чем 5.1.

🟢 Поиск багов
За счёт большей агентности и подросшего ризонинга модель гораздо лучше ищет причины нетривиальных проблем в коде.
А если у вас есть доступ к ChatGPT Pro — по API (дорого!) или через веб (неудобно), — то там это ещё качественнее работает.

🟡 Душность
Ну, я бы это в плюсы записал, но не всё же хвалить 🙂

При планировании или обсуждении каких-то идей модель вас будет душить corner case’ами, невозможностью что-то сделать и вообще поначалу кажется, что это постоянные палки в колёса, вообще никакого вайба.

Но, как правило, замечания по делу, и к этой манере просто нужно привыкнуть (разработчики, кстати, тоже такие попадаются, чего уж там).

И я почти всегда предпочту именно такое поведение, чем потом вылавливать неучтённые при планировании нюансы в виде кривой архитектуры или багов на проде.

🟡 Всё ещё медленно
Тут от 5.1 отличий не так много — модель запросто может задумываться минут на 10-20 чисто для сбора контекста на старте, несмотря на все анонсируемые ускорения.
Но это всё не зря — лучше неё этот контекст ни одна другая модель не собирает и сложные проблемы решить на таком уровне не может.

Вердикт
Универсального инструмента, как обычно, нет.

В случае GPT-5.3 Codex и Opus 4.6 произошла конвергенция — модели примерно одинаковы по скорости, интеллекту, вниманию, даже по стилю общения стали ближе.

А вот GPT-5.2 тут стоит особняком.

Для меня использование разных моделей выглядит сейчас так:

● планирование, архитектура, рефакторинги, дебаггинг в существующей кодовой базе
GPT-5.2 xhigh

● реализация планов
GPT-5.3 Codex high-xhigh или GPT-5.2 high

● верификация (ревью, контроль техдолга)
GPT-5.2 xhigh

● интерактивная быстрая работа
GPT-5.3 Codex или Opus 4.6

● не очень большие (сравнительно) вайб-проекты с нуля
Opus 4.6

Прошлый обзор на GPT 5.1 / Gemini 3 Pro / Opus 4.5

#ai #model #review

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *