Вайб-обзор на GPT-5.3 Codex, Opus 4.6 и (бонус) GPT-5.2 (22) Команды агентов Это фича больше Claud

Написано

Вайб-обзор на GPT-5.3 Codex, Opus 4.6 и (бонус) GPT-5.2 (2/2)

🟡 Команды агентов
Это фича больше Claude Code, но модель тут тоже имеет значение — в конце-концов, Anthropic тренирует свои модели на то, чтобы быть лучше как менеджер агентов.

Лучший результат достигается если:
● задача заранее декомпозирована на подзадачи
● подзадачи параллелизуемые и не конфликтующие
● разумно прописаны роли агентов

Если просто бросить в Claude Code задачу без планирования, то чего угодно можно ожидать, а цена одного эксперимента высоковата выходит.
Я в чате канала уже писал, что мне удалось за полчаса потратить 5-часовой лимит Claude Max за $100 🙂
Ну и в целом пока что нестабильно работает, стоит иметь в виду.

Кстати, в Codex-обвязку тоже скоро завезут нечто подобное, ждём!

🔴 Неправильные приоритеты
Я не знаю, как это лучше назвать, но это в принципе свойство моделей Claude с определенного релиза: с одной стороны, упускать важные нюансы, а с другой — делать то, чего не просили.
Как будто она в постоянном стрессе, когда качественно подумать не получается, а делать что-то всё равно надо.
Что вы там с ней делаете на посттрейне, а, Дарио?

🔴 Шустрее улетают лимиты
Цена за API-токены осталась та же, а вот в подписке, по всей видимости, лимиты понизили.
Встречал даже мнение о том, что подписка ChatGPT Plus за $20 даёт примерно столько же сделать, сколько Claude Max за $100 (тут стоит учесть, что сейчас и до 2 апреля в рамках подписки у Codex лимиты x2).

GPT-5.2

Я не писал обзор на 5.2, потому что с её выходом случилась та самая вайб-эйфория 🙂
Но лучше поздно, чем никогда, к тому же она незаменима в моей работе на текущий момент.
Всё, что было в обзоре на 5.1, справедливо и для 5.2 (только лучше), поэтому опишу лишь отличия.

🟢 Больше агентности
Раньше именно Codex-тюн этим отличался, но в 5.2 агентность сильно повысилась, и модель сама способна доводить до конца многоэтапные задачи, пусть и медленно.

🟢 Минимизация техдолга
Комплексная характеристика, но очень важная: если вам нужно предотвратить архитектурный дрифт или вернуть проект в нормальное состояние относительно желаемой архитектуры — нужно использовать 5.2 как для планирования изменений, так и контроля результата, и тут она стала лучше, чем 5.1.

🟢 Поиск багов
За счёт большей агентности и подросшего ризонинга модель гораздо лучше ищет причины нетривиальных проблем в коде.
А если у вас есть доступ к ChatGPT Pro — по API (дорого!) или через веб (неудобно), — то там это ещё качественнее работает.

🟡 Душность
Ну, я бы это в плюсы записал, но не всё же хвалить 🙂

При планировании или обсуждении каких-то идей модель вас будет душить corner case’ами, невозможностью что-то сделать и вообще поначалу кажется, что это постоянные палки в колёса, вообще никакого вайба.

Но, как правило, замечания по делу, и к этой манере просто нужно привыкнуть (разработчики, кстати, тоже такие попадаются, чего уж там).

И я почти всегда предпочту именно такое поведение, чем потом вылавливать неучтённые при планировании нюансы в виде кривой архитектуры или багов на проде.

🟡 Всё ещё медленно
Тут от 5.1 отличий не так много — модель запросто может задумываться минут на 10-20 чисто для сбора контекста на старте, несмотря на все анонсируемые ускорения.
Но это всё не зря — лучше неё этот контекст ни одна другая модель не собирает и сложные проблемы решить на таком уровне не может.

Вердикт
Универсального инструмента, как обычно, нет.

В случае GPT-5.3 Codex и Opus 4.6 произошла конвергенция — модели примерно одинаковы по скорости, интеллекту, вниманию, даже по стилю общения стали ближе.

А вот GPT-5.2 тут стоит особняком.

Для меня использование разных моделей выглядит сейчас так:

● планирование, архитектура, рефакторинги, дебаггинг в существующей кодовой базе
GPT-5.2 xhigh

● реализация планов
GPT-5.3 Codex high-xhigh или GPT-5.2 high

● верификация (ревью, контроль техдолга)
GPT-5.2 xhigh

● интерактивная быстрая работа
GPT-5.3 Codex или Opus 4.6

● не очень большие (сравнительно) вайб-проекты с нуля
Opus 4.6

—

Прошлый обзор на GPT 5.1 / Gemini 3 Pro / Opus 4.5

#ai #model #review

Вайб-обзор на GPT-5.3 Codex, Opus 4.6 и (бонус) GPT-5.2 (22) Команды агентов Это фича больше Claud

Комментарии

Добавить комментарий Отменить ответ

Больше записей

А в чём прикол-то был Объясните

Ищем удалёнку за границей: в Твиттере собрали 11 лучших сайтов с вакансиями во всех сферах от айти

День анимешника отмечаем сегодня именно 11 апреля закрепилось как праздник любителей японских мульт

Убираем все следы ИИ из любого текста! Нашли сервис The AI Text Humanizer, который отредактирует тек