Мой воркфлоу: Opus 4.5, Gemini 3 Pro, GPT-5.1-Codex-Max Коль скоро новыйая Opus теперь доступна в п

Мой воркфлоу: Opus 4.5, Gemini 3 Pro, GPT-5.1-Codex-Max

Коль скоро новыйая Opus теперь доступна в подписке Claude за 20$, самое время для нового поста.
В «свободное от работы время» я пишу Next.js фулл стэк приложение полностью нейронками. Интересно, что еще год назад, когда мы делали CodeAlive и нужно было запрогать фронтэнд, мы нанимали разработчика для этого — сейчас уже, покодив пару недель фронт, в принципе, я делаю вывод, что любой бекендщик с какой-то элементарной базой по фронтэнду (стэк, линтинг), может вполне успешно генерить красивый и функциональный фронт разной сложности. Конечно, UX в таком случае всегда будет слабым местом, но это уже совсем другая история, о которой я обязательно отдельно расскажу чуть позже.
А теперь, к сравнению. Все, что ниже почти полностью базируется на моем опыте.

Opus 4.5 — бизнес аналитик и архитектор.
Горячо рекомендую Opus 4.5 для создания/дошлифовки спеки или плана (SDD) — мне понравилось как он работает в Plan Mode внутри CC — особенно актуально когда вы даете на вход не до конца проработанную фичу (а фичи вообще редко когда сразу хорошо продуманы), Claude в этом случае прежде, чем перейти к реализации, задаст вам ряд хороших уточняющих вопросов — для взрослой разработки самое то. Кстати, на создание одного такого плана у меня ушло 5$ extra usage (это было ещё до того, как Опус открыли для Pro подписки).
Отмечу ещё, что Опус за one shot решила заковыристую задачу по фронтэнду, с которой Gemini 3 Pro не справилась даже за несколько запросов.
Из неочевидного — бенчмарки на качество код ревью показывают очень низкие результаты для Opus 4.5. В CC перключиться на Opus можно командой /model.

Едем дальше — по остальным моделям сейчас картина следующая:
Gemini 3 Pro + Nano Banana Pro — дизайнер и очень скиловый frontend разработчик, который почти наверняка напишет вам куда более крутой дизайн, чем большинство студий. Проще всего использовать внутри Antigravity, там же удобно запрягать эту модельки сходить потестировать ваше приложение в браузере — уж больно хорошо субагент в Antigravity управляет браузером. В «ежедневной» агентной разработке пока не нашел места для новой Gemini.

Sonnet 4.5 — быстрый, но иногда невнимательный джун-исполнитель, который может пропускать пункты спеки или делать их «на отвали», поэтому ей лучше не давать большие задачи и выполнение спеки. А еще, 1Сники очень хвалят эту модель как выдающуюся для BSL.

GPT-5.1-Codex-Max (medium) — медленный, но довольно внимательный к деталям джун-исполнитель. Пока лучший вариант для выполнения больших задач по спеке (не считая комбайнов типа CodeMachine).

GPT-5.1-Codex-Max (xhigh) — а это программист-олимпиадник, способный придумать и реализовать наиболее запутанные алгоритмы и найти причину даже самых коварных багов. Еще, вероятно, это лучшая CLI-комбинация для глубокого код ревью. Напомню, что запускается эта модель командой codex --config model_reasoning_effort="xhigh".

Бонус: GPT 5.1 Pro — это, пожалуй, лучший выбор если вы хотите за one-shot нагенерить план реализации и архитектуру для целого сервиса или эпика по тех. заданию — буквально, скидываете ей описание сервиса или фичи, функциональные и нефункциональные требования и получаете почти готовый план реализации. Она подумает 10-20 минут и выдаст наиболее продуманный результат, который потом можно дорабатывать через ту же Opus и отдавать дальше на реализацию исполнителям. Лайфхак: просите эту модель продумать только архитектуру, схему БД, DTOшки, использовать UML/C4 и НЕ писать код. А конкретный код и финальную реализацию пусть пишут кодагенты, подстраиваясь под ваш проект. В сложном код ревью прошка тоже с большей вероятностью отработает лучше всех. Это весьма продвинутый подход к SDD (Spec-Driven Development) — напишите, если интересно подробнее почитать про этот флоу, там есть что описывать.

Кстати, друг нашего канала Максим Этихлид тоже выпустил отличный обзор на новенькие LLMки, если еще не читали, как всегда — рекомендую.

А какие результаты новые модельки показывают на ваших задачах? На сколько преобразился ваш воркфлоу за последний месяц?

@ai_driven

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *