Протестировал GPT-5.4 — medium — результат 5 из 5 Я ж вам говорил, этот дизайн вы ни с чем не спута

Написано

Протестировал GPT-5.4 — medium — результат 5 из 5

Я ж вам говорил, этот дизайн вы ни с чем не спутаете… результат 5 из 5 даже с medium thinking. Но, как обычно есть нюансы.

Промпт:

Создайте…

1. Все телефоны настолько курпные, что не влезают в экран.
2. Все аппараты ровные, экраны нигде не торчат за пределы корпуса (но если вы присмотритесь, некоторые клавиатуры кривые и косые).
3. Иногда он пишет туду список, иногда не пишет (не знаю, на что это влияет). Так же в режиме задавания вопросов, иногда он задает больше вопросов иногда меньше, так что имеет смысл написать: «задай мне как можно больше вопросов».

Больше у меня основных замечаний нет.

Но, есть дополнительные нюасны:
• В 2х змейках из 5 нет экрана гейм овер. Некоторые змейки стартуют только после нажатия на ок, что уже не канонично. (у китайцев таких приколов не было).
• У некоторых аппаратов отправлются смс (но не у всех).
• Видно, что он пыхтит и старается сделать Нокия Тюн, но только у 1 из 5 это реально Нокия Тюн.
• У последнего аппарата экран настолько пикселявый, что ничего не видно (у Опуса кстати, был аналогичный, но другой косяк).
• Если аппарат не стартует, возможно надо запусить веб сервер (я в этом еще не очень силен).

Выводы:

Мы видим, что создать телефон с игрой змейка, редактором смс и визуализатором мелодии для топовых американских моделей за 10 минут задача не сложная даже для среднего мышления с ван шота без тестирования (только нужен хотя бы нативный режим планирования).

Им не нужно объяснять, что «экран не должен торчать за пределы корпуса обязательно проверь».

GPT-5.4 делает намного-намного-намного дешевле Opus 4.6. Но, чисто субъективно, Opus 4.6 визуально делает на голову выше GPT-5.4, который в отличае от китайцев делает все ровно и аккуратно.

Так что:
Если у вас много свободного времени и для вас важна цена — китайские модели напишут вам кучу забагованного кода, (даже GLM-5.1), который вам потом долго тестировать.
Если у вас денег дофига — то американцы, делают все в 3-5 раз дороже и качественне, но тестировать все равно вам придется.

Тут такая делема, что по времениденьгам? Написать доп. промпт «Экран не ровный исправь» (но это происходит в 20% случаев), или поставить на автопилот и не парится.

Что же по лимитам?

Как я писал ранее, на 1 аппарат уходит 5% обычного пятичасового лимита Плюс за $20. На все 5 аппаратов ушло 26% пятичасового лимита. Иногда он тратит 75% контекста, иногда 69%, иногда 79%. Вот 5% контекста — примерно 1% дневного лимита )

Протестировал GPT-5.4 — medium — результат 5 из 5

Промпт:

Создайте…

Больше у меня основных замечаний нет.

Выводы:

Им не нужно объяснять, что «экран не должен торчать за пределы корпуса обязательно проверь».

Что же по лимитам?

Протестировал GPT-5.4 — medium — результат 5 из 5 Я ж вам говорил, этот дизайн вы ни с чем не спута

Комментарии

Добавить комментарий Отменить ответ

Больше записей

Реддит удивляет интересным взглядом на ситуацию с агентами и вайб-кодингом. Только в отличии от рабо

Россиян начали карать за смайл Какашка ростовчанину впаяли штраф в 30 000 рублей за то, что он пост

Хороший вопрос задал подписчик в чате Будем постепенно двигаться в этом направлении. Только я не о

Теперь Клод Код может сам себе писать промпты В последних версиях добавлии ScheduleWakeup — этот ме