Протестировал Composer 2 Чтож, модель, похоже, действительно хорошая — оценка 4 из 5 (+ 1 бонусный

Протестировал Composer 2

Чтож, модель, похоже, действительно хорошая — оценка 4 из 5 (+ 1 бонусный аппарат).

Промпт:

Создайте Nokia 3310 с пиксельным экраном, игрой Змейка, составлением SMS и визуализатором классического рингтона.

Но, как обычно, есть нюансы:
• Тестировал я в Cursor CLI — и это нечто. Все там максимально криво и косо. И больше всего вымораживают сообщения — Connection lost. Retry attempted. — буквально на ровном месте. Так что, если, у вас стремный интернет (как у меня) настоятельно не рекомендую. Но обзор на Cursor CLI нужно делать отдельным постом. И постараться отделить косяки IDE от косяков модели, в этом посте тесты модели, а не IDE.
• Один аппарат из 5 оказался полностью не рабочий. У змейки нет еды. СМС набираются с ошибками. Только рингтон играет. У одного аппарта экран вылез за пределы корпуса.
• Основной косяк у модели — это надписи: Они все кривые и косые. На одном из скриншотов видно какие-то артефакты в главном меню, но там внутри интерфеса, все очень очень плохо. Особенно в Змейке. В принципе ровнота надписей она не должна влиять на результаты нашего теста, но у других моделей таких проблем не было.
• Модель только платная. Я пока не нашел бесплатных способов ее получить, как остальные китайские модели. Опять же вопрос, можно ли ее подключить в OpenCode? Ну скорее всего можно.
• Скорость работы протестировать решительно не ясно как. План пишет ну очень быстро, потом реализация очень медленная и постоянно вот эти Connection lost.
• Какие там лимиты совершенно не понятно. У меня на 6 телефонов Нокия ушло 6.9М токенов — $2 (из $20?) — если так, то реально очень дорого, потому что, такое качество можно получить совершенно за бесплатно.

Откуда взялся бонусный аппарат? Он из Cursor Desktop — там интерфейс намного намного лучше, чем CLI. И там ошибок Connection lost замечено не было. Это видимо чисто CLI фича.

Тут надо сделать какие-то выводы, а их так сразу сложно сделать, потому что цена модели ну совершенно не понятна. По-хорошему план такой:
• Отдельный пост с обзором CLI
• Отдельный пост с обзором лимитов
• Попутно выяснить, можно ли это добавить в OpenCode (т.к. там интерфес куда лучше, чем Cursor CLI)

И вот тогда можно будет вернутся, и закончить этот пост.

Главная интрига, лучше ли это чем Опус 4.6? Ну как вы наверное, догадались не лучше, даже если мы будем сравнивать версию с контекстным окном в 200к, а с 1м даже сравнивать нельзя. Но есть одна проблема, этот мой тест «со змейкой» он не предназначен для тестирования таких монстров как GPT-5.4 и Opus 4.6 — тут надо что-то более сложное придумывать (есть у меня одна идейка).

Один вывод можно сделать уверенно — это явно лучше, чем МиниМакс М2.5. С М2.7 надо еще поразбираться.

UPD: Нашел какую-то цену в интернете $2.501M — но как и где это купить?

Протестировал Composer 2

Чтож, модель, похоже, действительно хорошая — оценка 4 из 5 (+ 1 бонусный аппарат).

Промпт:

Создайте Nokia 3310 с пиксельным экраном, игрой Змейка, составлением SMS и визуализатором классического рингтона.

Но, как обычно, есть нюансы:
• Тестировал я в Cursor CLI — и это нечто. Все там максимально криво и косо. И больше всего вымораживают сообщения — Connection lost. Retry attempted. — буквально на ровном месте. Так что, если, у вас стремный интернет (как у меня) настоятельно не рекомендую. Но обзор на Cursor CLI нужно делать отдельным постом. И постараться отделить косяки IDE от косяков модели, в этом посте тесты модели, а не IDE.
• Один аппарат из 5 оказался полностью не рабочий. У змейки нет еды. СМС набираются с ошибками. Только рингтон играет. У одного аппарта экран вылез за пределы корпуса.
• Основной косяк у модели — это надписи: Они все кривые и косые. На одном из скриншотов видно какие-то артефакты в главном меню, но там внутри интерфеса, все очень очень плохо. Особенно в Змейке. В принципе ровнота надписей она не должна влиять на результаты нашего теста, но у других моделей таких проблем не было.
• Модель только платная. Я пока не нашел бесплатных способов ее получить, как остальные китайские модели. Опять же вопрос, можно ли ее подключить в OpenCode? Ну скорее всего можно.
• Скорость работы протестировать решительно не ясно как. План пишет ну очень быстро, потом реализация очень медленная и постоянно вот эти Connection lost.
• Какие там лимиты совершенно не понятно. У меня на 6 телефонов Нокия ушло 6.9М токенов — $2 (из $20?) — если так, то реально очень дорого, потому что, такое качество можно получить совершенно за бесплатно.

Откуда взялся бонусный аппарат? Он из Cursor Desktop — там интерфейс намного намного лучше, чем CLI. И там ошибок Connection lost замечено не было. Это видимо чисто CLI фича.

Тут надо сделать какие-то выводы, а их так сразу сложно сделать, потому что цена модели ну совершенно не понятна. По-хорошему план такой:
• Отдельный пост с обзором CLI
• Отдельный пост с обзором лимитов
• Попутно выяснить, можно ли это добавить в OpenCode (т.к. там интерфес куда лучше, чем Cursor CLI)

И вот тогда можно будет вернутся, и закончить этот пост.

Главная интрига, лучше ли это чем Опус 4.6? Ну как вы наверное, догадались не лучше, даже если мы будем сравнивать версию с контекстным окном в 200к, а с 1м даже сравнивать нельзя. Но есть одна проблема, этот мой тест «со змейкой» он не предназначен для тестирования таких монстров как GPT-5.4 и Opus 4.6 — тут надо что-то более сложное придумывать (есть у меня одна идейка).

Один вывод можно сделать уверенно — это явно лучше, чем МиниМакс М2.5. С М2.7 надо еще поразбираться.

UPD: Нашел какую-то цену в интернете $2.501M — но как и где это купить?

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *