Обновился рейтинг arena.ai по кодированию Сегодня необычный такой обзор с 6 по 18 место. Просто, в

Написано

Обновился рейтинг arena.ai по кодированию

Сегодня необычный такой обзор с 6 по 18 место. Просто, в топ 10 ничего особо интересного не происходит, пока GLM 5.1 тестируется.

Итак,

1. MiniMax M2.7 набрал на 1 elm меньше, чем kimi-k2.5-thinking. А разговоров-то было… единственное, что там размер модели в 2 раза меньше, но он не опенсорц.

2. qwen3.6-plus-preview набрал 1454 elo на 9 место (это ноздря в ноздрю с Gemini 3.1 Pro, это солидно больше GLM-5, который при длительном тестировании от GLM-4.7 отличие на 2 балла.

Получатеся, по ценекачеству сейчас GLM 4.7 оптимальный выбор.

Чет-то DeepSeek обещали выпустить V4 и всех порвать, так что ждем.

https://arena.ai/leaderboard/code

Обновился рейтинг arena.ai по кодированию Сегодня необычный такой обзор с 6 по 18 место. Просто, в

Комментарии

Добавить комментарий Отменить ответ

Больше записей

Протестировал Qwen 3.6 Plus Оценка 3 из 5 (Может ему не свезло и если делать 10 шотов, то результат

Grok Heavy самая бессмысленная подписка в мире Оформил её, чтобы протестировать Heavy-модель, и ос

Кооп завезли в Mount & Blade 2 коммьюнити буквально умоляло разрабов выкатить эту фичу и они вы

Протестировал GPT-4.1 Ребята, Ребята, посмотрите какую игру змейка сделал старичок GPT-4.1 Промпт: