Обновился рейтинг arena.ai по кодированию Сегодня необычный такой обзор с 6 по 18 место. Просто, в

Обновился рейтинг arena.ai по кодированию

Сегодня необычный такой обзор с 6 по 18 место. Просто, в топ 10 ничего особо интересного не происходит, пока GLM 5.1 тестируется.

Итак,

1. MiniMax M2.7 набрал на 1 elm меньше, чем kimi-k2.5-thinking. А разговоров-то было… единственное, что там размер модели в 2 раза меньше, но он не опенсорц.

2. qwen3.6-plus-preview набрал 1454 elo на 9 место (это ноздря в ноздрю с Gemini 3.1 Pro, это солидно больше GLM-5, который при длительном тестировании от GLM-4.7 отличие на 2 балла.

Получатеся, по ценекачеству сейчас GLM 4.7 оптимальный выбор.

Чет-то DeepSeek обещали выпустить V4 и всех порвать, так что ждем.

https://arena.ai/leaderboard/code

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *