✴️ Claude Opus 4.6 забрала топ-1 в Arena.ai
Gemini 3 Pro теперь не лидер. Anthropic сместила модель Google с первого места в текстовом рейтинге, где та лидировала с момента выхода.
Результаты слепых тестов:
— Text Arena: 1496 Elo (+10 к Gemini).
— Code Arena: 1576 Elo (скачок +74 относительно Opus 4.5).
— Expert Arena: Отрыв 49 очков от Opus 4.5.
Теперь Opus 4.6 удерживает лидерство сразу в трёх категориях на арене: код, текст и хардкорные задания, хотя Gemini продолжает быть лучшим в мультимодальных задачах (зрение).



Добавить комментарий