Claude Opus 4.6 забрала топ-1 в Arena.ai Gemini 3 Pro теперь не лидер. Anthropic сместила модель Go

✴️ Claude Opus 4.6 забрала топ-1 в Arena.ai

Gemini 3 Pro теперь не лидер. Anthropic сместила модель Google с первого места в текстовом рейтинге, где та лидировала с момента выхода.

Результаты слепых тестов:

Text Arena: 1496 Elo (+10 к Gemini).
Code Arena: 1576 Elo (скачок +74 относительно Opus 4.5).
Expert Arena: Отрыв 49 очков от Opus 4.5.

Теперь Opus 4.6 удерживает лидерство сразу в трёх категориях на арене: код, текст и хардкорные задания, хотя Gemini продолжает быть лучшим в мультимодальных задачах (зрение).

@ThePerceptronChannel

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *