✴️ Вышла Qwen3-Max-Thinking
Команда Qwen представила флагманскую рассуждающую модель Qwen3-Max-Thinking. Архитектура масштабирована для улучшения фактических знаний и возможностей агента, достигая уровня GPT-5.2-Thinking, Claude-Opus-4.5 и Gemini 3 Pro.
— Внедрен механизм adaptive tool-use: модель автономно решает, когда использовать поиск, память или интерпретатор кода.
— Улучшенное «время на размышление» (test-time scaling): модель не генерирует кучу вариантов параллельно, а последовательно дорабатывает решение, учитывая выводы прошлых шагов.
— В бенчмарке Arena-Hard v2 модель получила оценку 90.2, а после скейлинга превосходит Gemini 3 Pro в GPQA (92.8) и LiveCodeBench (91.4).
— API полностью совместимо с протоколами OpenAI и Anthropic, что позволяет использовать модель напрямую в инструменте Claude Code.
Модель уже доступна бесплатно в веб-чате и через API на платформе Alibaba Cloud.


Добавить комментарий