Qwen 3.5 Medium: больше интеллекта за меньше вычислений Alibaba Cloud показали среднюю линейку Qwen

✴️ Qwen 3.5 Medium: «больше интеллекта за меньше вычислений»

Alibaba Cloud показали среднюю линейку Qwen 3.5 — набор моделей, которые делают ставку на архитектуру, данные и RL, а не на «просто больше параметров». В серию вошли Qwen3.5-Flash, Qwen3.5-35B-A3B, Qwen3.5-122B-A10B и Qwen3.5-27B.

Главный тезис релиза — эффективность:
🟡 35B-A3B якобы обходит прошлые гиганты Qwen вроде Qwen3-235B-A22B-2507 и Qwen3-VL-235B-A22B. Это хороший сигнал, что прирост качества всё чаще даёт правильная архитектура + качество датасетов + дообучение, а не только размер.
🟡 122B-A10B и 27B продолжают сужать разрыв между «средним классом» и frontier-моделями, особенно в задачах, где нужно вести агента, планировать шаги и работать с инструментами.

Отдельно про Qwen3.5-Flash — это production-хостед версия, «по смыслу» близкая к 35B-A3B, но с упором на удобство:
🟡 1M контекст по умолчанию
🟡 официальные встроенные инструменты (tool-use из коробки)

Где попробовать и скачать:
🟡 Коллекция моделей на HF: Qwen 3.5 (коллекция)
🟡 Qwen Chat: Flash122B-A10B

🤑 ForgetMe | Boosty

Приобрести подписку на любые сервисы
@forgetshop_bot

#нейросети #новости #qwen

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *