Qwen 3.5 Medium: больше интеллекта за меньше вычислений Alibaba Cloud показали среднюю линейку Qwen

Написано

✴️ Qwen 3.5 Medium: «больше интеллекта за меньше вычислений»

Alibaba Cloud показали среднюю линейку Qwen 3.5 — набор моделей, которые делают ставку на архитектуру, данные и RL, а не на «просто больше параметров». В серию вошли Qwen3.5-Flash, Qwen3.5-35B-A3B, Qwen3.5-122B-A10B и Qwen3.5-27B.

Главный тезис релиза — эффективность:
🟡 35B-A3B якобы обходит прошлые гиганты Qwen вроде Qwen3-235B-A22B-2507 и Qwen3-VL-235B-A22B. Это хороший сигнал, что прирост качества всё чаще даёт правильная архитектура + качество датасетов + дообучение, а не только размер.
🟡 122B-A10B и 27B продолжают сужать разрыв между «средним классом» и frontier-моделями, особенно в задачах, где нужно вести агента, планировать шаги и работать с инструментами.

Отдельно про Qwen3.5-Flash — это production-хостед версия, «по смыслу» близкая к 35B-A3B, но с упором на удобство:
🟡 1M контекст по умолчанию
🟡 официальные встроенные инструменты (tool-use из коробки)

Где попробовать и скачать:
🟡 Коллекция моделей на HF: Qwen 3.5 (коллекция)
🟡 Qwen Chat: Flash • 122B-A10B

🤑 ForgetMe | Boosty

Приобрести подписку на любые сервисы
⏩ @forgetshop_bot

#нейросети #новости #qwen

Qwen 3.5 Medium: больше интеллекта за меньше вычислений Alibaba Cloud показали среднюю линейку Qwen

Комментарии

Добавить комментарий Отменить ответ

Больше записей

А в чём прикол-то был Объясните

Ищем удалёнку за границей: в Твиттере собрали 11 лучших сайтов с вакансиями во всех сферах от айти

День анимешника отмечаем сегодня именно 11 апреля закрепилось как праздник любителей японских мульт

Убираем все следы ИИ из любого текста! Нашли сервис The AI Text Humanizer, который отредактирует тек