✴️ DeepSeek R2 или V4 на подходе
В официальном репозитории DeepSeek заметили следы подготовки к релизу новой модели. Разработчики обновили код библиотеки, добавив настройки под архитектуру, которая отличается от текущей версии V3.
Обычно такие изменения появляются за несколько дней до официального анонса.
— В коде библиотеки FlashMLA (инструмент для ускорения работы ИИ) нашли упоминание новой сущности MODEL1.
— Изменились требования к памяти: для новой модели шаг кэширования составляет 576 байт, тогда как для текущей V3 нужно 656 байт.
— Это подтверждает, что DeepSeek создали иную, более оптимизированную архитектуру.
— Находка совпала с годовщиной выхода DeepSeek-R1 (прошел ровно год), что подогревает слухи о скором релизе.

Добавить комментарий