DeepSeek R2 или V4 на подходе В официальном репозитории DeepSeek заметили следы подготовки к релизу

✴️ DeepSeek R2 или V4 на подходе

В официальном репозитории DeepSeek заметили следы подготовки к релизу новой модели. Разработчики обновили код библиотеки, добавив настройки под архитектуру, которая отличается от текущей версии V3.

Обычно такие изменения появляются за несколько дней до официального анонса.

— В коде библиотеки FlashMLA (инструмент для ускорения работы ИИ) нашли упоминание новой сущности MODEL1.
— Изменились требования к памяти: для новой модели шаг кэширования составляет 576 байт, тогда как для текущей V3 нужно 656 байт.
— Это подтверждает, что DeepSeek создали иную, более оптимизированную архитектуру.
— Находка совпала с годовщиной выхода DeepSeek-R1 (прошел ровно год), что подогревает слухи о скором релизе.

@ThePerceptronChannel

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *