✴️ DeepSeek выпустит флагманскую модель V4
Издание The Information сообщает, что DeepSeek планирует релиз модели следующего поколения DeepSeek-V4 в ближайшие недели. Ожидается, что запуск состоится в середине февраля, во время празднования китайского Нового года. Компания собирается повторить успех Deepseek R1, которая вышла в январе 2025.
— Внутренние бенчмарки показывают, что V4 превосходит Claude от Anthropic и серию GPT от OpenAI в задачах программирования.
— Достигнут прорыв в обработке сверхдлинных промптов.
— Модель демонстрирует улучшенные способности к рассуждению, аналогично модели R1.
— Для обучения использовались чипы Nvidia Blackwell, полученные через сложные цепочки поставок.
— В обновленных документах упоминается использование технологии mHC и механизма sparse attention (разреженное внимание).
— Валидация качества проводится через LmArena для исключения предвзятости в оценках.
Вероятная дата релиза — около 17 февраля, при этом возможно раннее появление модели на лидербордах для тестирования.

Добавить комментарий