DeepSeek выпустит флагманскую модель V4 Издание The Information сообщает, что DeepSeek планирует ре

✴️ DeepSeek выпустит флагманскую модель V4

Издание The Information сообщает, что DeepSeek планирует релиз модели следующего поколения DeepSeek-V4 в ближайшие недели. Ожидается, что запуск состоится в середине февраля, во время празднования китайского Нового года. Компания собирается повторить успех Deepseek R1, которая вышла в январе 2025.

— Внутренние бенчмарки показывают, что V4 превосходит Claude от Anthropic и серию GPT от OpenAI в задачах программирования.
— Достигнут прорыв в обработке сверхдлинных промптов.
— Модель демонстрирует улучшенные способности к рассуждению, аналогично модели R1.
— Для обучения использовались чипы Nvidia Blackwell, полученные через сложные цепочки поставок.
— В обновленных документах упоминается использование технологии mHC и механизма sparse attention (разреженное внимание).
— Валидация качества проводится через LmArena для исключения предвзятости в оценках.

Вероятная дата релиза — около 17 февраля, при этом возможно раннее появление модели на лидербордах для тестирования.

@ThePerceptronChannel

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *