Представлена Claude Mythos Preview Anthropic анонсировала непубличную модель Claude Mythos Preview,

✴️ Представлена Claude Mythos Preview

Anthropic анонсировала непубличную модель Claude Mythos Preview, специализированную на поиске и эксплуатации уязвимостей в коде. Одновременно запущен Project Glasswing — совместная инициатива с AWS, Apple, Google, Microsoft, NVIDIA и другими IT-корпорациями для защиты критической инфраструктуры с применением новой модели.

— Автономно обнаруживает уязвимости нулевого дня (ранее неизвестные разработчикам критические баги) и пишет эксплойты без участия человека, успешно находя ошибки в ядре Linux, OpenBSD, основных браузерах и библиотеке FFmpeg.
— Обходит Claude Opus 4.6 в тестах на написание кода и работу агентов: набирает 83.1% в CyberGym, 77.8% в SWE-bench Pro и 82.0% в Terminal-Bench 2.0.
— Показывает 94.6% в бенчмарке GPQA Diamond и 64.7% в Humanity’s Last Exam при использовании внешних инструментов.
— Расходует в 4.9 раза меньше токенов по сравнению с Opus 4.6 при выполнении задач в BrowseComp.
— Тарифицируется по цене $25 за 1 млн входных и $125 за 1 млн выходных токенов.

Модель не планируется к публичному релизу. Доступ открыт только участникам Project Glasswing и более чем 40 доверенным организациям через Claude API, Amazon Bedrock, Google Vertex AI и Microsoft Foundry. Для поддержки тестирования Anthropic выделила $100 млн в виде кредитов на API и пожертвовала $4 млн разработчикам открытого ПО, включая Linux Foundation и Apache. Для массового рынка компания разрабатывает новые механизмы безопасности, которые дебютируют в предстоящем релизе семейства Claude Opus.

💠 PERCEPTRON.

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *