Мне тут подписчики подсказывают, что вышла новая модель Muse Spark
Давайте пока вместо тестирования мои мысли
1. Meta — они новички в кодировании, поэтому странно ждать от этой модели сильных результатов в кодировании. Были какие-то неудачные попытки делать Code LLama, но на текущий момент можно признать их провальными.
2. Мета сами пишут: Muse Spark демонстрирует конкурентоспособные результаты в задачах многомодального восприятия, рассуждения, здравоохранения и управления агентами, т.е. оринтирована больше на бенчим мультимодальности и на HLE, нежали на стандартные SWE Bench и Terminal Bench.
3. Есть какой-то LiveCodeBench Pro но я такой бенч не знаю, поэтому не могу ничего сказать. Но, в этом бенче модель всех разрывает.
В общем:
• моделька явно интересная для OpenClaw
• подождем, что скажут другие блогеры
Сейчас есть что тестировать, спойлеры:
1. orba/superpowers
2. GLM-5.1 vs Opus 4.6
Как Антропики нам показали, что можно добиться крутых результатов в кодировании, если сфокусироваться, то и нам тоже надо фокусироваться на чем-то одном.

Добавить комментарий