Мне тут подписчики подсказывают, что вышла новая модель Muse Spark Давайте пока вместо тестирования

Мне тут подписчики подсказывают, что вышла новая модель Muse Spark

Давайте пока вместо тестирования мои мысли

1. Meta — они новички в кодировании, поэтому странно ждать от этой модели сильных результатов в кодировании. Были какие-то неудачные попытки делать Code LLama, но на текущий момент можно признать их провальными.

2. Мета сами пишут: Muse Spark демонстрирует конкурентоспособные результаты в задачах многомодального восприятия, рассуждения, здравоохранения и управления агентами, т.е. оринтирована больше на бенчим мультимодальности и на HLE, нежали на стандартные SWE Bench и Terminal Bench.

3. Есть какой-то LiveCodeBench Pro но я такой бенч не знаю, поэтому не могу ничего сказать. Но, в этом бенче модель всех разрывает.

В общем:
• моделька явно интересная для OpenClaw
• подождем, что скажут другие блогеры

Сейчас есть что тестировать, спойлеры:
1. orba/superpowers
2. GLM-5.1 vs Opus 4.6

Как Антропики нам показали, что можно добиться крутых результатов в кодировании, если сфокусироваться, то и нам тоже надо фокусироваться на чем-то одном.

https://ai.meta.com/blog/introducing-muse-spark-msl/

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *