Meta запускает LLAMA-5 Muse Spark — первую модель от звёздной команды MSL, инженеры и исследователи которой привлекались миллиардными офферами. Бенчмарки вы можете видеть на картинке (bro thinks he’s with big boys).
На второй картинке — мультиагентский режим Contemplating (как Deep Think или GPT Pro).
На третьей картинке — эффективность претрейна, выраженная через способность модели предсказывать текст по ходу обучения (увеличения количества пропущенных через модель мощностей).
На четвертой картинке — качество в HLE в зависимости от количества агентов и задержке для пользователя.
Про релиз модели не написано ничего, весов я бы пока не ждал (но когда-то их обещают выпустить). Статьи тоже нет. Будет закрытое API для выбранных компаний + модель уже появилась в AI-сервисах компании, и пообщаться с ней можно на https://meta.ai/
Alexandr Wang, chief ai officer, написал, что бОльшие модели уже тренируются и их стоит ждать скоро.




Добавить комментарий