Очередной пост про Gemma 4 Gemma 4 31B заняла 3-е место на LMArena среди всего опенсорса уступила

Очередной пост про Gemma 4

• Gemma 4 31B заняла 3-е место на LMArena среди всего опенсорса — уступила только GLM 5 и Kimi K2.5, которые весят в 20–35 раз больше. В общем рейтинге — 27-е место, выше Opus 4.1 и Gemini 2.5 Pro. Да, это рейтинг типа «какой ответ больше понравился», а не строгий бенчмарк, и в реальной работе Gemma будет явно слабее того же Opus 4.1. Но сам факт, что 31B-модель для кого-то обходит по восприятию ещё недавно топовые закрытые модели, показателен

Thinking даёт огромный буст. Даже версии на 2–4B отвечают с ним кратно лучше, чем без. В AI Edge Gallery на Android и iOS это переключается в настройках. В LMStudio на Mac (где я тоже юзаю гемму) это делается через добавление тега <|think|> в начало системного промпта модели

Уже появились Uncensored-версии для 2B и 4B — цензура там вырезана полностью, модель отвечает на всё без отказов. Но большого смысла в отсутствии цензуры у мелких моделей нет — они всё равно вряд ли дадут толковый ответ на запретную тему. Ждём Uncensored для 31B, вот там будет интереснее!

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *