Очередной пост про Gemma 4 Gemma 4 31B заняла 3-е место на LMArena среди всего опенсорса уступила

Написано

Очередной пост про Gemma 4

• Gemma 4 31B заняла 3-е место на LMArena среди всего опенсорса — уступила только GLM 5 и Kimi K2.5, которые весят в 20–35 раз больше. В общем рейтинге — 27-е место, выше Opus 4.1 и Gemini 2.5 Pro. Да, это рейтинг типа «какой ответ больше понравился», а не строгий бенчмарк, и в реальной работе Gemma будет явно слабее того же Opus 4.1. Но сам факт, что 31B-модель для кого-то обходит по восприятию ещё недавно топовые закрытые модели, показателен

• Thinking даёт огромный буст. Даже версии на 2–4B отвечают с ним кратно лучше, чем без. В AI Edge Gallery на Android и iOS это переключается в настройках. В LMStudio на Mac (где я тоже юзаю гемму) это делается через добавление тега <|think|> в начало системного промпта модели

• Уже появились Uncensored-версии для 2B и 4B — цензура там вырезана полностью, модель отвечает на всё без отказов. Но большого смысла в отсутствии цензуры у мелких моделей нет — они всё равно вряд ли дадут толковый ответ на запретную тему. Ждём Uncensored для 31B, вот там будет интереснее!

Очередной пост про Gemma 4 Gemma 4 31B заняла 3-е место на LMArena среди всего опенсорса уступила

Комментарии

Добавить комментарий Отменить ответ

Больше записей

Протестировал Qwen 3.6 Plus Оценка 3 из 5 (Может ему не свезло и если делать 10 шотов, то результат

Grok Heavy самая бессмысленная подписка в мире Оформил её, чтобы протестировать Heavy-модель, и ос

Кооп завезли в Mount & Blade 2 коммьюнити буквально умоляло разрабов выкатить эту фичу и они вы

Протестировал GPT-4.1 Ребята, Ребята, посмотрите какую игру змейка сделал старичок GPT-4.1 Промпт: