Топ 3 самых недооценённых модельки сейчас по моему мнению: 1) Grok 4.1 Fast Модель с отличными аген

Топ 3 самых недооценённых модельки сейчас по моему мнению:

1) Grok 4.1 Fast
Модель с отличными агентными способностями — можно дать ей хоть 25 разных инструментов, и она будет грамотно ими пользоваться. С тулзами работает, пожалуй, даже лучше чем Claude Opus: Grok проактивен и сам догадывается вызвать нужный инструмент, даже если ты об этом не просил. Другие модели так делают редко

При этом она очень дешёвая по API (0.2/0.5$), быстрая и достаточно умная. А ещё с минимальной цензурой. Контекстное окно — 2 миллиона токенов, хотя реально комфортная работа, скорее всего, до 50–100к. По-моему Grok 4.1 Fast куда интереснее перехайпленной Gemini 3 Flash. Это сейчас лучшее решение, к примеру, как для собственного агента внутри Telegram-бота; он совмещает все нужные качества в себе: скорость, цена, качество, агентность

2) Minimax M2.1
Это китайская моделька, которая напомнила мне Claude своим стилем общения и вызовом тулов. Сейчас из китайцев хайпуют GLM, но Minimax тоже очень крута, многие недооценивают. Она также дешевая (0.2/1.2$), выбивает аж 74% на SWE-bench (это почти как Opus 4.1), хорошо общается на русском. Конечно, бенчмаркам я бы верить слепо не стал, и естественно прям до уровня Opus 4.1 ей далеко. Но она явно ничем не хуже GLM 4.7, которая сейчас популярна

3) Gemma 3
Модельке почти уже год, а она всё еще остаётся лучшей из небольших моделек для телефона/ноутбука для повседневного юза. Я через это приложение на айфоне гоняю Gemma 3 4B.
У неё тот же плюс, что и у моделей Gemini — широкая база знаний. В модельку весом 3 ГБ уместилось очень много информации, о которой не знают даже некоторые крупные модели — настоящая Википедия в кармане :))
Да, галлюцинаций хватает, но это лучше, чем ничего, и постоянно выручает, когда нужно что-то узнать, а интернета нет. Тестировал конкурентов вроде Ministral — на русском они заметно хуже.
Gemma 3 радует, жду Gemma 4 🥺

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *