✴️ Google представила Gemini 3.1 Flash-Lite
Разработчикам открыли превью Gemini 3.1 Flash-Lite — это самая быстрая и экономичная модель серии Gemini 3 на данный момент. Новинка уже доступна в режиме preview в Google AI Studio и Vertex AI.
По сравнению с версией 2.5 Flash модель показывает заметный прирост производительности. Заявлено:
🟡 +45% к скорости генерации вывода
🟡 в 2,5 раза быстрее первый ответ (Time to First Token)
🟡 улучшенная эффективность при более низкой стоимости
Модель получила динамические уровни «мышления» — она автоматически подбирает глубину обработки под сложность задачи. Это значит, что простые запросы выполняются максимально быстро, а более сложные получают дополнительную вычислительную «проработку».
По цене всё тоже агрессивно:
🟡 $0.25 за 1 млн входных токенов
🟡 $1.50 за 1 млн выходных токенов
Flash-Lite позиционируется как вариант для реального времени и масштабируемых сценариев, где важны скорость, стабильность и контроль бюджета. По соотношению цена/производительность модель ориентирована на массовые продакшн-нагрузки.

Добавить комментарий