✴️ Google представила Gemini 3.1 Flash Live
Google выпустила аудиомодель Gemini 3.1 Flash Live для голосовых диалогов в реальном времени.
— Набирает 90.8% в тесте ComplexFuncBench Audio (многошаговый вызов функций) и 36.1% в Scale AI Audio MultiChallenge с включенным режимом размышлений (выполнение длинных инструкций с учетом перебиваний).
— Распознает интонации, высоту тона и темп речи точнее версии 2.5 Flash Native Audio.
— Адаптирует ответы на лету, если слышит в голосе пользователя недовольство или замешательство.
— Отвечает быстрее и удерживает контекст беседы в два раза дольше предыдущей модели.
— Выполняет задачи в условиях фонового шума.
— Встраивает во все сгенерированные аудио невидимый водяной знак SynthID.
Доступно разработчикам через Gemini Live API в Google AI Studio, корпоративным клиентам в Gemini Enterprise и пользователям в Search Live и Gemini Live. Мультиязычная версия развернута более чем в 200 странах.


Добавить комментарий