✴️ Google представила Gemini 3.1 Flash Live
Google выпустила Gemini 3.1 Flash Live — модель для живых голосовых диалогов, которая умеет не просто отвечать, а адаптироваться к речи пользователя на лету.
Главный фокус — естественное общение: модель лучше понимает интонацию, темп и эмоции, а также быстрее реагирует и держит контекст.
Что умеет:
🟡 точнее распознаёт тон, эмоции и темп речи
🟡 может менять ответы по ходу диалога, если слышит недовольство или замешательство
🟡 работает даже при фоновом шуме
🟡 удерживает контекст разговора в 2 раза дольше
🟡 быстрее отвечает по сравнению с предыдущей версией
По бенчмаркам:
🟡 90.8% в ComplexFuncBench Audio (многошаговые задачи)
🟡 36.1% в Scale AI Audio MultiChallenge (длинные инструкции с перебиваниями)
Дополнительно:
🟡 во все аудио встроен невидимый watermark SynthID
🟡 модель уже доступна через Gemini Live API, AI Studio и Enterprise
🟡 работает в 200+ странах

Добавить комментарий