✴️ Вышла Gemini 3.1 Flash TTS
Google выпустила Gemini 3.1 Flash TTS — новую модель для генерации речи по тексту.
— Поддерживает более 70 языков и нативно генерирует диалоги с участием нескольких спикеров.
— Позволяет управлять стилем, темпом и акцентом с помощью текстовых аудиотегов, которые встраиваются прямо в промпт и могут менять интонацию посреди предложения.
— В Google AI Studio поддерживает настройку окружения сцены, создание профилей спикеров с «режиссерскими заметками» и экспорт заданных параметров в виде готового кода для Gemini API.
— Автоматически встраивает в сгенерированные файлы невидимый водяной знак SynthID для маркировки ИИ-контента.
— Стоит по API в 2 раза дороже 2.5 Flash TTS: $1.00 за Input и $20.00 за Output.
Доступна в режиме превью в Gemini API, Google AI Studio, на платформе Vertex AI и в сервисе Google Vids.

Добавить комментарий