Вышла Gemini 3.1 Flash TTS Google выпустила Gemini 3.1 Flash TTS новую модель для генерации речи п

✴️ Вышла Gemini 3.1 Flash TTS

Google выпустила Gemini 3.1 Flash TTS — новую модель для генерации речи по тексту.

— Поддерживает более 70 языков и нативно генерирует диалоги с участием нескольких спикеров.
— Позволяет управлять стилем, темпом и акцентом с помощью текстовых аудиотегов, которые встраиваются прямо в промпт и могут менять интонацию посреди предложения.
— В Google AI Studio поддерживает настройку окружения сцены, создание профилей спикеров с «режиссерскими заметками» и экспорт заданных параметров в виде готового кода для Gemini API.
— Автоматически встраивает в сгенерированные файлы невидимый водяной знак SynthID для маркировки ИИ-контента.
— Стоит по API в 2 раза дороже 2.5 Flash TTS: $1.00 за Input и $20.00 за Output.

Доступна в режиме превью в Gemini API, Google AI Studio, на платформе Vertex AI и в сервисе Google Vids.

💠 PERCEPTRON.

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *