Релизнулся самый доступный генератор речи — MOSS-TTS-Nano можно развернуть хоть на тостере: он работает на процессорах любой мощности!
• GPU вообще не нужен! Нейронка работает на процессоре в 4 ядра — можно запустить хоть на микроконтроллере.
• При этом озвучивает любые тексты без задержек — работает очень шустро.
• Знает 20 языков, включая русский.
• Моделька всего на 100 млн параметров, но выдает шикарный звук в 48 кГц.
• Клонирует любые голоса и озвучивает даже длинные тексты.
😶😶😶😶😶😶😶😶😶
Демка лежит — тут.
Код на GitHub — здесь.
👍 Бэкдор


Добавить комментарий