Kling 3.0, Omni 3.0 и Image 3.0
В теории это значит, что теперь Kling безоговорочная SOTA — он и так составлял достойную конкуренцию Veo 3.1, обладая более широким функционалом и разрешением 1080p (не только через API). O1 была не самой лучшей в плане качества, но уже мультимодальной, а теперь на вход генерации можно подавать голос и даже видео в качестве элементов. Вдобавок они выкатили еще и Kling Image 3.0. Судя по успеху motion control, новое поколение моделей должно быть крайне удачным.
Черипики у Klinga ну просто какие-то божественные, в слепом тесте я бы никогда не отличил от реальных футажей. Но это черипики, а у них они всегда были хорошие.
Генерации теперь до 15 секунд (было 10) с выбором длительности шота с шагом в 1 секунду. Появился Multi-shot как в Sora 2, прикрутили нативный звук в OMNI модель и обновили Elements 3.0. Вроде как улучшили и текст, хотя не помню, чтобы с этим были проблемы.
А вот редактирования видео я пока не увидел, его можно подавать как элемент, причём генератор будет референсить движение в кадре, в том числе мимику актера. Кстати, про русский язык в анонсе не написано, интересно, будет ли поддержка.
И всё-таки я всё ещё не фанат элементов, какие бы крутые они ни были — сгенерировать начальный кадр сейчас гораздо проще и даёт больше контроля, а видос по-прежнему генерить дорого, и я сомневаюсь, что результат будет лучше чем у бананы. В этом плане обновление Kling Image 3.0 звучит гораздо интереснее. Там, как всегда, всё стало лучше, а из новых фич добавилась генерация сторибордов, где по одному промпту генерится серия последовательных во времени кадров. NanoBanana тоже таким хвалилась, но что-то, видимо, у них не задалось, не видел, чтобы эта фича нашла применение, так ещё и гугл во всю режут лимиты и косты на компьют.
Новая версия доступна на плане Ultra, на других должно быть скоро.
Ну что, догнали Kling флагмана от гугл, как думаете? Буржуа с подпиской ультра, прошу, скидывайте тесты в комментарии!
Добавить комментарий