Генерирует подходящие звуковые эффекты и фоновую музыку по вашему видео, чтобы ролик не был «немым». Цена - 7 ₽ за 1 видео.
Kling Video-to-Audio - нейросеть, которая берёт короткий видеоролик и создаёт к нему звук: шумы и эффекты (SFX) плюс фоновую музыку (BGM). Инструмент относится к экосистеме Kling от компании Kuaishou и заточен именно под «озвучку по картинке», когда нужно, чтобы звук попадал в происходящее на экране.
По описаниям в источниках, Kling Video-to-Audio умеет автоматически подбирать и синхронизировать звуки под события в кадре (например, шаги, всплески воды, движение машин), а также добавлять фоновую музыку под настроение сцены. Отдельно упоминается режим ASMR - он усиливает «микро-детали» и эффект близкого микрофона, чтобы шорохи и фоли звучали более иммерсивно.
Вы загружаете видео (до 20 секунд), а модель «смотрит», что происходит в кадре: движения, действия, окружение. Дальше она генерирует звуковую дорожку, стараясь попасть по таймингу - например, чтобы удар двери звучал в момент хлопка, а волны шли фоном, пока в кадре море.
Если добавить текстовые подсказки, вы как бы направляете модель: какие именно звуки нужны и какая музыка должна играть. Подсказки можно оставить пустыми - тогда нейросеть попытается озвучить видео сама.
Kling Video-to-Audio - это именно «видео -> озвучка», то есть модель отталкивается от картинки и старается подогнать звук под действия в кадре. В отличие от генераторов «текст -> звук», здесь проще получить синхронизацию (когда звуки возникают в нужные моменты), а ASMR-режим полезен для сцен, где важны мелкие фоли-детали.