Создаёт видео, где человек на вашем фото говорит и двигает губами в такт загруженному аудио, с мимикой и лёгкими движениями головы. Цена зависит от модели: Standard - 10 ₽/сек., Pro - 18 ₽/сек.
Kling AI Avatar 2 - это нейросеть для “говорящих аватаров”: вы загружаете портретное фото и аудио, а на выходе получаете видео, где человек на снимке разговаривает в ритм вашей записи.
По заявлениям создателей и интеграторов, Avatar 2 делает упор на более естественную мимику (включая мелкие выражения лица), точный липсинк (синхронизацию губ со звуком) и более “живые” движения головы/плеч, чтобы результат выглядел менее “роботизированным”. Также встречается заявка на поддержку длинных роликов вплоть до нескольких минут, что удобно для озвучек, объяснялок и мини-презентаций.
Kling AI Avatar 2 обычно описывают как модель, которая старается делать речь “живее” за счёт мимики и микродвижений, а не просто “открывать/закрывать рот” под звук. Плюс у неё есть разделение на Standard и Pro - можно выбрать быстрее/дешевле или качественнее, в зависимости от задачи.