Синхронизирует движения губ и речь в видео по загруженному аудио, чтобы персонаж выглядел говорящим естественно. Цена: Fast - 3 ₽/сек., Обычная - 480p: 6 ₽/сек., 720p: 12 ₽/сек.
InfiniteTalk Video - нейросеть для «озвучки» видео: вы загружаете ролик и отдельную аудиодорожку, а на выходе получаете видео, где губы (и часто мимика) подстраиваются под речь.
По заявлениям авторов InfiniteTalk, модель заточена не только на рот: она старается согласовать с аудио ещё и движения головы, выражение лица и даже позу, чтобы результат выглядел живее. Ещё одна заявленная особенность - поддержка очень длинных роликов (вплоть до «почти любой длины»), при этом обещают более стабильную «личность» персонажа без сильных скачков внешности по ходу видео.
Если по-простому, InfiniteTalk «слушает» ваш звук и по нему понимает, когда и какие звуки произносит человек. Дальше она перерисовывает области лица (в первую очередь рот) кадр за кадром так, чтобы артикуляция совпадала с аудио. В отличие от совсем простых липсинк-решений, здесь часто меняются и микродвижения - например, лёгкие повороты головы и мимика, чтобы речь не выглядела «приклеенной».