Создаёт говорящее видео по одному фото, синхронизируя речь двух людей по двум аудиодорожкам (слева и справа). Цена: Fast 480p - 3 ₽/сек., Standard 480p - 5 ₽/сек., Standard 720p - 10 ₽/сек.
InfiniteTalk Multi - нейросеть, которая делает «разговорное» видео из одного изображения: вы загружаете фото (обычно с двумя персонажами) и два аудиофайла, а на выходе получаете ролик, где мимика и движение губ совпадают с речью.
По заявлениям создателей, InfiniteTalk Multi умеет делать реалистичную синхронизацию губ для двух говорящих/поющих персонажей, добавляет выражения лица и небольшие движения, а ещё старается сохранять внешность персонажей стабильной на протяжении всего видео. Также они подчёркивают сценарии «диалога» и «дуэта» - когда голоса могут идти одновременно или по очереди.
Вы даёте системе:
Дальше нейросеть «привязывает» каждую аудиодорожку к своему персонажу и анимирует лицо: губы, мимику и небольшие движения так, чтобы выглядело как живая беседа.
InfiniteTalk Multi заточен именно под сценарий «два спикера - две дорожки» и даёт простой контроль порядка реплик (одновременно или по очереди). Это удобно, когда у вас уже есть два готовых аудиофайла и нужно быстро превратить их в видеодиалог по одному изображению, без сложного монтажа.