Оживляет фотографию: делает видео, где человек на снимке двигает губами и говорит под ваше аудио в качестве 720p. Цена: 1 ₽/сек. (минимум 30 рублей, даже если длительность менее 30 секунд).
Heygen 720p - это нейросеть для формата «говорящее фото»: вы загружаете портрет и аудиофайл, а на выходе получаете видео 720p, где лицо на фотографии «оживает» и синхронно шевелит губами под речь.
По заявлениям HeyGen, их технология умеет делать «talking avatar» из одного фото и использует генеративные кредиты, а также лучше работает, если на изображении один человек (иначе модель может попытаться «синхронизировать губы» сразу нескольким лицам). Ещё у HeyGen есть ограничения по длительности таких роликов в зависимости от плана, а в бесплатном плане экспорт видео заявлен как 720p.
Вы даёте нейросети два входа:
Дальше модель подстраивает движения губ и мимику под звук, чтобы получилось ощущение, что человек действительно произносит этот текст. Это не «перевод голоса» и не «озвучка из текста» - именно липсинк (подгонка губ под готовое аудио).