Генерирует видео по тексту, из изображения, по набору референсов и умеет редактировать готовый ролик. Цена зависит от разрешения: 720P - 16 ₽/сек., 1080P - 30 ₽/сек.
Понравилось? Зарегистрируйтесь и создайте свой результат.
HappyHorse 1.0 - нейросеть для создания и редактирования видео. Она может собрать ролик по текстовому описанию, оживить одно изображение, ориентироваться на несколько референсов и переделать уже готовое видео под новый стиль или задачу.
По заявлениям создателей, модель разработана Alibaba ATH-AI как единая мультимодальная система: она работает сразу с текстом, изображением, видео и звуком. Разработчики делают упор на синхронную генерацию картинки и аудио в одном проходе, без отдельной сборки озвучки и липсинка. Отдельно подчёркивается поддержка 1080p, хороший результат в вертикальном формате и ориентация на ролики с речью и крупными планами.
Авторы сервиса пишут, что HappyHorse 1.0 особенно сильна в диалоговых сценах, видео с говорящим человеком, коротких рекламных роликах, превизе - то есть черновой сборке сцены до полноценной съёмки, - и в локализации видео на разные языки. В описании модели упоминается поддержка нескольких языков для синхронизации речи, а в сравнении с другими генераторами видео упор делается на более естественное совпадение движения губ и звука.
У модели четыре понятных режима. В первом вы просто описываете сцену словами - например, кто в кадре, как движется камера, какая атмосфера нужна. Во втором загружаете один стартовый кадр, и нейросеть превращает его в короткий ролик. В третьем даёте несколько референсных изображений, чтобы она лучше держала стиль, персонажа или предмет. В четвёртом загружаете готовое видео и просите изменить внешний вид, подачу или звук.
Сильная сторона HappyHorse 1.0 - работа с роликом как с цельной сценой. Для пользователя это выглядит так: меньше разъезда между мимикой, голосом и движением камеры, чем у систем, где сначала делают видео, а потом отдельно приклеивают звук.
Лучше всего HappyHorse 1.0 чувствует себя в коротких роликах. По форме настроек длительность ограничена 15 секундами, а в режиме редактирования можно загрузить видео до 60 секунд, но тарификация всё равно идёт максимум по 15 секундам.
Для режима из изображения нужен один файл, а для режима по референсам - от 1 до 9 картинок. Это значит, что длинные сцены со сложной сменой событий здесь не главный сценарий. Ещё один практический момент: соотношение сторон вручную выбирается не во всех режимах - при работе с первым кадром и при редактировании оно определяется загруженным медиа.
Главное отличие HappyHorse 1.0 в том, что её подают как модель, которая изначально делает видео вместе со звуком, а не достраивает аудио отдельным этапом. За счёт этого разработчики обещают более естественную речь, движение губ и фоновое звучание.
На фоне многих видеогенераторов она выглядит заточенной под короткие разговорные ролики, вертикальные форматы и задачи, где важно быстро получить клип в 720P или 1080P. Судя по описанию сервиса, акцент здесь не на длинных сложных фильмах, а на коротком понятном результате: реклама, говорящие персонажи, ролики для ленты и аккуратное редактирование уже готового видео.