Генерирует видео по тексту, по изображениям-референсам или как переход между первым и последним кадром. Цена за одно видео - от 30 до 330 ₽, зависит от модели и разрешения.
Veo 3.1 - нейросеть Google для генерации видео. Она умеет создавать ролики по текстовому описанию, оживлять изображения и строить плавный переход между начальным и конечным кадром.
По заявлениям Google, в версии 3.1 модель стала лучше держать персонажей и фон от кадра к кадру, поддерживает вертикальный формат 9:16 и умеет выдавать более детализированную картинку в высоком разрешении. Компания делает упор на более естественное движение в кадре и на то, что модель рассчитана как на быстрые черновики, так и на ролики более высокого качества.
Вы задаёте сцену словами или загружаете изображения, а модель сама собирает короткий видеоролик. Она пытается понять, кто находится в кадре, что должно происходить, какое движение нужно показать и как связать всё это в один цельный фрагмент.
Режим с референсами нужен, когда важно сохранить внешний вид объекта или общий стиль. А режим перехода полезен, когда у вас уже есть первый и последний кадр, и нужно придумать, что происходит между ними.
У Veo 3.1 есть понятные рамки. В официальном описании для линии Veo 3.1 указаны короткие длительности роликов - 4, 6 или 8 секунд, а для некоторых режимов набор возможностей отличается. Например, режим с референсами в вашем интерфейсе привязан только к Fast, а по официальной документации часть функций у разных вариантов модели доступна не одинаково.
Для генерации по тексту Google указывает английский язык промптов, так что самые предсказуемые результаты обычно получают на английском описании. Как и у других видеогенераторов, сложные сцены с толпой, мелкими надписями, точной анатомией рук или очень быстрым действием могут получаться неровно: фон иногда "плывёт", мелкие детали меняются от кадра к кадру, а движение бывает слишком киношным даже там, где нужен реализм.
Главная особенность Veo 3.1 - упор на управляемость сцены и на несколько сценариев генерации внутри одной линейки: текст в видео, изображение в видео и переход между кадрами. Отдельный плюс - деление на Lite, Fast и обычную модель. Это удобно, когда нужно выбрать между экономией и качеством, а не платить всегда по максимальному тарифу.
По сравнению с более простыми генераторами, здесь лучше продумана работа с вертикальным форматом и с роликами, где важна опора на исходные кадры. Но за максимальное качество цена заметно выше, особенно в 4K, поэтому для черновиков разумнее брать Lite или Fast, а флагманскую версию оставлять для тех случаев, когда нужна самая аккуратная картинка.