Sora 2
Генерирует короткие видео по текстовому описанию или по загруженному изображению. Цена зависит от модели: Sora 2 - 25 ₽ за видео, Sora Pro - 140 ₽ за видео.
Описание
Sora 2 - нейросеть для генерации коротких видео по тексту или по картинке, разработанная OpenAI. Вы описываете сцену словами (или даёте изображение как “опору”), выбираете ориентацию и длительность - и получаете готовый ролик.
По заявлениям OpenAI, Sora 2 стала лучше в “понимании” происходящего в кадре: обещают более правдоподобную физику (как двигаются предметы и люди), более реалистичную картинку и более управляемый результат. Ещё одна заявленная особенность - синхронизированный звук: модель может добавлять аудио (например, реплики, шумы и эффекты) так, чтобы оно попадало в происходящее на экране.
Как это работает
Вы задаёте нейросети задание простыми словами: кто в кадре, где действие, что происходит, какая атмосфера, какой “стиль” (например, как в рекламном ролике, как в мультфильме, как в домашнем видео). Нейросеть собирает это в короткую сцену - как будто мини-эпизод фильма.
Если выбрать генерацию из изображения, картинка работает как подсказка: помогает удержать внешний вид героя/объекта и общую композицию кадра.
Настройки
- Тип генерации - сделать видео из текста или “оживить” видео на основе изображения.
- Модель - Sora 2 (дешевле) или Sora Pro (дороже, обычно берут когда важнее качество).
- Задание - ваш текст: что должно происходить в видео. Чем конкретнее вы описываете действие, окружение и детали, тем меньше сюрпризов в результате.
- Изображение - загрузка картинки-референса (нужно только в режиме “Видео из изображения”).
- Ориентация - горизонтальное (под YouTube/монитор) или вертикальное (под сторис/шорты).
- Длительность - 10 или 15 секунд.
Для чего подойдёт
- Сделать короткий ролик для поздравления: “кот в шапке Деда Мороза танцует на кухне, надпись ‘С днём рождения!’”.
- Быстро собрать черновик рекламы: “банка лимонада на столе, солнечный свет, крупные планы, всплески льда”.
- Оживить рисунок ребёнка или свою иллюстрацию: загрузить картинку и попросить “чтобы персонаж помахал рукой и улыбнулся”.
- Сгенерировать фоновые видео для презентации: “ночной город, дождь по стеклу, мягкий свет вывесок”.
- Придумать сториборд (черновые кадры) для клипа или короткометражки, чтобы показать идею команде.
Ограничения
- Чем сложнее сцена (много персонажей, быстрые движения, мелкие детали), тем выше шанс странностей: “плывущие” руки, меняющиеся предметы, скачущие детали одежды.
- Точный текст в кадре (вывески, надписи, мелкие буквы) может получаться с ошибками - иногда лучше просить крупные, короткие слова и проверять результат.
- Если нужен один и тот же герой в серии роликов “один в один”, может понадобиться несколько попыток и аккуратные подсказки в задании (описание внешности, одежды, ракурса).
Чем отличается от аналогов
Главный акцент Sora 2 по описаниям разработчика - на более правдоподобном движении и физике, управляемости и на том, что видео может идти вместе со звуком, а не отдельно. Плюс у модели есть режим, где можно отталкиваться от изображения, чтобы проще удерживать задуманный вид сцены.