Генерирует короткие видео по текстовому описанию или загруженному изображению с синхронным звуком и реалистичной физикой. Цена зависит от модели, разрешения и длительности: от 15 до 75 ₽ за секунду видео.
Sora 2 - нейросеть для генерации коротких видео по тексту или по картинке, разработанная OpenAI. Вы описываете сцену словами (или даёте изображение как “опору”), выбираете ориентацию и длительность - и получаете готовый ролик.
По заявлениям OpenAI, Sora 2 стала лучше в “понимании” происходящего в кадре: обещают более правдоподобную физику (как двигаются предметы и люди), более реалистичную картинку и более управляемый результат. Ещё одна заявленная особенность - синхронизированный звук: модель может добавлять аудио (например, реплики, шумы и эффекты) так, чтобы оно попадало в происходящее на экране.
Вы задаёте нейросети задание простыми словами: кто в кадре, где действие, что происходит, какая атмосфера, какой “стиль” (например, как в рекламном ролике, как в мультфильме, как в домашнем видео). Нейросеть собирает это в короткую сцену - как будто мини-эпизод фильма.
Если выбрать генерацию из изображения, картинка работает как подсказка: помогает удержать внешний вид героя/объекта и общую композицию кадра.
Главный акцент Sora 2 по описаниям разработчика - на более правдоподобном движении и физике, управляемости и на том, что видео может идти вместе со звуком, а не отдельно. Плюс у модели есть режим, где можно отталкиваться от изображения, чтобы проще удерживать задуманный вид сцены.