SAM 3D

Превращает одно фото в 3D-модель - отдельно для человека (фигура и поза) или для выбранного объекта в кадре. Цена - 4 рубля за изображение.

Описание

SAM 3D - нейросеть, которая восстанавливает 3D по одной фотографии: либо делает 3D-фигуру человека (поза + форма тела), либо превращает выбранный предмет на фото в 3D-объект.

По заявлениям создателей, SAM 3D умеет работать с “живыми” фото (не студийными) - со сложным фоном, частичными перекрытиями (когда часть тела/предмета закрыта) и необычными позами. Также подчёркивается “open vocabulary” подход: можно указать текстом, какой именно объект на фото нужно превратить в 3D, даже если это что-то редкое или нестандартное.

Как это работает

В простых словах процесс такой:

вы загружаете фото;
нейросеть “понимает”, где на картинке нужный человек или предмет (по маске или по текстовому запросу);
достраивает глубину и форму - и собирает 3D-модель, которую можно вращать и использовать дальше.

Важно понимать: это всё равно “догадка по одной картинке”. То, чего не видно (например, спинка стула или часть тела за сумкой), нейросеть достраивает по типичным формам.

Настройки

Тип генерации - выбираете, что нужно получить: 3D-фигура из фото или 3D-объект из фото.
Изображение - один файл (поддерживаются популярные форматы вроде JPG/PNG и форматы с айфонов).
Маска (для режима 3D‑фигуры) - если включить, вы вручную закрашиваете человека на фото. Это помогает, когда фон сложный, людей несколько, или нейросеть цепляет лишнее.
Экспортировать отдельные меши (.ply) для каждого человека (для режима 3D‑фигуры) - удобно, если на фото несколько людей и вы хотите получить их как отдельные 3D-части.
Добавить 3D‑ключевые точки для визуализации (для режима 3D‑фигуры) - добавляет “опорные точки” скелета/позы, чтобы было проще проверить, правильно ли восстановилась поза.
Маски объектов (для режима 3D‑объекта) - можно загрузить до 8 масок, если нужно точно указать, какие предметы в кадре превращать в 3D.
Что восстановить в 3D (для режима 3D‑объекта) - текстом пишете, какой предмет нужен (например: car, chair, lamp). Это особенно полезно, если маски не загружали, и нейросети нужно самой найти объект.

Для чего подойдёт

Сделать 3D-модель человека по фото для превиза: прикинуть позу персонажа для рисунка, анимации или раскадровки.
Быстро получить 3D-предмет из фотографии: например, “оцифровать” стул, лампу, игрушку или машину для макета/сцены.
Подготовить 3D для примерки в AR/сцене: когда хочется “покрутить” предмет перед использованием в визуализации.
Разобрать кадр со множеством объектов: выбрать нужный предмет маской или текстом и восстановить именно его.

Ограничения

Один ракурс = всегда есть угадывание: задние и скрытые части могут получиться неточно.
Мелкие детали (тонкие ремешки, пальцы, сложные узоры) часто упрощаются или “плывут”, особенно на фото низкого качества.
Сильно размытые, тёмные, пересвеченные фото и кадры, где объект занимает маленькую часть изображения, заметно ухудшают результат.
Если в кадре несколько людей/предметов и они перекрывают друг друга, лучше использовать маску - так меньше шансов, что захватится лишнее.