Генерирует изображения по текстовому описанию и редактирует загруженные картинки по инструкции. Цена - 4 рубля.
Понравилось? Зарегистрируйтесь и создайте свой результат.
GPT Image 2 - нейросеть для создания картинок по тексту и редактирования готовых изображений. Её развивает OpenAI. По смыслу это инструмент из семейства GPT Image: модель понимает обычные текстовые инструкции, умеет работать с изображениями на входе и подходит как для генерации с нуля, так и для правок уже существующей картинки.
По заявлениям OpenAI, такие модели делают упор на точное следование инструкции, аккуратное редактирование без лишней порчи исходника, более естественный результат и лучшую работу с текстом внутри изображения - например, на вывесках, постерах и карточках. Компания отдельно отмечает, что новые версии стали лучше сохранять важные детали при правках, в том числе черты лица, и быстрее выдают результат по сравнению с более ранними версиями.
Вы пишете, что хотите получить: например, "кот в дождевике на фоне вечернего города" или "убери лишний предмет со стола и сделай фон светлее". Модель разбирает инструкцию, смотрит на загруженные изображения и собирает новый вариант с учётом вашего описания.
С текстом она работает довольно буквально, поэтому лучше писать ясно: кто или что в кадре, какой фон нужен, какой стиль, ракурс, освещение и что именно надо изменить. Когда загружено исходное изображение, нейросеть старается сохранить композицию и важные детали, а менять только то, что вы попросили.
Идеальный результат бывает не с первого раза. На сложных сценах с мелкими деталями модель может менять то, что вы хотели оставить без изменений. Иногда плывут пальцы, украшения, узоры на ткани и мелкий текст, особенно когда инструкция перегружена или в исходнике уже много визуального шума.
Редактирование зависит от качества исходной картинки. Размытые фото, сильно пережатые изображения и тёмные кадры дают менее аккуратный результат. Ещё один момент - нейросеть лучше справляется с понятными запросами, чем с расплывчатыми фразами вроде "сделай красиво" или "улучши как-нибудь".
Главная сильная сторона семейства GPT Image - понимание длинных и сложных инструкций обычным человеческим языком. В сравнении с более старыми генераторами OpenAI делает упор на три вещи: точность правок, сохранение исходных деталей и более уверенную работу с текстом внутри картинки.
От простых генераторов "по одной фразе" этот инструмент отличается тем, что его можно использовать как редактор: не только создать новое изображение, но и переработать уже готовое. Это полезно, когда нужно не фантазировать с нуля, а довести до ума конкретную картинку.