Grok Image

Генерирует изображения по текстовому описанию или редактирует картинку по вашему запросу, если вы загрузили фото. Цена - 4 рубля за изображение.

API

Что умеет «Grok Image»

Юмористическое парное фото

Портрет женщины с ноутбуком

Парное тревел-фото

Иллюстрация в кавайном стиле

Понравилось? Зарегистрируйтесь и создайте свой результат.

Зарегистрироваться

Grok Image - нейросеть для генерации картинок по тексту и для редактирования готовых изображений (когда вы загружаете свою картинку и просите “переделай вот так”). Её развивает компания xAI.

По заявлениям разработчиков, у Grok Image есть свой “родной” режим работы с изображениями: модель понимает инструкции в тексте, делает фотореалистичные сцены и умеет опираться на загруженную пользователем картинку - например, менять детали, стиль или композицию. Также xAI описывает подход, где модель учится на смешанных данных “текст + изображения”, поэтому ей проще следовать промпту и не терять смысл запроса.

Как это работает

Если вы вводите только текст, нейросеть рисует картинку “с нуля” по вашему описанию: кто/что на изображении, где это происходит, какой стиль, свет, настроение.

Если вы добавляете изображение, включается режим редактирования: нейросеть берёт вашу картинку за основу и пытается изменить её так, как вы попросили в задании (например, заменить фон, “переодеть” персонажа, сделать день вместо ночи, добавить предметы).

Настройки

Задание - главный текст, где вы описываете результат. Лучше писать по-человечески и конкретно: “женщина 60 лет, домашняя кухня, мягкий дневной свет, стиль фото на смартфон”.
Изображение - если загрузить файл, нейросеть будет редактировать его, а не генерировать с нуля. Удобно, когда уже есть фото/картинка и нужно “чуть поправить”.
Соотношение сторон - выбираете форму кадра (доступно, когда вы генерируете по тексту без загрузки картинки):
- 1:1 - квадрат (аватарки, карточки товаров)
- 16:9 - широкий кадр (обложки, презентации)
- 9:16 - вертикально (сторис/вертикальные постеры)
- 3:2 и 2:3 - “фотоформат”, часто выглядит естественно для снимков

Для чего подойдёт

Сделать иллюстрацию к посту: “кот в шапке-ушанке на фоне зимнего города” в нужном формате.
Быстро набросать обложку для презентации или школьного проекта, когда нет подходящих картинок.
Придумать дизайн-идею: варианты упаковки, наклейки, постера, меню для кафе.
Отредактировать фото: “убери лишний предмет со стола”, “сделай фон более нейтральным”, “поменяй цвет стен”, “добавь вывеску на здании”.
Сгенерировать несколько вариантов одной идеи: разные ракурсы, время суток, настроение.

Ограничения

Качество сильно зависит от того, насколько понятно вы сформулировали запрос: размытые промпты дают “средний” результат.
В реалистичных людях возможны типичные ошибки генерации (пальцы, мелкие детали, текст на вывесках).
По открытым сообщениям и новостям вокруг Grok, у него заметно менялись правила и ограничения на генерацию/редактирование изображений, особенно когда речь про контент с реальными людьми и потенциально спорные темы - иногда модель может отказать или “смягчить” результат.

Чем отличается от аналогов

Акцент на “мультимодальность”: можно не только описывать, но и приносить свою картинку, чтобы нейросеть отталкивалась от неё при правках.
По заявлениям xAI, модель рассчитана на точное следование текстовым инструкциям и фотореализм, то есть она больше про “сделай как я написал”, а не про угадывание стиля.