Grok Image
Генерирует изображения по текстовому описанию или редактирует картинку по вашему запросу, если вы загрузили фото. Цена - 4 рубля за изображение.
Описание
Grok Image - нейросеть для генерации картинок по тексту и для редактирования готовых изображений (когда вы загружаете свою картинку и просите “переделай вот так”). Её развивает компания xAI.
По заявлениям разработчиков, у Grok Image есть свой “родной” режим работы с изображениями: модель понимает инструкции в тексте, делает фотореалистичные сцены и умеет опираться на загруженную пользователем картинку - например, менять детали, стиль или композицию. Также xAI описывает подход, где модель учится на смешанных данных “текст + изображения”, поэтому ей проще следовать промпту и не терять смысл запроса.
Как это работает
Если вы вводите только текст, нейросеть рисует картинку “с нуля” по вашему описанию: кто/что на изображении, где это происходит, какой стиль, свет, настроение.
Если вы добавляете изображение, включается режим редактирования: нейросеть берёт вашу картинку за основу и пытается изменить её так, как вы попросили в задании (например, заменить фон, “переодеть” персонажа, сделать день вместо ночи, добавить предметы).
Настройки
- Задание - главный текст, где вы описываете результат. Лучше писать по-человечески и конкретно: “женщина 60 лет, домашняя кухня, мягкий дневной свет, стиль фото на смартфон”.
- Изображение - если загрузить файл, нейросеть будет редактировать его, а не генерировать с нуля. Удобно, когда уже есть фото/картинка и нужно “чуть поправить”.
- Соотношение сторон - выбираете форму кадра (доступно, когда вы генерируете по тексту без загрузки картинки):
- 1:1 - квадрат (аватарки, карточки товаров)
- 16:9 - широкий кадр (обложки, презентации)
- 9:16 - вертикально (сторис/вертикальные постеры)
- 3:2 и 2:3 - “фотоформат”, часто выглядит естественно для снимков
Для чего подойдёт
- Сделать иллюстрацию к посту: “кот в шапке-ушанке на фоне зимнего города” в нужном формате.
- Быстро набросать обложку для презентации или школьного проекта, когда нет подходящих картинок.
- Придумать дизайн-идею: варианты упаковки, наклейки, постера, меню для кафе.
- Отредактировать фото: “убери лишний предмет со стола”, “сделай фон более нейтральным”, “поменяй цвет стен”, “добавь вывеску на здании”.
- Сгенерировать несколько вариантов одной идеи: разные ракурсы, время суток, настроение.
Ограничения
- Качество сильно зависит от того, насколько понятно вы сформулировали запрос: размытые промпты дают “средний” результат.
- В реалистичных людях возможны типичные ошибки генерации (пальцы, мелкие детали, текст на вывесках).
- По открытым сообщениям и новостям вокруг Grok, у него заметно менялись правила и ограничения на генерацию/редактирование изображений, особенно когда речь про контент с реальными людьми и потенциально спорные темы - иногда модель может отказать или “смягчить” результат.
Чем отличается от аналогов
- Акцент на “мультимодальность”: можно не только описывать, но и приносить свою картинку, чтобы нейросеть отталкивалась от неё при правках.
- По заявлениям xAI, модель рассчитана на точное следование текстовым инструкциям и фотореализм, то есть она больше про “сделай как я написал”, а не про угадывание стиля.