Grok Image

Генерирует изображения по текстовому описанию или редактирует картинку по вашему запросу, если вы загрузили фото. Цена - 4 рубля за изображение.

0/1

Описание

Grok Image - нейросеть для генерации картинок по тексту и для редактирования готовых изображений (когда вы загружаете свою картинку и просите “переделай вот так”). Её развивает компания xAI.

По заявлениям разработчиков, у Grok Image есть свой “родной” режим работы с изображениями: модель понимает инструкции в тексте, делает фотореалистичные сцены и умеет опираться на загруженную пользователем картинку - например, менять детали, стиль или композицию. Также xAI описывает подход, где модель учится на смешанных данных “текст + изображения”, поэтому ей проще следовать промпту и не терять смысл запроса.

Как это работает

Если вы вводите только текст, нейросеть рисует картинку “с нуля” по вашему описанию: кто/что на изображении, где это происходит, какой стиль, свет, настроение.

Если вы добавляете изображение, включается режим редактирования: нейросеть берёт вашу картинку за основу и пытается изменить её так, как вы попросили в задании (например, заменить фон, “переодеть” персонажа, сделать день вместо ночи, добавить предметы).

Настройки

  • Задание - главный текст, где вы описываете результат. Лучше писать по-человечески и конкретно: “женщина 60 лет, домашняя кухня, мягкий дневной свет, стиль фото на смартфон”.
  • Изображение - если загрузить файл, нейросеть будет редактировать его, а не генерировать с нуля. Удобно, когда уже есть фото/картинка и нужно “чуть поправить”.
  • Соотношение сторон - выбираете форму кадра (доступно, когда вы генерируете по тексту без загрузки картинки):
    • 1:1 - квадрат (аватарки, карточки товаров)
    • 16:9 - широкий кадр (обложки, презентации)
    • 9:16 - вертикально (сторис/вертикальные постеры)
    • 3:2 и 2:3 - “фотоформат”, часто выглядит естественно для снимков

Для чего подойдёт

  • Сделать иллюстрацию к посту: “кот в шапке-ушанке на фоне зимнего города” в нужном формате.
  • Быстро набросать обложку для презентации или школьного проекта, когда нет подходящих картинок.
  • Придумать дизайн-идею: варианты упаковки, наклейки, постера, меню для кафе.
  • Отредактировать фото: “убери лишний предмет со стола”, “сделай фон более нейтральным”, “поменяй цвет стен”, “добавь вывеску на здании”.
  • Сгенерировать несколько вариантов одной идеи: разные ракурсы, время суток, настроение.

Ограничения

  • Качество сильно зависит от того, насколько понятно вы сформулировали запрос: размытые промпты дают “средний” результат.
  • В реалистичных людях возможны типичные ошибки генерации (пальцы, мелкие детали, текст на вывесках).
  • По открытым сообщениям и новостям вокруг Grok, у него заметно менялись правила и ограничения на генерацию/редактирование изображений, особенно когда речь про контент с реальными людьми и потенциально спорные темы - иногда модель может отказать или “смягчить” результат.

Чем отличается от аналогов

  • Акцент на “мультимодальность”: можно не только описывать, но и приносить свою картинку, чтобы нейросеть отталкивалась от неё при правках.
  • По заявлениям xAI, модель рассчитана на точное следование текстовым инструкциям и фотореализм, то есть она больше про “сделай как я написал”, а не про угадывание стиля.

Мы используем файлы cookie и данные сервисов веб-аналитики, собираемые посредством «Яндекс Метрика». Продолжая использовать сайт, Вы соглашаетесь с обработкой таких данных на условиях Политики обработки в отношении файлов cookie.