Qwen-Image

Мультимодальная модель для генерации и редактирования изображений на основе текстовых запросов, входящая в серию моделей Qwen. Она демонстрирует значительные улучшения в точном отображении сложного текста (включая китайский язык) и выполнении продвинутых операций редактирования изображений. Модель обладает обобщенными способностями как в создании изображений, так и в их редактировании, с акцентом на сохранение деталей шрифтов, композиции и контекстной гармонии текста.

Основные возможности:

  • Поддержка генерации изображений по текстовым запросам на английском и китайском языках.
  • Вариативные соотношения сторон (например, 16:9, 4:3, 1:1) с указанием размеров.
  • Высокая детализация текста на изображениях, сохранение лэйаута и контекста для языков с алфавитом (например, английский) и идеографических систем (например, китайский).

Модель является составной частью пайплайна генерации изображений, состоящего из:

  • Text encoder: ~8.3B параметров,
  • Transformer: ~20.4B параметров,
  • VAE: ~126M параметров.

Всего: ~28.8B параметров


Строка "Потребление памяти" рассчитана на основе размера весов в указанной точности с добавочным коэффициентом +10% на инференс: 
  model_weights_size * 1.1 / 1024^3 
где model_weights_size - размер весов модели.


Дата анонса: 04.08.2025
Параметров: 20B
Контекст: 128K
Потребление памяти: 14.8 ГБ в точности 4 бит, 29.6 ГБ в точности 8 бит, 59.1 ГБ в точности 16 бит
Разработчик: Qwen
Лицензия: Apache 2.0

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами бесплатно для теста инференса и знакомства с Qwen-Image. Получить токен для доступа к API вы можете на странице управления токенами после регистрации и верификации.
Наименование модели Контекст Тип GPU TPS Статус Ссылка
Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

  • получить максимальную производительность эндпоинта,
  • получить полный контекст для обработки больших запросов и диалогов,
  • обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
  • использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации для хостинга Qwen-Image

Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
teslaa100-1.16.64.160
128 000
16 65536 160 1 211,77 ₽ Запустить
teslah100-1.16.64.160
128 000
16 65536 160 1 341,77 ₽ Запустить
h100nvl-1.16.96.160
128 000
16 98304 160 1 367,41 ₽ Запустить
h200-1.16.128.160
128 000
16 131072 160 1 423,04 ₽ Запустить
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
teslav100-1.12.64.160
128 000
12 65536 160 1 107,57 ₽ Запустить
rtx5090-1.16.64.160
128 000
16 65536 160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160
128 000
16 65536 160 1 211,77 ₽ Запустить
teslah100-1.16.64.160
128 000
16 65536 160 1 341,77 ₽ Запустить
h100nvl-1.16.96.160
128 000
16 98304 160 1 367,41 ₽ Запустить
h200-1.16.128.160
128 000
16 131072 160 1 423,04 ₽ Запустить
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
teslat4-1.16.16.160
128 000
16 16384 160 1 29,33 ₽ Запустить
teslaa2-1.16.32.160
128 000
16 32768 160 1 33,74 ₽ Запустить
teslaa10-1.16.32.160
128 000
16 32768 160 1 46,94 ₽ Запустить
rtx3090-1.16.24.160
128 000
16 24576 160 1 78,53 ₽ Запустить
rtx4090-1.16.32.160
128 000
16 32768 160 1 103,04 ₽ Запустить
teslav100-1.12.64.160
128 000
12 65536 160 1 107,57 ₽ Запустить
rtx5090-1.16.64.160
128 000
16 65536 160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160
128 000
16 65536 160 1 211,77 ₽ Запустить
teslah100-1.16.64.160
128 000
16 65536 160 1 341,77 ₽ Запустить
h100nvl-1.16.96.160
128 000
16 98304 160 1 367,41 ₽ Запустить
h200-1.16.128.160
128 000
16 131072 160 1 423,04 ₽ Запустить

Связанные модели

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.