ERNIE-Image-Turbo

Открытая модель для генерации изображений по тексту, разработанная командой ERNIE-Image в Baidu. Она построена на архитектуре Diffusion Transformer (DiT) и включает дополнительные компоненты для улучшения работы с текстом и структурированными задачами.

Ключевые особенности

  • Несмотря на компактный масштаб, модель демонстрирует показатели, сопоставимые с существенно более крупными моделями с открытыми весами (state-of-the-art среди open-weight text-to-image models). 
  • Модель разработана с учетом того, что точная реализация контента важна так же, как и эстетика.
  • Способность следовать сложным промптам, включающим множество объектов.
  • Высокая эффективность при работе с текстом и макетами (постеры, инфографика, изображения в стиле UI).
  • Благодаря компактному размеру модель может запускаться на потребительских видеокартах (GPU) с 24G VRAM.
  • Turbo модель, оптимизированная с помощью DMD и RL, обеспечивает более высокую скорость и лучшую эстетику всего за 8 шагов вывода.

Модель является составной частью пайплайна генерации изображений, состоящего из:

  • PE: ~3.8B параметров,
  • Text encoder: ~3.8B параметров,
  • Transformer: ~8B параметров,
  • VAE: ~84M параметров, 

Всего: ~15.8B параметров


Дата анонса: 10.04.2026
Параметров: 7B
Разработчик: Baidu, Inc.
Версия Diffusers: 0.36.0
Версия vLLM-Omni: 0.20.0
Лицензия: Apache 2.0

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами бесплатно для теста инференса и знакомства с ERNIE-Image-Turbo. Получить токен для доступа к API вы можете на странице управления токенами после регистрации и верификации.
Наименование модели Контекст Тип GPU Статус Ссылка
Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

  • получить максимальную производительность эндпоинта,
  • получить полный контекст для обработки больших запросов и диалогов,
  • обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
  • использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации сервера для хостинга ERNIE-Image-Turbo

Цены:
Наименование GPU Цена, час Время генерации, с.
teslat4-1.16.16.160 1 29,33 ₽ Запустить
teslaa2-1.16.32.160 1 33,74 ₽ Запустить
teslaa10-1.16.32.160 1 46,94 ₽ Запустить
rtx3090-1.16.24.160 1 73,73 ₽ Запустить
rtx4090-1.16.32.160 1 91,14 ₽ Запустить
rtx5090-1.16.64.160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160 1 211,77 ₽ Запустить
h100-1.16.64.160 1 341,77 ₽ Запустить
h100nvl-1.16.96.160 1 367,41 ₽ Запустить
h200-1.16.128.160 1 423,04 ₽ Запустить
Цены:
Наименование GPU Цена, час Время генерации, с.
teslat4-1.16.16.160 1 29,33 ₽ Запустить
rtx2080ti-1.10.16.500 1 34,23 ₽ Запустить
teslaa2-1.16.32.160 1 33,74 ₽ Запустить
teslaa10-1.16.32.160 1 46,94 ₽ Запустить
rtx3080-1.16.32.160 1 51,34 ₽ Запустить
rtx3090-1.16.24.160 1 73,73 ₽ Запустить
rtx4090-1.16.32.160 1 91,14 ₽ Запустить
rtx5090-1.16.64.160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160 1 211,77 ₽ Запустить
h100-1.16.64.160 1 341,77 ₽ Запустить
h100nvl-1.16.96.160 1 367,41 ₽ Запустить
h200-1.16.128.160 1 423,04 ₽ Запустить
Цены:
Наименование GPU Цена, час Время генерации, с.
teslat4-1.16.16.160 1 29,33 ₽ Запустить
rtx2080ti-1.10.16.500 1 34,23 ₽ Запустить
teslaa2-1.16.32.160 1 33,74 ₽ Запустить
teslaa10-1.16.32.160 1 46,94 ₽ Запустить
rtx3080-1.16.32.160 1 51,34 ₽ Запустить
rtx3090-1.16.24.160 1 73,73 ₽ Запустить
rtx4090-1.16.32.160 1 91,14 ₽ Запустить
rtx5090-1.16.64.160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160 1 211,77 ₽ Запустить
h100-1.16.64.160 1 341,77 ₽ Запустить
h100nvl-1.16.96.160 1 367,41 ₽ Запустить
h200-1.16.128.160 1 423,04 ₽ Запустить

Связанные модели

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.