Helios-Base

Модель для генерации видео по тексту (T2V), изображению (I2V) и видео (V2V), разработанная для использования в режиме реального времени и долгой продолжительности. Она способна синтезировать видео длительностью до нескольких минут с частотой 19,5 кадров в секунду (FPS) на одном GPU H100. Уникальность модели заключается в отсутствии использования традиционных методов противодрейфа (например, self-forcing, error-banks) и стандартных ускоряющих техник (KV-cache, causal masking), что не снижает качество и синхронность видео.

Основные характеристики:  

  • Требования: 80 ГБ VRAM на 4 GPU (fp32).  
  • Group Offloading: Снижает потребление VRAM до ~6 ГБ, разрешая запуск на GPU с ограниченной памятью.  
  • Параллелизм на нескольких GPU: Поддержка Ulysses Attention, Ring Attention и других механизмов для распределения вычислений.  
  • Инференс-пайплайны: Интеграция с Diffusers, vLLM-Omni, SGLang-Diffusion для генерации видео через модульные конвейеры.  
  • Настройки: Число кадров должно быть кратным 33 (например, 240 кадров = 60 секунд при 24 FPS).  

Модель является составной частью пайплайна генерации видео, состоящего из:

  • Text encoder: ~5.7B параметров,
  • Transformer: ~28.7B параметров,
  • Transformer_init: ~14B параметров,
  • VAE: ~127M параметров, 

Всего: ~48.7B параметров


Дата анонса: 23.02.2026
Параметров: 14B
Разработчик: BestWishYsh
Версия Diffusers: 0.37.0
Версия vLLM-Omni: 0.18.0
Лицензия: Apache 2.0

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами бесплатно для теста инференса и знакомства с Helios-Base. Получить токен для доступа к API вы можете на странице управления токенами после регистрации и верификации.
Наименование модели Контекст Тип GPU Статус Ссылка
Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

  • получить максимальную производительность эндпоинта,
  • получить полный контекст для обработки больших запросов и диалогов,
  • обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
  • использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации сервера для хостинга Helios-Base

Цены:
Наименование GPU Цена, час Время генерации, с.
teslaa100-1.16.64.160 1 211,77 ₽ Запустить
h100-1.16.64.160 1 341,77 ₽ Запустить
h100nvl-1.16.96.160 1 367,41 ₽ Запустить
h200-1.16.128.160 1 423,04 ₽ Запустить
Цены:
Наименование GPU Цена, час Время генерации, с.
teslaa10-1.16.32.160 1 46,94 ₽ Запустить
rtx3090-1.16.24.160 1 73,73 ₽ Запустить
rtx4090-1.16.32.160 1 91,14 ₽ Запустить
rtx5090-1.16.64.160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160 1 211,77 ₽ Запустить
h100-1.16.64.160 1 341,77 ₽ Запустить
h100nvl-1.16.96.160 1 367,41 ₽ Запустить
h200-1.16.128.160 1 423,04 ₽ Запустить
Цены:
Наименование GPU Цена, час Время генерации, с.
teslat4-1.16.16.160 1 29,33 ₽ Запустить
rtx2080ti-1.10.16.500 1 34,23 ₽ Запустить
teslaa2-1.16.32.160 1 33,74 ₽ Запустить
teslaa10-1.16.32.160 1 46,94 ₽ Запустить
rtx3080-1.16.32.160 1 51,34 ₽ Запустить
rtx3090-1.16.24.160 1 73,73 ₽ Запустить
rtx4090-1.16.32.160 1 91,14 ₽ Запустить
rtx5090-1.16.64.160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160 1 211,77 ₽ Запустить
h100-1.16.64.160 1 341,77 ₽ Запустить
h100nvl-1.16.96.160 1 367,41 ₽ Запустить
h200-1.16.128.160 1 423,04 ₽ Запустить

Связанные модели

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.