Wan2.2-TI2V-5B-Diffusers

это текст-к-видео (Text-to-Video, T2V) и изображение-к-видео (Image-to-Video, I2V) модель на основе архитектуры диффузера, разработанная в рамках проекта Wan2.2. Модель содержит 5 миллиардов параметров и использует высококомпрессивный кодировщик Wan2.2-VAE с соотношением сжатия 4×16×16. Она поддерживает генерацию видео в разрешении 720p (1280×704 или 704×1280) с частотой кадров 24 fps, и может работать на потребительских GPU, таких как NVIDIA RTX 4090.

Ключевые особенности

  • Поддержка нескольких задач - генерация видео по тексту (T2V) и генерация видео по изображению (I2V). Обе задачи реализованы в едином фреймворке.
  • Архитектура Mixture-of-Experts (MoE) — использует специализированных экспертов для удаления шума на разных этапах процесса диффузии. Эксперт для высокого уровня шума отвечает за генерацию начального этапа композиции, в то время как эксперт для низкого уровня шума точно восстанавливает детали на поздних этапах, увеличивая емкость модели вдвое без роста вычислительных затрат.
  • Улучшенная эстетика и движение — обучена на расширенных датасетах (на 65,6% больше изображений и на 83,2% больше видео, чем в Wan2.1), что улучшает генерацию движения, семантическое разнообразие и эстетику кинематографического стиля (освещение, композиция, цветовая гамма).
  • Производительность — показывает лучшие результаты среди моделей с открытым и закрытым исходным кодом на бенчмарке Wan-Bench 2.0.
  • Эффективность - Генерация 5-секундного видео в 720p занимает менее 9 минут на одном GPU RTX 4090. Поддерживает выгрузку моделей на CPU и смешанную точность для экономии памяти. Мульти-GPU вывод доступен через FSDP + DeepSpeed Ulysses (опции --dit_fsdp, --t5_fsdp).
  • Ограничения - Поддерживает только формат видео с разрешением 720p (аспект-соотношение может зависеть от входных данных).

Модель является составной частью пайплайна генерации видео, состоящего из:

  • Text encoder: ~6B параметров, 
  • Transformer: ~5B параметров, 
  • VAE: ~705M параметров.

Всего: ~11B параметров


Дата анонса: 28.07.2025
Параметров: 5B
Потребление памяти: 5.8 ГБ в точности 4 бит, 11.7 ГБ в точности 8 бит, 23.3 ГБ в точности 16 бит
Разработчик: Alibaba Wan Team
Лицензия: Apache 2.0

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами бесплатно для теста инференса и знакомства с Wan2.2-TI2V-5B-Diffusers. Получить токен для доступа к API вы можете на странице управления токенами после регистрации и верификации.
Наименование модели Контекст Тип GPU TPS Статус Ссылка
Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

  • получить максимальную производительность эндпоинта,
  • получить полный контекст для обработки больших запросов и диалогов,
  • обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
  • использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации для хостинга Wan2.2-TI2V-5B-Diffusers

Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
teslat4-1.16.16.160 16 16384 160 1 29,33 ₽ Запустить
rtx2080ti-1.10.16.500 10 16384 500 1 34,23 ₽ Запустить
teslaa2-1.16.32.160 16 32768 160 1 33,74 ₽ Запустить
teslaa10-1.16.32.160 16 32768 160 1 46,94 ₽ Запустить
rtx3080-1.16.32.160 16 32768 160 1 51,34 ₽ Запустить
rtx3090-1.16.24.160 16 24576 160 1 78,53 ₽ Запустить
rtx4090-1.16.32.160 16 32768 160 1 103,04 ₽ Запустить
teslav100-1.12.64.160 12 65536 160 1 107,57 ₽ Запустить
rtxa5000-2.16.64.160.nvlink 16 65536 160 2 109,77 ₽ Запустить
rtx5090-1.16.64.160 16 65536 160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160 16 65536 160 1 230,77 ₽ Запустить
teslah100-1.16.64.160 16 65536 160 1 456,27 ₽ Запустить
h200-1.16.128.160 16 131072 160 1 623,04 ₽ Запустить
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
teslat4-1.16.16.160 16 16384 160 1 29,33 ₽ Запустить
rtx2080ti-1.10.16.500 10 16384 500 1 34,23 ₽ Запустить
teslaa2-1.16.32.160 16 32768 160 1 33,74 ₽ Запустить
teslaa10-1.16.32.160 16 32768 160 1 46,94 ₽ Запустить
rtx3080-1.16.32.160 16 32768 160 1 51,34 ₽ Запустить
rtx3090-1.16.24.160 16 24576 160 1 78,53 ₽ Запустить
rtx4090-1.16.32.160 16 32768 160 1 103,04 ₽ Запустить
teslav100-1.12.64.160 12 65536 160 1 107,57 ₽ Запустить
rtxa5000-2.16.64.160.nvlink 16 65536 160 2 109,77 ₽ Запустить
rtx5090-1.16.64.160 16 65536 160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160 16 65536 160 1 230,77 ₽ Запустить
teslah100-1.16.64.160 16 65536 160 1 456,27 ₽ Запустить
h200-1.16.128.160 16 131072 160 1 623,04 ₽ Запустить
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
teslat4-1.16.16.160 16 16384 160 1 29,33 ₽ Запустить
rtx2080ti-1.10.16.500 10 16384 500 1 34,23 ₽ Запустить
teslaa2-1.16.32.160 16 32768 160 1 33,74 ₽ Запустить
teslaa10-1.16.32.160 16 32768 160 1 46,94 ₽ Запустить
rtx3090-1.16.24.160 16 24576 160 1 78,53 ₽ Запустить
rtx3080-2.16.32.160 16 32762 160 2 86,54 ₽ Запустить
rtx4090-1.16.32.160 16 32768 160 1 103,04 ₽ Запустить
teslav100-1.12.64.160 12 65536 160 1 107,57 ₽ Запустить
rtxa5000-2.16.64.160.nvlink 16 65536 160 2 109,77 ₽ Запустить
rtx5090-1.16.64.160 16 65536 160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160 16 65536 160 1 230,77 ₽ Запустить
teslah100-1.16.64.160 16 65536 160 1 456,27 ₽ Запустить
h200-1.16.128.160 16 131072 160 1 623,04 ₽ Запустить

Связанные модели

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.