LTX-2

это аудиовизуальная базовая модель на базе архитектуры DiT, разработанная для синхронной генерации видео и аудио в рамках единой модели. Она объединяет ключевые компоненты современных систем генерации видео, включая открытые веса и оптимизацию для локального использования.

Основные характеристики:  

  • Генерация аудиовизуального контента по тексту, изображению, видео или аудио.  
  • Поддержка задач: Image-to-Video, Text-to-Video, Video-to-Video, Audio-to-Video, Text-to-Audio и др.  
  • Встроенная синхронизация аудио и видео.    
  • Ограничения:  
    • Не предназначена для предоставления фактической информации.  
    • Размер кадра должен быть кратен 32, количество кадров — кратно 8+1.
    • Аудио без речи может иметь низкое качество.  
    • Точность выполнения промпта зависит от стиля написания. Подробнее в Prompting guide
    • Модель распространяется с предупреждением о возможности генерации неподходящего или оскорбительного контента.

Модель является составной частью пайплайна генерации видео, состоящего из:

  • audio VAE: ~153M параметров, 
  • connectors: ~1.4B параметров, 
  • latent upsampler: ~497M параметров, 
  • Text encoder: ~12B параметров,
  • Transformer: ~19B параметров,
  • VAE: ~1.2B параметров, 
  • vocoder: ~56M параметров

Всего: ~34B параметров


Для локального запуска специалисты nvidia советуют использовать для генерации 4 секундного видео в разрешении 720p24 (с 20 шагами) GPU с 24GB+ видеопамятью.


Дата анонса: 06.01.2026
Параметров: 19B
Разработчик: Lightricks
Версия Diffusers: 0.37.0.dev0
Версия vLLM: 0.16.0
Лицензия: LTX-2 Community License Agreement

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами бесплатно для теста инференса и знакомства с LTX-2. Получить токен для доступа к API вы можете на странице управления токенами после регистрации и верификации.
Наименование модели Контекст Тип GPU Статус Ссылка
Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

  • получить максимальную производительность эндпоинта,
  • получить полный контекст для обработки больших запросов и диалогов,
  • обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
  • использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации сервера для хостинга LTX-2

Для данной модели, контекста и квантизации пока нет подходящих конфигураций.
Для данной модели, контекста и квантизации пока нет подходящих конфигураций.
Для данной модели, контекста и квантизации пока нет подходящих конфигураций.

Связанные модели

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.