Lance

Унифицированная мультимодальная модель (Unified Multimodal Modeling), разработанная для демонстрации унифицированного подхода к пониманию, генерации и редактированию изображений и видео в рамках относительно небольшой модели и ограниченного вычислительного бюджета.

Ключевые особенности:

  • Поддерживает следующие задачи в едином фреймворке:
    • Понимание изображений (Image Understanding): Визуальные вопросы (VQA) и рассуждения на основе изображений.
    • Понимание видео (Video Understanding): Визуальные вопросы на основе видео и описание видео (captioning).
    • Генерация изображений (Image Generation)
    • Генерация видео (Video Generation)
    • Редактирование изображений (Image Editing)
    • Редактирование видео (Video Editing)
  • Ограничения разрешения и производительности:
    • Генерация изображений: разрешение до 768x768.
    • Генерация видео: разрешение до 480p при 12 кадрах в секунду.
    • Кадры видео: максимум 121 кадр для генерации видео.
    • Распознавание видео: поддерживает до 50 кадров для вывода (пример конфигурации).
  • Требования к развертыванию (Inference Requirements):
    • Программное обеспечение: Python 3.10+, CUDA 12.4+.
    • Аппаратное обеспечение: Графический процессор (GPU) с объемом видеопамяти не менее 40 ГБ требуется для инференса.
    • Тестовая среда: Официально протестировано на NVIDIA A100 (комбинации PyTorch 2.8.0 или 2.5.1 с соответствующими версиями flash-attn).

Модель является составной частью пайплайна генерации видео, состоящего из:

  • Lance_3B: ~13.3B параметров,
  • Lance_3B_Video: ~7.1B параметров,
  • Qwen2.5-VL-ViT: ~668M параметров, 

Всего: ~21B параметров


Дата анонса: 15.05.2026
Параметров: 21B
Активно параметров при инференсе: 3B
Разработчик: ByteDance-Seed
Лицензия: Apache 2.0

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами бесплатно для теста инференса и знакомства с Lance. Получить токен для доступа к API вы можете на странице управления токенами после регистрации и верификации.
Наименование модели Контекст Тип GPU Статус Ссылка
Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

  • получить максимальную производительность эндпоинта,
  • получить полный контекст для обработки больших запросов и диалогов,
  • обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
  • использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации сервера для хостинга Lance

Цены:
Наименование GPU Цена, час Время генерации, с.
teslaa100-1.16.64.160 1 211,77 ₽ Запустить
h100-1.16.64.160 1 341,77 ₽ Запустить
h100nvl-1.16.96.160 1 367,41 ₽ Запустить
h200-1.16.128.160 1 423,04 ₽ Запустить
Цены:
Наименование GPU Цена, час Время генерации, с.
teslaa10-1.16.32.160 1 46,94 ₽ Запустить
rtx3090-1.16.24.160 1 73,73 ₽ Запустить
rtx4090-1.16.32.160 1 91,14 ₽ Запустить
rtx5090-1.16.64.160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160 1 211,77 ₽ Запустить
h100-1.16.64.160 1 341,77 ₽ Запустить
h100nvl-1.16.96.160 1 367,41 ₽ Запустить
h200-1.16.128.160 1 423,04 ₽ Запустить
Цены:
Наименование GPU Цена, час Время генерации, с.
teslat4-1.16.16.160 1 29,33 ₽ Запустить
teslaa2-1.16.32.160 1 33,74 ₽ Запустить
teslaa10-1.16.32.160 1 46,94 ₽ Запустить
rtx3090-1.16.24.160 1 73,73 ₽ Запустить
rtx4090-1.16.32.160 1 91,14 ₽ Запустить
rtx5090-1.16.64.160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160 1 211,77 ₽ Запустить
h100-1.16.64.160 1 341,77 ₽ Запустить
h100nvl-1.16.96.160 1 367,41 ₽ Запустить
h200-1.16.128.160 1 423,04 ₽ Запустить

Связанные модели

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.