Qwen3-VL-4B-Instruct — это компактная мультимодальная модель с 4 миллиардами параметров, разработанная для эффективного развертывания на серверах с ограниченными ресурсами при сохранении полного функционала серии Qwen3-VL. Несмотря на вдвое меньший размер по сравнению с 8B-версией, модель сохраняет все ключевые архитектурные инновации серии: Interleaved-MRoPE для видеопонимания, DeepStack для многоуровневого слияния визуальных признаков и Text-Timestamp Alignment для точной временной локализации. Бесшовная интеграция текстовых и визуальных модальностей обеспечивает понимание мультимодального контекста на уровне, сопоставимом с чисто текстовыми LLM.
По производительности Qwen3-VL-4B-Instruct приближается к результатам Qwen2.5-VL-7B, демонстрируя, что уменьшение размера модели было достигнуто без существенной потери качества. Модель поддерживает нативный контекст 256K токенов (расширяемый до 1M), обеспечивая возможность обработки длинных документов, многочасовых видео и сложных мультимодальных диалогов. Расширенные возможности OCR с поддержкой 32 языков и устойчивостью к сложным условиям съемки делают 4B-модель полноценным решением для задач интеллектуальной обработки документов несмотря на компактный размер.
Qwen3-VL-4B-Instruct представляет собой идеальное решение для сценариев, где требуется баланс между производительностью и эффективностью: развертывание на потребительских устройствах, возможность обработки больших объемов визуального контента, скорость ответов при интеграции в реалтайм-приложения и исследовательские проекты. А открытая лицензия Apache 2.0 предполагает свободное коммерческое использование модели, что делает её доступной для широкого круга пользователей от стартапов до крупных предприятий.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 tensor |
4 | 85,77 ₽ | 1,23 | Запустить | ||
262 144 tensor |
4 | 112,24 ₽ | 1,23 | Запустить | ||
262 144 pipeline |
3 | 119,81 ₽ | 1,49 | Запустить | ||
262 144 tensor |
4 | 139,96 ₽ | 2,03 | Запустить | ||
262 144 tensor |
2 | 198,54 ₽ | 1,36 | Запустить | ||
262 144 pipeline |
3 | 204,41 ₽ | 1,49 | Запустить | ||
262 144 tensor |
4 | 209,04 ₽ | 2,03 | Запустить | ||
262 144 |
1 | 211,77 ₽ | 1,83 | Запустить | ||
262 144 pipeline |
3 | 252,41 ₽ | 1,49 | Запустить | ||
262 144 tensor |
4 | 257,77 ₽ | 2,03 | Запустить | ||
262 144 tensor |
2 | 261,77 ₽ | 1,36 | Запустить | ||
262 144 tensor |
4 | 321,77 ₽ | 2,03 | Запустить | ||
262 144 |
1 | 341,77 ₽ | 1,83 | Запустить | ||
262 144 |
1 | 367,41 ₽ | 2,18 | Запустить | ||
262 144 |
1 | 423,04 ₽ | 3,36 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 tensor |
4 | 85,77 ₽ | 1,16 | Запустить | ||
262 144 tensor |
4 | 112,24 ₽ | 1,16 | Запустить | ||
262 144 pipeline |
3 | 119,81 ₽ | 67,96 | 1,42 | Запустить | |
262 144 tensor |
4 | 139,96 ₽ | 1,96 | Запустить | ||
262 144 tensor |
2 | 198,54 ₽ | 1,29 | Запустить | ||
262 144 pipeline |
3 | 204,41 ₽ | 65,69 | 1,42 | Запустить | |
262 144 tensor |
4 | 209,04 ₽ | 1,96 | Запустить | ||
262 144 |
1 | 211,77 ₽ | 93,86 | 1,76 | Запустить | |
262 144 pipeline |
3 | 252,41 ₽ | 57,90 | 1,42 | Запустить | |
262 144 tensor |
4 | 257,77 ₽ | 1,96 | Запустить | ||
262 144 tensor |
2 | 261,77 ₽ | 1,29 | Запустить | ||
262 144 tensor |
4 | 321,77 ₽ | 1,96 | Запустить | ||
262 144 |
1 | 341,77 ₽ | 126,67 | 1,76 | Запустить | |
262 144 |
1 | 367,41 ₽ | 2,11 | Запустить | ||
262 144 |
1 | 423,04 ₽ | 3,29 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 tensor |
4 | 85,77 ₽ | 1,08 | Запустить | ||
262 144 tensor |
4 | 112,24 ₽ | 1,08 | Запустить | ||
262 144 pipeline |
3 | 119,81 ₽ | 1,35 | Запустить | ||
262 144 tensor |
4 | 139,96 ₽ | 1,88 | Запустить | ||
262 144 tensor |
2 | 198,54 ₽ | 1,21 | Запустить | ||
262 144 pipeline |
3 | 204,41 ₽ | 58,43 | 1,35 | Запустить | |
262 144 tensor |
4 | 209,04 ₽ | 1,88 | Запустить | ||
262 144 |
1 | 211,77 ₽ | 74,84 | 1,68 | Запустить | |
262 144 pipeline |
3 | 252,41 ₽ | 69,68 | 1,35 | Запустить | |
262 144 tensor |
4 | 257,77 ₽ | 1,88 | Запустить | ||
262 144 tensor |
2 | 261,77 ₽ | 87,96 | 1,21 | Запустить | |
262 144 tensor |
4 | 321,77 ₽ | 1,88 | Запустить | ||
262 144 |
1 | 341,77 ₽ | 106,83 | 1,68 | Запустить | |
262 144 |
1 | 367,41 ₽ | 2,03 | Запустить | ||
262 144 |
1 | 423,04 ₽ | 3,21 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.