Продукты

Облачные серверы

Облачные серверы с посекундной тарификацией. Изолированные ресурсы дадут максимальную производительность для вашего проекта.

GPU-серверы

Облачные серверы с современными графическими ускорителями RTX и Tesla для игр, рендеринга, стриминга, работы с 3Д-графикой, искусственным интеллектом.

Tesla H200

Tesla H100

RTX 5090

RTX 4090

RTX 3090

RTX 3080

Tesla A100

RTX A5000

Tesla A10

RTX 2080 Ti

Tesla A2

Tesla T4

Tesla V100

Все GPU-серверы

CPU-серверы

Облачные серверы с высокопроизводительными центральными процессорами Intel Xeon Gold второго и третьего поколений, доступные на 100% процессорного времени.
SSD-серверы NVMe-серверы
Все CPU-серверы

Выделенные серверы

Арендуйте физически выделенный сервер на длительный срок с помесячной оплатой. Собрерите конфигурацию с использованием современных комлектующих: процессоров Intel Xeon Gold 2-го и 3-го поколений, до 10 новейших видеоускорителей RTX и Tesla и до 8192 ГБ RAM на сервер, SSD- и NVMe-дисков для дата-центров.

Выбрать выделенный сервер

Маркетплейс

Используйте популярные и современные приложения в качестве эффективных инструментов для организации вашего проекта. Экономьте время с помощью предварительно настроенных образов, в которых уже установлены все необходимые компоненты.

Забудьте про ручную загрузку и установку программного обеспечения — просто разверните виртуальный сервер с готовым образом.
Нейронные сети 3D CUDA Docker / NGC Для игр Windows-образы Linux-образы
Все предустановленные образы
Возможности
Тарифы
FAQ
Контакты
Вход

Qwen3-VL-32B-Thinking

размышляющая

мультимодальная

русскоязычная

Qwen3-VL-32B-Thinking представляет собой reasoning-оптимизированную версию 32-миллиардной модели, специально обученную для сложных задач, требующих глубокого визуального анализа и многоступенчатых логических выводов. Архитектурно модель базируется на тех же трех ключевых инновациях Qwen3-VL: Interleaved-MRoPE, DeepStack и Text-Timestamp Alignment. Однако Thinking-версия проходит специализированное обучение с подкреплением, направленное на развитие способности к структурированному рассуждению при работе с визуальным контентом. Это обучение позволяет модели не просто распознавать визуальные элементы, но и формировать причинно-следственные связи, выдвигать и проверять гипотезы, а также строить логические аргументации на основе визуальных данных.

На бенчмарках мультимодального рассуждения Qwen3-VL-32B-Thinking лидирует среди всех open-source и закрытых моделей схожей размерности практически по всем сравниваемым критериям и категориям. Модель нативно поддерживает контекстное окно 256K токенов с расширением до 1M токенов, что критически важно для обработки комплексных исследовательских работ, технических документов или длинных образовательных видео с сохранением контекста для глубокого анализа. Расширенная поддержка 32 языков OCR с улучшенным распознаванием технической терминологии, математических формул и научных обозначений делает модель универсальным инструментом для оцифровки архивных документов и научных статей.

Сценарии использования Qwen3-VL-32B-Thinking охватывают профессиональные и академические направления. Научные исследования и академическая работа выигрывают от способности модели анализировать сложные экспериментальные данные, интерпретировать научные визуализации и формировать обоснованные гипотезы на основе визуальных паттернов. Образовательные платформы могут использовать модель для создания детальных пошаговых решений сложных задач. Медицинская диагностика и анализ сложных случаев, где требуется многофакторное рассуждение на основе медицинских изображений. Финансовый анализ и бизнес-аналитика с интерпретацией сложных графиков, диаграмм и визуализаций данных, где модель может выявлять тренды, аномалии и формировать прогнозы с обоснованиями. Анализ длинных видео для профессионального контент-анализа, где требуется не только временная локализация событий, но и понимание причинно-следственных связей между ними, выявление скрытых паттернов и формулирование аналитических выводов.

Дата анонса: 22.10.2025
Параметров: 33B
Контекст: 263K
Слоев: 64
Тип внимания: Full Attention
Потребление памяти: 86.9 ГБ в точности 4 бит
Разработчик: Qwen
Версия Transformers: 4.57.0.dev0
Лицензия: Apache 2.0

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами бесплатно для теста инференса и знакомства с Qwen3-VL-32B-Thinking. Получить токен для доступа к API вы можете на странице управления токенами после регистрации и верификации.

Наименование модели	Контекст	Тип	GPU	TPS	Статус	Ссылка


        Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

получить максимальную производительность эндпоинта,
получить полный контекст для обработки больших запросов и диалогов,
обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Наименование	vCPU	ОЗУ, МБ	Диск, ГБ	GPU	Цена, час	Цена, месяц
rtxa5000-6.24.192.160.nvlink 262 144	24	196608	160	6	312,70 ₽	225 144,00 ₽	Запустить
teslav100-4.32.96.160 262 144	32	98304	160	4	388,21 ₽	279 511,20 ₽	Запустить
teslaa100-2.24.96.160.nvlink 262 144	24	98304	160	2	449,81 ₽	323 863,20 ₽	Запустить
rtx5090-4.16.128.160 262 144	16	131072	160	4	513,04 ₽	369 388,80 ₽	Запустить
rtx4090-6.44.256.160 262 144	44	262144	160	6	592,37 ₽	426 506,40 ₽	Запустить
h200-1.16.128.160 262 144	16	131072	160	1	623,04 ₽	448 588,80 ₽	Запустить
teslah100-2.24.256.160 262 144	24	262144	160	2	928,97 ₽	668 858,40 ₽	Запустить

Наименование	vCPU	ОЗУ, МБ	Диск, ГБ	GPU	Цена, час	Цена, месяц
rtxa5000-6.24.192.160.nvlink 262 144	24	196608	160	6	312,70 ₽	225 144,00 ₽	Запустить
teslav100-4.32.256.160 262 144	32	262144	160	4	416,37 ₽	299 786,40 ₽	Запустить
teslaa100-2.24.128.160.nvlink 262 144	24	131072	160	2	455,44 ₽	327 916,80 ₽	Запустить
rtx5090-4.16.128.160 262 144	16	131072	160	4	513,04 ₽	369 388,80 ₽	Запустить
rtx4090-6.44.256.160 262 144	44	262144	160	6	592,37 ₽	426 506,40 ₽	Запустить
h200-1.16.128.160 262 144	16	131072	160	1	623,04 ₽	448 588,80 ₽	Запустить
teslah100-2.24.256.160 262 144	24	262144	160	2	928,97 ₽	668 858,40 ₽	Запустить

Наименование	vCPU	ОЗУ, МБ	Диск, ГБ	GPU	Цена, час	Цена, месяц
rtxa5000-8.24.256.160.nvlink 262 144	24	262144	160	8	411,97 ₽	296 618,40 ₽	Запустить
teslaa100-2.24.192.160.nvlink 262 144	24	196608	160	2	466,70 ₽	336 024,00 ₽	Запустить
rtx4090-8.44.256.160 262 144	44	262144	160	8	766,17 ₽	551 642,40 ₽	Запустить
rtx5090-6.44.256.160 262 144	44	262144	160	6	790,97 ₽	569 498,40 ₽	Запустить
teslah100-2.24.256.160 262 144	24	262144	160	2	928,97 ₽	668 858,40 ₽	Запустить
h200-2.24.256.240 262 144	24	262144	240	2	1 240,74 ₽	893 332,80 ₽	Запустить

Связанные модели

Qwen3-30B-A3B

Qwen3-235B-A22B

Qwen3-0.6B

Qwen3-1.7B

Qwen3-4B

Qwen3-8B

Qwen3-14B

Qwen3-32B

DeepSeek-R1-0528-Qwen3-8B

T-pro-2.0

Qwen3-235B-A22B-Instruct-2507

Qwen3-235B-A22B-Thinking-2507

Qwen3-Coder-480B-A35B-Instruct

Qwen3-Coder-30B-A3B-Instruct

Qwen3-30B-A3B-Instruct-2507

Qwen3-30B-A3B-Thinking-2507

Qwen3-4B-Instruct-2507

Qwen3-4B-Thinking-2507

Qwen3-VL-235B-A22B-Instruct

Qwen3-VL-235B-A22B-Thinking

Qwen3-VL-30B-A3B-Instruct

Qwen3-VL-30B-A3B-Thinking

Qwen3-VL-8B-Instruct

Qwen3-VL-8B-Thinking

Qwen3-VL-4B-Instruct

Qwen3-VL-4B-Thinking

Qwen3-VL-2B-Instruct

Qwen3-VL-2B-Thinking

Qwen3-VL-32B-Instruct

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.

Qwen3-VL-32B-Thinking

Публичный эндпоинт

Частный сервер

Рекомендуемые конфигурации для хостинга Qwen3-VL-32B-Thinking

Связанные модели

Остались вопросы?