GLM-4.6V-Flash — это облегчённая версия мультимодальной языковой модели семейства GLM-V с 9 миллиардами параметров, оптимизированная для локального развёртывания и приложений с низкой задержкой. Несмотря на компактный размер, модель сохраняет ключевые возможности старшей 106-миллиардной версии, включая контекстное окно в 128 тысяч токенов и поддержку нативного мультимодального вызова функций (Native Multimodal Function Calling) — инновации, которая впервые появилась в линейке GLM-V и позволяет передавать изображения, скриншоты и документы напрямую как параметры инструментов без промежуточного текстового преобразования. Конфигурация модели обеспечивает обработку ~150 страниц документов, 200 слайдов или часового видео в одном проходе.
Модель демонстрирует state-of-the-art результаты среди открытых моделей сопоставимого масштаба. На бенчмарке MMBench V1.1 Flash-версия достигает 86.9 баллов, на MathVista (математическое мультимодальное рассуждение) — 82.7, на OCRBench (распознавание текста в изображениях) — 84.7, а на AI2D (понимание научных диаграмм) — 89.2. Особенно впечатляющих результатов модель добивается в агентных задачах: 71.8 на WebVoyager (навигация в браузере) и 69.8 на Design2Code (воспроизведение UI в код), опережая значительно более крупные модели вроде Qwen2.5-VL-72B в задачах понимания длинных документов.
Сценарии использования модели включают: локальную обработку конфиденциальных документов (финансовые отчёты, медицинские записи) с анализом таблиц и графиков без; генерацию фронтенд-кода (точного HTML/CSS) из скриншотов интерфейсов с возможностью итеративного редактирования по текстовым командам; создание мультимодальных агентов для автоматизации задач вроде визуального поиска в интернете или обработки смешанных медиа-контентов (текст + изображения) для соцсетей. Благодаря лицензии MIT и поддержке inference-фреймворков vLLM и SGLang, модель готова к промышленному внедрению как в облачных, так и в edge-сценариях.
| Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
131 072 |
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | |
131 072 tensor |
16 | 32768 | 160 | 2 | 48,14 ₽ | Запустить | |
131 072 tensor |
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | |
131 072 tensor |
12 | 65536 | 160 | 2 | 61,37 ₽ | Запустить | |
131 072 |
16 | 24576 | 160 | 1 | 73,73 ₽ | Запустить | |
131 072 |
16 | 32768 | 160 | 1 | 91,14 ₽ | Запустить | |
131 072 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
131 072 pipeline |
16 | 65536 | 160 | 3 | 127,37 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 4 | 162,57 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 211,77 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 341,77 ₽ | Запустить | |
131 072 |
16 | 98304 | 160 | 1 | 367,41 ₽ | Запустить | |
131 072 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
131 072 |
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | |
131 072 tensor |
16 | 32768 | 160 | 2 | 48,14 ₽ | Запустить | |
131 072 tensor |
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | |
131 072 |
16 | 24576 | 160 | 1 | 73,73 ₽ | Запустить | |
131 072 pipeline |
12 | 24576 | 120 | 3 | 74,84 ₽ | Запустить | |
131 072 |
16 | 32768 | 160 | 1 | 91,14 ₽ | Запустить | |
131 072 tensor |
16 | 32768 | 160 | 4 | 99,74 ₽ | Запустить | |
131 072 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
131 072 pipeline |
16 | 65536 | 160 | 3 | 127,37 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 4 | 162,57 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 211,77 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 341,77 ₽ | Запустить | |
131 072 |
16 | 98304 | 160 | 1 | 367,41 ₽ | Запустить | |
131 072 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
131 072 pipeline |
32 | 65536 | 160 | 3 | 78,57 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 83,37 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 4 | 85,77 ₽ | Запустить | |
131 072 pipeline |
32 | 131072 | 160 | 3 | 94,64 ₽ | Запустить | |
131 072 tensor |
16 | 32768 | 160 | 4 | 99,74 ₽ | Запустить | |
131 072 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
131 072 tensor |
32 | 131072 | 160 | 4 | 112,24 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 139,77 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 4 | 162,57 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 171,77 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 211,77 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 341,77 ₽ | Запустить | |
131 072 |
16 | 98304 | 160 | 1 | 367,41 ₽ | Запустить | |
131 072 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.