GLM-4.6V-Flash — это облегчённая версия мультимодальной языковой модели семейства GLM-V с 9 миллиардами параметров, оптимизированная для локального развёртывания и приложений с низкой задержкой. Несмотря на компактный размер, модель сохраняет ключевые возможности старшей 106-миллиардной версии, включая контекстное окно в 128 тысяч токенов и поддержку нативного мультимодального вызова функций (Native Multimodal Function Calling) — инновации, которая впервые появилась в линейке GLM-V и позволяет передавать изображения, скриншоты и документы напрямую как параметры инструментов без промежуточного текстового преобразования. Конфигурация модели обеспечивает обработку ~150 страниц документов, 200 слайдов или часового видео в одном проходе.
Модель демонстрирует state-of-the-art результаты среди открытых моделей сопоставимого масштаба. На бенчмарке MMBench V1.1 Flash-версия достигает 86.9 баллов, на MathVista (математическое мультимодальное рассуждение) — 82.7, на OCRBench (распознавание текста в изображениях) — 84.7, а на AI2D (понимание научных диаграмм) — 89.2. Особенно впечатляющих результатов модель добивается в агентных задачах: 71.8 на WebVoyager (навигация в браузере) и 69.8 на Design2Code (воспроизведение UI в код), опережая значительно более крупные модели вроде Qwen2.5-VL-72B в задачах понимания длинных документов.
Сценарии использования модели включают: локальную обработку конфиденциальных документов (финансовые отчёты, медицинские записи) с анализом таблиц и графиков без; генерацию фронтенд-кода (точного HTML/CSS) из скриншотов интерфейсов с возможностью итеративного редактирования по текстовым командам; создание мультимодальных агентов для автоматизации задач вроде визуального поиска в интернете или обработки смешанных медиа-контентов (текст + изображения) для соцсетей. Благодаря лицензии MIT и поддержке inference-фреймворков vLLM и SGLang, модель готова к промышленному внедрению как в облачных, так и в edge-сценариях.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 |
1 | 46,94 ₽ | 2,05 | Запустить | ||
131 072 tensor |
2 | 48,14 ₽ | 2,99 | Запустить | ||
131 072 tensor |
2 | 51,34 ₽ | 2,99 | Запустить | ||
131 072 tensor |
2 | 61,37 ₽ | 1,19 | Запустить | ||
131 072 |
1 | 73,73 ₽ | 2,05 | Запустить | ||
131 072 |
1 | 91,14 ₽ | 2,05 | Запустить | ||
131 072 |
1 | 107,57 ₽ | 3,49 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 5,87 | Запустить | ||
131 072 pipeline |
3 | 127,37 ₽ | 2,13 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 3,49 | Запустить | ||
131 072 tensor |
4 | 162,57 ₽ | 3,43 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 12,13 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 12,13 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 14,65 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 23,11 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 |
1 | 46,94 ₽ | 1,23 | Запустить | ||
131 072 tensor |
2 | 48,14 ₽ | 2,17 | Запустить | ||
131 072 tensor |
2 | 51,34 ₽ | 2,17 | Запустить | ||
131 072 |
1 | 73,73 ₽ | 1,23 | Запустить | ||
131 072 pipeline |
3 | 74,84 ₽ | 1,85 | Запустить | ||
131 072 |
1 | 91,14 ₽ | 1,23 | Запустить | ||
131 072 tensor |
4 | 99,74 ₽ | 3,33 | Запустить | ||
131 072 |
1 | 107,57 ₽ | 2,67 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 5,05 | Запустить | ||
131 072 pipeline |
3 | 127,37 ₽ | 1,31 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 2,67 | Запустить | ||
131 072 tensor |
4 | 162,57 ₽ | 2,61 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 11,31 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 11,31 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 13,83 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 22,29 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 pipeline |
3 | 78,57 ₽ | 3,02 | Запустить | ||
131 072 tensor |
2 | 83,37 ₽ | 3,52 | Запустить | ||
131 072 tensor |
4 | 85,77 ₽ | 5,40 | Запустить | ||
131 072 pipeline |
3 | 94,64 ₽ | 3,02 | Запустить | ||
131 072 tensor |
4 | 99,74 ₽ | 1,80 | Запустить | ||
131 072 |
1 | 107,57 ₽ | 1,14 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 3,52 | Запустить | ||
131 072 tensor |
4 | 112,24 ₽ | 5,40 | Запустить | ||
131 072 tensor |
2 | 139,77 ₽ | 3,52 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 1,14 | Запустить | ||
131 072 tensor |
4 | 162,57 ₽ | 1,08 | Запустить | ||
131 072 tensor |
2 | 171,77 ₽ | 3,52 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 9,78 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 9,78 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 12,30 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 20,76 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.