GLM-4.6V-Flash — это облегчённая версия мультимодальной языковой модели семейства GLM-V с 9 миллиардами параметров, оптимизированная для локального развёртывания и приложений с низкой задержкой. Несмотря на компактный размер, модель сохраняет ключевые возможности старшей 106-миллиардной версии, включая контекстное окно в 128 тысяч токенов и поддержку нативного мультимодального вызова функций (Native Multimodal Function Calling) — инновации, которая впервые появилась в линейке GLM-V и позволяет передавать изображения, скриншоты и документы напрямую как параметры инструментов без промежуточного текстового преобразования. Конфигурация модели обеспечивает обработку ~150 страниц документов, 200 слайдов или часового видео в одном проходе.
Модель демонстрирует state-of-the-art результаты среди открытых моделей сопоставимого масштаба. На бенчмарке MMBench V1.1 Flash-версия достигает 86.9 баллов, на MathVista (математическое мультимодальное рассуждение) — 82.7, на OCRBench (распознавание текста в изображениях) — 84.7, а на AI2D (понимание научных диаграмм) — 89.2. Особенно впечатляющих результатов модель добивается в агентных задачах: 71.8 на WebVoyager (навигация в браузере) и 69.8 на Design2Code (воспроизведение UI в код), опережая значительно более крупные модели вроде Qwen2.5-VL-72B в задачах понимания длинных документов.
Сценарии использования модели включают: локальную обработку конфиденциальных документов (финансовые отчёты, медицинские записи) с анализом таблиц и графиков без; генерацию фронтенд-кода (точного HTML/CSS) из скриншотов интерфейсов с возможностью итеративного редактирования по текстовым командам; создание мультимодальных агентов для автоматизации задач вроде визуального поиска в интернете или обработки смешанных медиа-контентов (текст + изображения) для соцсетей. Благодаря лицензии MIT и поддержке inference-фреймворков vLLM и SGLang, модель готова к промышленному внедрению как в облачных, так и в edge-сценариях.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 tensor |
2 | 83,37 ₽ | 3,14 | Запустить | ||
131 072 tensor |
4 | 85,77 ₽ | 1,04 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 3,14 | Запустить | ||
131 072 tensor |
4 | 112,24 ₽ | 1,06 | Запустить | ||
131 072 tensor |
2 | 139,77 ₽ | 3,53 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 2,37 | Запустить | ||
131 072 tensor |
2 | 171,77 ₽ | 3,51 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 11,19 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 11,17 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 13,73 | Запустить | ||
131 072 tensor |
2 | 411,81 ₽ | 24,02 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 22,33 | Запустить | ||
131 072 tensor |
2 | 839,97 ₽ | 46,30 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 tensor |
2 | 83,37 ₽ | 2,38 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 2,38 | Запустить | ||
131 072 tensor |
2 | 139,77 ₽ | 2,77 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 1,61 | Запустить | ||
131 072 pipeline |
6 | 147,44 ₽ | 1,04 | Запустить | ||
131 072 tensor |
2 | 171,77 ₽ | 2,75 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 10,43 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 10,41 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 12,97 | Запустить | ||
131 072 tensor |
2 | 411,81 ₽ | 23,26 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 21,57 | Запустить | ||
131 072 tensor |
2 | 839,97 ₽ | 45,54 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 pipeline |
3 | 119,81 ₽ | 2,10 | Запустить | ||
131 072 tensor |
2 | 139,77 ₽ | 1,34 | Запустить | ||
131 072 tensor |
4 | 139,96 ₽ | 2,87 | Запустить | ||
131 072 tensor |
2 | 171,77 ₽ | 1,33 | Запустить | ||
131 072 tensor |
4 | 209,04 ₽ | 2,87 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 9,00 | Запустить | ||
131 072 tensor |
2 | 261,77 ₽ | 4,21 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 8,99 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 11,55 | Запустить | ||
131 072 tensor |
2 | 411,81 ₽ | 21,84 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 20,14 | Запустить | ||
131 072 tensor |
2 | 839,97 ₽ | 44,12 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.