GLM-4.6V продолжает развивать мультимодальное направление архитектуры GLM (General Language Model). Модель имеет 106 миллиардов параметров. Её текстовая часть (текстовый энкодер) состоит из 46 слоёв, поддерживает контекстное окно длиной 128 тысяч токенов и использует механизм из 128 «экспертов», из которых для обработки каждого токена активируется 8. Главным прорывом GLM-4.6V является внедрение нативного мультимодального вызова функций (Native Multimodal Function Calling). В отличие от традиционных LLM, где инструментам передаются только текстовые описания изображений, GLM-4.6V может напрямую использовать изображения, скриншоты или PDF-страницы в качестве входных параметров для инструментов. Это замыкает цикл «восприятие → понимание → действие»: модель может, например, увидеть график, автоматически вызвать инструмент для его анализа, визуально прочитать результат и интегрировать его в итоговый ответ.
Модель демонстрирует отличные результаты на ключевых мультимодальных бенчмарках, занимая лидирующие позиции среди всех открытых моделей сопоставимого масштаба.
Сценарии использования GLM-4.6V охватывают широкий спектр практических применений. Модель идеально подходит для автоматизации работы с документами — она может анализировать PDF, таблицы и сканированные страницы как единые визуальные объекты, извлекая структурированную информацию без предварительной обработки. Эта способность особенно хорошо применима для направления бизнес-аналитики: GLM-4.6V может анализировать отчеты, графики и диаграммы, автоматически генерируя текстовые интерпретации и выводы, что значительно ускоряет процесс принятия решений на основе визуальных данных.Отдельно стоить выделить фронтенд-разработку и репликацию интерфейсов: по скриншоту скриншот макета, модель генерирует высокоточный HTML/CSS/JS-код. Пользователь может обвести область на скриншоте и дать текстовую команду («сделай эту кнопку синей»), и модель автоматически найдёт и отредактирует соответствующий фрагмент кода.
| Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
131 072 tensor |
24 | 196608 | 160 | 6 | 312,70 ₽ | Запустить | |
131 072 tensor |
32 | 98304 | 160 | 4 | 388,21 ₽ | Запустить | |
131 072 tensor |
24 | 98304 | 160 | 2 | 411,81 ₽ | Запустить | |
131 072 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
131 072 tensor |
16 | 131072 | 160 | 4 | 513,04 ₽ | Запустить | |
131 072 tensor |
44 | 262144 | 160 | 6 | 520,97 ₽ | Запустить | |
131 072 tensor |
24 | 262144 | 160 | 2 | 699,97 ₽ | Запустить | |
131 072 tensor |
24 | 196608 | 240 | 2 | 729,47 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
131 072 tensor |
24 | 262144 | 240 | 2 | 440,74 ₽ | Запустить | |
131 072 tensor |
44 | 262144 | 240 | 8 | 671,74 ₽ | Запустить | |
131 072 tensor |
24 | 262144 | 240 | 2 | 700,74 ₽ | Запустить | |
131 072 tensor |
24 | 196608 | 240 | 2 | 729,47 ₽ | Запустить | |
131 072 tensor |
44 | 262144 | 240 | 6 | 791,74 ₽ | Запустить | |
131 072 tensor |
24 | 262144 | 240 | 2 | 840,74 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
131 072 tensor |
16 | 262144 | 480 | 4 | 818,68 ₽ | Запустить | |
131 072 tensor |
24 | 262144 | 320 | 2 | 841,52 ₽ | Запустить | |
131 072 tensor |
24 | 393216 | 480 | 3 | 1 105,60 ₽ | Запустить | |
131 072 tensor |
16 | 262144 | 480 | 4 | 1 338,68 ₽ | Запустить | |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.