GLM-4.6V

размышляющая
мультимодальная
русскоязычная

GLM-4.6V продолжает развивать мультимодальное направление архитектуры GLM (General Language Model). Модель имеет 106 миллиардов параметров. Её текстовая часть (текстовый энкодер) состоит из 46 слоёв, поддерживает контекстное окно длиной 128 тысяч токенов и использует механизм из 128 «экспертов», из которых для обработки каждого токена активируется 8. Главным прорывом GLM-4.6V является внедрение нативного мультимодального вызова функций (Native Multimodal Function Calling). В отличие от традиционных LLM, где инструментам передаются только текстовые описания изображений, GLM-4.6V может напрямую использовать изображения, скриншоты или PDF-страницы в качестве входных параметров для инструментов. Это замыкает цикл «восприятие → понимание → действие»: модель может, например, увидеть график, автоматически вызвать инструмент для его анализа, визуально прочитать результат и интегрировать его в итоговый ответ.

Модель демонстрирует отличные результаты на ключевых мультимодальных бенчмарках, занимая лидирующие позиции среди всех открытых моделей сопоставимого масштаба.

Сценарии использования GLM-4.6V охватывают широкий спектр практических применений. Модель идеально подходит для автоматизации работы с документами — она может анализировать PDF, таблицы и сканированные страницы как единые визуальные объекты, извлекая структурированную информацию без предварительной обработки. Эта способность особенно хорошо применима для направления бизнес-аналитики: GLM-4.6V может анализировать отчеты, графики и диаграммы, автоматически генерируя текстовые интерпретации и выводы, что значительно ускоряет процесс принятия решений на основе визуальных данных.Отдельно стоить выделить фронтенд-разработку и репликацию интерфейсов: по скриншоту скриншот макета, модель генерирует высокоточный HTML/CSS/JS-код. Пользователь может обвести область на скриншоте и дать текстовую команду («сделай эту кнопку синей»), и модель автоматически найдёт и отредактирует соответствующий фрагмент кода.


Дата анонса: 07.12.2025
Параметров: 107.71093312B
Экспертов: 128
Активно параметров при инференсе: 12B
Контекст: 131K
Слоев: 46
Тип внимания: Full Attention
Разработчик: Z.ai
Версия Transformers: 5.0.0rc0
Лицензия: MIT

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами бесплатно для теста инференса и знакомства с GLM-4.6V. Получить токен для доступа к API вы можете на странице управления токенами после регистрации и верификации.
Наименование модели Контекст Тип GPU TPS Статус Ссылка
Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

  • получить максимальную производительность эндпоинта,
  • получить полный контекст для обработки больших запросов и диалогов,
  • обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
  • использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации для хостинга GLM-4.6V

Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
rtxa5000-6.24.192.160.nvlink
131 072
tensor
24 196608 160 6 312,70 ₽ Запустить
teslav100-4.32.96.160
131 072
tensor
32 98304 160 4 388,21 ₽ Запустить
teslaa100-2.24.96.160.nvlink
131 072
tensor
24 98304 160 2 411,81 ₽ Запустить
h200-1.16.128.160
131 072
16 131072 160 1 423,04 ₽ Запустить
rtx5090-4.16.128.160
131 072
tensor
16 131072 160 4 513,04 ₽ Запустить
rtx4090-6.44.256.160
131 072
tensor
44 262144 160 6 520,97 ₽ Запустить
h100-2.24.256.160
131 072
tensor
24 262144 160 2 699,97 ₽ Запустить
h100nvl-2.24.192.240
131 072
tensor
24 196608 240 2 729,47 ₽ Запустить
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
teslaa100-2.24.256.240
131 072
tensor
24 262144 240 2 440,74 ₽ Запустить
rtx4090-8.44.256.240
131 072
tensor
44 262144 240 8 671,74 ₽ Запустить
h100-2.24.256.240
131 072
tensor
24 262144 240 2 700,74 ₽ Запустить
h100nvl-2.24.192.240
131 072
tensor
24 196608 240 2 729,47 ₽ Запустить
rtx5090-6.44.256.240
131 072
tensor
44 262144 240 6 791,74 ₽ Запустить
h200-2.24.256.240
131 072
tensor
24 262144 240 2 840,74 ₽ Запустить
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
teslaa100-4.16.256.480
131 072
tensor
16 262144 480 4 818,68 ₽ Запустить
h200-2.24.256.320
131 072
tensor
24 262144 320 2 841,52 ₽ Запустить
h100nvl-3.24.384.480
131 072
tensor
24 393216 480 3 1 105,60 ₽ Запустить
h100-4.16.256.480
131 072
tensor
16 262144 480 4 1 338,68 ₽ Запустить

Связанные модели

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.