GLM-4.5-Air это воплощение принципа "эффективность и скорость" созданная специально для агентных приложений с ограниченными вычислительными ресурсами – да разработчики уверяют рассуждающая модель, может быть, и быстрой и точной одновременно. Эта компактная модель с 106 миллиардами общих параметров и 12 миллиардами активных параметров демонстрирует, как грамотная оптимизация архитектуры может сохранить ключевые возможности более крупной модели при радикальном снижении требований к ресурсам. Используя ту же MoE архитектуру, что и старший брат, но оптимизирована для быстрого инференса и ресурсоэффективности без ущерба для основных возможностей. Специализированное обучение для агент-ориентированных задач включает экстенсивную оптимизацию для использования инструментов, веб-браузинга, разработки программного обеспечения и фронтенд-разработки. Это позволяет GLM-4.5-Air обеспечивать превосходную производительность в практических задачах разработки по сравнению с моделями общего назначения аналогичного размера.
Гибридная система рассуждений GLM-4.5-Air адаптирована для высокоскоростных интерактивных приложений. Модель наследует двухрежимную архитектуру старшей версии, но оптимизирована для минимизации латентности в non-thinking режиме, обеспечивая время отклика менее секунды для большинства запросов. Это делает ее идеальной для real-time приложений, таких как автодополнение кода, интерактивная отладка и генерация документации в реальном времени. В thinking режиме модель все еще способна на сложные многошаговые рассуждения, но с оптимизированным балансом между глубиной анализа и скоростью выполнения.
Производительность GLM-4.5-Air на бенчмарках впечатляет для модели своего класса. Заняв 6-е место в общем рейтинге из 12 ключевых бенчмарков с результатом 59.8, модель опережает множество более крупных конкурентов. Особенно впечатляет успешность вызова инструментов на уровне 90.6%, превосходящая многие крупные проприетарные решения.
Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
---|---|---|---|---|---|---|---|
16 | 131072 | 160 | 4 | 156,24 ₽ | Запустить | ||
16 | 131072 | 160 | 4 | 288,24 ₽ | Запустить | ||
16 | 131072 | 160 | 4 | 380,64 ₽ | Запустить | ||
16 | 98304 | 160 | 3 | 387,41 ₽ | Запустить | ||
24 | 262144 | 160 | 2 | 477,97 ₽ | Запустить | ||
24 | 262144 | 160 | 2 | 928,97 ₽ | Запустить |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.