Z.ai

Юридическое название компании — Beijing Zhipu Huazhang Technology Co., Ltd. (北京智谱华章科技有限公司). Зарегистрирована в Китае, штаб-квартира расположена в Пекине. Компания была основана в 2019 году как стартап, выделившийся из исследовательской группы THUDM Университета Цинхуа (Tsinghua University Department of Computer Science and Technology). Первоначально она была известна под брендом Zhipu AI, а в 2025 году глобально ребрендинровалась в Z.ai. Устоявшееся в сообществе название "Team GLM" происходит от их первых научных публикаций и разрабатываемой серии моделей GLM.

Z.ai знаменита систематическим развитием семейства больших языковых моделей GLM, от академических исследований до промышленных продуктов. Компания добилась признания благодаря инженерной воспроизводимости своих моделей, в частности, за практическую реализацию INT4-квантизации для моделей класса 100B+ (GLM-130B), что позволило запускать их на потребительском оборудовании. Она стала одним из первых исследователей, представивших нативную, интегрированную поддержку вызова инструментов (веб-браузер, код, генерация изображений) в рамках единой модели (GLM-4 All Tools), заложив основу для современных агентских сценариев. Далее вышла GLM-4.5 (2025), впервые реализовавшая в рамках открытых моделей автоматическое переключение между thinking mode для сложных многошаговых задач и non-thinking mode для быстрых, рутинных ответов. Вместо традиционного увеличения ширины (размерности скрытых слоёв и числа экспертов), Z.ai сделала ставку на глубину — увеличив число слоёв и attention heads — это обеспечило модели выдающуюся производительность в генерации длинного, структурированного кода (особенно HTML) и сложных агентских сценариях. Параллельно была представлена мультимодальная версия GLM-4.5V, достигшая SOTA среди открытых VLM.

Сегодня Z.ai позиционируется как один из ключевых китайских "ИИ-тигров" и третий по величине игрок на рынке больших языковых моделей в Китае. При этом Z.ai объективно выделяется в глобальной ИИ-индустрии сочетанием трёх факторов: научной новизной исследований, открытостью весов передовых моделей и фокусом на практических сценариях их использования с акцентом на вызов инструментов и генерацию кода.

Связанные модели