GLM-Z1-9B-0414 — это модель с 9.4-млдр параметров из новой серии GLM-4–0414, которая стала настоящим сюрпризом даже для разработчиков. Несмотря на относительно небольшое количество параметров, она была обучена с использованием всех ключевых техник, применённых при создании гораздо более крупных моделей этой серии. Это позволило достичь неожиданно высокого уровня точности, логического мышления и общей эффективности.
Модель прошла через комплексное обучение, начиная с фазы предобучения на массивах качественных данных и заканчивая сложными этапами пост-обучения (выравнивание по пользовательским предпочтениям, rejection sampling, обучение с подкреплением на основе парного ранжирования обратной связи). Эти подходы позволили модели лучше понимать, какие ответы являются наиболее полезными и корректными в конкретных ситуациях.
Особое внимание в обучении было уделено развитию способности к рассуждению, особенно в математических задачах и логических головоломках. Полученные навыки делают модель эффективной не только в стандартных вопросах-ответах, но и в решении более сложных аналитических задач. При этом, благодаря своему компактному размеру, GLM-Z1-9B-0414 демонстрирует отличную вычислительную эффективность, что делает её идеальным выбором для сценариев с ограниченными ресурсами.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 |
1 | 29,33 ₽ | 3,73 | Запустить | ||
32 768 |
1 | 33,74 ₽ | 3,76 | Запустить | ||
32 768 |
1 | 46,94 ₽ | 9,57 | Запустить | ||
32 768 tensor |
2 | 61,37 ₽ | 6,56 | Запустить | ||
32 768 |
1 | 73,73 ₽ | 10,35 | Запустить | ||
32 768 tensor |
2 | 86,54 ₽ | 5,16 | Запустить | ||
32 768 |
1 | 91,14 ₽ | 10,32 | Запустить | ||
32 768 tensor |
2 | 109,77 ₽ | 24,13 | Запустить | ||
32 768 |
1 | 141,77 ₽ | 16,09 | Запустить | ||
32 768 |
1 | 211,77 ₽ | 51,34 | Запустить | ||
32 768 |
1 | 341,77 ₽ | 107,92 | 51,29 | Запустить | |
32 768 |
1 | 367,41 ₽ | 61,53 | Запустить | ||
32 768 tensor |
2 | 411,81 ₽ | 107,67 | Запустить | ||
32 768 |
1 | 423,04 ₽ | 95,91 | Запустить | ||
32 768 tensor |
2 | 839,97 ₽ | 196,80 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 |
1 | 29,33 ₽ | 1,71 | Запустить | ||
32 768 |
1 | 33,74 ₽ | 1,74 | Запустить | ||
32 768 |
1 | 46,94 ₽ | 7,56 | Запустить | ||
32 768 tensor |
2 | 61,37 ₽ | 4,54 | Запустить | ||
32 768 |
1 | 73,73 ₽ | 8,34 | Запустить | ||
32 768 tensor |
2 | 86,54 ₽ | 3,14 | Запустить | ||
32 768 |
1 | 91,14 ₽ | 8,31 | Запустить | ||
32 768 tensor |
2 | 109,77 ₽ | 22,12 | Запустить | ||
32 768 |
1 | 141,77 ₽ | 14,07 | Запустить | ||
32 768 |
1 | 211,77 ₽ | 49,32 | Запустить | ||
32 768 |
1 | 341,77 ₽ | 49,27 | Запустить | ||
32 768 |
1 | 367,41 ₽ | 59,51 | Запустить | ||
32 768 tensor |
2 | 411,81 ₽ | 105,65 | Запустить | ||
32 768 |
1 | 423,04 ₽ | 93,89 | Запустить | ||
32 768 tensor |
2 | 839,97 ₽ | 194,78 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 tensor |
2 | 48,14 ₽ | 3,42 | Запустить | ||
32 768 tensor |
2 | 51,34 ₽ | 3,48 | Запустить | ||
32 768 |
1 | 73,73 ₽ | 1,33 | Запустить | ||
32 768 pipeline |
3 | 74,84 ₽ | 1,74 | Запустить | ||
32 768 tensor |
2 | 83,37 ₽ | 15,11 | Запустить | ||
32 768 |
1 | 91,14 ₽ | 1,30 | Запустить | ||
32 768 tensor |
4 | 99,74 ₽ | 4,54 | Запустить | ||
32 768 tensor |
2 | 109,77 ₽ | 15,11 | Запустить | ||
32 768 |
1 | 141,77 ₽ | 7,07 | Запустить | ||
32 768 tensor |
4 | 162,57 ₽ | 3,14 | Запустить | ||
32 768 |
1 | 211,77 ₽ | 42,32 | Запустить | ||
32 768 |
1 | 341,77 ₽ | 42,27 | Запустить | ||
32 768 |
1 | 367,41 ₽ | 52,51 | Запустить | ||
32 768 tensor |
2 | 411,81 ₽ | 98,65 | Запустить | ||
32 768 |
1 | 423,04 ₽ | 86,89 | Запустить | ||
32 768 tensor |
2 | 839,97 ₽ | 187,78 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.