GLM-Z1-9B-0414 — это модель с 9.4-млдр параметров из новой серии GLM-4–0414, которая стала настоящим сюрпризом даже для разработчиков. Несмотря на относительно небольшое количество параметров, она была обучена с использованием всех ключевых техник, применённых при создании гораздо более крупных моделей этой серии. Это позволило достичь неожиданно высокого уровня точности, логического мышления и общей эффективности.
Модель прошла через комплексное обучение, начиная с фазы предобучения на массивах качественных данных и заканчивая сложными этапами пост-обучения (выравнивание по пользовательским предпочтениям, rejection sampling, обучение с подкреплением на основе парного ранжирования обратной связи). Эти подходы позволили модели лучше понимать, какие ответы являются наиболее полезными и корректными в конкретных ситуациях.
Особое внимание в обучении было уделено развитию способности к рассуждению, особенно в математических задачах и логических головоломках. Полученные навыки делают модель эффективной не только в стандартных вопросах-ответах, но и в решении более сложных аналитических задач. При этом, благодаря своему компактному размеру, GLM-Z1-9B-0414 демонстрирует отличную вычислительную эффективность, что делает её идеальным выбором для сценариев с ограниченными ресурсами.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 |
1 | 34,51 ₽ | 4,53 | Запустить | ||
32 768 |
1 | 37,77 ₽ | 4,53 | Запустить | ||
32 768 tensor |
2 | 63,57 ₽ | 6,85 | Запустить | ||
32 768 tensor |
2 | 92,17 ₽ | 5,41 | Запустить | ||
32 768 |
1 | 105,57 ₽ | 10,29 | Запустить | ||
32 768 tensor |
2 | 109,77 ₽ | 25,57 | Запустить | ||
32 768 |
1 | 150,57 ₽ | 16,05 | Запустить | ||
32 768 tensor |
4 | 156,24 ₽ | 56,13 | Запустить | ||
32 768 |
1 | 211,77 ₽ | 50,61 | Запустить | ||
32 768 tensor |
4 | 269,04 ₽ | 56,13 | Запустить | ||
32 768 |
1 | 341,77 ₽ | 107,92 | 50,61 | Запустить | |
32 768 |
1 | 367,41 ₽ | 60,69 | Запустить | ||
32 768 tensor |
2 | 439,97 ₽ | 106,21 | Запустить | ||
32 768 tensor |
2 | 839,97 ₽ | 194,05 | Запустить | ||
32 768 tensor |
4 | 1 717,59 ₽ | 393,09 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 |
1 | 34,51 ₽ | 2,52 | Запустить | ||
32 768 |
1 | 37,77 ₽ | 2,52 | Запустить | ||
32 768 tensor |
2 | 63,57 ₽ | 4,84 | Запустить | ||
32 768 tensor |
2 | 92,17 ₽ | 3,40 | Запустить | ||
32 768 |
1 | 105,57 ₽ | 8,28 | Запустить | ||
32 768 tensor |
2 | 109,77 ₽ | 23,56 | Запустить | ||
32 768 |
1 | 150,57 ₽ | 14,04 | Запустить | ||
32 768 tensor |
4 | 156,24 ₽ | 54,12 | Запустить | ||
32 768 |
1 | 211,77 ₽ | 48,60 | Запустить | ||
32 768 tensor |
4 | 269,04 ₽ | 54,12 | Запустить | ||
32 768 |
1 | 341,77 ₽ | 48,60 | Запустить | ||
32 768 |
1 | 367,41 ₽ | 58,68 | Запустить | ||
32 768 tensor |
2 | 439,97 ₽ | 104,20 | Запустить | ||
32 768 tensor |
2 | 839,97 ₽ | 192,04 | Запустить | ||
32 768 tensor |
4 | 1 717,59 ₽ | 391,08 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 tensor |
2 | 51,34 ₽ | 3,99 | Запустить | ||
32 768 pipeline |
3 | 74,84 ₽ | 2,71 | Запустить | ||
32 768 pipeline |
3 | 78,95 ₽ | 13,51 | Запустить | ||
32 768 tensor |
4 | 99,74 ₽ | 8,63 | Запустить | ||
32 768 tensor |
2 | 109,77 ₽ | 15,51 | Запустить | ||
32 768 tensor |
4 | 127,45 ₽ | 23,03 | Запустить | ||
32 768 |
1 | 150,57 ₽ | 5,99 | Запустить | ||
32 768 tensor |
4 | 156,24 ₽ | 46,07 | Запустить | ||
32 768 tensor |
4 | 168,21 ₽ | 5,75 | Запустить | ||
32 768 tensor |
2 | 171,77 ₽ | 15,51 | Запустить | ||
32 768 |
1 | 211,77 ₽ | 40,55 | Запустить | ||
32 768 tensor |
4 | 269,04 ₽ | 46,07 | Запустить | ||
32 768 |
1 | 341,77 ₽ | 40,55 | Запустить | ||
32 768 |
1 | 367,41 ₽ | 50,63 | Запустить | ||
32 768 tensor |
2 | 439,97 ₽ | 96,15 | Запустить | ||
32 768 tensor |
2 | 839,97 ₽ | 183,99 | Запустить | ||
32 768 tensor |
4 | 1 717,59 ₽ | 383,03 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.