Qwen2.5-32B содержит 32 млрд параметров, 64 слоя и архитектуру 40/8 голов внимания, представляя значительный скачок в вычислительной мощности и способностях модели. С поддержкой контекстного окна в 128K токенов и генерацией до 8K токенов, модель способна обрабатывать исключительно сложные и объемные задачи.
Qwen2.5-32B возвращает размерность весов в 32 млрд в линейку Qwen после отсутствия в серии Qwen2, предоставляя пользователям мощную альтернативу флагманской 72B модели с меньшими требованиями к ресурсам. Благодаря обучению на 18 триллионах токенов высококачественных данных модель демонстрирует уверенную работу с большими массивами информации, экспертный уровень знаний в специализированных доменах, превосходные способности к абстрактному мышлению и умение решать задачи, требующие глубокого понимания контекста и многоступенчатого анализа.
Qwen2.5-32B предназначена для организаций и исследовательских групп, которым нужны возможности уровня frontier-моделей без полных затрат на самые крупные модели. Идеальные форматы применения включают научные исследования, разработку сложного программного обеспечения, создание высококачественного контента, системы экспертной поддержки в медицине и праве, а также как основа для создания высокоспециализированных ИИ-систем.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 pipeline |
3 | 78,57 ₽ | 2,06 | Запустить | ||
32 768 tensor |
2 | 83,37 ₽ | 2,37 | Запустить | ||
32 768 tensor |
4 | 85,77 ₽ | 3,55 | Запустить | ||
32 768 pipeline |
3 | 94,64 ₽ | 2,06 | Запустить | ||
32 768 tensor |
4 | 99,74 ₽ | 1,30 | Запустить | ||
32 768 tensor |
2 | 109,77 ₽ | 2,37 | Запустить | ||
32 768 tensor |
4 | 112,24 ₽ | 3,55 | Запустить | ||
32 768 tensor |
2 | 139,77 ₽ | 2,37 | Запустить | ||
32 768 tensor |
2 | 171,77 ₽ | 2,37 | Запустить | ||
32 768 tensor |
2 | 198,54 ₽ | 4,17 | Запустить | ||
32 768 |
1 | 211,77 ₽ | 6,29 | Запустить | ||
32 768 tensor |
2 | 261,77 ₽ | 4,17 | Запустить | ||
32 768 |
1 | 341,77 ₽ | 6,29 | Запустить | ||
32 768 |
1 | 367,41 ₽ | 7,86 | Запустить | ||
32 768 |
1 | 423,04 ₽ | 13,15 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 tensor |
2 | 83,37 ₽ | 1,05 | Запустить | ||
32 768 tensor |
4 | 85,77 ₽ | 2,22 | Запустить | ||
32 768 tensor |
2 | 109,77 ₽ | 1,05 | Запустить | ||
32 768 tensor |
4 | 112,24 ₽ | 2,22 | Запустить | ||
32 768 tensor |
2 | 139,77 ₽ | 1,05 | Запустить | ||
32 768 tensor |
2 | 171,77 ₽ | 1,05 | Запустить | ||
32 768 tensor |
2 | 198,54 ₽ | 2,85 | Запустить | ||
32 768 |
1 | 211,77 ₽ | 4,96 | Запустить | ||
32 768 tensor |
2 | 261,77 ₽ | 2,85 | Запустить | ||
32 768 |
1 | 341,77 ₽ | 4,96 | Запустить | ||
32 768 |
1 | 367,41 ₽ | 6,54 | Запустить | ||
32 768 |
1 | 423,04 ₽ | 11,82 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 tensor |
4 | 156,24 ₽ | 1,36 | Запустить | ||
32 768 tensor |
4 | 209,04 ₽ | 1,36 | Запустить | ||
32 768 tensor |
4 | 264,96 ₽ | 1,36 | Запустить | ||
32 768 tensor |
4 | 328,96 ₽ | 1,36 | Запустить | ||
32 768 pipeline |
3 | 347,52 ₽ | 1,67 | Запустить | ||
32 768 |
1 | 367,41 ₽ | 2,07 | Запустить | ||
32 768 pipeline |
3 | 387,41 ₽ | 1,67 | Запустить | ||
32 768 tensor |
4 | 388,21 ₽ | 4,96 | Запустить | ||
32 768 tensor |
2 | 411,81 ₽ | 9,18 | Запустить | ||
32 768 |
1 | 423,04 ₽ | 7,36 | Запустить | ||
32 768 tensor |
4 | 513,04 ₽ | 4,96 | Запустить | ||
32 768 tensor |
2 | 699,97 ₽ | 9,18 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.