Qwen2.5-32B содержит 32 млрд параметров, 64 слоя и архитектуру 40/8 голов внимания, представляя значительный скачок в вычислительной мощности и способностях модели. С поддержкой контекстного окна в 128K токенов и генерацией до 8K токенов, модель способна обрабатывать исключительно сложные и объемные задачи.
Qwen2.5-32B возвращает размерность весов в 32 млрд в линейку Qwen после отсутствия в серии Qwen2, предоставляя пользователям мощную альтернативу флагманской 72B модели с меньшими требованиями к ресурсам. Благодаря обучению на 18 триллионах токенов высококачественных данных модель демонстрирует уверенную работу с большими массивами информации, экспертный уровень знаний в специализированных доменах, превосходные способности к абстрактному мышлению и умение решать задачи, требующие глубокого понимания контекста и многоступенчатого анализа.
Qwen2.5-32B предназначена для организаций и исследовательских групп, которым нужны возможности уровня frontier-моделей без полных затрат на самые крупные модели. Идеальные форматы применения включают научные исследования, разработку сложного программного обеспечения, создание высококачественного контента, системы экспертной поддержки в медицине и праве, а также как основа для создания высокоспециализированных ИИ-систем.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 pipeline |
3 | 78,95 ₽ | 2,06 | Запустить | ||
32 768 tensor |
4 | 99,74 ₽ | 1,30 | Запустить | ||
32 768 tensor |
2 | 109,77 ₽ | 2,37 | Запустить | ||
32 768 tensor |
4 | 115,35 ₽ | 3,55 | Запустить | ||
32 768 pipeline |
3 | 117,17 ₽ | 2,06 | Запустить | ||
32 768 tensor |
4 | 127,45 ₽ | 3,55 | Запустить | ||
32 768 tensor |
4 | 156,24 ₽ | 7,15 | Запустить | ||
32 768 tensor |
2 | 171,77 ₽ | 2,37 | Запустить | ||
32 768 |
1 | 211,77 ₽ | 6,29 | Запустить | ||
32 768 tensor |
2 | 261,77 ₽ | 4,17 | Запустить | ||
32 768 tensor |
4 | 269,04 ₽ | 7,15 | Запустить | ||
32 768 |
1 | 341,77 ₽ | 6,29 | Запустить | ||
32 768 |
1 | 367,41 ₽ | 7,86 | Запустить | ||
32 768 tensor |
2 | 439,97 ₽ | 14,97 | Запустить | ||
32 768 tensor |
2 | 839,97 ₽ | 28,70 | Запустить | ||
32 768 tensor |
4 | 1 717,59 ₽ | 59,80 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 tensor |
2 | 109,77 ₽ | 1,05 | Запустить | ||
32 768 tensor |
4 | 115,35 ₽ | 2,22 | Запустить | ||
32 768 tensor |
4 | 127,45 ₽ | 2,22 | Запустить | ||
32 768 tensor |
4 | 156,24 ₽ | 5,82 | Запустить | ||
32 768 tensor |
2 | 171,77 ₽ | 1,05 | Запустить | ||
32 768 |
1 | 211,77 ₽ | 4,96 | Запустить | ||
32 768 tensor |
2 | 261,77 ₽ | 2,85 | Запустить | ||
32 768 tensor |
4 | 269,04 ₽ | 5,82 | Запустить | ||
32 768 |
1 | 341,77 ₽ | 4,96 | Запустить | ||
32 768 |
1 | 367,41 ₽ | 6,54 | Запустить | ||
32 768 tensor |
2 | 439,97 ₽ | 13,65 | Запустить | ||
32 768 tensor |
2 | 839,97 ₽ | 27,37 | Запустить | ||
32 768 tensor |
4 | 1 717,59 ₽ | 58,47 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 tensor |
4 | 157,01 ₽ | 1,36 | Запустить | ||
32 768 tensor |
4 | 264,96 ₽ | 1,36 | Запустить | ||
32 768 tensor |
4 | 328,96 ₽ | 1,36 | Запустить | ||
32 768 |
1 | 368,18 ₽ | 2,07 | Запустить | ||
32 768 pipeline |
3 | 388,18 ₽ | 1,67 | Запустить | ||
32 768 tensor |
2 | 440,74 ₽ | 9,18 | Запустить | ||
32 768 tensor |
2 | 441,52 ₽ | 9,18 | Запустить | ||
32 768 tensor |
4 | 514,59 ₽ | 4,96 | Запустить | ||
32 768 tensor |
2 | 700,74 ₽ | 9,18 | Запустить | ||
32 768 tensor |
2 | 840,74 ₽ | 22,91 | Запустить | ||
32 768 tensor |
4 | 1 717,59 ₽ | 54,01 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.