Qwen3-14B – модель с 14 млрд параметров с более глубокой архитектурой из 40 слоев и увеличенным количеством голов внимания до 40/8. Модель поддерживает контекстное окно в 128K токенов и не использует tie embeddings, что обеспечивает максимальную гибкость и вариативность ответов.
Модель демонстрирует исключительные результаты в задачах, требующих экспертного уровня знаний и сложного анализа. Поддержка 119 языков в сочетании с продвинутыми гибридными возможностями рассуждения делает ее идеальной для международных проектов высокой сложности.
Qwen3-14B предназначена для enterprise-решений и исследовательских проектов: автоматизация сложных бизнес-процессов, научные исследования, разработка AI-продуктов, создание специализированных экспертных систем. Модель идеально подходит для компаний, требующих высококачественного AI-ассистента для стратегического планирования, технического консалтинга и разработки инновационных продуктов.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
40 960 |
1 | 46,94 ₽ | 29,49 | 1,46 | Запустить | |
40 960 tensor |
2 | 48,14 ₽ | 2,21 | Запустить | ||
40 960 tensor |
2 | 51,34 ₽ | 8,95 | 2,21 | Запустить | |
40 960 |
1 | 73,73 ₽ | 38,23 | 1,46 | Запустить | |
40 960 pipeline |
3 | 74,84 ₽ | 1,96 | Запустить | ||
40 960 |
1 | 91,14 ₽ | 62,04 | 1,46 | Запустить | |
40 960 tensor |
4 | 99,74 ₽ | 3,14 | Запустить | ||
40 960 |
1 | 107,57 ₽ | 2,61 | Запустить | ||
40 960 tensor |
2 | 109,77 ₽ | 4,52 | Запустить | ||
40 960 pipeline |
3 | 127,37 ₽ | 1,52 | Запустить | ||
40 960 |
1 | 141,77 ₽ | 71,68 | 2,61 | Запустить | |
40 960 tensor |
4 | 162,57 ₽ | 2,56 | Запустить | ||
40 960 |
1 | 211,77 ₽ | 52,52 | 9,52 | Запустить | |
40 960 |
1 | 341,77 ₽ | 64,21 | 9,52 | Запустить | |
40 960 |
1 | 367,41 ₽ | 79,95 | 11,54 | Запустить | |
40 960 |
1 | 423,04 ₽ | 18,31 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
40 960 tensor |
2 | 48,14 ₽ | 1,20 | Запустить | ||
40 960 tensor |
2 | 51,34 ₽ | 1,20 | Запустить | ||
40 960 tensor |
2 | 83,37 ₽ | 3,50 | Запустить | ||
40 960 tensor |
4 | 99,74 ₽ | 2,12 | Запустить | ||
40 960 |
1 | 107,57 ₽ | 1,60 | Запустить | ||
40 960 tensor |
2 | 109,77 ₽ | 3,50 | Запустить | ||
40 960 tensor |
2 | 139,77 ₽ | 3,50 | Запустить | ||
40 960 |
1 | 141,77 ₽ | 1,60 | Запустить | ||
40 960 tensor |
4 | 162,57 ₽ | 1,55 | Запустить | ||
40 960 tensor |
2 | 171,77 ₽ | 3,50 | Запустить | ||
40 960 |
1 | 211,77 ₽ | 8,51 | Запустить | ||
40 960 |
1 | 341,77 ₽ | 8,51 | Запустить | ||
40 960 |
1 | 367,41 ₽ | 10,52 | Запустить | ||
40 960 |
1 | 423,04 ₽ | 17,29 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
40 960 pipeline |
3 | 78,57 ₽ | 0,99 | Запустить | ||
40 960 tensor |
2 | 83,37 ₽ | 1,39 | Запустить | ||
40 960 tensor |
4 | 85,77 ₽ | 2,89 | Запустить | ||
40 960 pipeline |
3 | 94,64 ₽ | 0,99 | Запустить | ||
40 960 tensor |
2 | 109,77 ₽ | 1,39 | Запустить | ||
40 960 tensor |
4 | 112,24 ₽ | 2,89 | Запустить | ||
40 960 tensor |
2 | 139,77 ₽ | 1,39 | Запустить | ||
40 960 tensor |
2 | 171,77 ₽ | 1,39 | Запустить | ||
40 960 tensor |
2 | 198,54 ₽ | 3,69 | Запустить | ||
40 960 |
1 | 211,77 ₽ | 6,40 | Запустить | ||
40 960 tensor |
2 | 261,77 ₽ | 3,69 | Запустить | ||
40 960 |
1 | 341,77 ₽ | 6,40 | Запустить | ||
40 960 |
1 | 367,41 ₽ | 8,41 | Запустить | ||
40 960 |
1 | 423,04 ₽ | 15,18 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.