Qwen3-4B – следующий уровень в серии. Модель построена на более глубокой архитектуре из 4 млрд параметров, 36 слоев с удвоенным количеством голов внимания (32/8), что обеспечивает существенное улучшение качества понимания и генерации во всех поддерживаемых доменах.
Модель демонстрирует значительные улучшения в задачах, требующих сложных, пошаговых рассуждения, а интегрированные режимы мышления позволяют адаптировать глубину анализа в зависимости от сложности запроса. Поддержка 119 языков в сочетании с отличным извлечением смыслов делают ее особенно эффективной для многоязычного анализа документов и кросс-лингвистических задач.
Qwen3-4B идеально подходит для профессиональных приложений, требующих анализа документов: юридический анализ, научные исследования, техническая документация, литературный анализ. Модель превосходно справляется с задачами суммаризации, многоязычного перевода и систематизацией академического материала в образовательных проектах.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
40 960 |
1 | 29,33 ₽ | 1,35 | Запустить | ||
40 960 |
1 | 33,74 ₽ | 1,36 | Запустить | ||
40 960 |
1 | 46,94 ₽ | 2,65 | Запустить | ||
40 960 tensor |
2 | 61,37 ₽ | 1,98 | Запустить | ||
40 960 |
1 | 73,73 ₽ | 2,82 | Запустить | ||
40 960 tensor |
2 | 86,54 ₽ | 1,67 | Запустить | ||
40 960 |
1 | 91,14 ₽ | 2,81 | Запустить | ||
40 960 tensor |
2 | 109,77 ₽ | 5,88 | Запустить | ||
40 960 |
1 | 141,77 ₽ | 4,09 | Запустить | ||
40 960 |
1 | 211,77 ₽ | 11,93 | Запустить | ||
40 960 |
1 | 341,77 ₽ | 159,50 | 11,92 | Запустить | |
40 960 |
1 | 367,41 ₽ | 14,19 | Запустить | ||
40 960 tensor |
2 | 411,81 ₽ | 24,45 | Запустить | ||
40 960 |
1 | 423,04 ₽ | 21,83 | Запустить | ||
40 960 tensor |
2 | 839,97 ₽ | 44,25 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
40 960 |
1 | 29,33 ₽ | 1,08 | Запустить | ||
40 960 |
1 | 33,74 ₽ | 1,08 | Запустить | ||
40 960 |
1 | 46,94 ₽ | 2,38 | Запустить | ||
40 960 tensor |
2 | 61,37 ₽ | 1,71 | Запустить | ||
40 960 |
1 | 73,73 ₽ | 2,55 | Запустить | ||
40 960 tensor |
2 | 86,54 ₽ | 1,40 | Запустить | ||
40 960 |
1 | 91,14 ₽ | 2,54 | Запустить | ||
40 960 tensor |
2 | 109,77 ₽ | 5,61 | Запустить | ||
40 960 |
1 | 141,77 ₽ | 3,82 | Запустить | ||
40 960 |
1 | 211,77 ₽ | 11,66 | Запустить | ||
40 960 |
1 | 341,77 ₽ | 11,65 | Запустить | ||
40 960 |
1 | 367,41 ₽ | 13,92 | Запустить | ||
40 960 tensor |
2 | 411,81 ₽ | 24,18 | Запустить | ||
40 960 |
1 | 423,04 ₽ | 21,56 | Запустить | ||
40 960 tensor |
2 | 839,97 ₽ | 43,98 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
40 960 |
1 | 46,94 ₽ | 1,90 | Запустить | ||
40 960 tensor |
2 | 48,14 ₽ | 2,54 | Запустить | ||
40 960 tensor |
2 | 51,34 ₽ | 2,55 | Запустить | ||
40 960 tensor |
2 | 61,37 ₽ | 1,23 | Запустить | ||
40 960 |
1 | 73,73 ₽ | 2,08 | Запустить | ||
40 960 |
1 | 91,14 ₽ | 2,07 | Запустить | ||
40 960 tensor |
2 | 109,77 ₽ | 5,14 | Запустить | ||
40 960 pipeline |
3 | 127,37 ₽ | 2,05 | Запустить | ||
40 960 |
1 | 141,77 ₽ | 3,35 | Запустить | ||
40 960 tensor |
4 | 162,57 ₽ | 3,18 | Запустить | ||
40 960 |
1 | 211,77 ₽ | 11,19 | Запустить | ||
40 960 |
1 | 341,77 ₽ | 11,17 | Запустить | ||
40 960 |
1 | 367,41 ₽ | 13,45 | Запустить | ||
40 960 tensor |
2 | 411,81 ₽ | 23,70 | Запустить | ||
40 960 |
1 | 423,04 ₽ | 21,09 | Запустить | ||
40 960 tensor |
2 | 839,97 ₽ | 43,51 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.