Qwen3-4B-Instruct-2507 представляет собой революционную модель, построенную на инновационной архитектуре с 4,02 миллиардами параметров (с учёт embeddings), 36 скрытыми слоями трансформера, использует Group Query Attention (GQA) с 32 головами внимания для запросов и 8 для ключей и значений, что обеспечивает оптимальный баланс между производительностью и эффективным использованием памяти. Модель оптимизирована на базе гибридной Qwen3-4B для работы только в режиме non-thinking mode, полностью исключая генерацию <think></think> блоков, что максимизирует скорость обработки запросов. Нативная поддержка контекста длиной 262,144 токена позволяет эффективно работать с объёмными документами, длинными диалогами и сложными многоэтапными задачами без потери качества обработки информации. Архитектурные инновации включают продвинутую систему ориентирования на пользовательские предпочтения, что обеспечивает более релевантные и полезные ответы, а также модель получила значительные улучшения в части обработки многоязычного контента.
Модель демонстрирует выдающиеся результаты на ключевых бенчмарках, превосходя проприетарный аналог GPT-4.1-nano по всем основным метрикам: MMLU-Pro (69.6 vs 62.8), GPQA (62.0 vs 50.3), и особенно впечатляюще результаты на ZebraLogic (80.2 vs 14.8) и в генерации творческого/креативного контента достигает 83.5 (против 72.7). Особую ценность модель представляет в задачах связанных точным выполнением инструкций, где она достигает 83.4% на IFEval и 43.4 балла на Arena-Hard v2. Модель также превосходно справляется с агентными задачами и использованием инструментов, показывая высокие результаты на бенчмарках BFCL-v3 (61.9) и TAU-серии, что делает её идеальной для интеграции в автоматизированные системы.
Модель Qwen3-4B-Instruct-2507 отлично подходит для автоматизации бизнес‑процессов, включая обслуживание клиентов через интеллектуальных чат‑ботов, обработку и анализ документов, генерацию отчётов и персонализированные рекомендации. Она эффективна в создании и локализации SEO‑оптимизированного маркетингового контента, описаний товаров, постов для социальных сетей и т.д. Благодаря лёгкой интеграции через API модель можно применять для автоматизации в CRM и ERP системами, а также для любых задач, требующих интеллектуальной маршрутизации и быстрой обработки запросов в реальном времени.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
80 000 |
1 | 46,94 ₽ | 1,42 | Запустить | ||
80 000 tensor |
2 | 48,14 ₽ | 1,84 | Запустить | ||
80 000 tensor |
2 | 51,34 ₽ | 1,84 | Запустить | ||
80 000 tensor |
2 | 61,37 ₽ | 1,02 | Запустить | ||
80 000 |
1 | 73,73 ₽ | 1,42 | Запустить | ||
262 144 tensor |
4 | 85,77 ₽ | 1,22 | Запустить | ||
80 000 |
1 | 91,14 ₽ | 1,42 | Запустить | ||
80 000 |
1 | 107,57 ₽ | 2,07 | Запустить | ||
80 000 tensor |
2 | 109,77 ₽ | 3,15 | Запустить | ||
262 144 tensor |
4 | 112,24 ₽ | 1,22 | Запустить | ||
262 144 pipeline |
3 | 119,81 ₽ | 1,49 | Запустить | ||
80 000 pipeline |
3 | 127,37 ₽ | 1,45 | Запустить | ||
262 144 tensor |
4 | 139,96 ₽ | 2,02 | Запустить | ||
80 000 |
1 | 141,77 ₽ | 2,07 | Запустить | ||
80 000 tensor |
4 | 162,57 ₽ | 2,04 | Запустить | ||
262 144 tensor |
2 | 198,54 ₽ | 1,36 | Запустить | ||
262 144 pipeline |
3 | 204,41 ₽ | 53,29 | 1,49 | Запустить | |
262 144 tensor |
4 | 209,04 ₽ | 2,02 | Запустить | ||
262 144 |
1 | 211,77 ₽ | 93,92 | 1,83 | Запустить | |
262 144 pipeline |
3 | 252,41 ₽ | 81,53 | 1,49 | Запустить | |
262 144 tensor |
4 | 257,77 ₽ | 2,02 | Запустить | ||
262 144 tensor |
2 | 261,77 ₽ | 140,62 | 1,36 | Запустить | |
262 144 tensor |
4 | 321,77 ₽ | 2,02 | Запустить | ||
262 144 |
1 | 341,77 ₽ | 107,33 | 1,83 | Запустить | |
262 144 |
1 | 367,41 ₽ | 2,18 | Запустить | ||
262 144 |
1 | 423,04 ₽ | 3,36 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
80 000 |
1 | 46,94 ₽ | 1,27 | Запустить | ||
80 000 tensor |
2 | 48,14 ₽ | 1,69 | Запустить | ||
80 000 tensor |
2 | 51,34 ₽ | 1,69 | Запустить | ||
80 000 |
1 | 73,73 ₽ | 1,27 | Запустить | ||
80 000 pipeline |
3 | 74,84 ₽ | 1,55 | Запустить | ||
262 144 tensor |
4 | 85,77 ₽ | 1,18 | Запустить | ||
80 000 |
1 | 91,14 ₽ | 1,27 | Запустить | ||
80 000 tensor |
4 | 99,74 ₽ | 2,22 | Запустить | ||
80 000 |
1 | 107,57 ₽ | 1,92 | Запустить | ||
80 000 tensor |
2 | 109,77 ₽ | 3,00 | Запустить | ||
262 144 tensor |
4 | 112,24 ₽ | 1,18 | Запустить | ||
262 144 pipeline |
3 | 119,81 ₽ | 56,23 | 1,45 | Запустить | |
80 000 pipeline |
3 | 127,37 ₽ | 1,30 | Запустить | ||
262 144 tensor |
4 | 139,96 ₽ | 1,98 | Запустить | ||
80 000 |
1 | 141,77 ₽ | 1,92 | Запустить | ||
80 000 tensor |
4 | 162,57 ₽ | 1,89 | Запустить | ||
262 144 tensor |
2 | 198,54 ₽ | 1,32 | Запустить | ||
262 144 pipeline |
3 | 204,41 ₽ | 102,57 | 1,45 | Запустить | |
262 144 tensor |
4 | 209,04 ₽ | 1,98 | Запустить | ||
262 144 |
1 | 211,77 ₽ | 131,35 | 1,79 | Запустить | |
262 144 pipeline |
3 | 252,41 ₽ | 66,13 | 1,45 | Запустить | |
262 144 tensor |
4 | 257,77 ₽ | 1,98 | Запустить | ||
262 144 tensor |
2 | 261,77 ₽ | 1,32 | Запустить | ||
262 144 tensor |
4 | 321,77 ₽ | 1,98 | Запустить | ||
262 144 |
1 | 341,77 ₽ | 136,71 | 1,79 | Запустить | |
262 144 |
1 | 367,41 ₽ | 2,14 | Запустить | ||
262 144 |
1 | 423,04 ₽ | 3,31 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
80 000 |
1 | 46,94 ₽ | 1,01 | Запустить | ||
80 000 tensor |
2 | 48,14 ₽ | 1,43 | Запустить | ||
80 000 tensor |
2 | 51,34 ₽ | 1,43 | Запустить | ||
80 000 |
1 | 73,73 ₽ | 1,01 | Запустить | ||
80 000 pipeline |
3 | 74,84 ₽ | 1,29 | Запустить | ||
262 144 tensor |
4 | 85,77 ₽ | 1,10 | Запустить | ||
80 000 |
1 | 91,14 ₽ | 1,01 | Запустить | ||
80 000 tensor |
4 | 99,74 ₽ | 1,96 | Запустить | ||
80 000 |
1 | 107,57 ₽ | 1,66 | Запустить | ||
80 000 tensor |
2 | 109,77 ₽ | 2,74 | Запустить | ||
262 144 tensor |
4 | 112,24 ₽ | 1,10 | Запустить | ||
262 144 pipeline |
3 | 119,81 ₽ | 46,80 | 1,37 | Запустить | |
80 000 pipeline |
3 | 127,37 ₽ | 1,04 | Запустить | ||
262 144 tensor |
4 | 139,96 ₽ | 1,90 | Запустить | ||
80 000 |
1 | 141,77 ₽ | 1,66 | Запустить | ||
80 000 tensor |
4 | 162,57 ₽ | 1,63 | Запустить | ||
262 144 tensor |
2 | 198,54 ₽ | 1,24 | Запустить | ||
262 144 pipeline |
3 | 204,41 ₽ | 68,87 | 1,37 | Запустить | |
262 144 tensor |
4 | 209,04 ₽ | 1,90 | Запустить | ||
262 144 |
1 | 211,77 ₽ | 102,86 | 1,71 | Запустить | |
262 144 pipeline |
3 | 252,41 ₽ | 79,88 | 1,37 | Запустить | |
262 144 tensor |
4 | 257,77 ₽ | 1,90 | Запустить | ||
262 144 tensor |
2 | 261,77 ₽ | 1,24 | Запустить | ||
262 144 tensor |
4 | 321,77 ₽ | 1,90 | Запустить | ||
262 144 |
1 | 341,77 ₽ | 118,70 | 1,71 | Запустить | |
262 144 |
1 | 367,41 ₽ | 2,06 | Запустить | ||
262 144 |
1 | 423,04 ₽ | 3,23 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.