Qwen3-Next-80B-A3B-Instruct первая модель на базе инновационной архитектуры Qwen3-Next, в рамках которой разработчиками внедрено целый ряд технологических новшеств. В основе модели лежит архитектура с гибридной системой внимания, которая в соотношении 3:1 сочетает два механизма: Gated DeltaNet (75% слоев - линейное внимание) обеспечивает линейную вычислительную сложность и эффективную обработку длинных последовательностей, в то время как Gated Attention (25% слоев - полное внимание) гарантирует высокую точность и способность к информационному поиску. Эта архитектура решает фундаментальную проблему традиционного внимания: линейное внимание быстро, но слабо в задачах поиска, а стандартное внимание дорого и медленно при инференсе. А их гибрид показывает более сильные способности к обучению и пониманию контекста по сравнению с такими методами, как Sliding Window Attention или Mamba2.
Модель также внедряет ультра-разреженную MoE архитектуру с 512 экспертами, из которых активируются только 10 направляемых экспертов плюс 1 общий эксперт — всего лишь 3.7% от общего количества параметров. По сравнению с MoE структурой Qwen3 (128 экспертов, 8 активных). Qwen3-Next внедряет несколько критически важных оптимизаций для обеспечения стабильности обучения и высокой производительности: Zero-Centered RMSNorm вместо традиционной QK-Norm, механизм Attention Output Gating для устранения проблемы Attention Sink и Massive Activation, Multi-Token Prediction (MTP) лучшей связности в контексте, повышения скорости и общей производительности.
Qwen3-Next-80B-A3B-Instruct демонстрирует впечатляющие результаты на ключевых бенчмарках, практически сравнявшись с флагманской моделью Qwen3-235B-A22B-Instruct-2507 при значительно меньших вычислительных затратах. На Arena-Hard v2 модель достигает 82.7 баллов, превосходя многие конкурирующие решения, в программировании модель показывает неплохие результаты на LiveCodeBench v6 с 56.6 баллами, опережая даже некоторые более крупные модели. На математическом бенчмарке AIME25 модель достигает 69.5 баллов, демонстрируя сильные способности к сложным рассуждениям. Благодаря своим уникальным архитектурным особенностям и высокой эффективности, Qwen3-Next-80B-A3B-Instruct идеально подходит для широкого спектра применений: обработка сверхдлинных документов, разработка и программирование, агентские приложения, автоматизации бизнес-процессов, и это далеко не полный список.
| Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
262 144 |
16 | 65536 | 160 | 4 | 85,77 ₽ | Запустить | |
262 144 |
32 | 131072 | 160 | 4 | 112,24 ₽ | Запустить | |
262 144 |
16 | 98304 | 160 | 3 | 119,81 ₽ | Запустить | |
262 144 |
16 | 65535 | 240 | 2 | 198,54 ₽ | Запустить | |
262 144 |
16 | 131072 | 160 | 4 | 209,04 ₽ | Запустить | |
262 144 |
16 | 98304 | 160 | 3 | 218,81 ₽ | Запустить | |
262 144 |
16 | 65536 | 160 | 1 | 230,77 ₽ | Запустить | |
262 144 |
16 | 65536 | 160 | 2 | 261,77 ₽ | Запустить | |
262 144 |
16 | 98304 | 160 | 3 | 288,11 ₽ | Запустить | |
262 144 |
16 | 65536 | 160 | 1 | 456,27 ₽ | Запустить | |
262 144 |
16 | 131072 | 160 | 1 | 623,04 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
262 144 |
24 | 196608 | 160 | 6 | 312,70 ₽ | Запустить | |
262 144 |
32 | 98304 | 160 | 4 | 388,21 ₽ | Запустить | |
262 144 |
24 | 98304 | 160 | 2 | 449,81 ₽ | Запустить | |
262 144 |
16 | 131072 | 160 | 4 | 513,04 ₽ | Запустить | |
262 144 |
44 | 262144 | 160 | 6 | 592,37 ₽ | Запустить | |
262 144 |
16 | 131072 | 160 | 1 | 623,04 ₽ | Запустить | |
262 144 |
24 | 262144 | 160 | 2 | 928,97 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
262 144 |
32 | 393216 | 240 | 3 | 714,66 ₽ | Запустить | |
262 144 |
44 | 262144 | 240 | 8 | 1 031,74 ₽ | Запустить | |
262 144 |
24 | 262144 | 240 | 2 | 1 240,74 ₽ | Запустить | |
262 144 |
32 | 393216 | 240 | 3 | 1 391,16 ₽ | Запустить | |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.