Qwen3-Next-80B-A3B-Instruct первая модель на базе инновационной архитектуры Qwen3-Next, в рамках которой разработчиками внедрено целый ряд технологических новшеств. В основе модели лежит архитектура с гибридной системой внимания, которая в соотношении 3:1 сочетает два механизма: Gated DeltaNet (75% слоев - линейное внимание) обеспечивает линейную вычислительную сложность и эффективную обработку длинных последовательностей, в то время как Gated Attention (25% слоев - полное внимание) гарантирует высокую точность и способность к информационному поиску. Эта архитектура решает фундаментальную проблему традиционного внимания: линейное внимание быстро, но слабо в задачах поиска, а стандартное внимание дорого и медленно при инференсе. А их гибрид показывает более сильные способности к обучению и пониманию контекста по сравнению с такими методами, как Sliding Window Attention или Mamba2.
Модель также внедряет ультра-разреженную MoE архитектуру с 512 экспертами, из которых активируются только 10 направляемых экспертов плюс 1 общий эксперт — всего лишь 3.7% от общего количества параметров. По сравнению с MoE структурой Qwen3 (128 экспертов, 8 активных). Qwen3-Next внедряет несколько критически важных оптимизаций для обеспечения стабильности обучения и высокой производительности: Zero-Centered RMSNorm вместо традиционной QK-Norm, механизм Attention Output Gating для устранения проблемы Attention Sink и Massive Activation, Multi-Token Prediction (MTP) лучшей связности в контексте, повышения скорости и общей производительности.
Qwen3-Next-80B-A3B-Instruct демонстрирует впечатляющие результаты на ключевых бенчмарках, практически сравнявшись с флагманской моделью Qwen3-235B-A22B-Instruct-2507 при значительно меньших вычислительных затратах. На Arena-Hard v2 модель достигает 82.7 баллов, превосходя многие конкурирующие решения, в программировании модель показывает неплохие результаты на LiveCodeBench v6 с 56.6 баллами, опережая даже некоторые более крупные модели. На математическом бенчмарке AIME25 модель достигает 69.5 баллов, демонстрируя сильные способности к сложным рассуждениям. Благодаря своим уникальным архитектурным особенностям и высокой эффективности, Qwen3-Next-80B-A3B-Instruct идеально подходит для широкого спектра применений: обработка сверхдлинных документов, разработка и программирование, агентские приложения, автоматизации бизнес-процессов, и это далеко не полный список.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 |
3 | 119,81 ₽ | 1,69 | Запустить | ||
262 144 |
6 | 147,44 ₽ | 1,45 | Запустить | ||
262 144 |
3 | 204,41 ₽ | 2,02 | Запустить | ||
262 144 |
4 | 209,04 ₽ | 2,78 | Запустить | ||
262 144 |
1 | 211,77 ₽ | 5,16 | Запустить | ||
262 144 |
3 | 252,41 ₽ | 2,00 | Запустить | ||
262 144 |
2 | 261,77 ₽ | 2,22 | Запустить | ||
262 144 |
1 | 341,77 ₽ | 5,15 | Запустить | ||
262 144 |
1 | 367,41 ₽ | 7,27 | Запустить | ||
262 144 |
2 | 411,81 ₽ | 16,82 | Запустить | ||
262 144 |
1 | 423,04 ₽ | 14,39 | Запустить | ||
262 144 |
2 | 839,97 ₽ | 35,29 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 |
8 | 3,25 | Запустить | |||
262 144 |
1 | 368,18 ₽ | 1,36 | Запустить | ||
262 144 |
1 | 423,81 ₽ | 8,48 | Запустить | ||
262 144 |
2 | 440,74 ₽ | 10,92 | Запустить | ||
262 144 |
2 | 441,52 ₽ | 10,92 | Запустить | ||
262 144 |
4 | 514,59 ₽ | 2,52 | Запустить | ||
262 144 |
6 | 521,74 ₽ | 2,20 | Запустить | ||
262 144 |
2 | 700,74 ₽ | 10,89 | Запустить | ||
262 144 |
2 | 840,74 ₽ | 29,38 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 |
3 | 658,44 ₽ | 6,60 | Запустить | ||
262 144 |
2 | 731,81 ₽ | 2,45 | Запустить | ||
262 144 |
2 | 841,52 ₽ | 16,69 | Запустить | ||
262 144 |
2 | 841,52 ₽ | 16,69 | Запустить | ||
262 144 |
4 | 848,44 ₽ | 10,78 | Запустить | ||
262 144 |
8 | 1 034,08 ₽ | 2,45 | Запустить | ||
262 144 |
3 | 1 048,44 ₽ | 6,58 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.