Qwen3-Next-80B-A3B-Instruct первая модель на базе инновационной архитектуры Qwen3-Next, в рамках которой разработчиками внедрено целый ряд технологических новшеств. В основе модели лежит архитектура с гибридной системой внимания, которая в соотношении 3:1 сочетает два механизма: Gated DeltaNet (75% слоев - линейное внимание) обеспечивает линейную вычислительную сложность и эффективную обработку длинных последовательностей, в то время как Gated Attention (25% слоев - полное внимание) гарантирует высокую точность и способность к информационному поиску. Эта архитектура решает фундаментальную проблему традиционного внимания: линейное внимание быстро, но слабо в задачах поиска, а стандартное внимание дорого и медленно при инференсе. А их гибрид показывает более сильные способности к обучению и пониманию контекста по сравнению с такими методами, как Sliding Window Attention или Mamba2.
Модель также внедряет ультра-разреженную MoE архитектуру с 512 экспертами, из которых активируются только 10 направляемых экспертов плюс 1 общий эксперт — всего лишь 3.7% от общего количества параметров. По сравнению с MoE структурой Qwen3 (128 экспертов, 8 активных). Qwen3-Next внедряет несколько критически важных оптимизаций для обеспечения стабильности обучения и высокой производительности: Zero-Centered RMSNorm вместо традиционной QK-Norm, механизм Attention Output Gating для устранения проблемы Attention Sink и Massive Activation, Multi-Token Prediction (MTP) лучшей связности в контексте, повышения скорости и общей производительности.
Qwen3-Next-80B-A3B-Instruct демонстрирует впечатляющие результаты на ключевых бенчмарках, практически сравнявшись с флагманской моделью Qwen3-235B-A22B-Instruct-2507 при значительно меньших вычислительных затратах. На Arena-Hard v2 модель достигает 82.7 баллов, превосходя многие конкурирующие решения, в программировании модель показывает неплохие результаты на LiveCodeBench v6 с 56.6 баллами, опережая даже некоторые более крупные модели. На математическом бенчмарке AIME25 модель достигает 69.5 баллов, демонстрируя сильные способности к сложным рассуждениям. Благодаря своим уникальным архитектурным особенностям и высокой эффективности, Qwen3-Next-80B-A3B-Instruct идеально подходит для широкого спектра применений: обработка сверхдлинных документов, разработка и программирование, агентские приложения, автоматизации бизнес-процессов, и это далеко не полный список.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 |
6 | 150,55 ₽ | 4,84 | Запустить | ||
262 144 |
4 | 156,24 ₽ | 5,67 | Запустить | ||
262 144 |
4 | 209,04 ₽ | 5,67 | Запустить | ||
262 144 |
1 | 211,77 ₽ | 4,52 | Запустить | ||
262 144 |
3 | 252,41 ₽ | 2,50 | Запустить | ||
262 144 |
2 | 261,77 ₽ | 1,72 | Запустить | ||
262 144 |
4 | 269,04 ₽ | 5,67 | Запустить | ||
262 144 |
1 | 341,77 ₽ | 4,52 | Запустить | ||
262 144 |
1 | 367,41 ₽ | 6,61 | Запустить | ||
262 144 |
2 | 439,97 ₽ | 16,04 | Запустить | ||
262 144 |
2 | 839,97 ₽ | 34,23 | Запустить | ||
262 144 |
4 | 1 717,59 ₽ | 75,46 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 |
2 | 440,74 ₽ | 9,69 | Запустить | ||
262 144 |
2 | 441,52 ₽ | 9,69 | Запустить | ||
262 144 |
4 | 514,59 ₽ | 4,09 | Запустить | ||
262 144 |
6 | 521,74 ₽ | 5,65 | Запустить | ||
262 144 |
2 | 700,74 ₽ | 9,69 | Запустить | ||
262 144 |
2 | 840,74 ₽ | 27,89 | Запустить | ||
262 144 |
3 | 1 110,26 ₽ | 27,47 | Запустить | ||
262 144 |
4 | 1 717,59 ₽ | 69,11 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 |
3 | 658,44 ₽ | 7,59 | Запустить | ||
262 144 |
2 | 841,52 ₽ | 14,27 | Запустить | ||
262 144 |
8 | 1 034,08 ₽ | 7,91 | Запустить | ||
262 144 |
3 | 1 048,44 ₽ | 7,59 | Запустить | ||
262 144 |
3 | 1 110,26 ₽ | 13,86 | Запустить | ||
262 144 |
6 | 1 257,57 ₽ | 42,14 | Запустить | ||
262 144 |
4 | 1 717,59 ₽ | 55,50 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.