В обновлении 2507 разработчики отказались от гибридного режима, и флагманская модель серии Qwen3-235B-A22B получила 2 высокооптимизированные версии. Qwen3-235B-A22B-Thinking-2507 — это Thinking-версия, она получила удвоенную длину рассуждений и значительно усиленные алгоритмы chain-of-thought. При этом архитектура модели не изменилась это все та же Mixture-of-Experts с 235 миллиардами общих параметров, 128 экспертами, из которых активируются только 22 миллиарда параметров и 8 экспертов на каждый токен, обеспечивая вычислительную эффективность при сохранении знаний гигантской 235-миллиардной системы. В дополнении разработчики реализовали нативную поддержку контекста в 262144 токена открывая новые возможности для анализа объемных документов, кода и проведения многоэтапных рассуждений. Параллельно с основной версией выпущена FP8-квантизованная модель.
Оценивая возможности Qwen3-235B-A22B-Thinking-2507 необходимо отметить, что она демонстрирует феноменальные улучшения производительности на банчмарках, особенно в агентских задачах, где модель показывает рост до 108% на TAU2-Telecom, 93% на TAU2-Airline и 78% на TAU2-Retail в сравнении с предыдущей версией. В математических состязаниях модель достигает 92.3% на AIME25, уступая только OpenAI o4-mini (92.7%), но уже HMMT25 опережает всех демонстрируя результат в 83.9%. В программировании модель устанавливает новые стандарты с результатом 74.1% на LiveCodeBench v6, аналогично и в научных рассуждениях - 81.1% на GPQA (против 79.6% у Claude Opus 4 Thinking).
Qwen3-235B-A22B-Thinking-2507 идеально подходит для решения комплексных задач, требующих глубокого анализа: математические доказательства и олимпиадные задачи, разработка сложных алгоритмов и архитектурных решений, научные исследования и анализ данных, юридический анализ и составление документов и многих других задач где акцент делается не на скорость ответа, а на его точность и логическую согласованность.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 pipeline |
3 | 657,66 ₽ | 2,11 | Запустить | ||
262 144 tensor |
2 | 729,47 ₽ | 1,17 | Запустить | ||
262 144 pipeline |
6 | 791,74 ₽ | 1,03 | Запустить | ||
262 144 tensor |
4 | 816,34 ₽ | 3,59 | Запустить | ||
262 144 tensor |
2 | 840,74 ₽ | 2,97 | Запустить | ||
262 144 tensor |
8 | 1 031,74 ₽ | 2,15 | Запустить | ||
262 144 pipeline |
3 | 1 047,66 ₽ | 2,11 | Запустить | ||
262 144 tensor |
4 | 1 336,34 ₽ | 3,59 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 pipeline |
6 | 1 257,57 ₽ | 3,84 | Запустить | ||
262 144 pipeline |
3 | 1 282,53 ₽ | 2,91 | Запустить | ||
262 144 tensor |
4 | 1 450,00 ₽ | 1,96 | Запустить | ||
262 144 tensor |
8 | 1 637,57 ₽ | 6,80 | Запустить | ||
262 144 tensor |
4 | 1 717,59 ₽ | 5,56 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.