В обновлении 2507 разработчики отказались от гибридного режима, и флагманская модель серии Qwen3-235B-A22B получила 2 высокооптимизированные версии. Qwen3-235B-A22B-Thinking-2507 — это Thinking-версия, она получила удвоенную длину рассуждений и значительно усиленные алгоритмы chain-of-thought. При этом архитектура модели не изменилась это все та же Mixture-of-Experts с 235 миллиардами общих параметров, 128 экспертами, из которых активируются только 22 миллиарда параметров и 8 экспертов на каждый токен, обеспечивая вычислительную эффективность при сохранении знаний гигантской 235-миллиардной системы. В дополнении разработчики реализовали нативную поддержку контекста в 262144 токена открывая новые возможности для анализа объемных документов, кода и проведения многоэтапных рассуждений. Параллельно с основной версией выпущена FP8-квантизованная модель.
Оценивая возможности Qwen3-235B-A22B-Thinking-2507 необходимо отметить, что она демонстрирует феноменальные улучшения производительности на банчмарках, особенно в агентских задачах, где модель показывает рост до 108% на TAU2-Telecom, 93% на TAU2-Airline и 78% на TAU2-Retail в сравнении с предыдущей версией. В математических состязаниях модель достигает 92.3% на AIME25, уступая только OpenAI o4-mini (92.7%), но уже HMMT25 опережает всех демонстрируя результат в 83.9%. В программировании модель устанавливает новые стандарты с результатом 74.1% на LiveCodeBench v6, аналогично и в научных рассуждениях - 81.1% на GPQA (против 79.6% у Claude Opus 4 Thinking).
Qwen3-235B-A22B-Thinking-2507 идеально подходит для решения комплексных задач, требующих глубокого анализа: математические доказательства и олимпиадные задачи, разработка сложных алгоритмов и архитектурных решений, научные исследования и анализ данных, юридический анализ и составление документов и многих других задач где акцент делается не на скорость ответа, а на его точность и логическую согласованность.
| Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
262 144 pipeline |
32 | 393216 | 240 | 3 | 657,66 ₽ | Запустить | |
262 144 pipeline |
44 | 262144 | 240 | 6 | 791,74 ₽ | Запустить | |
262 144 tensor |
16 | 262144 | 240 | 4 | 816,34 ₽ | Запустить | |
262 144 tensor |
24 | 262144 | 240 | 2 | 840,74 ₽ | Запустить | |
262 144 tensor |
44 | 262144 | 240 | 8 | 1 031,74 ₽ | Запустить | |
262 144 pipeline |
32 | 393216 | 240 | 3 | 1 047,66 ₽ | Запустить | |
262 144 tensor |
16 | 262144 | 240 | 4 | 1 336,34 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
262 144 pipeline |
44 | 524288 | 320 | 6 | 1 257,57 ₽ | Запустить | |
262 144 pipeline |
32 | 524288 | 480 | 3 | 1 282,53 ₽ | Запустить | |
262 144 tensor |
44 | 524288 | 320 | 8 | 1 637,57 ₽ | Запустить | |
262 144 tensor |
32 | 786432 | 480 | 4 | 1 717,59 ₽ | Запустить | |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.