Qwen3-Coder-480B-A35B-Instruct

русскоязычная

Qwen3-Coder реализует качественно новый подход к автоматизированной разработке программного обеспечения. Эта инновационная модель от команды Alibaba Qwen использует передовую архитектуру Mixture-of-Experts с 480 миллиардами параметров, из которых активно задействуется лишь 35 миллиардов, обеспечивая оптимальный баланс между производительностью и вычислительной эффективностью. Уникальные возможности модели в области агентного программирования делают её настоящим прорывом в индустрии. Qwen3-Coder способна не просто генерировать код, но и автономно планировать, использовать инструменты, получать обратную связь и принимать решения в рамках сложных многоэтапных рабочих процессов разработки. Модель обучалась на корпусе 7,5 триллионов токенов с 70% кода и прошла специальную постобработку с использованием обучения с подкреплением в 20,000 параллельных средах, что позволило ей освоить реальные сценарии разработки программного обеспечения. Особенно впечатляющим является нативная поддержка контекста до 256K токенов с возможностью расширения до 1 миллиона, что позволяет модели обрабатывать целые репозитории кода и комплексные проекты в едином контексте.

Превосходство Qwen3-Coder над конкурентами подтверждается выдающимися результатами на ключевых бенчмарках. На SWE-Bench Verified модель достигает state-of-the-art результатов среди open-source решений, опережая DeepSeek V3 (78%) и Kimi K2 (82%) с результатом, сопоставимым с Claude Sonnet 4 (86%). При этом модель также лидирует на CodeForces ELO и LiveCodeBench v5, устанавливая новые стандарты для открытых решений в области программирования.

Сценарии применения Qwen3-Coder охватывают весь спектр современной разработки — от создания интерактивных веб-приложений до модернизации legacy-систем. Модель превосходно справляется с агентными рабочими процессами разработки, включая автономную разработку функций, охватывающих backend API, frontend компоненты и базы данных. Модель может генерировать полноценные игры, симуляции с динамическими объектами, 3D-визуализации и анимированные фоны с реакцией на движения мыши. Qwen3-Coder также отлично подходит для модернизации legacy-систем, где она может анализировать архитектуру, выявлять уязвимости безопасности, планировать миграцию и реализовывать изменения с сохранением обратной совместимости.


Дата анонса: 22.07.2025
Параметров: 480B
Экспертов: 160
Активно параметров при инференсе: 35B
Контекст: 263K
Тип внимания: Full or Sliding Window Attention
Потребление памяти: 282.7 ГБ в точности 4 бит
Разработчик: Alibaba
Версия Transformers: 4.51.0
Лицензия: Apache 2.0

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами для теста инференса и знакомства с Qwen3-Coder-480B-A35B-Instruct.
Наименование модели Контекст Тип GPU TPS Статус Ссылка
Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

  • получить максимальную производительность эндпоинта,
  • получить полный контекст для обработки больших запросов и диалогов,
  • обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
  • использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации для хостинга Qwen3-Coder-480B-A35B-Instruct

Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
teslaa100-4.44.512.320 44 524288 320 4 953,57 ₽ Запустить
teslah100-4.44.512.320 44 524288 320 4 1 855,57 ₽ Запустить
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час

Связанные модели

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.