Qwen3-32B является самой мощной плотной моделью с 32 млрд параметров, архитектурой в 64 слоя и 64 головы внимания и поддерживаемым контекстным окном в 128K токенов. Эта модель представляет вершину плотной архитектуры в серии Qwen3 и обеспечивает производительность, сопоставимую с ведущими проприетарными решениями в большинстве задач. Разработчики подчеркивают, что благодаря инновациям и обучению на 36 триллионах токенов высококачественных данных Qwen3-32B по качеству сопоставима с Qwen2.5-72B, но использует в 2 раза меньше параметров.
Модель демонстрирует выдающиеся результаты во всех бенчмарках, особенно в области программирования, решения математических задача, знаний в сложных областях науки и техники. Qwen3-32B способна выполнять задачи уровня senior-экспертов и обеспечивает качество, достаточное для критически важных коммерческих приложений. Поддержка всех 119 языков на максимальном уровне качества делает эту модель универсальным решением для приложений с международной интеграцией.
Эта модель предназначена для флагманских продуктов крупных технологических компаний, национальных исследовательских проектов, критически важных систем ИИ и приложений, где качество является приоритетом. Qwen3-32B идеально подходит для создания ИИ-ассистентов премиум уровня, сложных аналитических систем, профессиональных инструментов разработки и любых применений, требующих максимального качества обработки естественного языка.
Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
---|---|---|---|---|---|---|
Qwen/QwQ-32B-AWQ | 40 960 | Публичный | 2×RTX4090 | 40.00 | доступен | попробовать |
curl https://chat.immers.cloud/v1/endpoints/Qwen-3-32b/generate/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer USER_API_KEY" \
-d '{"model": "Qwen-3-32b", "messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Say this is a test"}
], "temperature": 0, "max_tokens": 150}'
$response = Invoke-WebRequest https://chat.immers.cloud/v1/endpoints/Qwen-3-32b/generate/chat/completions `
-Method POST `
-Headers @{
"Authorization" = "Bearer USER_API_KEY"
"Content-Type" = "application/json"
} `
-Body (@{
model = "Qwen-3-32b"
messages = @(
@{ role = "system"; content = "You are a helpful assistant." },
@{ role = "user"; content = "Say this is a test" }
)
} | ConvertTo-Json)
($response.Content | ConvertFrom-Json).choices[0].message.content
#!pip install OpenAI --upgrade
from openai import OpenAI
client = OpenAI(
api_key="USER_API_KEY",
base_url="https://chat.immers.cloud/v1/endpoints/Qwen-3-32b/generate/",
)
chat_response = client.chat.completions.create(
model="Qwen-3-32b",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Say this is a test"},
]
)
print(chat_response.choices[0].message.content)
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
---|---|---|---|---|---|---|---|
16 | 98304 | 160 | 3 | 119,81 ₽ | Запустить | ||
16 | 65536 | 160 | 4 | 131,77 ₽ | Запустить | ||
16 | 98304 | 160 | 3 | 218,81 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 230,77 ₽ | Запустить | ||
16 | 65536 | 160 | 2 | 261,77 ₽ | Запустить | ||
16 | 98304 | 160 | 3 | 288,11 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 456,27 ₽ | Запустить |
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
---|---|---|---|---|---|---|---|
16 | 98304 | 160 | 3 | 119,81 ₽ | Запустить | ||
16 | 98304 | 160 | 3 | 218,81 ₽ | Запустить | ||
16 | 131072 | 160 | 1 | 242,04 ₽ | Запустить | ||
16 | 98304 | 160 | 3 | 288,11 ₽ | Запустить | ||
16 | 98304 | 160 | 3 | 387,41 ₽ | Запустить | ||
16 | 131072 | 160 | 1 | 467,54 ₽ | Запустить |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.