QwQ-32B — это инновационная языковая модель, разработанная Alibaba, с 32 миллиардами параметров и контекстным окном в 131K токенов. Она специализируется на глубоких рассуждениях и способна к многошаговому логическому анализу, что делает ее особенно эффективной при решении сложных задач, требующих структурированного мышления.
QwQ-32B была обучена основе передовых методов Reinforcement Learning, которые позволили значительно улучшить её способности к рассуждению, что позволяет модели показывать выдающиеся результаты в таких областях, как математические вычисления, программирование, анализ юридических документов. По производительности она не уступает DeepSeek-R1, которая имеет 671 миллиард параметров. Кроме того, QwQ-32B обладает возможностями агентного поведения, что позволяет ей адаптировать свои рассуждения на основе обратной связи, а также использовать различные инструменты для более точного анализа запросов.
Благодаря своему контекстному окну в 131 000 токенов, модель может обрабатывать объемные аналитические задачи и работать с многоэтапными логическими цепочками, что делает её незаменимой для научных исследований, образовательных приложений, поиска проблем в коде, сопоставления доводов в юридических документах и других задач, требующих максимального внимания к деталям.
Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
---|---|---|---|---|---|---|
Qwen/QwQ-32B | 40 960 | Публичный | 2×RTX4090 | 46.40 | доступен | попробовать |
curl https://chat.immers.cloud/v1/endpoints/QwQ-32b/generate/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer USER_API_KEY" \
-d '{"model": "QwQ-32b", "messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Say this is a test"}
], "temperature": 0, "max_tokens": 150}'
$response = Invoke-WebRequest https://chat.immers.cloud/v1/endpoints/QwQ-32b/generate/chat/completions `
-Method POST `
-Headers @{
"Authorization" = "Bearer USER_API_KEY"
"Content-Type" = "application/json"
} `
-Body (@{
model = "QwQ-32b"
messages = @(
@{ role = "system"; content = "You are a helpful assistant." },
@{ role = "user"; content = "Say this is a test" }
)
} | ConvertTo-Json)
($response.Content | ConvertFrom-Json).choices[0].message.content
#!pip install OpenAI --upgrade
from openai import OpenAI
client = OpenAI(
api_key="USER_API_KEY",
base_url="https://chat.immers.cloud/v1/endpoints/QwQ-32b/generate/",
)
chat_response = client.chat.completions.create(
model="QwQ-32b",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Say this is a test"},
]
)
print(chat_response.choices[0].message.content)
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
---|---|---|---|---|---|---|---|
16 | 98304 | 160 | 3 | 119,81 ₽ | Запустить | ||
16 | 65536 | 160 | 4 | 131,77 ₽ | Запустить | ||
16 | 98304 | 160 | 3 | 218,81 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 230,77 ₽ | Запустить | ||
16 | 65536 | 160 | 2 | 261,77 ₽ | Запустить | ||
16 | 98304 | 160 | 3 | 288,11 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 456,27 ₽ | Запустить |
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
---|---|---|---|---|---|---|---|
16 | 98304 | 160 | 3 | 119,81 ₽ | Запустить | ||
16 | 98304 | 160 | 3 | 218,81 ₽ | Запустить | ||
16 | 131072 | 160 | 1 | 242,04 ₽ | Запустить | ||
16 | 98304 | 160 | 3 | 288,11 ₽ | Запустить | ||
16 | 98304 | 160 | 3 | 387,41 ₽ | Запустить | ||
16 | 131072 | 160 | 1 | 467,54 ₽ | Запустить |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.