QwQ-32B — это инновационная языковая модель, разработанная Alibaba, с 32 миллиардами параметров и контекстным окном в 131K токенов. Она специализируется на глубоких рассуждениях и способна к многошаговому логическому анализу, что делает ее особенно эффективной при решении сложных задач, требующих структурированного мышления.
QwQ-32B была обучена основе передовых методов Reinforcement Learning, которые позволили значительно улучшить её способности к рассуждению, что позволяет модели показывать выдающиеся результаты в таких областях, как математические вычисления, программирование, анализ юридических документов. По производительности она не уступает DeepSeek-R1, которая имеет 671 миллиард параметров. Кроме того, QwQ-32B обладает возможностями агентного поведения, что позволяет ей адаптировать свои рассуждения на основе обратной связи, а также использовать различные инструменты для более точного анализа запросов.
Благодаря своему контекстному окну в 131 000 токенов, модель может обрабатывать объемные аналитические задачи и работать с многоэтапными логическими цепочками, что делает её незаменимой для научных исследований, образовательных приложений, поиска проблем в коде, сопоставления доводов в юридических документах и других задач, требующих максимального внимания к деталям.
| Наименование модели | Контекст | Тип | GPU | TPS | Tooling | Статус | Ссылка |
|---|---|---|---|---|---|---|---|
| Qwen/QwQ-32B | 40 960 | Публичный | 2×RTX4090 tensor |
46.40 | доступен | чат |
curl https://chat.immers.cloud/v1/endpoints/QwQ-32b/generate/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer USER_API_KEY" \
-d '{"model": "QwQ-32b", "messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Say this is a test"}
], "temperature": 0, "max_tokens": 150}'
$response = Invoke-WebRequest https://chat.immers.cloud/v1/endpoints/QwQ-32b/generate/chat/completions `
-Method POST `
-Headers @{
"Authorization" = "Bearer USER_API_KEY"
"Content-Type" = "application/json"
} `
-Body (@{
model = "QwQ-32b"
messages = @(
@{ role = "system"; content = "You are a helpful assistant." },
@{ role = "user"; content = "Say this is a test" }
)
} | ConvertTo-Json)
($response.Content | ConvertFrom-Json).choices[0].message.content
#!pip install OpenAI --upgrade
from openai import OpenAI
client = OpenAI(
api_key="USER_API_KEY",
base_url="https://chat.immers.cloud/v1/endpoints/QwQ-32b/generate/",
)
chat_response = client.chat.completions.create(
model="QwQ-32b",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Say this is a test"},
]
)
print(chat_response.choices[0].message.content)
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 pipeline |
3 | 119,81 ₽ | 1,19 | Запустить | ||
131 072 tensor |
4 | 144,97 ₽ | 1,78 | Запустить | ||
131 072 pipeline |
6 | 147,44 ₽ | 1,63 | Запустить | ||
131 072 tensor |
2 | 198,54 ₽ | 1,04 | Запустить | ||
131 072 pipeline |
3 | 204,41 ₽ | 1,19 | Запустить | ||
131 072 tensor |
4 | 209,04 ₽ | 1,78 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 1,57 | Запустить | ||
131 072 pipeline |
3 | 252,41 ₽ | 1,19 | Запустить | ||
131 072 tensor |
4 | 257,77 ₽ | 1,78 | Запустить | ||
131 072 tensor |
2 | 261,77 ₽ | 1,04 | Запустить | ||
131 072 tensor |
4 | 321,77 ₽ | 1,78 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 1,57 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 1,96 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 3,28 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 pipeline |
6 | 147,44 ₽ | 1,29 | Запустить | ||
131 072 tensor |
4 | 156,24 ₽ | 1,44 | Запустить | ||
131 072 tensor |
4 | 209,04 ₽ | 1,44 | Запустить | ||
131 072 |
1 | 223,04 ₽ | 1,23 | Запустить | ||
131 072 tensor |
4 | 264,96 ₽ | 1,44 | Запустить | ||
131 072 tensor |
4 | 328,96 ₽ | 1,44 | Запустить | ||
131 072 pipeline |
3 | 347,52 ₽ | 1,52 | Запустить | ||
131 072 |
1 | 353,04 ₽ | 1,23 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 1,62 | Запустить | ||
131 072 pipeline |
3 | 387,41 ₽ | 1,52 | Запустить | ||
131 072 tensor |
4 | 388,21 ₽ | 2,34 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 2,94 | Запустить | ||
131 072 tensor |
4 | 513,04 ₽ | 2,34 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 pipeline |
6 | 312,70 ₽ | 1,53 | Запустить | ||
131 072 tensor |
8 | 411,97 ₽ | 2,73 | Запустить | ||
131 072 tensor |
4 | 416,37 ₽ | 1,24 | Запустить | ||
131 072 tensor |
2 | 417,44 ₽ | 2,29 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 1,84 | Запустить | ||
131 072 tensor |
4 | 513,04 ₽ | 1,24 | Запустить | ||
131 072 pipeline |
6 | 520,97 ₽ | 1,53 | Запустить | ||
131 072 tensor |
8 | 670,97 ₽ | 2,73 | Запустить | ||
131 072 tensor |
2 | 699,97 ₽ | 2,29 | Запустить | ||
131 072 tensor |
2 | 729,47 ₽ | 3,08 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.