Qwen3-8B представляет собой новую ступеньку в серии. Модель с 8.2 миллиардами параметров, сохраняет архитектуру с 36 слоями и 32 головами внимания, но с важными изменением — она уже не использует tie embedding и контекстное окно увеличено до 40K токенов, тем самым обеспечиваются превосходные возможности для работы с длинными документами и сложными задачами.
Удвоение количества параметров по сравнению с 4B версией заметно улучшает качество ответов во всех типах задач, особенно в области математических рассуждений, программирования и сложного анализа. Модель демонстрирует превосходные результаты в задачах, требующих многошагового рассуждения и глубокого понимания контекста. Поддержка как thinking, так и non-thinking режимов позволяет оптимизировать производительность в зависимости от сложности задачи и доступного времени на обработку, а механизм Thinking budget позволяет тонко настраивать интенсивность вычислений для оптимальной производительности.
Qwen3-8B оптимальна для продвинутых профессиональных приложений: финансовый анализ, медицинская диагностика, юриспруденция. Модель превосходно подходит для создания интеллектуальных ассистентов для специалистов, систем автоматического создания технической документации и образовательных платформ.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
40 960 |
1 | 34,51 ₽ | 1,11 | Запустить | ||
40 960 |
1 | 37,77 ₽ | 1,11 | Запустить | ||
40 960 tensor |
2 | 63,57 ₽ | 1,62 | Запустить | ||
40 960 tensor |
2 | 92,17 ₽ | 1,30 | Запустить | ||
40 960 |
1 | 105,57 ₽ | 2,39 | Запустить | ||
40 960 tensor |
2 | 109,77 ₽ | 5,78 | Запустить | ||
40 960 |
1 | 150,57 ₽ | 3,67 | Запустить | ||
40 960 tensor |
4 | 156,24 ₽ | 12,57 | Запустить | ||
40 960 |
1 | 211,77 ₽ | 11,35 | Запустить | ||
40 960 tensor |
4 | 269,04 ₽ | 12,57 | Запустить | ||
40 960 |
1 | 341,77 ₽ | 11,35 | Запустить | ||
40 960 |
1 | 367,41 ₽ | 13,59 | Запустить | ||
40 960 tensor |
2 | 439,97 ₽ | 23,70 | Запустить | ||
40 960 tensor |
2 | 839,97 ₽ | 43,22 | Запустить | ||
40 960 tensor |
4 | 1 717,59 ₽ | 87,45 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
40 960 tensor |
2 | 51,34 ₽ | 2,55 | Запустить | ||
40 960 pipeline |
3 | 74,84 ₽ | 2,27 | Запустить | ||
40 960 pipeline |
3 | 78,95 ₽ | 4,67 | Запустить | ||
40 960 tensor |
4 | 99,74 ₽ | 3,59 | Запустить | ||
40 960 |
1 | 105,57 ₽ | 1,72 | Запустить | ||
40 960 tensor |
2 | 109,77 ₽ | 5,11 | Запустить | ||
40 960 tensor |
4 | 127,45 ₽ | 6,79 | Запустить | ||
40 960 pipeline |
3 | 133,01 ₽ | 1,79 | Запустить | ||
40 960 |
1 | 150,57 ₽ | 3,00 | Запустить | ||
40 960 tensor |
4 | 156,24 ₽ | 11,91 | Запустить | ||
40 960 tensor |
4 | 168,21 ₽ | 2,95 | Запустить | ||
40 960 |
1 | 211,77 ₽ | 10,68 | Запустить | ||
40 960 tensor |
4 | 269,04 ₽ | 11,91 | Запустить | ||
40 960 |
1 | 341,77 ₽ | 10,68 | Запустить | ||
40 960 |
1 | 367,41 ₽ | 12,92 | Запустить | ||
40 960 tensor |
2 | 439,97 ₽ | 23,03 | Запустить | ||
40 960 tensor |
2 | 839,97 ₽ | 42,55 | Запустить | ||
40 960 tensor |
4 | 1 717,59 ₽ | 86,79 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
40 960 tensor |
2 | 51,34 ₽ | 1,32 | Запустить | ||
40 960 pipeline |
3 | 74,84 ₽ | 1,03 | Запустить | ||
40 960 pipeline |
3 | 78,95 ₽ | 3,43 | Запустить | ||
40 960 tensor |
4 | 99,74 ₽ | 2,35 | Запустить | ||
40 960 tensor |
2 | 109,77 ₽ | 3,88 | Запустить | ||
40 960 tensor |
4 | 127,45 ₽ | 5,55 | Запустить | ||
40 960 |
1 | 150,57 ₽ | 1,76 | Запустить | ||
40 960 tensor |
4 | 156,24 ₽ | 10,67 | Запустить | ||
40 960 tensor |
4 | 168,21 ₽ | 1,71 | Запустить | ||
40 960 tensor |
2 | 171,77 ₽ | 3,88 | Запустить | ||
40 960 |
1 | 211,77 ₽ | 9,44 | Запустить | ||
40 960 tensor |
4 | 269,04 ₽ | 10,67 | Запустить | ||
40 960 |
1 | 341,77 ₽ | 9,44 | Запустить | ||
40 960 |
1 | 367,41 ₽ | 11,68 | Запустить | ||
40 960 tensor |
2 | 439,97 ₽ | 21,80 | Запустить | ||
40 960 tensor |
2 | 839,97 ₽ | 41,32 | Запустить | ||
40 960 tensor |
4 | 1 717,59 ₽ | 85,55 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.