Qwen3-8B представляет собой новую ступеньку в серии. Модель с 8.2 миллиардами параметров, сохраняет архитектуру с 36 слоями и 32 головами внимания, но с важными изменением — она уже не использует tie embedding и контекстное окно увеличено до 128K токенов, тем самым обеспечиваются превосходные возможности для работы с длинными документами и сложными задачами.
Удвоение количества параметров по сравнению с 4B версией заметно улучшает качество ответов во всех типах задач, особенно в области математических рассуждений, программирования и сложного анализа. Модель демонстрирует превосходные результаты в задачах, требующих многошагового рассуждения и глубокого понимания контекста. Поддержка как thinking, так и non-thinking режимов позволяет оптимизировать производительность в зависимости от сложности задачи и доступного времени на обработку, а механизм Thinking budget позволяет тонко настраивать интенсивность вычислений для оптимальной производительности.
Qwen3-8B оптимальна для продвинутых профессиональных приложений: финансовый анализ, медицинская диагностика, юриспруденция. Модель превосходно подходит для создания интеллектуальных ассистентов для специалистов, систем автоматического создания технической документации и образовательных платформ.
| Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
131 072 tensor |
16 | 32768 | 160 | 2 | 48,14 ₽ | Запустить | |
131 072 tensor |
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 83,37 ₽ | Запустить | |
131 072 pipeline |
16 | 65536 | 160 | 3 | 84,47 ₽ | Запустить | |
131 072 tensor |
16 | 32768 | 160 | 4 | 99,74 ₽ | Запустить | |
131 072 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 149,37 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 4 | 162,57 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 195,57 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 211,77 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 341,77 ₽ | Запустить | |
131 072 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
131 072 pipeline |
32 | 65536 | 160 | 3 | 78,57 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 83,37 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 4 | 85,77 ₽ | Запустить | |
131 072 pipeline |
32 | 131072 | 160 | 3 | 94,64 ₽ | Запустить | |
131 072 tensor |
16 | 32768 | 160 | 4 | 99,74 ₽ | Запустить | |
131 072 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
131 072 tensor |
32 | 131072 | 160 | 4 | 112,24 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 149,37 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 4 | 162,57 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 195,57 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 211,77 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 341,77 ₽ | Запустить | |
131 072 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
131 072 pipeline |
32 | 65536 | 160 | 3 | 78,57 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 83,37 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 4 | 85,77 ₽ | Запустить | |
131 072 pipeline |
32 | 131072 | 160 | 3 | 94,64 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
131 072 tensor |
32 | 131072 | 160 | 4 | 112,24 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 149,37 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 195,57 ₽ | Запустить | |
131 072 tensor |
16 | 65535 | 240 | 2 | 198,54 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 211,77 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 261,77 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 341,77 ₽ | Запустить | |
131 072 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.