DeepSeek-R1-0528-Qwen3-8B представляет собой компактную 8-миллиардную модель, полученную путём дистилляции знаний и умений рассуждать от флагманской DeepSeek-R1-0528 в базовую модель Qwen3 8B. Эта модель использует архитектуру, идентичную Qwen3-8B, но с токенайзером от DeepSeek-R1-0528, что обеспечивает совместимость с более продвинутыми возможностями мышления. Модель демонстрирует исключительные результаты, достигая 86.0% на AIME 2024, что превосходит базовую Qwen3 8B на 10% и соответствует производительности значительно более крупной Qwen3-235B-thinking. Эти результаты и ряд других показателей на бенчмарках позволяют модели занять лидирующие позиции среди open-source моделей своего класса.
Модель представляет собой хороший пример качественной реализации процедуры дистилляции. Цепочки мыслей от DeepSeek-R1-0528 были успешно перенесены в более компактную архитектуру, что открывает новые возможности для академических исследований и промышленной разработки небольших специализированных моделей. Компактный размер в 8B параметров делает модель доступной для развертывания на менее мощном оборудовании, сохраняя при этом высокое качество рассуждений.
DeepSeek-R1-0528-Qwen3-8B отлично подходит для образовательных приложений, небольших исследовательских проектов, и в целом для ситуаций, когда требуется хорошая модель настроенная отвечать в стиле рассуждений, но нет возможности развернуть крупные reasoning модели.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 pipeline |
3 | 78,57 ₽ | 1,50 | Запустить | ||
131 072 tensor |
2 | 83,37 ₽ | 1,71 | Запустить | ||
131 072 tensor |
4 | 85,77 ₽ | 2,11 | Запустить | ||
131 072 pipeline |
3 | 94,64 ₽ | 1,51 | Запустить | ||
131 072 tensor |
4 | 99,74 ₽ | 1,29 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 1,71 | Запустить | ||
131 072 tensor |
4 | 112,24 ₽ | 2,12 | Запустить | ||
131 072 tensor |
2 | 139,77 ₽ | 1,82 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 1,15 | Запустить | ||
131 072 tensor |
4 | 162,57 ₽ | 1,09 | Запустить | ||
131 072 tensor |
2 | 171,77 ₽ | 1,81 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 3,60 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 3,59 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 4,30 | Запустить | ||
131 072 tensor |
2 | 411,81 ₽ | 7,51 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 6,69 | Запустить | ||
131 072 tensor |
2 | 839,97 ₽ | 13,70 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 pipeline |
3 | 78,57 ₽ | 1,33 | Запустить | ||
131 072 tensor |
2 | 83,37 ₽ | 1,53 | Запустить | ||
131 072 tensor |
4 | 85,77 ₽ | 1,93 | Запустить | ||
131 072 pipeline |
3 | 94,64 ₽ | 1,33 | Запустить | ||
131 072 tensor |
4 | 99,74 ₽ | 1,12 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 1,53 | Запустить | ||
131 072 tensor |
4 | 112,24 ₽ | 1,94 | Запустить | ||
131 072 tensor |
2 | 139,77 ₽ | 1,64 | Запустить | ||
131 072 tensor |
2 | 171,77 ₽ | 1,64 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 3,42 | Запустить | ||
131 072 tensor |
2 | 261,77 ₽ | 2,44 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 3,42 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 4,13 | Запустить | ||
131 072 tensor |
2 | 411,81 ₽ | 7,33 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 6,52 | Запустить | ||
131 072 tensor |
2 | 839,97 ₽ | 13,52 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 tensor |
2 | 83,37 ₽ | 1,17 | Запустить | ||
131 072 tensor |
4 | 85,77 ₽ | 1,57 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 1,17 | Запустить | ||
131 072 tensor |
4 | 112,24 ₽ | 1,58 | Запустить | ||
131 072 tensor |
2 | 139,77 ₽ | 1,28 | Запустить | ||
131 072 tensor |
2 | 171,77 ₽ | 1,28 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 3,06 | Запустить | ||
131 072 tensor |
2 | 261,77 ₽ | 2,08 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 3,06 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 3,77 | Запустить | ||
131 072 tensor |
2 | 411,81 ₽ | 6,98 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 6,16 | Запустить | ||
131 072 tensor |
2 | 839,97 ₽ | 13,17 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.