DeepSeek-R1 — это первое поколение reasoning моделей разработанное компанией DeepSeek-AI и представленное 20.01.2025. Модель основана на масштабном обучении с подкреплением (RL) и демонстрирует выдающиеся способности в решении сложных задач, таких как математика, программирование и научные рассуждения.
Модель поддерживает генерацию длинных цепочек рассуждений (Chain-of-Thought, CoT), включая самопроверку, рефлексию и альтернативные подходы к решению задач. DeepSeek-R1 достигает производительности, сопоставимой с OpenAI-o1-1217, на таких бенчмарках, как AIME 2024 (79.8%) и MATH-500 (97.3%).
Базовая версия DeepSeek-R1 включает 671 млрд параметров и достаточно требовательна по ресурсам, однако существуют компактные версии модели (1.5B, 7B, 8B, 14B, 32B, 70B) и дистиллированные версии из DeepSeek-R1 на базе Qwen и Llama. Таким образом, DeepSeek-R1 устанавливает новый стандарт в области reasoning-моделей, сочетая мощь масштабного RL-обучения с практической применимостью, что делает её одной из лучших среди открытых моделей.
| Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
163 840 |
44 | 524288 | 480 | 6 | 1 373,13 ₽ | Запустить | |
163 840 |
32 | 786432 | 480 | 4 | 2 517,59 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
163 840 |
52 | 917504 | 960 | 6 | 3 735,78 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
163 840 |
52 | 917504 | 960 | 6 | 3 735,78 ₽ | Запустить | |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.