DeepSeek-R1 — это первое поколение reasoning моделей разработанное компанией DeepSeek-AI и представленная 20.01.2025. Модель основана на масштабном обучении с подкреплением (RL) и демонстрирует выдающиеся способности в решении сложных задач, таких как математика, программирование и научные рассуждения.
Модель поддерживает генерацию длинных цепочек рассуждений (Chain-of-Thought, CoT), включая самопроверку, рефлексию и альтернативные подходы к решению задач. DeepSeek-R1 достигает производительности, сопоставимой с OpenAI-o1-1217, на таких бенчмарках, как AIME 2024 (79.8%) и MATH-500 (97.3%).
Базовая версия DeepSeek-R1 включает 671 млрд параметров и достаточно требовательна по ресурсам, однако существуют компактные версии модели (1.5B, 7B, 8B, 14B, 32B, 70B) и дистиллированные версии из DeepSeek-R1 на базе Qwen и Llama. Таким образом, DeepSeek-R1 устанавливает новый стандарт в области reasoning-моделей, сочетая мощь масштабного RL-обучения с практической применимостью, что делает её одной из лучших среди открытых моделей.
Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU |
---|
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU |
---|
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU |
---|
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.