DeepSeek-R1

размышляющая
русскоязычная

DeepSeek-R1 — это первое поколение reasoning моделей разработанное компанией DeepSeek-AI и представленная 20.01.2025. Модель основана на масштабном обучении с подкреплением (RL) и демонстрирует выдающиеся способности в решении сложных задач, таких как математика, программирование и научные рассуждения.

Модель поддерживает генерацию длинных цепочек рассуждений (Chain-of-Thought, CoT), включая самопроверку, рефлексию и альтернативные подходы к решению задач. DeepSeek-R1 достигает производительности, сопоставимой с OpenAI-o1-1217, на таких бенчмарках, как AIME 2024 (79.8%) и MATH-500 (97.3%).

Базовая версия DeepSeek-R1 включает 671 млрд параметров и достаточно требовательна по ресурсам, однако существуют компактные версии модели (1.5B, 7B, 8B, 14B, 32B, 70B) и дистиллированные версии из DeepSeek-R1 на базе Qwen и Llama. Таким образом, DeepSeek-R1 устанавливает новый стандарт в области reasoning-моделей, сочетая мощь масштабного RL-обучения с практической применимостью, что делает её одной из лучших среди открытых моделей.


Дата анонса: 20.01.2025
Параметров: 671B
Экспертов: 16
Активно параметров при инференсе: 37B
Контекст: 164K
Тип внимания: Multi-head Latent Attention
Потребление памяти: 323.2 ГБ в точности 4 бит
Разработчик: DeepSeek
Версия Transformers: 4.46.3
Лицензия: MIT

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами для теста инференса и знакомства с DeepSeek-R1.
Наименование модели Контекст Тип GPU TPS Статус Ссылка
Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

  • получить максимальную производительность эндпоинта,
  • получить полный контекст для обработки больших запросов и диалогов,
  • обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
  • использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации для хостинга DeepSeek-R1

Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час

Связанные модели

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.