DeepSeek-R1-0528 - это первое значительное обновление популярной серии DeepSeek R1, выпущенное 28 мая 2025 года. Разработчики изменили подходы к глубине мышления, количество параметров увеличилось до 685 млрд, как результат - рост более 10 % пунктов практически по всем значимым бенчмаркам в сравнении с версией от 22.01.2025.
DeepSeek-R1-0528-Qwen3-8B — компактная модель на базе Qwen3 c 8 млрд параметрами, дистиллированная от флагманской версии DeepSeek-R1-0528, достигающая SOTA результатов среди open-source моделей в категории. Модель идеально подходит для развертывания в условиях ограниченных ресурсов, сохраняя продвинутые способности математического и логического рассуждения от модели учителя.
DeepSeek-R1-Distill-32B — модель, построенная на основе дистилляции крупной MoE reasoning-модели экспертного уровня, устанавливающая новые рекорды среди open-source dense-моделей. Подходит для научных, корпоративных и образовательных платформ с высокими требованиями к логике и анализу.
DeepSeek-R1 — уникальная размышляющая модель с 671 млрд параметров обученная на базе RL, с поддержкой длинных CoT, специализирующаяся на многошаговых рассуждениях и логическом анализе. Незаменима для задач, требующих обоснованных выводов и прозрачной цепочки мышления.
DeepSeek-R1-Distill-1.5B — компактная модель, благодаря дистилляции обладающая хорошими навыками рассуждения. Идеально подходит для быстрого анализа текста для мобильных и edge-приложений.