DeepSeek-V3.1-Terminus

размышляющая
русскоязычная

DeepSeek-V3.1-Terminus довольно неожиданное дополнение DeepSeek-V3.1, которое вышло спустя месяц после релиза базовой версии. По словам разработчиков, необходимость этого обновления была вызвана необходимостью устранения проблем, указанных в обратной связи от пользователей. В частности, модель значительно улучшила языковую консистентность, практически устранив случаи смешивания китайского и английского текста, а также появление случайных символов. Кроме того, были кардинально переработаны агентские возможности: Code Agent теперь обрабатывает программные задачи с повышенной точностью, а Search Agent демонстрирует улучшенную эффективность поиска и интеграции внешних инструментов.

DeepSeek-V3.1-Terminus демонстрирует впечатляющие результаты в ключевых оценочных метриках, особенно в задачах, требующих использования инструментов и агентских навыков. В SimpleQA (тест на фактическую точность коротких ответов) модель достигает 96,8% против 93,4% у предыдущей версии, что является одним из лучших результатов среди открытых моделей. В SWE Verified (оценка способностей в программной инженерии) показатель составляет 68,4%, превосходя многие коммерческие решения. В режиме рассуждения без задействования инструментов модель показывает результат 85.0 в решении сложных академических задач на MMLU-Pro, 80.7 в решении заданий аспирантского уровня на GPQA-Diamond и 74.9 в программировании на LiveCodeBench.

Благодаря улучшенным агентским возможностям и стабильности языковых выходов, DeepSeek-V3.1-Terminus особенно эффективна для автоматизированной разработки программного обеспечения, корпоративных приложений и сложных исследовательских задач.


Дата анонса: 22.09.2025
Параметров: 685B
Экспертов: 256
Активно параметров при инференсе: 37B
Контекст: 164K
Слоев: 61
Тип внимания: Multi-head Latent Attention
Потребление памяти: 329.7 ГБ в точности 4 бит
Разработчик: DeepSeek
Версия Transformers: 4.44.2
Лицензия: MIT

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами бесплатно для теста инференса и знакомства с DeepSeek-V3.1-Terminus. Получить токен для доступа к API вы можете на странице управления токенами после регистрации и верификации.
Наименование модели Контекст Тип GPU TPS Статус Ссылка
Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

  • получить максимальную производительность эндпоинта,
  • получить полный контекст для обработки больших запросов и диалогов,
  • обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
  • использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации для хостинга DeepSeek-V3.1-Terminus

Для данной модели, контекста и квантизации пока нет подходящих конфигураций.
Для данной модели, контекста и квантизации пока нет подходящих конфигураций.
Для данной модели, контекста и квантизации пока нет подходящих конфигураций.

Связанные модели

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.