DeepSeek-V3-0324

русскоязычная

DeepSeek-V3-0324 — это улучшенная версия сверхмощной языковой модели от DeepSeek, выпущенная 24 марта 2025 года. Одним из ключевых технических изменений стало небольшое увеличение общего числа параметров — с 671 миллиарда у V3 до 685 миллиардов у V3-0324.По сравнению с предыдущей версией (DeepSeek-V3), модель демонстрирует значительные улучшения в логическом мышлении, программировании и генерации текста на китайском языке. Модель продемонстрировала впечатляющий рост результатов в ключевых бенчмарках:

  • MMLU-Pro: с 75.9 до 81.2 (+5.3)
  • GPQA: с 59.1 до 68.4 (+9.3)
  • AIME: с 39.6 до 59.4 (+19.8)
  • LiveCodeBench: с 39.2 до 49.2 (+10.0)

Разработчики подчеркнули, что модель особенно выделяется своими возможностями в области разработки веб-приложений — генерируемый код не только исполняем, но и обладает улучшенным визуальным дизайном. Также DeepSeek-V3-0324 демонстрирует улучшенную интерактивность в многоэтапных диалогах, повышает точность вызова функций и исправляет ошибки предыдущие версии, что делает её одной из самых надежных моделей в своем классе.


Дата анонса: 24.03.2025
Параметров: 685B
Экспертов: 16
Активно параметров при инференсе: 37B
Контекст: 164K
Тип внимания: Multi-head Latent Attention
Потребление памяти: 329.7 ГБ в точности 4 бит
Разработчик: DeepSeek
Версия Transformers: 4.46.3
Версия Ollama: 0.5.5
Лицензия: MIT

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами для теста инференса и знакомства с DeepSeek-V3-0324.
Наименование модели Контекст Тип GPU TPS Статус Ссылка
Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

  • получить максимальную производительность эндпоинта,
  • получить полный контекст для обработки больших запросов и диалогов,
  • обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
  • использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации для хостинга DeepSeek-V3-0324

Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час

Связанные модели

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.