Юридическое наименование компании — Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd. Китайская исследовательская компания, зарегистрированная в Ханчжоу (провинция Чжэцзян). На международном рынке компания известна под брендом DeepSeek AI под которым публикует все свои продукты и исследования. Основана в июле 2023 года с фокусом на разработку фундаментальных технологий искусственного интеллекта.
Команда DeepSeek совершила ряд фундаментальных прорывов в архитектуре и обучении крупномасштабных языковых моделей, задав новые отраслевые стандарты эффективности: их подход к вниманию Multi-Head Latent Attention (MLA), впервые представленный в модели DeepSeek-V2, оптимизирует использование памяти за счёт сжатия KV-кэша в латентные векторы, сокращая его объём на 93.3% и ускоряя вывод в 5.76 раза — что делает возможным запуск моделей с контекстом до 128K токенов даже на потребительском железе; они также первыми в индустрии реализовали масштабное обучение в формате FP8 для модели с 671 млрд параметров (DeepSeek-V3), дополнив его инновационной схемой параллелизма DualPipe, что сократило затраты на обучение в 10 раз по сравнению с аналогами уровня GPT-4 за счёт минимизации простоев в вычислительном конвейере; наконец, их рассуждающая модель DeepSeek-R1 доказала возможность отказа от традиционного пайплайна SFT+RLHF, в пользу чистого обучения с подкреплением (Group Relative Policy Optimization, GRPO) для создания агентов, способных к сложному многошаговому планированию..
DeepSeek AI является одним из главных драйверов open-source движения в области ИИ. Компания последовательно выпускает свои самые передовые модели под открытой лицензией MIT, включая упомянутые семейства DeepSeek-V2, DeepSeek-R1, DeepSeek-V3 и DeepSeek-V3.1. Эти релизы не просто предоставляют веса моделей, но сопровождаются подробными техническими отчетами и, что особенно ценно, открытым исходным кодом ключевых инфраструктурных компонентов. Это позволяет глобальному исследовательскому сообществу не только использовать модели, но и глубоко изучать, воспроизводить и развивать лежащие в их основе технологии. DeepSeek AI по праву считается одним из ведущих исследовательских центров и ключевых игроков в мировой индустрии ИИ. Компания убедительно продемонстрировала, что открытые модели способны уверенно конкурировать с коммерческими продуктами за счет внедрения передовых и экономически эффективных технологий.