Mistral AI — французская компания в форме Mistral AI SAS, основанная в 2023 году в Париже Артюром Меншем (ex‑Google DeepMind), Гийомом Ламплем и Тимоте Лакруа (оба из Meta AI, выпускники École Polytechnique). Название отсылает к мистралю — сильному северо-западному ветру, дующему на средиземноморском побережье Франции. С самого начала деятельности компания фокусируется на разработке больших языковых моделей в том числе open‑weight LLM и быстро стала одним из главных европейских игроков в этой области.
Компания Mistral AI с самого начала демонстрирует стратегию выпуска разнообразных по своей архитектуре назначению моделей, эффективно воплощая передовые научные достижения. Первая релизная модель Mistral 7B, выпущенная в 2023 году использует Sliding Window Attention и Grouped-Query Attention что позволило существенно ускорить инференс и обеспечить экономию памяти на GPU. Продолжая развитие архитектурных новаций, компания представила Mixtral 8x7B — первую production-модель на базе Sparse Mixture of Experts (SMoE). Другим направлением стала работа с более крупными моделями и мультимодальностью: Mistral Large 2 использует 123-миллиарда параметров при ее обучении была существенно увеличена доля неанглийских данных, что позволило ей работать более чем с 12 естественными языками и 85+ языками программирования, а Pixtral Large стала нативной мультимодальной моделью с уникальным механизмом обработки изображений. Параллельно Mistral экспериментирует с принципиально новыми парадигмами, так в Codestral была реализована архитектура State Space Model. Серия Mistral 3 очень вариативна - под открытой лицензией Apache 2.0 выпущены и гигантские мультимодальные MoE-модели Mistral Large 3 с нативной FP8 и NVFP4 квантизацией и более легкие с 3, 8 и 14 миллиардами параметров с reasoning и instruct версиями.
Помимо открытых моделей, компания поддерживает API‑платформу La Plateforme, чат‑интерфейс Le Chat и официальные SDK, чем закрывает весь спектр сценариев использования LLM — от исследовательских экспериментов до премиум деплоя и корпоративных SaaS‑решений.
Таким образом, Mistral AI стала одним из символов «европейской школы» открытых LLM, последовательно публикуя веса моделей под Apache 2.0 или собственными исследовательскими лицензиями и делая их доступными для развертывания практически во всех современных фреймворках. Такая комбинация открытых моделей и коммерческого API закрепляет за Mistral роль одного из ключевых центров притяжения для open‑source LLM сообщества.