MiniMax M2 — это фундаментальная модель, заложившая архитектурные и методологические принципы всей серии. Разработанная для максимальной эффективности в агентных сценариях и программировании, M2 доказывает, что компактная архитектура может конкурировать с огромными моделями при правильном подходе к обучению и данным.
Архитектура модели — Mixture-of-Experts с 230 миллиардами общих параметров, из которых активируется только 10 миллиардов на токен. Ключевой особенностью является полное внимание (full attention) вместо гибридных механизмов — команда сознательно отказалась от sparse/linear attention после экспериментов, показавших деградацию качества на сложных многошаговых рассуждениях и агентных задачах. Модель внедряет Interleaved Thinking — паттерн чередующегося мышления, где режим рассуждений может происходить между шагами генерации и использования инструментов, а не только в начале диалога.
Уникальность M2 заключается в её роли как фундамента для всей серии. Она не просто отдельная модель, а первая реализация философии MiniMax, согласно которой будущее за "агент-нативными" LLM. Ключевая идея, заложенная в M2, — это подготовка модели не просто к генерации текста, а к решению задач в рамках агентного подхода, где требуется планирование, использование инструментов и адаптация к обратной связи. С практической точки зрения, это означает, что M2 отлично подходит для развертывания в качестве интеллектуального ядра ассистентов, способных работать с документами, анализировать таблицы и генерировать структурированные ответы, требующие понимания предметной области.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
196 608 tensor |
3 | 657,66 ₽ | 2,06 | Запустить | ||
196 608 tensor |
2 | 729,47 ₽ | 1,11 | Запустить | ||
196 608 tensor |
2 | 840,74 ₽ | 2,93 | Запустить | ||
196 608 tensor |
8 | 1 031,74 ₽ | 2,10 | Запустить | ||
196 608 tensor |
3 | 1 047,66 ₽ | 2,06 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
196 608 tensor |
4 | 848,44 ₽ | 1,37 | Запустить | ||
196 608 tensor |
3 | 1 282,53 ₽ | 3,42 | Запустить | ||
196 608 tensor |
4 | 1 397,57 ₽ | 1,37 | Запустить | ||
196 608 tensor |
4 | 1 450,00 ₽ | 2,45 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.