Ministral-3-8B-Instruct-2512 занимает золотую середину в семействе Ministral 3, предлагая оптимальный баланс между вычислительной эффективностью и качеством ответов. Архитектура включает текстовую LLM на 8,4 млрд параметров и визуальный энкодер на 0,4 млрд параметров. Модель предоставляется разработчиками в FP8 квантованном формате. Контекстное окно в 256 000 токенов обеспечивает обработку больших объемов информации, а лицензия Apache 2.0 позволяет свободное коммерческое использование.
Технология Cascade Distillation, лежащая в основе Ministral 3, позволяет 8B-модели сохранять значительную долю возможностей родительской Mistral Small 3.1 (24B) при сокращении параметров почти втрое. Это достигается путем итеративного прунинга и последующей дистилляции знаний, что существенно снижает вычислительные затраты на обучение без ощутимой потери качества. Визуальный энкодер на 410M параметров работает в связке с адаптером, обеспечивая эффективное мультимодальное восприятие при минимальных накладных расходах.
В бенчмарке Arena Hard (оценка следования инструкциям) модель показывает 0.509, что сопоставимо с Qwen3-VL-8B-Instruct (0.528) и выше Gemma3-12B-Instruct (0.436). В WildBench (диалоговые способности) результат 66.8 превосходит Qwen3-VL-8B-Instruct (66.3). На математическом бенчмарке MATH Maj@1 модель достигает 0.876, демонстрируя сильные аналитические способности при достаточно компактном размере.
При использовании модели разработчики рекомендуют четко определять в System prompt среду и сценарий использования. Temperature ниже 0.1 для продуктивных сред и минимизация количество инструментов в агентных сценариях. Для визуального ввода следует использовать изображения с соотношением сторон ~1:1. Модель отлично подходит для локальных AI-ассистентов и чат-интерфейса в ограниченных средах, а также для описания изображений/документов, перевода и генерации контента, специализированных агентных сценариев.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 tensor |
4 | 85,77 ₽ | 1,20 | Запустить | ||
262 144 tensor |
4 | 112,24 ₽ | 1,20 | Запустить | ||
262 144 pipeline |
3 | 119,81 ₽ | 1,48 | Запустить | ||
262 144 tensor |
4 | 139,96 ₽ | 2,04 | Запустить | ||
262 144 pipeline |
3 | 204,41 ₽ | 1,48 | Запустить | ||
262 144 tensor |
4 | 209,04 ₽ | 2,04 | Запустить | ||
262 144 |
1 | 211,77 ₽ | 1,84 | Запустить | ||
262 144 pipeline |
3 | 252,41 ₽ | 1,48 | Запустить | ||
262 144 tensor |
4 | 257,77 ₽ | 2,04 | Запустить | ||
262 144 tensor |
2 | 261,77 ₽ | 1,34 | Запустить | ||
262 144 tensor |
4 | 321,77 ₽ | 2,04 | Запустить | ||
262 144 |
1 | 341,77 ₽ | 1,84 | Запустить | ||
262 144 |
1 | 367,41 ₽ | 2,21 | Запустить | ||
262 144 |
1 | 423,04 ₽ | 3,46 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 pipeline |
3 | 119,81 ₽ | 1,11 | Запустить | ||
262 144 tensor |
4 | 144,97 ₽ | 1,68 | Запустить | ||
262 144 pipeline |
6 | 147,44 ₽ | 1,53 | Запустить | ||
262 144 pipeline |
3 | 204,41 ₽ | 1,11 | Запустить | ||
262 144 tensor |
4 | 209,04 ₽ | 1,68 | Запустить | ||
262 144 |
1 | 211,77 ₽ | 1,47 | Запустить | ||
262 144 pipeline |
3 | 252,41 ₽ | 1,11 | Запустить | ||
262 144 tensor |
4 | 257,77 ₽ | 1,68 | Запустить | ||
262 144 tensor |
2 | 261,77 ₽ | 0,98 | Запустить | ||
262 144 tensor |
4 | 321,77 ₽ | 1,68 | Запустить | ||
262 144 |
1 | 341,77 ₽ | 1,47 | Запустить | ||
262 144 |
1 | 367,41 ₽ | 1,84 | Запустить | ||
262 144 |
1 | 423,04 ₽ | 3,09 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 pipeline |
6 | 147,44 ₽ | 1,12 | Запустить | ||
262 144 tensor |
4 | 156,24 ₽ | 1,27 | Запустить | ||
262 144 tensor |
4 | 209,04 ₽ | 1,27 | Запустить | ||
262 144 |
1 | 223,04 ₽ | 1,07 | Запустить | ||
262 144 tensor |
4 | 264,96 ₽ | 1,27 | Запустить | ||
262 144 tensor |
4 | 328,96 ₽ | 1,27 | Запустить | ||
262 144 |
1 | 353,04 ₽ | 1,07 | Запустить | ||
262 144 |
1 | 367,41 ₽ | 1,44 | Запустить | ||
262 144 pipeline |
3 | 387,41 ₽ | 1,34 | Запустить | ||
262 144 |
1 | 423,04 ₽ | 2,68 | Запустить | ||
262 144 tensor |
4 | 513,04 ₽ | 2,12 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.