Ministral-3-14B-Reasoning-2512 — это флагманская модель в линейке Ministral 3, представляющая собой reasoning-вариант с пост-тренировкой, специально оптимизированный для решения сложных задач, требующих многошаговых рассуждений. Модель построена по модульной архитектуре, включающей два основных компонента: языковую модель с 13.5B параметров и визуальный энкодер с 0.4B параметров. Модель эффективно анализирует изображения и предоставляет выводы на основе визуального контента. Ключевой технической особенностью является применение метода Cascade Distillation — итеративной дистилляции и прунинга, позволившей получить модель из родительской Mistral Small 3.1 (24B) с сохранением высокого качества при сокращении размера более чем на 40%. Модель поддерживает десятки языков, демонстрирует строгое следование системным промптам и обладает хорошими агентными возможностями — встроенная поддержка вызова функций (function calling) и вывода в формате JSON. Контекстное окно в 256k токенов позволяет обрабатывать объёмные документы и вести продолжительные диалоги.
С точки зрения бенчмарков, Ministral-3-14B-Reasoning демонстрирует отличные результаты. На математических тестах AIME 2024 и AIME 2025 модель достигает 89.8% и 85.0% соответственно, что подтверждает её способность решать сложные олимпиадные задачи. В области научного мышления (GPQA Diamond) показатель составляет 71.2%, а в задачах на программирование (LiveCodeBench) — 64.6%. Согласно техническому отчёту, на момент выпуска, модель превосходит все известные аналоги сопоставимой размерности.
Разработчики рекомендуют при работе с изображениями поддерживать соотношение сторон, близкое к 1:1 (ширина/высота), избегая излишне узких или широких кадров — при необходимости изображения следует обрезать для оптимальной производительности. При многошаговых диалогах крайне важно сохранять цепочки рассуждений (reasoning traces) в контексте. Для большинства задач рекомендуется задавать системный промпт, определяющий порядок размышлений (пример от разработчиков https://huggingface.co/mistralai/Ministral-3-14B-Reasoning-2512/blob/main/SYSTEM_PROMPT.txt ) и устанавливать температуру сэмплирования 1, однако эксперименты вполне допустимы. При работе с инструментами следует ограничивать их набор минимально необходимым количеством, избегая перегрузки модели избыточным числом функций. Модель особенно эффективна в областях, связанных с математикой, программированием и других задачах, где требуется глубокое пошаговое рассуждение в связке с необходимостью анализировать изображения.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 pipeline |
3 | 119,81 ₽ | 1,20 | Запустить | ||
262 144 tensor |
4 | 144,97 ₽ | 1,68 | Запустить | ||
262 144 pipeline |
6 | 147,44 ₽ | 1,56 | Запустить | ||
262 144 pipeline |
3 | 204,41 ₽ | 1,20 | Запустить | ||
262 144 tensor |
4 | 209,04 ₽ | 1,68 | Запустить | ||
262 144 |
1 | 211,77 ₽ | 1,51 | Запустить | ||
262 144 pipeline |
3 | 252,41 ₽ | 1,20 | Запустить | ||
262 144 tensor |
4 | 257,77 ₽ | 1,68 | Запустить | ||
262 144 tensor |
2 | 261,77 ₽ | 1,09 | Запустить | ||
262 144 tensor |
4 | 321,77 ₽ | 1,68 | Запустить | ||
262 144 |
1 | 341,77 ₽ | 1,51 | Запустить | ||
262 144 |
1 | 367,41 ₽ | 1,82 | Запустить | ||
262 144 tensor |
2 | 411,81 ₽ | 3,25 | Запустить | ||
262 144 |
1 | 423,04 ₽ | 2,88 | Запустить | ||
262 144 tensor |
2 | 839,97 ₽ | 5,99 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 pipeline |
6 | 147,44 ₽ | 1,02 | Запустить | ||
262 144 tensor |
4 | 156,24 ₽ | 1,14 | Запустить | ||
262 144 tensor |
4 | 209,04 ₽ | 1,14 | Запустить | ||
262 144 tensor |
4 | 264,96 ₽ | 1,14 | Запустить | ||
262 144 tensor |
4 | 328,96 ₽ | 1,14 | Запустить | ||
262 144 |
1 | 367,41 ₽ | 1,28 | Запустить | ||
262 144 pipeline |
3 | 387,41 ₽ | 1,20 | Запустить | ||
262 144 tensor |
2 | 411,81 ₽ | 2,71 | Запустить | ||
262 144 |
1 | 423,04 ₽ | 2,34 | Запустить | ||
262 144 tensor |
2 | 439,97 ₽ | 2,71 | Запустить | ||
262 144 tensor |
4 | 513,04 ₽ | 1,86 | Запустить | ||
262 144 tensor |
2 | 699,97 ₽ | 2,71 | Запустить | ||
262 144 tensor |
2 | 839,97 ₽ | 5,45 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
262 144 pipeline |
6 | 312,70 ₽ | 1,57 | Запустить | ||
262 144 tensor |
2 | 411,81 ₽ | 2,18 | Запустить | ||
262 144 tensor |
8 | 411,97 ₽ | 2,52 | Запустить | ||
262 144 |
1 | 423,04 ₽ | 1,81 | Запустить | ||
262 144 tensor |
2 | 439,97 ₽ | 2,18 | Запустить | ||
262 144 tensor |
4 | 513,04 ₽ | 1,33 | Запустить | ||
262 144 pipeline |
6 | 520,97 ₽ | 1,57 | Запустить | ||
262 144 tensor |
8 | 670,97 ₽ | 2,52 | Запустить | ||
262 144 tensor |
2 | 699,97 ₽ | 2,18 | Запустить | ||
262 144 tensor |
2 | 729,47 ₽ | 2,81 | Запустить | ||
262 144 tensor |
2 | 839,97 ₽ | 4,92 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.