Llama 4 Maverick — это универсальная модель в новом поколении семейства Llama 4, вышедшем в апреле 2025 года. В отличие от более компактного Scout, Maverick создан для тех, кому требуется максимальная производительность и вычислительная мощность. Модель использует архитектуру MoE с 128 экспертами, имеет 400 миллиардов параметров в общей сложности – это делает ее одной из самых масштабных открытых моделей на рынке. Однако на каждом шаге активными являются только 17 миллиардов параметров, что существенно уменьшает задержки на выводе и снижает требования по ресурсам. Как и все модели серии Maverik поддерживает нативную мультимодальность, что позволяет легко подавать на вход и обрабатывать изображения совместно с текстом поддержка изображений.
Благодаря своей масштабной архитектуре Maverick предлагает последовательность и глубину рассуждений, точность и безопасность ответов. Модель демонстрирует достойные результаты в сложных задачах логического мышления, математики и программирования, опережая предыдущие поколения LLM и основных конкурентов по ряду ключевых метрик.
В состав модели входят передовые разработки для обеспечения безопасности: Llama Guard 4 (12B) — для фильтрации небезопасного контента и Llama Prompt Guard 2 (22M и 86M) — для защиты от манипулятивных или вредоносных входных данных.
Llama 4 Maverick идеально подходит для сложных корпоративных решений и масштабных проектов, где требуется глубокое понимание и точное исполнение задач.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
250 000 tensor |
4 | 818,68 ₽ | 67,50 | 4,53 | Запустить | |
250 000 tensor |
2 | 841,52 ₽ | 2,39 | Запустить | ||
1 048 576 tensor |
4 | 848,44 ₽ | 67,50 | 1,23 | Запустить | |
250 000 pipeline |
3 | 1 105,60 ₽ | 2,21 | Запустить | ||
1 048 576 pipeline |
3 | 1 282,53 ₽ | 3,13 | Запустить | ||
250 000 tensor |
4 | 1 338,68 ₽ | 54,46 | 4,53 | Запустить | |
1 048 576 tensor |
4 | 1 397,57 ₽ | 54,46 | 1,23 | Запустить | |
1 048 576 tensor |
4 | 1 450,00 ₽ | 2,24 | Запустить | ||
1 048 576 tensor |
4 | 1 717,59 ₽ | 5,60 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
250 000 pipeline |
6 | 1 259,13 ₽ | 2,11 | Запустить | ||
1 048 576 tensor |
8 | 1 639,13 ₽ | 3,34 | Запустить | ||
1 048 576 tensor |
4 | 1 717,59 ₽ | 2,18 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
1 048 576 tensor |
8 | 3 338,30 ₽ | 3,83 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.