Продукты

Облачные серверы

Облачные серверы с посекундной тарификацией. Изолированные ресурсы дадут максимальную производительность для вашего проекта.

GPU-серверы

Облачные серверы с современными графическими ускорителями RTX и Tesla для игр, рендеринга, стриминга, работы с 3Д-графикой, искусственным интеллектом.

Tesla H200

Tesla H100

RTX 5090

RTX 4090

RTX 3090

RTX 3080

Tesla A100

RTX A5000

Tesla A10

RTX 2080 Ti

Tesla A2

Tesla T4

Tesla V100

Все GPU-серверы

CPU-серверы

Облачные серверы с высокопроизводительными центральными процессорами Intel Xeon Gold второго и третьего поколений, доступные на 100% процессорного времени.
SSD-серверы NVMe-серверы
Все CPU-серверы

Выделенные серверы

Арендуйте физически выделенный сервер на длительный срок с помесячной оплатой. Собрерите конфигурацию с использованием современных комлектующих: процессоров Intel Xeon Gold 2-го и 3-го поколений, до 10 новейших видеоускорителей RTX и Tesla и до 8192 ГБ RAM на сервер, SSD- и NVMe-дисков для дата-центров.

Выбрать выделенный сервер

Маркетплейс

Используйте популярные и современные приложения в качестве эффективных инструментов для организации вашего проекта. Экономьте время с помощью предварительно настроенных образов, в которых уже установлены все необходимые компоненты.

Забудьте про ручную загрузку и установку программного обеспечения — просто разверните виртуальный сервер с готовым образом.
Нейронные сети 3D CUDA Docker / NGC Для игр Windows-образы Linux-образы
Все предустановленные образы
Возможности
Тарифы
FAQ
Контакты
Вход

Llama 4 Maverick

мультимодальная

русскоязычная

Llama 4 Maverick — это универсальная модель в новом поколении семейства Llama 4, вышедшем в апреле 2025 года. В отличие от более компактного Scout, Maverick создан для тех, кому требуется максимальная производительность и вычислительная мощность. Модель использует архитектуру MoE с 128 экспертами, имеет 400 миллиардов параметров в общей сложности – это делает ее одной из самых масштабных открытых моделей на рынке. Однако на каждом шаге активными являются только 17 миллиардов параметров, что существенно уменьшает задержки на выводе и снижает требования по ресурсам. Как и все модели серии Maverik поддерживает нативную мультимодальность, что позволяет легко подавать на вход и обрабатывать изображения совместно с текстом поддержка изображений.
Благодаря своей масштабной архитектуре Maverick предлагает последовательность и глубину рассуждений, точность и безопасность ответов. Модель демонстрирует достойные результаты в сложных задачах логического мышления, математики и программирования, опережая предыдущие поколения LLM и основных конкурентов по ряду ключевых метрик.
В состав модели входят передовые разработки для обеспечения безопасности: Llama Guard 4 (12B) — для фильтрации небезопасного контента и Llama Prompt Guard 2 (22M и 86M) — для защиты от манипулятивных или вредоносных входных данных.

Llama 4 Maverick идеально подходит для сложных корпоративных решений и масштабных проектов, где требуется глубокое понимание и точное исполнение задач.

Дата анонса: 05.04.2025
Параметров: 402B
Экспертов: 128
Активно параметров при инференсе: 17B
Контекст: 1M
Слоев: 48, с полным вниманием: 12
Тип внимания: Chunked Attention
Потребление памяти: 268.9 ГБ в точности 4 бит
Разработчик: Meta AI
Версия Transformers: 4.51.0
Лицензия: LLAMA 4

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами бесплатно для теста инференса и знакомства с Llama 4 Maverick. Получить токен для доступа к API вы можете на странице управления токенами после регистрации и верификации.

Наименование модели	Контекст	Тип	GPU	TPS	Статус	Ссылка


        Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

получить максимальную производительность эндпоинта,
получить полный контекст для обработки больших запросов и диалогов,
обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации для хостинга Llama 4 Maverick

Цены:

Наименование	vCPU	ОЗУ, МБ	Диск, ГБ	GPU	Цена, час	Цена, месяц
teslaa100-4.16.256.480 250 000	16	262144	480	4	894,68 ₽	644 169,60 ₽	Запустить
teslaa100-4.32.384.320.nvlink 1 048 576	32	393216	320	4	924,44 ₽	665 596,80 ₽	Запустить
h200-2.24.256.320 250 000	24	262144	320	2	1 241,52 ₽	893 894,40 ₽	Запустить
teslah100-4.16.256.480 250 000	16	262144	480	4	1 796,68 ₽	1 293 609,60 ₽	Запустить
teslah100-4.44.512.320 1 048 576	44	524288	320	4	1 855,57 ₽	1 336 010,40 ₽	Запустить
h200-3.32.512.480 1 048 576	32	524288	480	3	1 882,53 ₽	1 355 421,60 ₽	Запустить

Цены:

Наименование	vCPU	ОЗУ, МБ	Диск, ГБ	GPU	Цена, час	Цена, месяц
teslaa100-6.44.512.480.nvlink 250 000	44	524288	480	6	1 373,13 ₽	988 653,60 ₽	Запустить
teslaa100-8.44.512.480.nvlink 1 048 576	44	524288	480	8	1 791,13 ₽	1 289 613,60 ₽	Запустить
h200-4.32.768.480 1 048 576	32	786432	480	4	2 517,59 ₽	1 812 664,80 ₽	Запустить

Цены:

Наименование	vCPU	ОЗУ, МБ	Диск, ГБ	GPU	Цена, час	Цена, месяц
teslaa10-1.16.32.160 250 000	16	32768	160	1	46,94 ₽	33 796,80 ₽	Запустить
teslat4-2.16.32.160 250 000	16	32768	160	2	48,14 ₽	34 660,80 ₽	Запустить
teslaa2-2.16.32.160 250 000	16	32768	160	2	51,34 ₽	36 964,80 ₽	Запустить
rtx2080ti-2.12.64.160 250 000	12	65536	160	2	61,37 ₽	44 186,40 ₽	Запустить
rtx3090-1.16.24.160 250 000	16	24576	160	1	78,53 ₽	56 541,60 ₽	Запустить
rtx4090-1.16.32.160 250 000	16	32768	160	1	103,04 ₽	74 188,80 ₽	Запустить
teslav100-1.12.64.160 250 000	12	65536	160	1	107,57 ₽	77 450,40 ₽	Запустить
rtxa5000-2.16.64.160.nvlink 250 000	16	65536	160	2	109,77 ₽	79 034,40 ₽	Запустить
teslaa10-3.16.96.160 1 048 576	16	98304	160	3	119,81 ₽	86 263,20 ₽	Запустить
rtx3080-3.16.64.160 250 000	16	65536	160	3	127,37 ₽	91 706,40 ₽	Запустить
rtx5090-1.16.64.160 250 000	16	65536	160	1	141,77 ₽	102 074,40 ₽	Запустить
teslaa2-6.32.128.160 1 048 576	32	131072	160	6	147,44 ₽	106 156,80 ₽	Запустить
teslav100-2.16.64.240 1 048 576	16	65535	240	2	198,54 ₽	142 948,80 ₽	Запустить
rtxa5000-4.16.128.160.nvlink 1 048 576	16	131072	160	4	209,04 ₽	150 508,80 ₽	Запустить
rtx3090-3.16.96.160 1 048 576	16	98304	160	3	218,81 ₽	157 543,20 ₽	Запустить
teslaa100-1.16.64.160 1 048 576	16	65536	160	1	230,77 ₽	166 154,40 ₽	Запустить
rtx5090-2.16.64.160 1 048 576	16	65536	160	2	261,77 ₽	188 474,40 ₽	Запустить
rtx4090-3.16.96.160 1 048 576	16	98304	160	3	288,11 ₽	207 439,20 ₽	Запустить
teslah100-1.16.64.160 1 048 576	16	65536	160	1	456,27 ₽	328 514,40 ₽	Запустить
h200-1.16.128.160 1 048 576	16	131072	160	1	623,04 ₽	448 588,80 ₽	Запустить

Связанные модели

Llama 4 Scout

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.