Llama 4 Scout — это самая легкая модель в новом поколении семейства Llama 4, выпущенном 5 апреля 2025 года. Llama 4 scout имеет архитектуру MoE 16 экспертами, 109 миллиардами параметров из которых постоянно активными являются только 17 миллиардов. Модель поддерживает нативную мультимодальность. Она способна одновременно обрабатывать на входе до 5 изображений плюс текст, что позволяет эффективно использовать её в задачах компьютерного зрения, таких как распознавание объектов, описание изображений и ответы на вопросы по изображениям. Генерация креативного текста, пошаговые рассуждения, программирование также относятся к сильным сторонам модели.
При этом Llama scout может эффективно работать всего на одном GPU H100, что делает ее привлекательной для локального развертывания, а за счет большего количества параметров Llama scout опережает на бенчмарках более легковесные модели в сегменте.
Но, пожалуй, самой главной фишкой модели является поддержка рекордного контекстного окна до 10 миллионов токенов! что делает модель идеально подходящей для работы с большими документами, кодом, многостраничными запросами и продолжительными диалоговыми сессиями.
| Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
250 000 pipeline |
32 | 131072 | 160 | 6 | 147,44 ₽ | Запустить | |
250 000 tensor |
16 | 131072 | 160 | 4 | 156,24 ₽ | Запустить | |
250 000 tensor |
16 | 131072 | 160 | 4 | 209,04 ₽ | Запустить | |
250 000 |
16 | 131072 | 160 | 1 | 223,04 ₽ | Запустить | |
250 000 tensor |
16 | 98304 | 320 | 4 | 284,16 ₽ | Запустить | |
250 000 pipeline |
64 | 262144 | 320 | 3 | 347,52 ₽ | Запустить | |
250 000 |
16 | 131072 | 160 | 1 | 353,04 ₽ | Запустить | |
250 000 |
16 | 98304 | 160 | 1 | 367,41 ₽ | Запустить | |
250 000 tensor |
16 | 98304 | 320 | 4 | 376,56 ₽ | Запустить | |
250 000 pipeline |
16 | 98304 | 160 | 3 | 387,41 ₽ | Запустить | |
250 000 tensor |
32 | 98304 | 160 | 4 | 388,21 ₽ | Запустить | |
250 000 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
250 000 tensor |
16 | 131072 | 160 | 4 | 513,04 ₽ | Запустить | |
10 485 760 tensor |
44 | 720896 | 160 | 8 | 1 669,81 ₽ | Запустить | |
10 485 760 pipeline |
52 | 917504 | 640 | 6 | 2 532,67 ₽ | Запустить | |
10 485 760 tensor |
52 | 1048576 | 640 | 8 | 3 335,19 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
250 000 |
16 | 131072 | 240 | 1 | 423,81 ₽ | Запустить | |
250 000 tensor |
24 | 262144 | 240 | 2 | 440,74 ₽ | Запустить | |
250 000 tensor |
24 | 262144 | 240 | 2 | 700,74 ₽ | Запустить | |
250 000 tensor |
24 | 196608 | 240 | 2 | 729,47 ₽ | Запустить | |
250 000 tensor |
44 | 262144 | 240 | 8 | 766,94 ₽ | Запустить | |
250 000 pipeline |
44 | 262144 | 240 | 6 | 791,74 ₽ | Запустить | |
250 000 tensor |
44 | 262144 | 240 | 8 | 1 031,74 ₽ | Запустить | |
10 485 760 pipeline |
52 | 917504 | 640 | 6 | 2 532,67 ₽ | Запустить | |
10 485 760 tensor |
52 | 1048576 | 640 | 8 | 3 335,19 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
250 000 |
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | |
250 000 tensor |
16 | 32768 | 160 | 2 | 48,14 ₽ | Запустить | |
250 000 tensor |
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | |
250 000 tensor |
12 | 65536 | 160 | 2 | 61,37 ₽ | Запустить | |
250 000 |
16 | 24576 | 160 | 1 | 78,53 ₽ | Запустить | |
250 000 |
16 | 32768 | 160 | 1 | 103,04 ₽ | Запустить | |
250 000 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
250 000 tensor |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
250 000 pipeline |
16 | 65536 | 160 | 3 | 127,37 ₽ | Запустить | |
250 000 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
250 000 tensor |
16 | 65536 | 160 | 4 | 162,57 ₽ | Запустить | |
250 000 |
16 | 65536 | 160 | 1 | 211,77 ₽ | Запустить | |
250 000 |
16 | 65536 | 160 | 1 | 341,77 ₽ | Запустить | |
250 000 |
16 | 98304 | 160 | 1 | 367,41 ₽ | Запустить | |
250 000 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
10 485 760 tensor |
44 | 524288 | 160 | 8 | 1 636,02 ₽ | Запустить | |
10 485 760 tensor |
32 | 786432 | 480 | 4 | 1 717,59 ₽ | Запустить | |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.