Llama 4 Scout — это самая легкая модель в новом поколении семейства Llama 4, выпущенном 5 апреля 2025 года. Llama 4 scout имеет архитектуру MoE 16 экспертами, 109 миллиардами параметров из которых постоянно активными являются только 17 миллиардов. Модель поддерживает нативную мультимодальность. Она способна одновременно обрабатывать на входе до 5 изображений плюс текст, что позволяет эффективно использовать её в задачах компьютерного зрения, таких как распознавание объектов, описание изображений и ответы на вопросы по изображениям. Генерация креативного текста, пошаговые рассуждения, программирование также относятся к сильным сторонам модели.
При этом Llama scout может эффективно работать всего на одном GPU H100, что делает ее привлекательной для локального развертывания, а за счет большего количества параметров Llama scout опережает на бенчмарках более легковесные модели в сегменте.
Но, пожалуй, самой главной фишкой модели является поддержка рекордного контекстного окна до 10 миллионов токенов! что делает модель идеально подходящей для работы с большими документами, кодом, многостраничными запросами и продолжительными диалоговыми сессиями.
| Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
250 000 |
32 | 131072 | 160 | 6 | 147,44 ₽ | Запустить | |
250 000 |
16 | 131072 | 160 | 4 | 156,24 ₽ | Запустить | |
250 000 |
16 | 131072 | 160 | 4 | 209,04 ₽ | Запустить | |
250 000 |
16 | 131072 | 160 | 1 | 242,04 ₽ | Запустить | |
250 000 |
16 | 98304 | 320 | 4 | 284,16 ₽ | Запустить | |
250 000 |
64 | 262144 | 320 | 3 | 347,52 ₽ | Запустить | |
250 000 |
16 | 98304 | 320 | 4 | 376,56 ₽ | Запустить | |
250 000 |
16 | 98304 | 160 | 3 | 387,41 ₽ | Запустить | |
250 000 |
16 | 131072 | 160 | 1 | 467,54 ₽ | Запустить | |
250 000 |
16 | 131072 | 160 | 1 | 623,04 ₽ | Запустить | |
10 485 760 |
44 | 720896 | 160 | 8 | 1 821,81 ₽ | Запустить | |
10 485 760 |
52 | 917504 | 640 | 6 | 3 732,67 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
250 000 |
24 | 262144 | 240 | 2 | 478,74 ₽ | Запустить | |
250 000 |
16 | 131072 | 240 | 1 | 623,81 ₽ | Запустить | |
250 000 |
44 | 262144 | 240 | 8 | 766,94 ₽ | Запустить | |
250 000 |
44 | 262144 | 240 | 6 | 791,74 ₽ | Запустить | |
250 000 |
24 | 262144 | 240 | 2 | 929,74 ₽ | Запустить | |
10 485 760 |
52 | 917504 | 640 | 6 | 3 732,67 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
250 000 |
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | |
250 000 |
16 | 32768 | 160 | 2 | 48,14 ₽ | Запустить | |
250 000 |
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | |
250 000 |
12 | 65536 | 160 | 2 | 61,37 ₽ | Запустить | |
250 000 |
16 | 24576 | 160 | 1 | 78,53 ₽ | Запустить | |
250 000 |
16 | 32768 | 160 | 1 | 103,04 ₽ | Запустить | |
250 000 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
250 000 |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
250 000 |
16 | 65536 | 160 | 3 | 127,37 ₽ | Запустить | |
250 000 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
250 000 |
16 | 65536 | 160 | 1 | 230,77 ₽ | Запустить | |
250 000 |
16 | 65536 | 160 | 1 | 456,27 ₽ | Запустить | |
250 000 |
16 | 131072 | 160 | 1 | 623,04 ₽ | Запустить | |
10 485 760 |
44 | 524288 | 160 | 8 | 1 788,02 ₽ | Запустить | |
10 485 760 |
32 | 786432 | 480 | 4 | 2 517,59 ₽ | Запустить | |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.