Llama 4 Scout — это самая легкая модель в новом поколении семейства Llama 4, выпущенном 5 апреля 2025 года. Llama 4 scout имеет архитектуру MoE 16 экспертами, 109 миллиардами параметров из которых постоянно активными являются только 17 миллиардов. Модель поддерживает нативную мультимодальность. Она способна одновременно обрабатывать на входе до 5 изображений плюс текст, что позволяет эффективно использовать её в задачах компьютерного зрения, таких как распознавание объектов, описание изображений и ответы на вопросы по изображениям. Генерация креативного текста, пошаговые рассуждения, программирование также относятся к сильным сторонам модели.
При этом Llama scout может эффективно работать всего на одном GPU H100, что делает ее привлекательной для локального развертывания, а за счет большего количества параметров Llama scout опережает на бенчмарках более легковесные модели в сегменте.
Но, пожалуй, самой главной фишкой модели является поддержка рекордного контекстного окна до 10 миллионов токенов! что делает модель идеально подходящей для работы с большими документами, кодом, многостраничными запросами и продолжительными диалоговыми сессиями.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
250 000 tensor |
4 | 264,96 ₽ | 1,26 | Запустить | ||
250 000 pipeline |
6 | 312,70 ₽ | 3,52 | Запустить | ||
250 000 tensor |
4 | 328,96 ₽ | 1,25 | Запустить | ||
250 000 |
1 | 367,41 ₽ | 1,90 | Запустить | ||
250 000 pipeline |
3 | 387,41 ₽ | 1,49 | Запустить | ||
250 000 tensor |
2 | 411,81 ₽ | 6,06 | Запустить | ||
250 000 tensor |
8 | 411,97 ₽ | 6,06 | Запустить | ||
250 000 |
1 | 423,04 ₽ | 5,04 | Запустить | ||
250 000 tensor |
2 | 439,97 ₽ | 6,06 | Запустить | ||
250 000 tensor |
4 | 513,04 ₽ | 3,35 | Запустить | ||
250 000 tensor |
2 | 699,97 ₽ | 61,60 | 6,05 | Запустить | |
250 000 tensor |
2 | 839,97 ₽ | 14,19 | Запустить | ||
10 485 760 tensor |
8 | 1 669,81 ₽ | 1,04 | Запустить | ||
10 485 760 pipeline |
6 | 2 532,67 ₽ | 1,44 | Запустить | ||
10 485 760 tensor |
8 | 2 804,12 ₽ | 1,04 | Запустить | ||
10 485 760 tensor |
8 | 3 335,19 ₽ | 1,96 | Запустить | ||
10 485 760 tensor |
8 | 3 335,19 ₽ | 1,96 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
250 000 |
1 | 423,81 ₽ | 1,56 | Запустить | ||
250 000 tensor |
2 | 440,74 ₽ | 74,86 | 2,58 | Запустить | |
250 000 tensor |
2 | 441,52 ₽ | 2,58 | Запустить | ||
250 000 tensor |
8 | 539,21 ₽ | 3,15 | Запустить | ||
250 000 tensor |
8 | 671,74 ₽ | 3,12 | Запустить | ||
250 000 tensor |
2 | 700,74 ₽ | 68,07 | 2,57 | Запустить | |
250 000 tensor |
2 | 729,47 ₽ | 4,44 | Запустить | ||
250 000 pipeline |
6 | 791,74 ₽ | 3,60 | Запустить | ||
250 000 tensor |
2 | 840,74 ₽ | 10,71 | Запустить | ||
250 000 tensor |
8 | 1 031,74 ₽ | 7,33 | Запустить | ||
10 485 760 pipeline |
6 | 2 532,67 ₽ | 1,34 | Запустить | ||
10 485 760 tensor |
8 | 3 335,19 ₽ | 1,86 | Запустить | ||
10 485 760 tensor |
8 | 3 335,19 ₽ | 1,86 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
250 000 tensor |
4 | 818,68 ₽ | 5,56 | Запустить | ||
250 000 tensor |
2 | 841,52 ₽ | 3,52 | Запустить | ||
250 000 tensor |
2 | 841,52 ₽ | 3,52 | Запустить | ||
250 000 tensor |
4 | 848,44 ₽ | 5,56 | Запустить | ||
250 000 pipeline |
3 | 1 105,60 ₽ | 3,26 | Запустить | ||
250 000 tensor |
4 | 1 338,68 ₽ | 5,54 | Запустить | ||
250 000 tensor |
4 | 1 450,00 ₽ | 9,27 | Запустить | ||
10 485 760 pipeline |
6 | 2 532,67 ₽ | 1,14 | Запустить | ||
10 485 760 tensor |
8 | 3 335,19 ₽ | 1,66 | Запустить | ||
10 485 760 tensor |
8 | 3 335,19 ₽ | 1,66 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.