Llama 4 Scout — это самая легкая модель в новом поколении семейства Llama 4, выпущенном 5 апреля 2025 года. Llama 4 scout имеет архитектуру MoE 16 экспертами, 109 миллиардами параметров из которых постоянно активными являются только 17 миллиардов. Модель поддерживает нативную мультимодальность. Она способна одновременно обрабатывать на входе до 5 изображений плюс текст, что позволяет эффективно использовать её в задачах компьютерного зрения, таких как распознавание объектов, описание изображений и ответы на вопросы по изображениям. Генерация креативного текста, пошаговые рассуждения, программирование также относятся к сильным сторонам модели.
При этом Llama scout может эффективно работать всего на одном GPU H100, что делает ее привлекательной для локального развертывания, а за счет большего количества параметров Llama scout опережает на бенчмарках более легковесные модели в сегменте.
Но, пожалуй, самой главной фишкой модели является поддержка рекордного контекстного окна до 10 миллионов токенов! что делает модель идеально подходящей для работы с большими документами, кодом, многостраничными запросами и продолжительными диалоговыми сессиями.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
250 000 pipeline |
6 | 147,44 ₽ | 1,11 | Запустить | ||
250 000 tensor |
4 | 156,24 ₽ | 1,47 | Запустить | ||
250 000 tensor |
4 | 209,04 ₽ | 1,47 | Запустить | ||
250 000 |
1 | 223,04 ₽ | 0,97 | Запустить | ||
250 000 tensor |
4 | 264,96 ₽ | 1,47 | Запустить | ||
250 000 tensor |
4 | 328,96 ₽ | 1,47 | Запустить | ||
250 000 pipeline |
3 | 347,52 ₽ | 1,65 | Запустить | ||
250 000 |
1 | 353,04 ₽ | 0,97 | Запустить | ||
250 000 |
1 | 367,41 ₽ | 1,89 | Запустить | ||
250 000 pipeline |
3 | 387,41 ₽ | 1,65 | Запустить | ||
250 000 tensor |
4 | 388,21 ₽ | 3,57 | Запустить | ||
250 000 |
1 | 423,04 ₽ | 4,98 | Запустить | ||
250 000 tensor |
4 | 513,04 ₽ | 3,57 | Запустить | ||
10 485 760 tensor |
8 | 1 669,81 ₽ | 1,04 | Запустить | ||
10 485 760 pipeline |
6 | 2 532,67 ₽ | 1,43 | Запустить | ||
10 485 760 tensor |
8 | 3 335,19 ₽ | 1,95 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
250 000 |
1 | 423,81 ₽ | 1,50 | Запустить | ||
250 000 tensor |
2 | 440,74 ₽ | 74,86 | 2,56 | Запустить | |
250 000 tensor |
8 | 671,74 ₽ | 49,91 | 3,57 | Запустить | |
250 000 tensor |
2 | 700,74 ₽ | 68,07 | 2,56 | Запустить | |
250 000 tensor |
2 | 729,47 ₽ | 4,40 | Запустить | ||
250 000 pipeline |
6 | 791,74 ₽ | 3,93 | Запустить | ||
250 000 tensor |
8 | 1 031,74 ₽ | 7,78 | Запустить | ||
10 485 760 pipeline |
6 | 2 532,67 ₽ | 1,33 | Запустить | ||
10 485 760 tensor |
8 | 3 335,19 ₽ | 1,85 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
250 000 tensor |
4 | 818,68 ₽ | 4,45 | Запустить | ||
250 000 tensor |
2 | 841,52 ₽ | 2,32 | Запустить | ||
250 000 pipeline |
3 | 1 105,60 ₽ | 2,13 | Запустить | ||
250 000 tensor |
4 | 1 338,68 ₽ | 4,45 | Запустить | ||
250 000 tensor |
4 | 1 450,00 ₽ | 8,13 | Запустить | ||
10 485 760 pipeline |
6 | 2 532,67 ₽ | 1,10 | Запустить | ||
10 485 760 tensor |
8 | 3 335,19 ₽ | 1,61 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.