ERNIE-4.5-VL-28B-A3B-PT представляет собой мультимодальную модель семейства ERNIE 4.5, построенную на базе гетерогенной архитектуры Mixture-of-Experts. Модель содержит 28 миллиардов общих параметров, из которых только 3 миллиарда активируются при каждом проходе, что обеспечивает высокую эффективность инференса. Ключевая инновация — раздельные экспертов на отдельные группы для текстовых и визуальных модальностей при сохранении общих экспертов и слоев self-attention для кросс-модального взаимодействия. Модель оснащена адаптивным vision-энкодером, который обрабатывает изображения произвольного разрешения без искажения пропорций, сохраняя оригинальное соотношение сторон. Для видео применяется адаптивная стратегия выборки кадров с рендерингом временных меток непосредственно на кадрах, что обеспечивает точное временное понимание. Модель поддерживает контекстное окно до 131,072 токенов, что позволяет работать с довольно длинными документами и видео.
Модель поддерживает два режима работы (thinking и non-thinking), что делает её универсальной для различных задач: thinking-режим усиливает рассуждения на сложных визуальных задачах (STEM, математика, головоломки), в то время как non-thinking обеспечивает быструю обработку простых оперативных задач. По сравнению с флагманской ERNIE-4.5-VL-424B-A47B, компактная версия 28B-A3B демонстрирует лишь незначительное снижение качества при радикальном сокращении вычислительных требований.
Мультимодальные возможности модели обеспечивают ей широкий спектр практических применений: высокие результаты на OCRBench (885) и DocVQA (94.1) свидетельствуют о ее эффективности в обработке сканов, счётов и форм; высокие показатели на ChartQA (82.2) и TableVQA (70.0) позволяют использовать модель для анализа графиков и таблиц в финансовых и научных данных; возможности анализа видео (MVBench 72.0, VideoMME 74.4, LongVideoBench 62.1) могут быть полезны в рамках систем безопасности; а точный подсчёт объектов (CountBench 87.6) и визуальное восприятие (RealWorldQA 69.2) найдут применение в ритейле для инвентаризации и визуального поиска. Модель доступна под лицензией Apache 2.0 и тем самым может быть без ограничений использоваться в коммерческих проектах.
| Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
131 072 tensor |
16 | 32768 | 160 | 2 | 48,14 ₽ | Запустить | |
131 072 tensor |
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | |
131 072 pipeline |
12 | 24576 | 120 | 3 | 74,84 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 83,37 ₽ | Запустить | |
131 072 tensor |
16 | 32768 | 160 | 4 | 99,74 ₽ | Запустить | |
131 072 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 149,37 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 4 | 162,57 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 195,57 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 211,77 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 341,77 ₽ | Запустить | |
131 072 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
131 072 pipeline |
32 | 65536 | 160 | 3 | 78,57 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 83,37 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 4 | 85,77 ₽ | Запустить | |
131 072 pipeline |
32 | 131072 | 160 | 3 | 94,64 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
131 072 tensor |
32 | 131072 | 160 | 4 | 112,24 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 149,37 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 195,57 ₽ | Запустить | |
131 072 tensor |
16 | 65535 | 240 | 2 | 198,54 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 211,77 ₽ | Запустить | |
131 072 tensor |
16 | 65536 | 160 | 2 | 261,77 ₽ | Запустить | |
131 072 |
16 | 65536 | 160 | 1 | 341,77 ₽ | Запустить | |
131 072 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
131 072 pipeline |
32 | 131072 | 160 | 6 | 147,44 ₽ | Запустить | |
131 072 tensor |
16 | 131072 | 160 | 4 | 156,24 ₽ | Запустить | |
131 072 tensor |
16 | 131072 | 160 | 4 | 209,04 ₽ | Запустить | |
131 072 |
16 | 131072 | 160 | 1 | 223,04 ₽ | Запустить | |
131 072 tensor |
16 | 98304 | 320 | 4 | 284,16 ₽ | Запустить | |
131 072 pipeline |
64 | 262144 | 320 | 3 | 347,52 ₽ | Запустить | |
131 072 |
16 | 131072 | 160 | 1 | 353,04 ₽ | Запустить | |
131 072 tensor |
16 | 98304 | 320 | 4 | 376,56 ₽ | Запустить | |
131 072 pipeline |
16 | 98304 | 160 | 3 | 387,41 ₽ | Запустить | |
131 072 tensor |
32 | 98304 | 160 | 4 | 388,21 ₽ | Запустить | |
131 072 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
131 072 tensor |
16 | 131072 | 160 | 4 | 513,04 ₽ | Запустить | |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.