ERNIE-4.5-VL-28B-A3B-PT представляет собой мультимодальную модель семейства ERNIE 4.5, построенную на базе гетерогенной архитектуры Mixture-of-Experts. Модель содержит 28 миллиардов общих параметров, из которых только 3 миллиарда активируются при каждом проходе, что обеспечивает высокую эффективность инференса. Ключевая инновация — раздельные экспертов на отдельные группы для текстовых и визуальных модальностей при сохранении общих экспертов и слоев self-attention для кросс-модального взаимодействия. Модель оснащена адаптивным vision-энкодером, который обрабатывает изображения произвольного разрешения без искажения пропорций, сохраняя оригинальное соотношение сторон. Для видео применяется адаптивная стратегия выборки кадров с рендерингом временных меток непосредственно на кадрах, что обеспечивает точное временное понимание. Модель поддерживает контекстное окно до 131,072 токенов, что позволяет работать с довольно длинными документами и видео.
Модель поддерживает два режима работы (thinking и non-thinking), что делает её универсальной для различных задач: thinking-режим усиливает рассуждения на сложных визуальных задачах (STEM, математика, головоломки), в то время как non-thinking обеспечивает быструю обработку простых оперативных задач. По сравнению с флагманской ERNIE-4.5-VL-424B-A47B, компактная версия 28B-A3B демонстрирует лишь незначительное снижение качества при радикальном сокращении вычислительных требований.
Мультимодальные возможности модели обеспечивают ей широкий спектр практических применений: высокие результаты на OCRBench (885) и DocVQA (94.1) свидетельствуют о ее эффективности в обработке сканов, счётов и форм; высокие показатели на ChartQA (82.2) и TableVQA (70.0) позволяют использовать модель для анализа графиков и таблиц в финансовых и научных данных; возможности анализа видео (MVBench 72.0, VideoMME 74.4, LongVideoBench 62.1) могут быть полезны в рамках систем безопасности; а точный подсчёт объектов (CountBench 87.6) и визуальное восприятие (RealWorldQA 69.2) найдут применение в ритейле для инвентаризации и визуального поиска. Модель доступна под лицензией Apache 2.0 и тем самым может быть без ограничений использоваться в коммерческих проектах.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 tensor |
2 | 48,14 ₽ | 1,47 | Запустить | ||
131 072 tensor |
2 | 51,34 ₽ | 1,47 | Запустить | ||
131 072 pipeline |
3 | 74,84 ₽ | 1,24 | Запустить | ||
131 072 tensor |
2 | 83,37 ₽ | 3,53 | Запустить | ||
131 072 tensor |
4 | 99,74 ₽ | 2,30 | Запустить | ||
131 072 |
1 | 107,57 ₽ | 1,83 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 3,53 | Запустить | ||
131 072 tensor |
2 | 139,77 ₽ | 3,53 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 1,83 | Запустить | ||
131 072 tensor |
4 | 162,57 ₽ | 1,79 | Запустить | ||
131 072 tensor |
2 | 171,77 ₽ | 3,53 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 8,00 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 8,00 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 9,80 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 15,84 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 pipeline |
3 | 78,57 ₽ | 1,24 | Запустить | ||
131 072 tensor |
2 | 83,37 ₽ | 1,60 | Запустить | ||
131 072 tensor |
4 | 85,77 ₽ | 2,94 | Запустить | ||
131 072 pipeline |
3 | 94,64 ₽ | 1,24 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 1,60 | Запустить | ||
131 072 tensor |
4 | 112,24 ₽ | 2,94 | Запустить | ||
131 072 tensor |
2 | 139,77 ₽ | 1,60 | Запустить | ||
131 072 tensor |
2 | 171,77 ₽ | 1,60 | Запустить | ||
131 072 tensor |
2 | 198,54 ₽ | 3,66 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 6,07 | Запустить | ||
131 072 tensor |
2 | 261,77 ₽ | 3,66 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 6,07 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 7,87 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 13,91 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 pipeline |
6 | 147,44 ₽ | 1,79 | Запустить | ||
131 072 tensor |
4 | 156,24 ₽ | 2,51 | Запустить | ||
131 072 tensor |
4 | 209,04 ₽ | 2,51 | Запустить | ||
131 072 |
1 | 223,04 ₽ | 1,52 | Запустить | ||
131 072 tensor |
4 | 264,96 ₽ | 2,51 | Запустить | ||
131 072 tensor |
4 | 328,96 ₽ | 2,51 | Запустить | ||
131 072 pipeline |
3 | 347,52 ₽ | 2,87 | Запустить | ||
131 072 |
1 | 353,04 ₽ | 1,52 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 3,32 | Запустить | ||
131 072 pipeline |
3 | 387,41 ₽ | 2,87 | Запустить | ||
131 072 tensor |
4 | 388,21 ₽ | 6,62 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 9,37 | Запустить | ||
131 072 tensor |
4 | 513,04 ₽ | 6,62 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.