ERNIE-4.5-VL-28B-A3B-PT представляет собой мультимодальную модель семейства ERNIE 4.5, построенную на базе гетерогенной архитектуры Mixture-of-Experts. Модель содержит 28 миллиардов общих параметров, из которых только 3 миллиарда активируются при каждом проходе, что обеспечивает высокую эффективность инференса. Ключевая инновация — раздельные экспертов на отдельные группы для текстовых и визуальных модальностей при сохранении общих экспертов и слоев self-attention для кросс-модального взаимодействия. Модель оснащена адаптивным vision-энкодером, который обрабатывает изображения произвольного разрешения без искажения пропорций, сохраняя оригинальное соотношение сторон. Для видео применяется адаптивная стратегия выборки кадров с рендерингом временных меток непосредственно на кадрах, что обеспечивает точное временное понимание. Модель поддерживает контекстное окно до 131,072 токенов, что позволяет работать с довольно длинными документами и видео.
Модель поддерживает два режима работы (thinking и non-thinking), что делает её универсальной для различных задач: thinking-режим усиливает рассуждения на сложных визуальных задачах (STEM, математика, головоломки), в то время как non-thinking обеспечивает быструю обработку простых оперативных задач. По сравнению с флагманской ERNIE-4.5-VL-424B-A47B, компактная версия 28B-A3B демонстрирует лишь незначительное снижение качества при радикальном сокращении вычислительных требований.
Мультимодальные возможности модели обеспечивают ей широкий спектр практических применений: высокие результаты на OCRBench (885) и DocVQA (94.1) свидетельствуют о ее эффективности в обработке сканов, счётов и форм; высокие показатели на ChartQA (82.2) и TableVQA (70.0) позволяют использовать модель для анализа графиков и таблиц в финансовых и научных данных; возможности анализа видео (MVBench 72.0, VideoMME 74.4, LongVideoBench 62.1) могут быть полезны в рамках систем безопасности; а точный подсчёт объектов (CountBench 87.6) и визуальное восприятие (RealWorldQA 69.2) найдут применение в ритейле для инвентаризации и визуального поиска. Модель доступна под лицензией Apache 2.0 и тем самым может быть без ограничений использоваться в коммерческих проектах.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 tensor |
2 | 48,14 ₽ | 1,18 | Запустить | ||
131 072 tensor |
2 | 51,34 ₽ | 1,19 | Запустить | ||
131 072 pipeline |
3 | 74,84 ₽ | 1,03 | Запустить | ||
131 072 tensor |
2 | 83,37 ₽ | 3,27 | Запустить | ||
131 072 tensor |
4 | 99,74 ₽ | 2,19 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 3,27 | Запустить | ||
131 072 tensor |
2 | 139,77 ₽ | 3,55 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 1,83 | Запустить | ||
131 072 tensor |
4 | 162,57 ₽ | 1,69 | Запустить | ||
131 072 tensor |
2 | 171,77 ₽ | 3,54 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 8,13 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 8,12 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 9,95 | Запустить | ||
131 072 tensor |
2 | 411,81 ₽ | 18,19 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 16,09 | Запустить | ||
131 072 tensor |
2 | 839,97 ₽ | 34,10 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 tensor |
2 | 83,37 ₽ | 1,34 | Запустить | ||
131 072 tensor |
4 | 85,77 ₽ | 2,37 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 1,34 | Запустить | ||
131 072 tensor |
4 | 112,24 ₽ | 2,39 | Запустить | ||
131 072 tensor |
2 | 139,77 ₽ | 1,62 | Запустить | ||
131 072 tensor |
2 | 171,77 ₽ | 1,61 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 6,20 | Запустить | ||
131 072 tensor |
2 | 261,77 ₽ | 3,67 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 6,19 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 8,02 | Запустить | ||
131 072 tensor |
2 | 411,81 ₽ | 16,26 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 14,16 | Запустить | ||
131 072 tensor |
2 | 839,97 ₽ | 32,17 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 tensor |
4 | 156,24 ₽ | 1,99 | Запустить | ||
131 072 tensor |
4 | 209,04 ₽ | 1,99 | Запустить | ||
131 072 |
1 | 223,04 ₽ | 1,65 | Запустить | ||
131 072 tensor |
4 | 264,96 ₽ | 2,55 | Запустить | ||
131 072 tensor |
4 | 328,96 ₽ | 2,53 | Запустить | ||
131 072 |
1 | 353,04 ₽ | 1,64 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 3,47 | Запустить | ||
131 072 pipeline |
3 | 387,41 ₽ | 2,28 | Запустить | ||
131 072 tensor |
2 | 411,81 ₽ | 11,71 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 9,61 | Запустить | ||
131 072 tensor |
4 | 513,04 ₽ | 6,65 | Запустить | ||
131 072 tensor |
2 | 839,97 ₽ | 27,63 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.