Qwen2.5-VL-7B представляет собой оптимальный баланс между производительностью и вычислительными требованиями, устанавливая новые стандарты в качестве обработки мультимодальных данных. Революционная система MRoPE (Multimodal Rotary Position Embedding) с выравниванием по абсолютному времени позволяет модели изучать темпоральную динамику и скорость событий через интервалы между временными измерениями без дополнительных вычислительных затрат. Архитектурные инновации 7B модели включают усовершенствованный Vision Transformer с комбинацией полного внимания и window attention, где только 4 слоя используют полное внимание, а остальные применяют оконное внимание с максимальным размером окна 112×112. Это обеспечивает линейное масштабирование вычислительных затрат и позволяет модели нативно обрабатывать изображения любого разрешения. Динамическая обработка FPS для видео расширяет возможности модели на временное измерение, обеспечивая точную локализацию событий.
Производительность 7B модели впечатляет: 58.6% на MMMU, 95.7% на DocVQA, 84.9% на TextVQA и 68.2% на MathVista, что превосходит многие модели сопоставимого размера. В области агентских задач модель демонстрирует выдающиеся результаты: 84.7% на ScreenSpot, 81.9% на AITZ и 91.4% на MobileMiniWob++, подтверждая ее способность эффективно взаимодействовать с графическими интерфейсами. Особенно впечатляющими являются возможности видеопонимания, где модель достигает 69.6% на MVBench и 70.5% на PerceptionTest.
Сценарии применения модели охватывают профессиональные системы автоматизации документооборота, интеллектуальные системы видеонаблюдения с анализом поведения, образовательные платформы с интерактивным мультимедийным контентом и корпоративные решения для анализа больших объемов визуальных данных. Модель идеально подходит для развертывания в облачных сервисах, где требуется высокое качество обработки при разумных вычислительных затратах, а также для локальных серверов в средних и крупных организациях. Благодаря превосходным OCR возможностям, модель становится незаменимой для финтех-приложений, систем обработки счетов и автоматизации бухгалтерских процессов.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
128 000 |
1 | 46,94 ₽ | 1,79 | Запустить | ||
128 000 tensor |
2 | 48,14 ₽ | 2,48 | Запустить | ||
128 000 tensor |
2 | 51,34 ₽ | 2,48 | Запустить | ||
128 000 tensor |
2 | 61,37 ₽ | 1,16 | Запустить | ||
128 000 |
1 | 73,73 ₽ | 1,79 | Запустить | ||
128 000 |
1 | 91,14 ₽ | 1,79 | Запустить | ||
128 000 |
1 | 107,57 ₽ | 2,84 | Запустить | ||
128 000 tensor |
2 | 109,77 ₽ | 4,58 | Запустить | ||
128 000 pipeline |
3 | 127,37 ₽ | 1,85 | Запустить | ||
128 000 |
1 | 141,77 ₽ | 2,84 | Запустить | ||
128 000 tensor |
4 | 162,57 ₽ | 2,80 | Запустить | ||
128 000 |
1 | 211,77 ₽ | 9,16 | Запустить | ||
128 000 |
1 | 341,77 ₽ | 9,16 | Запустить | ||
128 000 |
1 | 367,41 ₽ | 11,01 | Запустить | ||
128 000 |
1 | 423,04 ₽ | 17,19 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
128 000 |
1 | 46,94 ₽ | 1,66 | Запустить | ||
128 000 tensor |
2 | 48,14 ₽ | 2,35 | Запустить | ||
128 000 tensor |
2 | 51,34 ₽ | 2,35 | Запустить | ||
128 000 tensor |
2 | 61,37 ₽ | 1,04 | Запустить | ||
128 000 |
1 | 73,73 ₽ | 1,66 | Запустить | ||
128 000 |
1 | 91,14 ₽ | 1,66 | Запустить | ||
128 000 |
1 | 107,57 ₽ | 2,72 | Запустить | ||
128 000 tensor |
2 | 109,77 ₽ | 4,46 | Запустить | ||
128 000 pipeline |
3 | 127,37 ₽ | 1,72 | Запустить | ||
128 000 |
1 | 141,77 ₽ | 2,72 | Запустить | ||
128 000 tensor |
4 | 162,57 ₽ | 2,67 | Запустить | ||
128 000 |
1 | 211,77 ₽ | 9,04 | Запустить | ||
128 000 |
1 | 341,77 ₽ | 9,04 | Запустить | ||
128 000 |
1 | 367,41 ₽ | 10,88 | Запустить | ||
128 000 |
1 | 423,04 ₽ | 17,07 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
128 000 tensor |
2 | 48,14 ₽ | 1,06 | Запустить | ||
128 000 tensor |
2 | 51,34 ₽ | 1,06 | Запустить | ||
128 000 tensor |
2 | 83,37 ₽ | 3,16 | Запустить | ||
128 000 tensor |
4 | 99,74 ₽ | 1,91 | Запустить | ||
128 000 |
1 | 107,57 ₽ | 1,42 | Запустить | ||
128 000 tensor |
2 | 109,77 ₽ | 3,16 | Запустить | ||
128 000 tensor |
2 | 139,77 ₽ | 3,16 | Запустить | ||
128 000 |
1 | 141,77 ₽ | 1,42 | Запустить | ||
128 000 tensor |
4 | 162,57 ₽ | 1,38 | Запустить | ||
128 000 tensor |
2 | 171,77 ₽ | 3,16 | Запустить | ||
128 000 |
1 | 211,77 ₽ | 7,74 | Запустить | ||
128 000 |
1 | 341,77 ₽ | 7,74 | Запустить | ||
128 000 |
1 | 367,41 ₽ | 9,59 | Запустить | ||
128 000 |
1 | 423,04 ₽ | 15,77 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.