Qwen2.5-VL-7B представляет собой оптимальный баланс между производительностью и вычислительными требованиями, устанавливая новые стандарты в качестве обработки мультимодальных данных. Революционная система MRoPE (Multimodal Rotary Position Embedding) с выравниванием по абсолютному времени позволяет модели изучать темпоральную динамику и скорость событий через интервалы между временными измерениями без дополнительных вычислительных затрат. Архитектурные инновации 7B модели включают усовершенствованный Vision Transformer с комбинацией полного внимания и window attention, где только 4 слоя используют полное внимание, а остальные применяют оконное внимание с максимальным размером окна 112×112. Это обеспечивает линейное масштабирование вычислительных затрат и позволяет модели нативно обрабатывать изображения любого разрешения. Динамическая обработка FPS для видео расширяет возможности модели на временное измерение, обеспечивая точную локализацию событий.
Производительность 7B модели впечатляет: 58.6% на MMMU, 95.7% на DocVQA, 84.9% на TextVQA и 68.2% на MathVista, что превосходит многие модели сопоставимого размера. В области агентских задач модель демонстрирует выдающиеся результаты: 84.7% на ScreenSpot, 81.9% на AITZ и 91.4% на MobileMiniWob++, подтверждая ее способность эффективно взаимодействовать с графическими интерфейсами. Особенно впечатляющими являются возможности видеопонимания, где модель достигает 69.6% на MVBench и 70.5% на PerceptionTest.
Сценарии применения модели охватывают профессиональные системы автоматизации документооборота, интеллектуальные системы видеонаблюдения с анализом поведения, образовательные платформы с интерактивным мультимедийным контентом и корпоративные решения для анализа больших объемов визуальных данных. Модель идеально подходит для развертывания в облачных сервисах, где требуется высокое качество обработки при разумных вычислительных затратах, а также для локальных серверов в средних и крупных организациях. Благодаря превосходным OCR возможностям, модель становится незаменимой для финтех-приложений, систем обработки счетов и автоматизации бухгалтерских процессов.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
128 000 tensor |
2 | 83,37 ₽ | 1,58 | Запустить | ||
128 000 tensor |
2 | 109,77 ₽ | 1,58 | Запустить | ||
128 000 tensor |
2 | 139,77 ₽ | 1,86 | Запустить | ||
128 000 |
1 | 141,77 ₽ | 1,51 | Запустить | ||
128 000 tensor |
2 | 171,77 ₽ | 1,85 | Запустить | ||
128 000 |
1 | 211,77 ₽ | 7,96 | Запустить | ||
128 000 |
1 | 341,77 ₽ | 7,95 | Запустить | ||
128 000 |
1 | 367,41 ₽ | 9,82 | Запустить | ||
128 000 tensor |
2 | 411,81 ₽ | 16,85 | Запустить | ||
128 000 |
1 | 423,04 ₽ | 16,10 | Запустить | ||
128 000 tensor |
2 | 839,97 ₽ | 33,15 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
128 000 tensor |
2 | 83,37 ₽ | 1,15 | Запустить | ||
128 000 tensor |
2 | 109,77 ₽ | 1,15 | Запустить | ||
128 000 tensor |
2 | 139,77 ₽ | 1,43 | Запустить | ||
128 000 |
1 | 141,77 ₽ | 1,08 | Запустить | ||
128 000 tensor |
2 | 171,77 ₽ | 1,42 | Запустить | ||
128 000 |
1 | 211,77 ₽ | 7,52 | Запустить | ||
128 000 |
1 | 341,77 ₽ | 7,52 | Запустить | ||
128 000 |
1 | 367,41 ₽ | 9,39 | Запустить | ||
128 000 tensor |
2 | 411,81 ₽ | 16,42 | Запустить | ||
128 000 |
1 | 423,04 ₽ | 15,67 | Запустить | ||
128 000 tensor |
2 | 839,97 ₽ | 32,72 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
128 000 pipeline |
3 | 119,81 ₽ | 1,35 | Запустить | ||
128 000 tensor |
4 | 139,96 ₽ | 2,77 | Запустить | ||
128 000 pipeline |
3 | 204,41 ₽ | 1,78 | Запустить | ||
128 000 tensor |
4 | 209,04 ₽ | 2,77 | Запустить | ||
128 000 |
1 | 211,77 ₽ | 6,64 | Запустить | ||
128 000 tensor |
4 | 252,14 ₽ | 3,34 | Запустить | ||
128 000 pipeline |
3 | 252,41 ₽ | 1,77 | Запустить | ||
128 000 tensor |
2 | 261,77 ₽ | 2,64 | Запустить | ||
128 000 tensor |
4 | 316,14 ₽ | 3,32 | Запустить | ||
128 000 |
1 | 341,77 ₽ | 6,63 | Запустить | ||
128 000 |
1 | 367,41 ₽ | 8,50 | Запустить | ||
128 000 tensor |
2 | 411,81 ₽ | 15,53 | Запустить | ||
128 000 |
1 | 423,04 ₽ | 14,79 | Запустить | ||
128 000 tensor |
2 | 839,97 ₽ | 31,83 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.