A-Vision — это русскоязычная визуально-языковая модель (VLM), построенная на архитектуре Qwen2.5-VL-7B-Instruct. Её уникальность — в целенаправленной доменной адаптации для понимания изображений в контексте русского языка и специфики маркетплейса. Как и A-Vibe, модель получила оптимизированный токенизатор, что уменьшило её размер до 7.4B параметров и увеличило скорость обработки русскоязычных мультимодальных запросов на 50%. Главное же отличие — собственный обучающий корпус, собранный Авито: около 200 тыс. изображений товаров и почти миллион русскоязычных пар «изображение-вопрос-ответ». Это позволяет модели глубоко понимать контекст бытовых предметов и объявлений.
Технически A-Vision прошла через многоступенчатый процесс адаптации: сначала был заменён токенизатор на русскоязычный с последующим freeze→unfreeze обучением LLM-части на большом корпусе русского текста, затем проведено мультимодальное SFT обучение на собранном датасете, и завершающий этап DPO для обеспечения безопасности ответов.
Модель демонстрирует сбалансированную экспертизу. Она лидирует в ключевом для бизнеса Авито бенчмарке AvitoImageGen_RU (0.7668), который оценивает качество автоматической генерации описаний товаров по фото, показывая прирост +6% к базовой модели. При этом она сохраняет и даже улучшает сильные стороны оригинала и в задачах с английским языком, опережая Qwen2.5-VL-7B-Instruct в тесте DocVQA_EN (94.97), проверяющем умение извлекать информацию из документов и форм.
Сценарии использования A-Vision напрямую связаны с её мультимодальной природой и обучением. Она предназначена для автоматизации работы с визуальным контентом: мгновенная генерация заголовков и описаний товаров по фотографии, извлечение текста, брендов и атрибутов с изображений (OCR), проверка соответствия фото текстовому описанию, а также помощь в модерации визуального контента на платформах.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
128 000 tensor |
2 | 83,37 ₽ | 1,81 | Запустить | ||
128 000 tensor |
2 | 109,77 ₽ | 1,81 | Запустить | ||
128 000 tensor |
2 | 139,77 ₽ | 2,09 | Запустить | ||
128 000 |
1 | 141,77 ₽ | 1,86 | Запустить | ||
128 000 tensor |
2 | 171,77 ₽ | 2,08 | Запустить | ||
128 000 |
1 | 211,77 ₽ | 8,30 | Запустить | ||
128 000 |
1 | 341,77 ₽ | 8,29 | Запустить | ||
128 000 |
1 | 367,41 ₽ | 10,16 | Запустить | ||
128 000 tensor |
2 | 411,81 ₽ | 17,08 | Запустить | ||
128 000 |
1 | 423,04 ₽ | 16,45 | Запустить | ||
128 000 tensor |
2 | 839,97 ₽ | 33,38 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
128 000 tensor |
2 | 83,37 ₽ | 1,33 | Запустить | ||
128 000 tensor |
2 | 109,77 ₽ | 1,33 | Запустить | ||
128 000 tensor |
2 | 139,77 ₽ | 1,61 | Запустить | ||
128 000 |
1 | 141,77 ₽ | 1,38 | Запустить | ||
128 000 tensor |
2 | 171,77 ₽ | 1,60 | Запустить | ||
128 000 |
1 | 211,77 ₽ | 7,82 | Запустить | ||
128 000 |
1 | 341,77 ₽ | 7,82 | Запустить | ||
128 000 |
1 | 367,41 ₽ | 9,69 | Запустить | ||
128 000 tensor |
2 | 411,81 ₽ | 16,60 | Запустить | ||
128 000 |
1 | 423,04 ₽ | 15,97 | Запустить | ||
128 000 tensor |
2 | 839,97 ₽ | 32,90 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
128 000 pipeline |
3 | 119,81 ₽ | 1,25 | Запустить | ||
128 000 tensor |
4 | 139,96 ₽ | 2,54 | Запустить | ||
128 000 pipeline |
3 | 204,41 ₽ | 1,68 | Запустить | ||
128 000 tensor |
4 | 209,04 ₽ | 2,54 | Запустить | ||
128 000 |
1 | 211,77 ₽ | 6,75 | Запустить | ||
128 000 tensor |
4 | 252,14 ₽ | 3,11 | Запустить | ||
128 000 pipeline |
3 | 252,41 ₽ | 1,66 | Запустить | ||
128 000 tensor |
2 | 261,77 ₽ | 2,64 | Запустить | ||
128 000 tensor |
4 | 316,14 ₽ | 3,09 | Запустить | ||
128 000 |
1 | 341,77 ₽ | 6,74 | Запустить | ||
128 000 |
1 | 367,41 ₽ | 8,61 | Запустить | ||
128 000 tensor |
2 | 411,81 ₽ | 15,53 | Запустить | ||
128 000 |
1 | 423,04 ₽ | 14,90 | Запустить | ||
128 000 tensor |
2 | 839,97 ₽ | 31,83 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.