A-Vision — это русскоязычная визуально-языковая модель (VLM), построенная на архитектуре Qwen2.5-VL-7B-Instruct. Её уникальность — в целенаправленной доменной адаптации для понимания изображений в контексте русского языка и специфики маркетплейса. Как и A-Vibe, модель получила оптимизированный токенизатор, что уменьшило её размер до 7.4B параметров и увеличило скорость обработки русскоязычных мультимодальных запросов на 50%. Главное же отличие — собственный обучающий корпус, собранный Авито: около 200 тыс. изображений товаров и почти миллион русскоязычных пар «изображение-вопрос-ответ». Это позволяет модели глубоко понимать контекст бытовых предметов и объявлений.
Технически A-Vision прошла через многоступенчатый процесс адаптации: сначала был заменён токенизатор на русскоязычный с последующим freeze→unfreeze обучением LLM-части на большом корпусе русского текста, затем проведено мультимодальное SFT обучение на собранном датасете, и завершающий этап DPO для обеспечения безопасности ответов.
Модель демонстрирует сбалансированную экспертизу. Она лидирует в ключевом для бизнеса Авито бенчмарке AvitoImageGen_RU (0.7668), который оценивает качество автоматической генерации описаний товаров по фото, показывая прирост +6% к базовой модели. При этом она сохраняет и даже улучшает сильные стороны оригинала и в задачах с английским языком, опережая Qwen2.5-VL-7B-Instruct в тесте DocVQA_EN (94.97), проверяющем умение извлекать информацию из документов и форм.
Сценарии использования A-Vision напрямую связаны с её мультимодальной природой и обучением. Она предназначена для автоматизации работы с визуальным контентом: мгновенная генерация заголовков и описаний товаров по фотографии, извлечение текста, брендов и атрибутов с изображений (OCR), проверка соответствия фото текстовому описанию, а также помощь в модерации визуального контента на платформах.
| Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
128 000 |
16 | 16384 | 160 | 1 | 29,33 ₽ | Запустить | |
128 000 |
16 | 32768 | 160 | 1 | 33,74 ₽ | Запустить | |
128 000 |
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | |
128 000 tensor |
12 | 65536 | 160 | 2 | 61,37 ₽ | Запустить | |
128 000 |
16 | 24576 | 160 | 1 | 78,53 ₽ | Запустить | |
128 000 tensor |
16 | 32762 | 160 | 2 | 86,54 ₽ | Запустить | |
128 000 |
16 | 32768 | 160 | 1 | 103,04 ₽ | Запустить | |
128 000 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
128 000 tensor |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
128 000 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
128 000 |
16 | 65536 | 160 | 1 | 211,77 ₽ | Запустить | |
128 000 |
16 | 65536 | 160 | 1 | 341,77 ₽ | Запустить | |
128 000 |
16 | 98304 | 160 | 1 | 367,41 ₽ | Запустить | |
128 000 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
128 000 |
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | |
128 000 tensor |
16 | 32768 | 160 | 2 | 48,14 ₽ | Запустить | |
128 000 tensor |
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | |
128 000 tensor |
12 | 65536 | 160 | 2 | 61,37 ₽ | Запустить | |
128 000 |
16 | 24576 | 160 | 1 | 78,53 ₽ | Запустить | |
128 000 tensor |
16 | 32762 | 160 | 2 | 86,54 ₽ | Запустить | |
128 000 |
16 | 32768 | 160 | 1 | 103,04 ₽ | Запустить | |
128 000 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
128 000 tensor |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
128 000 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
128 000 |
16 | 65536 | 160 | 1 | 211,77 ₽ | Запустить | |
128 000 |
16 | 65536 | 160 | 1 | 341,77 ₽ | Запустить | |
128 000 |
16 | 98304 | 160 | 1 | 367,41 ₽ | Запустить | |
128 000 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
128 000 tensor |
16 | 32768 | 160 | 2 | 48,14 ₽ | Запустить | |
128 000 tensor |
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | |
128 000 pipeline |
12 | 24576 | 120 | 3 | 74,84 ₽ | Запустить | |
128 000 tensor |
16 | 65536 | 160 | 2 | 83,37 ₽ | Запустить | |
128 000 tensor |
16 | 32768 | 160 | 4 | 99,74 ₽ | Запустить | |
128 000 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
128 000 tensor |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
128 000 pipeline |
16 | 65536 | 160 | 3 | 127,37 ₽ | Запустить | |
128 000 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
128 000 tensor |
16 | 65536 | 160 | 2 | 149,37 ₽ | Запустить | |
128 000 tensor |
16 | 65536 | 160 | 4 | 162,57 ₽ | Запустить | |
128 000 tensor |
16 | 65536 | 160 | 2 | 195,57 ₽ | Запустить | |
128 000 |
16 | 65536 | 160 | 1 | 211,77 ₽ | Запустить | |
128 000 |
16 | 65536 | 160 | 1 | 341,77 ₽ | Запустить | |
128 000 |
16 | 98304 | 160 | 1 | 367,41 ₽ | Запустить | |
128 000 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.