A-Vision — это русскоязычная визуально-языковая модель (VLM), построенная на архитектуре Qwen2.5-VL-7B-Instruct. Её уникальность — в целенаправленной доменной адаптации для понимания изображений в контексте русского языка и специфики маркетплейса. Как и A-Vibe, модель получила оптимизированный токенизатор, что уменьшило её размер до 7.4B параметров и увеличило скорость обработки русскоязычных мультимодальных запросов на 50%. Главное же отличие — собственный обучающий корпус, собранный Авито: около 200 тыс. изображений товаров и почти миллион русскоязычных пар «изображение-вопрос-ответ». Это позволяет модели глубоко понимать контекст бытовых предметов и объявлений.
Технически A-Vision прошла через многоступенчатый процесс адаптации: сначала был заменён токенизатор на русскоязычный с последующим freeze→unfreeze обучением LLM-части на большом корпусе русского текста, затем проведено мультимодальное SFT обучение на собранном датасете, и завершающий этап DPO для обеспечения безопасности ответов.
Модель демонстрирует сбалансированную экспертизу. Она лидирует в ключевом для бизнеса Авито бенчмарке AvitoImageGen_RU (0.7668), который оценивает качество автоматической генерации описаний товаров по фото, показывая прирост +6% к базовой модели. При этом она сохраняет и даже улучшает сильные стороны оригинала и в задачах с английским языком, опережая Qwen2.5-VL-7B-Instruct в тесте DocVQA_EN (94.97), проверяющем умение извлекать информацию из документов и форм.
Сценарии использования A-Vision напрямую связаны с её мультимодальной природой и обучением. Она предназначена для автоматизации работы с визуальным контентом: мгновенная генерация заголовков и описаний товаров по фотографии, извлечение текста, брендов и атрибутов с изображений (OCR), проверка соответствия фото текстовому описанию, а также помощь в модерации визуального контента на платформах.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
128 000 |
1 | 29,33 ₽ | 1,26 | Запустить | ||
128 000 |
1 | 33,74 ₽ | 1,26 | Запустить | ||
128 000 |
1 | 46,94 ₽ | 2,32 | Запустить | ||
128 000 tensor |
2 | 61,37 ₽ | 1,69 | Запустить | ||
128 000 |
1 | 73,73 ₽ | 2,32 | Запустить | ||
128 000 tensor |
2 | 86,54 ₽ | 1,42 | Запустить | ||
128 000 |
1 | 91,14 ₽ | 2,32 | Запустить | ||
128 000 |
1 | 107,57 ₽ | 3,37 | Запустить | ||
128 000 tensor |
2 | 109,77 ₽ | 5,11 | Запустить | ||
128 000 |
1 | 141,77 ₽ | 3,37 | Запустить | ||
128 000 |
1 | 211,77 ₽ | 9,69 | Запустить | ||
128 000 |
1 | 341,77 ₽ | 9,69 | Запустить | ||
128 000 |
1 | 367,41 ₽ | 11,53 | Запустить | ||
128 000 |
1 | 423,04 ₽ | 17,72 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
128 000 |
1 | 46,94 ₽ | 1,84 | Запустить | ||
128 000 tensor |
2 | 48,14 ₽ | 2,53 | Запустить | ||
128 000 tensor |
2 | 51,34 ₽ | 2,53 | Запустить | ||
128 000 tensor |
2 | 61,37 ₽ | 1,21 | Запустить | ||
128 000 |
1 | 73,73 ₽ | 1,84 | Запустить | ||
128 000 tensor |
2 | 86,54 ₽ | 0,95 | Запустить | ||
128 000 |
1 | 91,14 ₽ | 1,84 | Запустить | ||
128 000 |
1 | 107,57 ₽ | 2,89 | Запустить | ||
128 000 tensor |
2 | 109,77 ₽ | 4,63 | Запустить | ||
128 000 |
1 | 141,77 ₽ | 2,89 | Запустить | ||
128 000 |
1 | 211,77 ₽ | 9,21 | Запустить | ||
128 000 |
1 | 341,77 ₽ | 9,21 | Запустить | ||
128 000 |
1 | 367,41 ₽ | 11,06 | Запустить | ||
128 000 |
1 | 423,04 ₽ | 17,24 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
128 000 tensor |
2 | 48,14 ₽ | 1,31 | Запустить | ||
128 000 tensor |
2 | 51,34 ₽ | 1,31 | Запустить | ||
128 000 tensor |
2 | 83,37 ₽ | 3,41 | Запустить | ||
128 000 pipeline |
3 | 84,47 ₽ | 1,07 | Запустить | ||
128 000 tensor |
4 | 99,74 ₽ | 2,15 | Запустить | ||
128 000 |
1 | 107,57 ₽ | 1,67 | Запустить | ||
128 000 tensor |
2 | 109,77 ₽ | 3,41 | Запустить | ||
128 000 tensor |
2 | 139,77 ₽ | 3,41 | Запустить | ||
128 000 |
1 | 141,77 ₽ | 1,67 | Запустить | ||
128 000 tensor |
4 | 162,57 ₽ | 1,63 | Запустить | ||
128 000 tensor |
2 | 171,77 ₽ | 3,41 | Запустить | ||
128 000 |
1 | 211,77 ₽ | 7,99 | Запустить | ||
128 000 |
1 | 341,77 ₽ | 7,99 | Запустить | ||
128 000 |
1 | 367,41 ₽ | 9,83 | Запустить | ||
128 000 |
1 | 423,04 ₽ | 16,02 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.