A-vibe — это русскоязычная большая языковая модель от Авито, созданная на базе открытой Qwen3-8B-Base. Её главная особенность — уникальный подход к адаптации под русский язык: разработчики не просто дообучали модель, а полностью заменили токенизатор, объединив английские токены от оригинальной Qwen3 с русскими токенами из специально обученного токенизатора. Такой гибридный подход позволил достичь высокой плотности токенизации для русского текста (в среднем на 22% меньше токенов на один и тот же текст), что значительно ускорило обработку и сократило размер модели до 7.9 миллиардов параметров, модель обрабатывает русскоязычные запросы на 15-25% быстрее базовой версии
Технически обучение A-vibe включало несколько ключевых этапов: сначала адаптация токенизатора на 150 миллиардах токенов (31% русского и 31% английского языков), затем инструктивное обучение (SFT) на 800+ тысячах примеров, включая синтетические диалоги с function calling. Далее последовали этапы GRPO для улучшения математических способностей и работы с функциями, а также DPO для повышения безопасности и качества диалогов. Особое внимание уделялось частичной заморозке эмбеддингов при адаптации токенизатора — инновационный подход с хуками для градиентов позволил сохранить качество представлений для английских токенов.
A-vibe демонстрирует выдающиеся результаты на русскоязычных бенчмарках: она обгоняет базовую Qwen3-8B на math_500_ru (68.6% против 54.6%). На бенчмарке BFCL V3 для function calling модель достигает 58.63%, что подтверждает её возможности в вызове функций. Что особенно впечатляет, A-vibe в рейтинге RU_ARENA превосходит не только Qwen3-8B, но и другие русскоязычные модели гораздо большего размера.
Сценарии использования A-Vibe логично вытекают из её архитектуры и сильных сторон. Она идеально подходит для создания интеллектуальных русскоязычных чат-ботов и ассистентов, анализа и суммаризации текстов (включая пользовательские обращения и документы), генерации и объяснения кода, а также для решения логических и вычислительных задач в образовательных, аналитических и сервисных продуктах.
| Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
32 768 |
16 | 16384 | 160 | 1 | 29,33 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 33,74 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | |
32 768 tensor |
12 | 65536 | 160 | 2 | 61,37 ₽ | Запустить | |
32 768 |
16 | 24576 | 160 | 1 | 78,53 ₽ | Запустить | |
32 768 tensor |
16 | 32762 | 160 | 2 | 86,54 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 103,04 ₽ | Запустить | |
32 768 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
32 768 tensor |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 211,77 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 341,77 ₽ | Запустить | |
32 768 |
16 | 98304 | 160 | 1 | 367,41 ₽ | Запустить | |
32 768 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
32 768 |
16 | 16384 | 160 | 1 | 29,33 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 33,74 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | |
32 768 tensor |
12 | 65536 | 160 | 2 | 61,37 ₽ | Запустить | |
32 768 |
16 | 24576 | 160 | 1 | 78,53 ₽ | Запустить | |
32 768 tensor |
16 | 32762 | 160 | 2 | 86,54 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 103,04 ₽ | Запустить | |
32 768 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
32 768 tensor |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 211,77 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 341,77 ₽ | Запустить | |
32 768 |
16 | 98304 | 160 | 1 | 367,41 ₽ | Запустить | |
32 768 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
32 768 tensor |
16 | 32768 | 160 | 2 | 48,14 ₽ | Запустить | |
32 768 tensor |
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | |
32 768 pipeline |
12 | 24576 | 120 | 3 | 74,84 ₽ | Запустить | |
32 768 tensor |
16 | 65536 | 160 | 2 | 83,37 ₽ | Запустить | |
32 768 tensor |
16 | 32768 | 160 | 4 | 99,74 ₽ | Запустить | |
32 768 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
32 768 tensor |
16 | 65536 | 160 | 2 | 109,77 ₽ | Запустить | |
32 768 pipeline |
16 | 65536 | 160 | 3 | 127,37 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
32 768 tensor |
16 | 65536 | 160 | 2 | 149,37 ₽ | Запустить | |
32 768 tensor |
16 | 65536 | 160 | 4 | 162,57 ₽ | Запустить | |
32 768 tensor |
16 | 65536 | 160 | 2 | 195,57 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 211,77 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 341,77 ₽ | Запустить | |
32 768 |
16 | 98304 | 160 | 1 | 367,41 ₽ | Запустить | |
32 768 |
16 | 131072 | 160 | 1 | 423,04 ₽ | Запустить | |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.