A-vibe — это русскоязычная большая языковая модель от Авито, созданная на базе открытой Qwen3-8B-Base. Её главная особенность — уникальный подход к адаптации под русский язык: разработчики не просто дообучали модель, а полностью заменили токенизатор, объединив английские токены от оригинальной Qwen3 с русскими токенами из специально обученного токенизатора. Такой гибридный подход позволил достичь высокой плотности токенизации для русского текста (в среднем на 22% меньше токенов на один и тот же текст), что значительно ускорило обработку и сократило размер модели до 7.9 миллиардов параметров, модель обрабатывает русскоязычные запросы на 15-25% быстрее базовой версии
Технически обучение A-vibe включало несколько ключевых этапов: сначала адаптация токенизатора на 150 миллиардах токенов (31% русского и 31% английского языков), затем инструктивное обучение (SFT) на 800+ тысячах примеров, включая синтетические диалоги с function calling. Далее последовали этапы GRPO для улучшения математических способностей и работы с функциями, а также DPO для повышения безопасности и качества диалогов. Особое внимание уделялось частичной заморозке эмбеддингов при адаптации токенизатора — инновационный подход с хуками для градиентов позволил сохранить качество представлений для английских токенов.
A-vibe демонстрирует выдающиеся результаты на русскоязычных бенчмарках: она обгоняет базовую Qwen3-8B на math_500_ru (68.6% против 54.6%). На бенчмарке BFCL V3 для function calling модель достигает 58.63%, что подтверждает её возможности в вызове функций. Что особенно впечатляет, A-vibe в рейтинге RU_ARENA превосходит не только Qwen3-8B, но и другие русскоязычные модели гораздо большего размера.
Сценарии использования A-Vibe логично вытекают из её архитектуры и сильных сторон. Она идеально подходит для создания интеллектуальных русскоязычных чат-ботов и ассистентов, анализа и суммаризации текстов (включая пользовательские обращения и документы), генерации и объяснения кода, а также для решения логических и вычислительных задач в образовательных, аналитических и сервисных продуктах.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 |
1 | 29,33 ₽ | 1,43 | Запустить | ||
32 768 |
1 | 33,74 ₽ | 1,43 | Запустить | ||
32 768 |
1 | 46,94 ₽ | 3,05 | Запустить | ||
32 768 tensor |
2 | 61,37 ₽ | 2,03 | Запустить | ||
32 768 |
1 | 73,73 ₽ | 3,27 | Запустить | ||
32 768 tensor |
2 | 86,54 ₽ | 1,65 | Запустить | ||
32 768 |
1 | 91,14 ₽ | 3,26 | Запустить | ||
32 768 tensor |
2 | 109,77 ₽ | 6,92 | Запустить | ||
32 768 |
1 | 141,77 ₽ | 4,86 | Запустить | ||
32 768 |
1 | 211,77 ₽ | 14,65 | Запустить | ||
32 768 |
1 | 341,77 ₽ | 14,64 | Запустить | ||
32 768 |
1 | 367,41 ₽ | 17,48 | Запустить | ||
32 768 tensor |
2 | 411,81 ₽ | 30,12 | Запустить | ||
32 768 |
1 | 423,04 ₽ | 27,03 | Запустить | ||
32 768 tensor |
2 | 839,97 ₽ | 54,88 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 |
1 | 46,94 ₽ | 2,23 | Запустить | ||
32 768 tensor |
2 | 48,14 ₽ | 2,85 | Запустить | ||
32 768 tensor |
2 | 51,34 ₽ | 2,87 | Запустить | ||
32 768 tensor |
2 | 61,37 ₽ | 1,22 | Запустить | ||
32 768 |
1 | 73,73 ₽ | 2,45 | Запустить | ||
32 768 |
1 | 91,14 ₽ | 2,44 | Запустить | ||
32 768 tensor |
2 | 109,77 ₽ | 6,10 | Запустить | ||
32 768 pipeline |
3 | 127,37 ₽ | 2,06 | Запустить | ||
32 768 |
1 | 141,77 ₽ | 4,04 | Запустить | ||
32 768 tensor |
4 | 162,57 ₽ | 3,29 | Запустить | ||
32 768 |
1 | 211,77 ₽ | 13,83 | Запустить | ||
32 768 |
1 | 341,77 ₽ | 13,82 | Запустить | ||
32 768 |
1 | 367,41 ₽ | 16,66 | Запустить | ||
32 768 tensor |
2 | 411,81 ₽ | 29,30 | Запустить | ||
32 768 |
1 | 423,04 ₽ | 26,21 | Запустить | ||
32 768 tensor |
2 | 839,97 ₽ | 54,06 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 tensor |
2 | 48,14 ₽ | 1,22 | Запустить | ||
32 768 tensor |
2 | 51,34 ₽ | 1,23 | Запустить | ||
32 768 pipeline |
3 | 74,84 ₽ | 1,01 | Запустить | ||
32 768 tensor |
2 | 83,37 ₽ | 4,46 | Запустить | ||
32 768 tensor |
4 | 99,74 ₽ | 2,43 | Запустить | ||
32 768 tensor |
2 | 109,77 ₽ | 4,46 | Запустить | ||
32 768 tensor |
2 | 139,77 ₽ | 4,90 | Запустить | ||
32 768 |
1 | 141,77 ₽ | 2,41 | Запустить | ||
32 768 tensor |
4 | 162,57 ₽ | 1,66 | Запустить | ||
32 768 tensor |
2 | 171,77 ₽ | 4,88 | Запустить | ||
32 768 |
1 | 211,77 ₽ | 85,72 | 12,20 | Запустить | |
32 768 |
1 | 341,77 ₽ | 12,18 | Запустить | ||
32 768 |
1 | 367,41 ₽ | 15,03 | Запустить | ||
32 768 tensor |
2 | 411,81 ₽ | 27,67 | Запустить | ||
32 768 |
1 | 423,04 ₽ | 24,58 | Запустить | ||
32 768 tensor |
2 | 839,97 ₽ | 52,43 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.