AvitoTech (ООО «Авито Тех») — технологическое подразделение группы компаний Avito, крупнейшей платформы объявлений в России с более чем 113 млн пользователей в месяц. Компания зарегистрирована в Москве (ул. Лесная, д. 7) и функционирует как независимое юридическое лицо, осуществляя разработку программного обеспечения и баз данных. Организация прошла эволюцию от команды поддержки высоконагруженной платформы объявлений к созданию собственных AI-решений, управляя инфраструктурой из более чем 3000 микросервисов силами 2700+ инженеров. AvitoTech исторически развивалась вокруг задач электронной коммерции: модерация контента, поиск, рекомендации и компьютерное зрение. В 2024–2025 годах компания совершила стратегический переход к разработке собственных больших языковых моделей.
AvitoTech разработала методологию LEP Initialization (Language-Specific Embedding Projection) для умной инициализации эмбеддингов новых токенов. Компания внедрила технику SFT-mixed Tokenizer Training, при которой SFT-датасет подмешивается непосредственно в процесс обучения токенизатора для балансировки представления токенов между кодом, текстами и спецификацией e-commerce. На основе этих исследований осенью 2025 года AvitoTech выпустила в открытый доступ два семейства моделей — A-Vibe и A-Vision специализирующихся на русском языке и e-commerce. Обе модели выпущены под открытой лицензией Apache 2.0 на Hugging Face, позволяя исследователям и разработчикам русскоязычного сегмента использовать их без ограничений для коммерческих и исследовательских целей.