Yandex N.V. - международная публичная компания была основана в 1997 году. В России основной юридической единицей является ООО "ЯНДЕКС", зарегистрированное в 2000 году с головным офисом в Москве. Компания известна всему миру под брендом Yandex — аббревиатурой от "Yet Another Indexer", что отражает её изначальную специализацию в области поисковых технологий. Компания прославилась как создатель крупнейшей поисковой системы в русскоязычном интернете, а также разработчик широкой экосистемы сервисов: от браузера и карт до облачных решений, инструментов аналитики и платформ электронной коммерции. В области искусственного интеллекта Yandex проявила себя как разработчик больших языковых моделей для русского языка и один из ведущих исследовательских центров в сфере машинного обучения в России.
В 2017 «Алиса» стала одним из первых масштабных русскоязычных ассистентов, опираясь на собственные технологии. Далее компания перешла к крупным LLM, в июне 2022 года состоялся релиз YaLM-100B — первой открытой GPT модели с 100 миллиардами параметров, специально оптимизированной для русского языка. Модель обучалась 65 дней на кластере из 800 графических карт A100, обработав 1,7 ТБ текстовых данных. С 2023 Yandex развивает сервисную линейку Yandex Foundation Models в облаке. Из научных открытий команда Yandex Research известна разработкой инновационных методов экстремального сжатия больших языковых моделей, представленные в работе "Extreme Compression of Large Language Models via Additive Quantization". Эта технология позволяет сократить размер модели до 2-3 бит на параметр, уменьшая затраты на развертывание в 8 раз без существенной потери качества. Отдельного внимания заслуживает CatBoost – алгоритм классического ML, который с 2019 года и по сегодняшний день лидирует во многих соревнованиях на Kaggle оставляя за спиной нейронные сети.
В 2025 году компания представила семейство YandexGPT 5. Линейка включает YandexGPT 5 Pro для сложных бизнес-задач и открытую YandexGPT 5 Lite с 8 миллиардами параметров для широкого применения. Особенностью Lite-версии стал двухэтапный процесс обучения: основной претрейн на 15 триллионах токенов и этап "Powerup" на 320 миллиардах высококачественных данных с расширением контекста до 32 тысяч токенов.Это одна из лучших моделей в плане понимания русского языка. Кроме того, в отрытом доступе от Yandex есть коллекция Alchemist содержит инновационные инструменты для улучшения качества генерации изображений, основанные на систематическом подходе.