YandexGPT-5-Lite-8B-instruct представляет собой языковую модель размером 8 миллиардов параметров с контекстом в 32k токенов, разработанную Яндексом специально для работы с русскоязычным контентом. Модель построена на основе собственной pretrain-версии YandexGPT 5 Lite, что отличает ее от многих конкурентов, использующих веса сторонних моделей как отправную точку. Обучение проходило в два этапа: первый на корпусе данных объемом 15 триллионов токенов (30% русскоязычных), второй этап Powerup на высококачественных данных объемом 320 миллиардов токенов. Процесс alignment модели включает передовые методы SFT (Supervised Fine-Tuning) и RLHF (Reinforcement Learning from Human Feedback), дополненные собственной разработкой Яндекса — алгоритмом LogDPO, который решает проблему "разучивания" традиционного DPO подхода. Эта инновация позволяет модели стабильно обучаться на предпочтительных данных без деградации качества ответов.
Уникальной особенностью модели является специализированная обработка русскоязычного контента, включая оптимизированный для русского языка словарь токенов, что обеспечивает более эффективное использование вычислительных ресурсов по сравнению с изначально англоязычными моделями. 32k токенов контекста YandexGPT соответствуют 48k токенам модели Qwen-2.5-32B-base для русскоязычных текстов, таким образом YandexGPT-5-Lite демонстрирует оптимальную токенизацию для кириллицы. Особенностью токенизации так же является замена символов переноса строк на специальные токены [NL] и раздельная обработка каждой реплики диалога, что создает пробелы в начале каждого сообщения. Модель использует нестандартный шаблон диалога с последовательностью Ассистент:[SEP] для генерации ответов и завершающим токеном </s>, что обеспечивает корректную работу в многоходовых диалогах любой длины.
YandexGPT-5-Lite демонстрирует выдающиеся результаты в ключевых бенчмарках, достигая паритета или превосходства над моделями Llama-3.1-8B-instruct и Qwen-2.5-7B-instruct. Модель показывает исключительные результаты в RuCulture — специализированном бенчмарке по русской культуре, литературе и сленгу, где значительно опережает международные аналоги.
YandexGPT-5-Lite-8B-instruct идеально подходит для создания русскоязычных чат-ботов и виртуальных ассистентов, особенно в корпоративной среде, где требуется понимание российских культурных контекстов и бизнес-практик. Образовательные платформы могут использовать модель для создания интеллектуальных тьюторов по русской литературе, истории и культуре. Она отлично подходит и для контент-маркетинга и копирайтинга на русском языке, включая создание SEO-оптимизированных текстов и адаптацию контента под российскую аудиторию. Разработчики и исследователи найдут модель полезной для файн-тюнинга под специфические задачи, связанные с русским контентом, поскольку она изначально обучена на русскоязычных данных и не потребует значительной адаптации.
Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
---|---|---|---|---|---|---|---|
32 768 |
16 | 16384 | 160 | 1 | 29,33 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 33,74 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 37,04 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 51,34 ₽ | Запустить | |
32 768 |
16 | 24576 | 160 | 1 | 78,53 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 103,04 ₽ | Запустить | |
32 768 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 230,77 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 456,27 ₽ | Запустить |
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
---|---|---|---|---|---|---|---|
32 768 |
16 | 16384 | 160 | 1 | 29,33 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 33,74 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 37,04 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | |
32 768 |
16 | 24576 | 160 | 1 | 78,53 ₽ | Запустить | |
32 768 |
16 | 32762 | 160 | 2 | 86,54 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 103,04 ₽ | Запустить | |
32 768 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 230,77 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 456,27 ₽ | Запустить |
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
---|---|---|---|---|---|---|---|
32 768 |
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 2 | 48,14 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | |
32 768 |
12 | 65536 | 160 | 2 | 61,37 ₽ | Запустить | |
32 768 |
16 | 24576 | 160 | 1 | 78,53 ₽ | Запустить | |
32 768 |
16 | 32762 | 160 | 2 | 86,54 ₽ | Запустить | |
32 768 |
16 | 32768 | 160 | 1 | 103,04 ₽ | Запустить | |
32 768 |
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 230,77 ₽ | Запустить | |
32 768 |
16 | 65536 | 160 | 1 | 456,27 ₽ | Запустить |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.