YandexGPT-5-Lite-8B

русскоязычная

YandexGPT-5-Lite-8B-instruct представляет собой языковую модель размером 8 миллиардов параметров с контекстом в 32k токенов, разработанную Яндексом специально для работы с русскоязычным контентом. Модель построена на основе собственной pretrain-версии YandexGPT 5 Lite, что отличает ее от многих конкурентов, использующих веса сторонних моделей как отправную точку. Обучение проходило в два этапа: первый на корпусе данных объемом 15 триллионов токенов (30% русскоязычных), второй этап Powerup на высококачественных данных объемом 320 миллиардов токенов. Процесс alignment модели включает передовые методы SFT (Supervised Fine-Tuning) и RLHF (Reinforcement Learning from Human Feedback), дополненные собственной разработкой Яндекса — алгоритмом LogDPO, который решает проблему "разучивания" традиционного DPO подхода. Эта инновация позволяет модели стабильно обучаться на предпочтительных данных без деградации качества ответов.

Уникальной особенностью модели является специализированная обработка русскоязычного контента, включая оптимизированный для русского языка словарь токенов, что обеспечивает более эффективное использование вычислительных ресурсов по сравнению с изначально англоязычными моделями. 32k токенов контекста YandexGPT соответствуют 48k токенам модели Qwen-2.5-32B-base для русскоязычных текстов, таким образом YandexGPT-5-Lite демонстрирует оптимальную токенизацию для кириллицы. Особенностью токенизации так же является замена символов переноса строк на специальные токены [NL] и раздельная обработка каждой реплики диалога, что создает пробелы в начале каждого сообщения. Модель использует нестандартный шаблон диалога с последовательностью Ассистент:[SEP] для генерации ответов и завершающим токеном </s>, что обеспечивает корректную работу в многоходовых диалогах любой длины.

YandexGPT-5-Lite демонстрирует выдающиеся результаты в ключевых бенчмарках, достигая паритета или превосходства над моделями Llama-3.1-8B-instruct и Qwen-2.5-7B-instruct. Модель показывает исключительные результаты в RuCulture — специализированном бенчмарке по русской культуре, литературе и сленгу, где значительно опережает международные аналоги.

YandexGPT-5-Lite-8B-instruct идеально подходит для создания русскоязычных чат-ботов и виртуальных ассистентов, особенно в корпоративной среде, где требуется понимание российских культурных контекстов и бизнес-практик. Образовательные платформы могут использовать модель для создания интеллектуальных тьюторов по русской литературе, истории и культуре. Она отлично подходит и для контент-маркетинга и копирайтинга на русском языке, включая создание SEO-оптимизированных текстов и адаптацию контента под российскую аудиторию. Разработчики и исследователи найдут модель полезной для файн-тюнинга под специфические задачи, связанные с русским контентом, поскольку она изначально обучена на русскоязычных данных и не потребует значительной адаптации.


Дата анонса: 31.03.2025
Параметров: 8.04B
Контекст: 32K
Слоев: 32
Тип внимания: Full Attention
Потребление памяти: 7.7 ГБ в точности 4 бит
Разработчик: Yandex
Версия Transformers: 4.56.1
Лицензия: Лицензионное соглашение YandexGPT-5-Lite-8B

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами бесплатно для теста инференса и знакомства с YandexGPT-5-Lite-8B. Получить токен для доступа к API вы можете на странице управления токенами после регистрации и верификации.
Наименование модели Контекст Тип GPU TPS Статус Ссылка
Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

  • получить максимальную производительность эндпоинта,
  • получить полный контекст для обработки больших запросов и диалогов,
  • обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
  • использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации для хостинга YandexGPT-5-Lite-8B

Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
teslat4-1.16.16.160
32 768
16 16384 160 1 29,33 ₽ Запустить
teslaa2-1.16.32.160
32 768
16 32768 160 1 33,74 ₽ Запустить
rtx2080ti-1.16.32.160
32 768
16 32768 160 1 37,04 ₽ Запустить
teslaa10-1.16.32.160
32 768
16 32768 160 1 46,94 ₽ Запустить
rtx3080-1.16.32.160
32 768
16 32768 160 1 51,34 ₽ Запустить
rtx3090-1.16.24.160
32 768
16 24576 160 1 78,53 ₽ Запустить
rtx4090-1.16.32.160
32 768
16 32768 160 1 103,04 ₽ Запустить
teslav100-1.12.64.160
32 768
12 65536 160 1 107,57 ₽ Запустить
rtx5090-1.16.64.160
32 768
16 65536 160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160
32 768
16 65536 160 1 230,77 ₽ Запустить
teslah100-1.16.64.160
32 768
16 65536 160 1 456,27 ₽ Запустить
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
teslat4-1.16.16.160
32 768
16 16384 160 1 29,33 ₽ Запустить
teslaa2-1.16.32.160
32 768
16 32768 160 1 33,74 ₽ Запустить
rtx2080ti-1.16.32.160
32 768
16 32768 160 1 37,04 ₽ Запустить
teslaa10-1.16.32.160
32 768
16 32768 160 1 46,94 ₽ Запустить
rtx3090-1.16.24.160
32 768
16 24576 160 1 78,53 ₽ Запустить
rtx3080-2.16.32.160
32 768
16 32762 160 2 86,54 ₽ Запустить
rtx4090-1.16.32.160
32 768
16 32768 160 1 103,04 ₽ Запустить
teslav100-1.12.64.160
32 768
12 65536 160 1 107,57 ₽ Запустить
rtx5090-1.16.64.160
32 768
16 65536 160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160
32 768
16 65536 160 1 230,77 ₽ Запустить
teslah100-1.16.64.160
32 768
16 65536 160 1 456,27 ₽ Запустить
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
teslaa10-1.16.32.160
32 768
16 32768 160 1 46,94 ₽ Запустить
teslat4-2.16.32.160
32 768
16 32768 160 2 48,14 ₽ Запустить
teslaa2-2.16.32.160
32 768
16 32768 160 2 51,34 ₽ Запустить
rtx2080ti-2.12.64.160
32 768
12 65536 160 2 61,37 ₽ Запустить
rtx3090-1.16.24.160
32 768
16 24576 160 1 78,53 ₽ Запустить
rtx3080-2.16.32.160
32 768
16 32762 160 2 86,54 ₽ Запустить
rtx4090-1.16.32.160
32 768
16 32768 160 1 103,04 ₽ Запустить
teslav100-1.12.64.160
32 768
12 65536 160 1 107,57 ₽ Запустить
rtx5090-1.16.64.160
32 768
16 65536 160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160
32 768
16 65536 160 1 230,77 ₽ Запустить
teslah100-1.16.64.160
32 768
16 65536 160 1 456,27 ₽ Запустить

Связанные модели

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.