Продукты

Облачные серверы

Облачные серверы с посекундной тарификацией. Изолированные ресурсы дадут максимальную производительность для вашего проекта.

GPU-серверы

Облачные серверы с современными графическими ускорителями RTX и Tesla для игр, рендеринга, стриминга, работы с 3Д-графикой, искусственным интеллектом.

H200

H100 NVL

H100

RTX 5090

RTX 4090

RTX 3090

RTX 3080

A100

RTX A5000

A10

RTX 2080 Ti

A2

Tesla T4

Tesla V100

Все GPU-серверы

CPU-серверы

Облачные серверы с высокопроизводительными центральными процессорами Intel Xeon Gold 2-го, 3-го и 5-го поколений, доступные на 100% процессорного времени.
SSD-серверы NVMe-серверы
Все CPU-серверы

Выделенные серверы

Арендуйте физически выделенный сервер на длительный срок с помесячной оплатой. Соберите конфигурацию с использованием современных комлектующих: процессоров Intel Xeon Gold 2-го, 3-го и 5-го поколений, до 10 новейших видеоускорителей RTX и Tesla и до 8192 ГБ RAM на сервер, SSD- и NVMe-дисков для дата-центров.

Выбрать выделенный сервер

Маркетплейс

Используйте популярные и современные приложения в качестве эффективных инструментов для организации вашего проекта. Экономьте время с помощью предварительно настроенных образов, в которых уже установлены все необходимые компоненты.

Забудьте про ручную загрузку и установку программного обеспечения — просто разверните виртуальный сервер с готовым образом.
Нейронные сети 3D CUDA Docker / NGC Для игр Windows-образы Linux-образы
Все предустановленные образы
Возможности
Тарифы
FAQ
Контакты
Вход

YandexGPT-5-Lite-8B

русскоязычная

YandexGPT-5-Lite-8B-instruct представляет собой языковую модель размером 8 миллиардов параметров с контекстом в 32k токенов, разработанную Яндексом специально для работы с русскоязычным контентом. Модель построена на основе собственной pretrain-версии YandexGPT 5 Lite, что отличает ее от многих конкурентов, использующих веса сторонних моделей как отправную точку. Обучение проходило в два этапа: первый на корпусе данных объемом 15 триллионов токенов (30% русскоязычных), второй этап Powerup на высококачественных данных объемом 320 миллиардов токенов. Процесс alignment модели включает передовые методы SFT (Supervised Fine-Tuning) и RLHF (Reinforcement Learning from Human Feedback), дополненные собственной разработкой Яндекса — алгоритмом LogDPO, который решает проблему "разучивания" традиционного DPO подхода. Эта инновация позволяет модели стабильно обучаться на предпочтительных данных без деградации качества ответов.

Уникальной особенностью модели является специализированная обработка русскоязычного контента, включая оптимизированный для русского языка словарь токенов, что обеспечивает более эффективное использование вычислительных ресурсов по сравнению с изначально англоязычными моделями. 32k токенов контекста YandexGPT соответствуют 48k токенам модели Qwen-2.5-32B-base для русскоязычных текстов, таким образом YandexGPT-5-Lite демонстрирует оптимальную токенизацию для кириллицы. Особенностью токенизации так же является замена символов переноса строк на специальные токены [NL] и раздельная обработка каждой реплики диалога, что создает пробелы в начале каждого сообщения. Модель использует нестандартный шаблон диалога с последовательностью Ассистент:[SEP] для генерации ответов и завершающим токеном </s>, что обеспечивает корректную работу в многоходовых диалогах любой длины.

YandexGPT-5-Lite демонстрирует выдающиеся результаты в ключевых бенчмарках, достигая паритета или превосходства над моделями Llama-3.1-8B-instruct и Qwen-2.5-7B-instruct. Модель показывает исключительные результаты в RuCulture — специализированном бенчмарке по русской культуре, литературе и сленгу, где значительно опережает международные аналоги.

YandexGPT-5-Lite-8B-instruct идеально подходит для создания русскоязычных чат-ботов и виртуальных ассистентов, особенно в корпоративной среде, где требуется понимание российских культурных контекстов и бизнес-практик. Образовательные платформы могут использовать модель для создания интеллектуальных тьюторов по русской литературе, истории и культуре. Она отлично подходит и для контент-маркетинга и копирайтинга на русском языке, включая создание SEO-оптимизированных текстов и адаптацию контента под российскую аудиторию. Разработчики и исследователи найдут модель полезной для файн-тюнинга под специфические задачи, связанные с русским контентом, поскольку она изначально обучена на русскоязычных данных и не потребует значительной адаптации.

Дата анонса: 31.03.2025
Параметров: 9B
Контекст: 33K
Слоев: 32
Тип внимания: Full Attention
Разработчик: Yandex
Версия Transformers: 4.56.1
Лицензия: Лицензионное соглашение YandexGPT-5-Lite-8B

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами бесплатно для теста инференса и знакомства с YandexGPT-5-Lite-8B. Получить токен для доступа к API вы можете на странице управления токенами после регистрации и верификации.

Наименование модели	Контекст	Тип	GPU	Статус	Ссылка


        Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

получить максимальную производительность эндпоинта,
получить полный контекст для обработки больших запросов и диалогов,
обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации сервера для хостинга YandexGPT-5-Lite-8B

Цены:

Наименование	GPU	Цена, час	Цена, месяц	Параллельность (макс.)
teslat4-1.16.16.160 32 768	1	29,33 ₽	21 117,60 ₽	2,04	Запустить
teslaa2-1.16.32.160 32 768	1	33,74 ₽	24 292,80 ₽	2,04	Запустить
teslaa10-1.16.32.160 32 768	1	46,94 ₽	33 796,80 ₽	3,84	Запустить
rtx2080ti-2.12.64.160 32 768 tensor	2	61,37 ₽	44 186,40 ₽	2,76	Запустить
rtx3090-1.16.24.160 32 768	1	73,73 ₽	53 085,60 ₽	3,84	Запустить
rtx3080-2.16.32.160 32 768 tensor	2	86,54 ₽	62 308,80 ₽	2,31	Запустить
rtx4090-1.16.32.160 32 768	1	91,14 ₽	65 620,80 ₽	3,84	Запустить
teslav100-1.12.64.160 32 768	1	107,57 ₽	77 450,40 ₽	5,64	Запустить
rtxa5000-2.16.64.160.nvlink 32 768 tensor	2	109,77 ₽	79 034,40 ₽	8,61	Запустить
rtx5090-1.16.64.160 32 768	1	141,77 ₽	102 074,40 ₽	5,64	Запустить
teslaa100-1.16.64.160 32 768	1	211,77 ₽	152 474,40 ₽	16,44	Запустить
h100-1.16.64.160 32 768	1	341,77 ₽	246 074,40 ₽	16,44	Запустить
h100nvl-1.16.96.160 32 768	1	367,41 ₽	264 535,20 ₽	19,59	Запустить
h200-1.16.128.160 32 768	1	423,04 ₽	304 588,80 ₽	30,16	Запустить

Цены:

Наименование	GPU	Цена, час	Цена, месяц	Параллельность (макс.)
teslat4-1.16.16.160 32 768	1	29,33 ₽	21 117,60 ₽	1,10	Запустить
teslaa2-1.16.32.160 32 768	1	33,74 ₽	24 292,80 ₽	1,10	Запустить
teslaa10-1.16.32.160 32 768	1	46,94 ₽	33 796,80 ₽	2,90	Запустить
rtx2080ti-2.12.64.160 32 768 tensor	2	61,37 ₽	44 186,40 ₽	1,83	Запустить
rtx3090-1.16.24.160 32 768	1	73,73 ₽	53 085,60 ₽	2,90	Запустить
rtx3080-2.16.32.160 32 768 tensor	2	86,54 ₽	62 308,80 ₽	1,38	Запустить
rtx4090-1.16.32.160 32 768	1	91,14 ₽	65 620,80 ₽	2,90	Запустить
teslav100-1.12.64.160 32 768	1	107,57 ₽	77 450,40 ₽	4,70	Запустить
rtxa5000-2.16.64.160.nvlink 32 768 tensor	2	109,77 ₽	79 034,40 ₽	7,68	Запустить
rtx5090-1.16.64.160 32 768	1	141,77 ₽	102 074,40 ₽	4,70	Запустить
teslaa100-1.16.64.160 32 768	1	211,77 ₽	152 474,40 ₽	15,50	Запустить
h100-1.16.64.160 32 768	1	341,77 ₽	246 074,40 ₽	15,50	Запустить
h100nvl-1.16.96.160 32 768	1	367,41 ₽	264 535,20 ₽	18,65	Запустить
h200-1.16.128.160 32 768	1	423,04 ₽	304 588,80 ₽	29,23	Запустить

Цены:

Наименование	GPU	Цена, час	Цена, месяц	Параллельность (макс.)
teslat4-2.16.32.160 32 768 tensor	2	48,14 ₽	34 660,80 ₽	1,77	Запустить
teslaa2-2.16.32.160 32 768 tensor	2	51,34 ₽	36 964,80 ₽	1,77	Запустить
rtx2080ti-3.12.24.120 32 768 pipeline	3	74,84 ₽	53 884,80 ₽	1,37	Запустить
teslaa10-2.16.64.160 32 768 tensor	2	83,37 ₽	60 026,40 ₽	5,37	Запустить
rtx2080ti-4.16.32.160 32 768 tensor	4	99,74 ₽	71 812,80 ₽	3,22	Запустить
teslav100-1.12.64.160 32 768	1	107,57 ₽	77 450,40 ₽	2,40	Запустить
rtxa5000-2.16.64.160.nvlink 32 768 tensor	2	109,77 ₽	79 034,40 ₽	5,37	Запустить
rtx3090-2.16.64.160 32 768 tensor	2	139,77 ₽	100 634,40 ₽	5,37	Запустить
rtx5090-1.16.64.160 32 768	1	141,77 ₽	102 074,40 ₽	2,40	Запустить
rtx3080-4.16.64.160 32 768 tensor	4	162,57 ₽	117 050,40 ₽	2,32	Запустить
rtx4090-2.16.64.160 32 768 tensor	2	171,77 ₽	123 674,40 ₽	5,37	Запустить
teslaa100-1.16.64.160 32 768	1	211,77 ₽	152 474,40 ₽	13,20	Запустить
h100-1.16.64.160 32 768	1	341,77 ₽	246 074,40 ₽	13,20	Запустить
h100nvl-1.16.96.160 32 768	1	367,41 ₽	264 535,20 ₽	16,35	Запустить
h200-1.16.128.160 32 768	1	423,04 ₽	304 588,80 ₽	26,92	Запустить

Связанные модели

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.

YandexGPT-5-Lite-8B

Публичный эндпоинт

Частный сервер

Рекомендуемые конфигурации сервера для хостинга YandexGPT-5-Lite-8B

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Связанные модели

Остались вопросы?