Продукты

Облачные серверы

Облачная платформа с новейшими GPU, быстрым онбоардингом, посекундной тарификацией и иммерсионным охлаждением. Изолированные ресурсы обеспечат максимальную производительность для вашего проекта.

GPU-серверы

Облачные серверы с современными графическими ускорителями RTX и Tesla для игр, рендеринга, стриминга, работы с 3Д-графикой, искусственным интеллектом.

H200

H100 NVL

H100

RTX 5090

RTX 4090

RTX 3090

RTX 3080

A100

RTX A5000

A10

A2

RTX 2080 Ti^EOL

Tesla T4^EOL

Tesla V100^EOL

Все GPU-серверы

CPU-серверы

Облачные серверы с высокопроизводительными центральными процессорами Intel Xeon Gold 2-го, 3-го и 5-го поколений, доступные на 100% процессорного времени.
SSD-серверыдо 75К IOPS NVMe-серверыдо 360К IOPS
Все CPU-серверы

Immers Foundation Models

Самый большой каталог проверенных open-source моделей с автоматическим подбором конфигураций и настройками для быстрого деплоя. Запускайте частные эндпоинты без оплаты за токены или используйте публичные эндпоинты.

Kimi-K3 Unlimited-OCR GLM-5.2 Kimi-K2.7-Code NVIDIA-Nemotron-3-Ultra-550B-A55B gemma-4-12B-it MiniMax-M3 PaddleOCR-VL-1.6 DeepSeek-V4-Pro DeepSeek-V4-Flash Qwen3.6-27B Qwen3.6-35B-A3B Kimi-K2.6 GLM-5.1 gemma-4-26B-A4B-it gemma-4-31B-it NVIDIA-Nemotron-3-Super-120B-A12B Qwen3.5-122B-A10B Qwen3.5-397B-A17B gpt-oss-120b gpt-oss-20b

Все моделииз каталога

Выделенные серверы

Арендуйте физически выделенный сервер на длительный срок с помесячной оплатой. Соберите конфигурацию с использованием современных комлектующих: процессоров Intel Xeon Gold 2-го, 3-го и 5-го поколений, до 8192 ГБ RAM на сервер, SSD- и NVMe-дисков для дата-центров.

Выбрать выделенный сервердо 10 GPU и 2.5M IOPS

Маркетплейс

Используйте популярные и современные приложения в качестве эффективных инструментов для организации вашего проекта. Экономьте время с помощью предварительно настроенных образов, в которых уже установлены все необходимые компоненты.

Забудьте про ручную загрузку и установку программного обеспечения — просто разверните виртуальный сервер с готовым образом.
Нейронные сети 3D CUDA Docker / NGC Для игр Windows-образы Linux-образы
Все предустановленные образы
Возможности
Тарифы
FAQ
Контакты
Вход

Сколько видеопамяти (VRAM) нужно для запуска модели?

Подбор подходящего варианта сервера является сложной задачей, требующей высокой квалификации в предметной области. Он основывается на характеристиках самой модели (архитектура, количество параметров, тип внимания и т. п.), характеристиках инференса (длина контекста, параллельность и т. п.) и характеристиках конфигурации сервера. Мы предлагаем широкий ряд конфигураций с GPU, которые можно использовать для инференса нейронных сетей. Чтобы облегчить ваш выбор, мы сами составляем рекомендации для каждой модели и проверяем работоспособность и производительность этих конфигураций ежедневно.

В последние годы наблюдается тенденция: чем больше параметров в ИИ-модели, тем выше её качество. Однако крупные модели требуют дорогостоящих серверов с мощными GPU, что создаёт значительную нагрузку на бюджет. Для оптимизации затрат применяют квантование — снижение точности представления весов и активаций модели с стандартных 32 bit (FP32) до меньших форматов. Чаще всего используют:

4 bit (максимальная экономия ресурсов, возможны потери в качестве);
8 bit (оптимальный баланс между размером модели и качеством);
16 bit (без снижения точности, без потерь качества).

Таким образом, квантование помогает снизить затраты на инфраструктуру и использовать мощные ИИ-модели даже при ограниченном бюджете. Именно поэтому мы готовим рекомендации сразу для каждой битности.

Чтобы воспользоваться рекомендациями, достаточно перейти на страницу требуемой модели в каталоге моделей и пролистать до пункта «Рекомендуемые конфигурации сервера для хостинга». В зависимости от типа модели доступно два варианта использования:

Если модель относится к LLM или visual LLM, то по нажатию на кнопку «Запустить» откроется страница создания частного эндпоинта.
Для остальных моделей (генерации изображений, видео, аудио) доступно создание обычного сервера по нажатию на кнопку «Запустить».

Дата обновления 18.06.2026