Облачные серверы с NVIDIA H200

Первый графический ускоритель, преодолевший 100 GB памяти на одном чипе

Графические серверы с NVIDIA H200

Все графические серверы с NVIDIA H200 построены на базе двух центральных процессоров Intel Xeon Gold 5-го поколения — 6548Y+, с тактовой частотой All Core Boost 3,5 ГГц и максимальной тактовой частотой 4,1 ГГц.

Каждый процессор содержит два блока Intel® AVX-512 и поддерживает функции Intel® AVX-512 Deep Learning Boost. Инструкции данного набора многократно ускоряют операции умножения и сложения с пониженной точностью, которые используются во многих внутренних циклах алгоритма глубокого обучения.

Каждый сервер имеет до 8192 ГБ оперативной памяти DDR5 ECC Reg 5600 МГц. Локальное хранилище общей емкостью 3200 ГБ, организовано на твердотельных накопителях Samsung, разработанных специально для дата-центров.

GPU NVIDIA H200

Ускорьте свой переход в новую эпоху работы с искусственным интеллектом благодаря новейшим чипам H200 с тензорными ядрами четвертого поколения.

Графические процессоры H200, оснащенные тензорными ядрами четвертого поколения и Transformer Engine с точностью FP8, ускоряют инференс и обучение до 2 раз по сравнению с H100.

Тензорные ядра четвертого поколения ускоряют все типы точности, включая FP64, TF32, FP32, FP16 и INT8, а Transformer Engine использует FP8 и FP16 вместе, чтобы сократить использование памяти и повысить производительность, сохраняя при этом точность для больших языковых моделей.

Объем видеопамяти 141 ГБ
Тип видеопамяти HBM3e
Пропускная способность памяти 4.8 ТБ/с
Декодеры 7 NVDEC, 7 JPEG

Тесты производительности GPU

Результаты тестов производительности в виртуальной среде для 1 карты NVIDIA H200.
  • Matrix multiply example

    4500
    GFlop/s
  • Hashcat bcrypt

    320 000
    H/s

Базовые конфигурации с NVIDIA H200 141 GB

Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
h200-1.16.128.160 16 131072 160 1 623,04 ₽ Запустить
h200-1.16.128.240 16 131072 240 1 623,81 ₽ Запустить
h200-1.16.128.320 16 131072 320 1 624,59 ₽ Запустить
h200-1.24.192.160 24 196608 160 1 638,70 ₽ Запустить
h200-1.24.192.240 24 196608 240 1 639,47 ₽ Запустить
h200-1.24.192.320 24 196608 320 1 640,25 ₽ Запустить
h200-1.24.256.160 24 262144 160 1 649,97 ₽ Запустить
h200-1.24.256.240 24 262144 240 1 650,74 ₽ Запустить
h200-1.24.256.320 24 262144 320 1 651,52 ₽ Запустить
h200-2.24.256.240 24 262144 240 2 1 240,74 ₽ Запустить
h200-2.24.256.320 24 262144 320 2 1 241,52 ₽ Запустить
h200-2.24.256.480 24 262144 480 2 1 243,08 ₽ Запустить
h200-2.24.384.320 24 393216 320 2 1 264,04 ₽ Запустить
h200-2.24.384.480 24 393216 480 2 1 265,60 ₽ Запустить
h200-2.32.384.320 32 393216 320 2 1 268,44 ₽ Запустить
h200-2.32.384.480 32 393216 480 2 1 270,00 ₽ Запустить
h200-3.32.512.480 32 524288 480 3 1 882,53 ₽ Запустить
h200-3.32.512.640 32 524288 640 3 1 884,08 ₽ Запустить
h200-3.32.512.960 32 524288 960 3 1 887,19 ₽ Запустить
h200-4.32.768.480 32 786432 480 4 2 517,59 ₽ Запустить
h200-4.32.768.640 32 786432 640 4 2 519,14 ₽ Запустить
h200-4.32.768.960 32 786432 960 4 2 522,25 ₽ Запустить
h200-4.44.768.480 44 786432 480 4 2 524,19 ₽ Запустить
h200-4.44.768.640 44 786432 640 4 2 525,74 ₽ Запустить
h200-6.52.896.640 52 917504 640 6 3 732,67 ₽ Запустить
h200-6.52.896.960 52 917504 960 6 3 735,78 ₽ Запустить
h200-8.52.1024.640 52 1048576 640 8 4 935,19 ₽ Запустить
h200-8.52.1024.960 52 1048576 960 8 4 938,30 ₽ Запустить

100% производительности

Мы закрепляем физические ядра процессора и графические адаптеры только за одним клиентом.
Это значит, что:

  • Ядра процессора будут доступны на 100% процессорного времени;
  • Выбранный графический ускоритель будет зарезервирован только за вашим сервером;
  • Вы получите высокую производительность при работе с системой хранения.

Тестирование виртуальных серверов с локальными загрузочными дисками показывает до 75 000 IOPS1 на случайные операции чтения и до 20 000 IOPS на случайные операции записи.

Тестирование виртуальных серверов с сетевыми загрузочными дисками показывает до 70 000 IOPS1 на случайные операции чтения и до 60 000 IOPS на случайные операции записи.

Вы можете быть уверены, что арендуемые CPU и GPU используются только вашим виртуальным сервером.

  1. IOPS (от англ. Input/Output Operations Per Second) — количество операций ввода-вывода, выполняемых системой хранения данных за одну секунду.

Ответы на часто задаваемые вопросы

Вы можете арендовать виртуальный GPU-сервер на любой срок. Сделайте платеж на любую сумму от 100 ₽ и работайте в рамках предоплаченного баланса. По завершении работ — удалите сервер, чтобы остановить расходование средств.

В панели управления вы самостоятельно создаете нужное количество GPU-серверов, выбирая подходящую конфигурацию оборудования и операционную систему. Как правило заказанные мощности становятся доступны для использования в течение нескольких минут.

Если что-то пошло не так — напишите в нашу круглосуточную службу поддержки: https://t.me/immerscloudsupport.

Вы можете выбрать из базовых образов: Windows Server 2019, Windows Server 2022, Ubuntu, Debian, CentOS, Fedora, OpenSUSE. Или используйте преднастроенный образ из Маркетплейса.

Все операционные системы устанавливаются автоматически при создании GPU-сервера.

По-умолчанию мы предоставляем подключение к серверам на базе Windows Server по RDP, а для сереверов на базе Linux — по SSH.

В дальнейшем вы можете настроить любой удобный для вас способ подключения самостоятельно.

Да, это возможно. Обратитесь в нашу круглосуточную службу поддержки (https://t.me/immerscloudsupport) и расскажите, какая конфигурация вам требуется.

Еще немного о нас

  • Посекундая тарификация

    и бесплатная пауза (shelve). Вы платите за фактическое использование ваших ВМ
  • 24/7/365

    Поддержка всегда на связи в чате и отвечает за несколько минут

  • Бесплатный траффик

    Скорости до 20 Гб/с без оплаты за входящий и исходящий траффик

  • Свой ЦОД

    Построенный по стандарту TIER III в Москве
  • 100% мощностей — ваши

    Мы не делим купленные вами ресурсы с другими пользователями
  • 20 000+

    Клиентов доверили нам свои задачи за 5 лет работы
Регистрация

Готовые образы с нужным ПО

Создавайте виртуальные серверы на базе любой из предустановленных операционных систем с необходимым набором.
  • Ubuntu
     
  • Debian
     
  • CentOS
     
  • Fedora
     
  • OpenSUSE
     
  • MS Windows Server
     
  • 3ds Max
     
  • Cinema 4D
     
  • Corona
     
  • Deadline
     
  • Blender
     
  • Archicad
     
  • Ubuntu
    Graphics drivers, CUDA, cuDNN
  • MS Windows Server
    Graphics drivers, CUDA, cuDNN
  • Nginx
     
  • Apache
     
  • Git
     
  • Jupyter
     
  • Django
     
  • MySQL
     
Посмотрите все предустановленные образы в Маркетплейсе.

Оригинальный API OpenStack

Для разработчиков и системных администраторов доступно управление облаком с помощью полноценного API OpenStack.
Пример аутентификации ninja_user: $ curl -g -i -X POST https://api.immers.cloud:5000/v3/auth/tokens \
-H "Accept: application/json" \
-H "Content-Type: application/json" \
-H "User-Agent: YOUR-USER-AGENT" \
-d '{"auth": {"identity": {"methods": ["password"], "password": {"user": { "name": "ninja_user", "password": "ninja_password", "domain": {"id": "default"}}}}, "scope": {"project": {"name": "ninja_user", "domain": {"id": "default"}}}}}'
Пример создания ninja_vm: $ curl -g -i -X POST https://api.immers.cloud:8774/v2.1/servers \
-H "Accept: application/json" \
-H "Content-Type: application/json" \
-H "User-Agent: YOUR-USER-AGENT" \
-H "X-Auth-Token: YOUR-API-TOKEN" \
-d '{"server": {"name": "ninja_vm", "imageRef": "8b85e210-d2c8-490a-a0ba-dc17183c0223", "key_name": "mykey01", "flavorRef": "8f9a148d-b258-42f7-bcc2-32581d86e1f1", "max_count": 1, "min_count": 1, "networks": [{"uuid": "cc5f6f4a-2c44-44a4-af9a-f8534e34d2b7"}]}}'
Пример выключения ninja_vm: $ curl -g -i -X POST https://api.immers.cloud:8774/v2.1/servers/{server_id}/action \
-H "Accept: application/json" \
-H "Content-Type: application/json" \
-H "User-Agent: YOUR-USER-AGENT" \
-H "X-Auth-Token: YOUR-API-TOKEN" \
-d '{"os-stop" : null}'
Пример включения ninja_vm: $ curl -g -i -X POST https://api.immers.cloud:8774/v2.1/servers/{server_id}/action \
-H "Accept: application/json" \
-H "Content-Type: application/json" \
-H "User-Agent: YOUR-USER-AGENT" \
-H "X-Auth-Token: YOUR-API-TOKEN" \
-d '{"os-start" : null}'
Пример остановки и освобождения ресурсов ninja_vm (остановка тарификации): $ curl -g -i -X POST https://api.immers.cloud:8774/v2.1/servers/{server_id}/action \
-H "Accept: application/json" \
-H "Content-Type: application/json" \
-H "User-Agent: YOUR-USER-AGENT" \
-H "X-Auth-Token: YOUR-API-TOKEN" \
-d '{"shelve" : null}'
Пример удаления ninja_vm: $ curl -g -i -X DELETE https://api.immers.cloud:8774/v2.1/servers/{server_id} \
-H "User-Agent: YOUR-USER-AGENT" \
-H "X-Auth-Token: YOUR-API-TOKEN"
Вся документация
Зарегистрироваться

Есть вопросы?

Напишите нам в чате, по почте или позвоните по телефону:
@immerscloudsupport
support@immers.cloud
+7 499 110-44-94

Есть вопросы?

Напишите нам в чате, по почте или позвоните по телефону:
@immerscloudsupport support@immers.cloud +7 499 110-44-94
Регистрация

Подпишитесь на нашу рассылку

Получайте уведомления о новых акциях и спецпредложениях на электронную почту.

 Я согласен на обработку персональных данных