Продукты

Облачные серверы

Облачные серверы с посекундной тарификацией. Изолированные ресурсы дадут максимальную производительность для вашего проекта.

GPU-серверы

Облачные серверы с современными графическими ускорителями RTX и Tesla для игр, рендеринга, стриминга, работы с 3Д-графикой, искусственным интеллектом.

H200

H100 NVL

H100

RTX 5090

RTX 4090

RTX 3090

RTX 3080

A100

RTX A5000

A10

RTX 2080 Ti

A2

Tesla T4

Tesla V100

Все GPU-серверы

CPU-серверы

Облачные серверы с высокопроизводительными центральными процессорами Intel Xeon Gold 2-го, 3-го и 5-го поколений, доступные на 100% процессорного времени.
SSD-серверы NVMe-серверы
Все CPU-серверы

Выделенные серверы

Арендуйте физически выделенный сервер на длительный срок с помесячной оплатой. Соберите конфигурацию с использованием современных комлектующих: процессоров Intel Xeon Gold 2-го, 3-го и 5-го поколений, до 10 новейших видеоускорителей RTX и Tesla и до 8192 ГБ RAM на сервер, SSD- и NVMe-дисков для дата-центров.

Выбрать выделенный сервер

Маркетплейс

Используйте популярные и современные приложения в качестве эффективных инструментов для организации вашего проекта. Экономьте время с помощью предварительно настроенных образов, в которых уже установлены все необходимые компоненты.

Забудьте про ручную загрузку и установку программного обеспечения — просто разверните виртуальный сервер с готовым образом.
Нейронные сети 3D CUDA Docker / NGC Для игр Windows-образы Linux-образы
Все предустановленные образы
Возможности
Тарифы
FAQ
Контакты
Вход

Модели

В каталоге собраны наиболее популярные, свободно распространяемые нейросетевые модели от разработчиков со всего мира, включая большие языковые, мультимодальные и диффузионные модели. Попробуйте интересующие модели в одном месте.
Для знакомства с моделью и ее тестирования, вы можете воспользоваться публичным эндпоинтом. А для работы на постоянной основе, файнтюнинга или специфичных весов, лучше арендовать виртуальный или выделенный сервер с GPU.

DeepSeek-V4-Pro

Передовая MoE-модель на 1.6 трлн параметров (49 млрд активных), способная сверхэффективно обрабатывать контекст до 1 миллиона токенов благодаря инновационной гибридной архитектуре внимания – CSA+HCA. Модель уверенно лидирующие позиции по математике, программированию и агентным задачам, поддерживает три настраиваемых режима рассуждения («non-think», «think high», «think max») и потребляет почти в 10 раз меньше памяти KV-кэша по сравнению с предыдущими флагманами deepseek.

размышляющая

русскоязычная

для кодинга

22.04.2026

DeepSeek-V4-Flash

Открытая MoE‑модель из семейства DeepSeek V4, насчитывающая 284 млрд общих параметров при 13 млрд активных на токен и поддерживающая контекст до 1 млн токенов. Благодаря гибридному вниманию CSA + HCA она достигает экстремальной эффективности на сверхдлинных последовательностях. Модель демонстрирует близкие к Pro‑версии результаты в рассуждении, программировании и агентных задачах, будучи при этом гораздо менее требовательной к инфраструктуре.

размышляющая

русскоязычная

для кодинга

22.04.2026

Kimi-K2.6

Открытая мультимодальная модель от Moonshot AI ориентированная на работу с агентами. Архитектура Mixture-of-Experts с 1 трлн параметров (32 млрд активных на токен), поддерживающая окно контекста в 256K токенов и нативной INT4-квантизацией. Модель оптимизирована для длительных циклов программного решения задач, автономной работы и оркестрации «роя агентов», по этим направлениям она уверенно конкурирует с лучшими закрытыми моделями. Модель способна часами вести сложную инженерную работу, превращать визуальные макеты в готовые веб-приложения, декомпозировать и координировать до 300 параллельных суб-агентов в рамках одной сессии, что делает ее одним из лучших открытых решений для исследовательских задач и эффективного использования в качестве интеллектуального ядра в самых разных высокотехнологичных продуктах.

размышляющая

мультимодальная

русскоязычная

для кодинга

14.04.2026

MiniMax-M2.7

Первая модель, участвовавшая в собственной эволюции: в процессе разработки она сама строила навыки и оптимизировала своё обучение. Архитектура на базе 230B MoE (10B активных параметров) с полным вниманием обеспечивает стабильно высокое качество в сложных агентных и офисных задачах. На бенчмарках модель показывает результаты на уровне лучших закрытых решений. Идеально подходит для разработки автономных агентов, работы с офисными документами и комплексной автоматизации сложных профессиональных задач, выступая в роли «всезнающего и эмоционального AI-коллеги».

размышляющая

русскоязычная

для кодинга

09.04.2026

GLM-5.1

Флагманская MoE-модель (744 млрд общих / 40 млрд активных параметров) с механизмом разреженного внимания DSA, созданная для продолжительной автономной работы. Она занимает первое место на SWE‑Bench Pro и CyberGym, опережая на момент релиза все существующие модели (включая закрытые), и стабильно входит в число лидеров в других значимых бенчмарках, а главное — она сохраняет способность к прогрессу на сотнях итераций и тысячах вызовов инструментов, там, где многие модели теряют эффективность и стараются дать быстрый ответ GLM-5.1 продолжает искать лучшее решение.

размышляющая

русскоязычная

для кодинга

03.04.2026

gemma-4-26B-A4B-it

Высокоэффективная модель на архитектуре смеси экспертов, которая при активации лишь 3.8B параметров обеспечивает 97% качества флагманской модели 31B. Оптимальный выбор для сложных агентных и аналитических задач с умеренными требованиями к вычислительным ресурсам.

размышляющая

мультимодальная

русскоязычная

для кодинга

можно попробовать

11.03.2026

gemma-4-31B-it

Флагманская плотная модель семейства gemma-4, c 31B параметров она лишь немного уступает крупнейшим по размеру проприетарным и открытым аналогам. Нативная мультимодальность, мультиязычность, контекстное окно в 256K токенов, гибридный механизм внимания Sliding window для снижения требований к памяти и в совокупности - идеальный выбор для задач, требующих качественных рассуждений и глубокого анализа.

размышляющая

мультимодальная

русскоязычная

для кодинга

11.03.2026

NVIDIA-Nemotron-3-Super-120B-A12B

NVIDIA Nemotron 3 Super 120B (12B active) — это гибридная модель на базе разреженной архитектуры Latent Mixture-of-Experts (MoE) и Mamba-2, оптимизированная для создания сложных агентных систем и работы с контекстом до 1 млн токенов. Благодаря инновационной архитектуре, активирующей только 12 миллиардов параметров на токен и механизму предсказания нескольких токенов (MTP), модель обеспечивает высокую эффективность инференса, сочетая качество ответов с производительностью и экономией вычислений при обработке длинных последовательностей.

Универсальная модель с 35 миллиардами параметров (активируется 3B) отлично балансирует между высокой производительностью и экономией ресурсов. Она идеально подходит для продакшн-сред на доступном пользовательском оборудовании и хорошо справляется с задачами, требующими скорости, поддержки мультимодальности, рассуждений и обработки длинного контекста.

размышляющая

мультимодальная

русскоязычная

можно попробовать

24.02.2026

Helios-Base

Модель для генерации видео по тексту (T2V), изображению (I2V) и видео (V2V), разработанная для использования в режиме реального времени и долгой продолжительности. Она способна синтезировать видео длительностью до нескольких минут с частотой 19,5 кадров в секунду (FPS) на одном GPU H100. Уникальность модели заключается в отсутствии использования традиционных методов противодрейфа (например, self-forcing, error-banks) и стандартных ускоряющих техник (KV-cache, causal masking), что не снижает качество и синхронность видео.

23.02.2026

Qwen3.5-397B-A17B

Гибридная модель от команды Qwen, объединяющая передовые мультимодальные возможности с исключительной эффективностью благодаря архитектуре Gated DeltaNet и разреженных экспертов (MoE). При общем объеме в 397 миллиардов параметров модель активирует лишь 17 миллиардов за токен, обеспечивая производительность на широком спектре задач — от сложных математических рассуждений до мультимодального понимания и создания агентов.

размышляющая

мультимодальная

русскоязычная

16.02.2026