Продукты

Облачные серверы

Облачные серверы с посекундной тарификацией. Изолированные ресурсы дадут максимальную производительность для вашего проекта.

GPU-серверы

Облачные серверы с современными графическими ускорителями RTX и Tesla для игр, рендеринга, стриминга, работы с 3Д-графикой, искусственным интеллектом.

H200

H100 NVL

H100

RTX 5090

RTX 4090

RTX 3090

RTX 3080

A100

RTX A5000

A10

RTX 2080 Ti

A2

Tesla T4

Tesla V100

Все GPU-серверы

CPU-серверы

Облачные серверы с высокопроизводительными центральными процессорами Intel Xeon Gold 2-го, 3-го и 5-го поколений, доступные на 100% процессорного времени.
SSD-серверы NVMe-серверы
Все CPU-серверы

Выделенные серверы

Арендуйте физически выделенный сервер на длительный срок с помесячной оплатой. Соберите конфигурацию с использованием современных комлектующих: процессоров Intel Xeon Gold 2-го, 3-го и 5-го поколений, до 10 новейших видеоускорителей RTX и Tesla и до 8192 ГБ RAM на сервер, SSD- и NVMe-дисков для дата-центров.

Выбрать выделенный сервер

Маркетплейс

Используйте популярные и современные приложения в качестве эффективных инструментов для организации вашего проекта. Экономьте время с помощью предварительно настроенных образов, в которых уже установлены все необходимые компоненты.

Забудьте про ручную загрузку и установку программного обеспечения — просто разверните виртуальный сервер с готовым образом.
Нейронные сети 3D CUDA Docker / NGC Для игр Windows-образы Linux-образы
Все предустановленные образы
Возможности
Тарифы
FAQ
Контакты
Вход

Модели

В каталоге собраны наиболее популярные, свободно распространяемые нейросетевые модели от разработчиков со всего мира, включая большие языковые, мультимодальные и диффузионные модели. Попробуйте интересующие модели в одном месте.
Для знакомства с моделью и ее тестирования, вы можете воспользоваться публичным эндпоинтом. А для работы на постоянной основе, файнтюнинга или специфичных весов, лучше арендовать виртуальный или выделенный сервер с GPU.

GLM-4.5V

Мульти-модальная модель нового поколения, работающая с изображениями, видео, текстом и графическим пользовательским интерфейсом. Ее архитектура построена на базе флагманской МoЕ GLM-4.5 Air и поддерживает режимы Thinking Mode для глубокого рассуждения и No-Thinking Mode для быстрых ответов. На момент выхода модель занимает лидирующие позиции на 41 из 42 ключевых бенчмарков, с помощью которых тестируются LLM, способные воспринимать визуальную и текстовую информацию.

размышляющая

мультимодальная

русскоязычная

11.08.2025

Qwen3-4B-Instruct-2507

Небольшая, но высокопроизводительная языковая модель с 4B параметрами, специализированная на быстром выполнении инструкций без внутренних рассуждений. Модель превосходит GPT-4.1-nano по всем ключевым метрикам и поддерживает контекст до 262K токенов. Оптимальна для задач классификации, генерации ответов с использованием базы знаний и диалоговых ассистентов, и в целом для любых сценариев, где требуется высокая скорость обработки запросов и точное следование инструкциям.

русскоязычная

07.08.2025

Qwen3-4B-Thinking-2507

Обновление гибридной Qwen3-4B, получившее специализацию на сложных рассуждениях, увеличенный контекст в 262K токенов и работающая только в reasoning режиме. Для своих 4 млрд параметров модель достигает невероятного результата 81.3 в олимпиадной математике - AIME25! Она идеальна для локального развертывания, отладки кода, аналитических задач и сценариев, требующих пошаговых обдуманных решений.

размышляющая

русскоязычная

07.08.2025

gpt-oss-120b

Флагманская, открытая! reasoning модель от OpenAI, наследующая лучшие научные разработки и достижения, которые компания использовала в знаменитом ChatGPT. Это модель с уникальной MoE-архитектурой в 116.8B параметров, но активирующей только 5.1B параметров на токен и оснащенная таким количеством инноваций, позволяющих эффективно балансировать между производительностью и потреблением ресурсов, причем так, что модель может работать на одном 80GB GPU. GPT-OSS-120B поддерживает трехуровневую систему рассуждений и впервые в открытых моделях представлена расширенная иерархия ролей и каналы вывода генерации под соответствующие роли, что в совокупности позволяет пользователю максимально точно настраивать и управлять поведением модели.

размышляющая

русскоязычная

05.08.2025

gpt-oss-20b

Компактная, но мощная reasoning MoE-модель от OpenAI с 20.9B общих параметров (3.61 активируются на токен), которая работает всего на 16GB памяти и идеально подходит для локального развертывания с использованием общедоступного пользователям оборудования. Но при этом сохраняет все передовые возможности reasoning и tool use, а по целому ряду ключевых бенчмарков превосходит не только open-source решения, но и популярную o3-mini OpenAI, что является хорошим сигналом для использования gpt-oss-20b в самых разных исследовательских и продуктовых сценариях.

размышляющая

русскоязычная

можно попробовать

05.08.2025

Qwen-Image

Мультимодальная модель для генерации и редактирования изображений на основе текстовых запросов, входящая в серию моделей Qwen. Она демонстрирует значительные улучшения в точном отображении сложного текста (включая китайский язык) и выполнении продвинутых операций редактирования изображений. Модель обладает обобщенными способностями как в создании изображений, так и в их редактировании, с акцентом на сохранение деталей шрифтов, композиции и контекстной гармонии текста.

04.08.2025

Qwen3-30B-A3B-Thinking-2507

Qwen3-30B-A3B-Thinking-2507 — обновление Qwen3-30B-A3B адаптированная и специализированная на работе только в режиме размышления. Модель с 30.5B параметров (3.3B активных), 128 экспертами (8 активны на токен) и увеличенным контекстом в 262 144 является идеальным open-source решением среди моделей средних размеров под задачи, требующие качественного reasoning для задействования инструментов и реализации агентских возможностей или же просто для формирования выверенных ответов на очень сложные вопросы пользователя.

размышляющая

русскоязычная

29.07.2025

Qwen3-30B-A3B-Instruct-2507

Обновленная версия Qwen3-30B-A3B с 30.5 млрд параметров (3.3B активных) и увеличенным контекстом в 262 144 ориентированная на генерацию мгновенных и точных ответов без промежуточных размышлений. Невероятно эффективная диалоговая модель, способная на решение не только технических, но и творческих задач – идеальна для использования в чат-ботах.

русскоязычная

29.07.2025

Wan2.2-I2V-A14B-Diffusers

Модель предназначена для генерации видео на основе входного изображения (Image-to-Video, I2V). Она входит в семейство Wan2.2, улучшенных моделей генерации видео, и реализует архитектуру Mixture-of-Experts (MoE) для повышения емкости модели при сохранении вычислительных затрат.

28.07.2025

Wan2.2-T2V-A14B-Diffusers

Модель T2V-A14B поддерживает генерацию 5-секундных видео в разрешениях 480P и 720P. Построенная на основе архитектуры Mixture-of-Experts (MoE), она обеспечивает исключительное качество генерации видео. На новом бенчмарке Wan-Bench 2.0 модель превосходит ведущие коммерческие решения по большинству ключевых показателей оценки.

28.07.2025

Wan2.2-TI2V-5B-Diffusers

Это Text-to-Video и Image-to-Video модель на основе диффузионной архитектуры, разработанная в рамках проекта Wan2.2. Модель содержит 5 миллиардов параметров и использует высококомпрессивный кодировщик Wan2.2-VAE с соотношением сжатия 4×16×16. Она поддерживает генерацию видео в разрешении 720p (1280×704 или 704×1280) с частотой кадров 24 fps, и может работать на потребительских GPU, таких как NVIDIA RTX 4090.

28.07.2025

GLM-4.5

Гибридная модель с 355B параметров, объединяющая продвинутые рассуждения, программирование с артефактами и агентные возможности в единой MoE архитектуре с увеличенным количеством скрытых слоев. На момент выхода модель занимает 3-е место в мировом рейтинге по среднему показателю на 12 ключевых бенчмарках. Особенно впечатляет ее возможности в генерации готовых веб-приложений, интерактивных презентаций и сложного программного кода. При этом пользователям достаточно просто объяснить модели как должна работать программа и какой результат они хотят видеть.

размышляющая

русскоязычная

28.07.2025

GLM-4.5-Air

Качественая агент-ориентированная модель с 106B параметров, оптимизированная для быстрого инференса и умеренных аппаратных требований, сохраняющая ключевые возможности гибридного рассуждения и общей функциональности. На момент релиза модель занимает 6-е место в мировом рейтинге по 12 ключевым бенчмаркам, демонстрируя исключительную скорость и превосходные результаты в реальных сценариях разработки. Разработчики особенно подчеркивают эффективность ее использования в задачах автозаполнения и корректировки програмного кода для фронтэнда.

размышляющая

русскоязычная

28.07.2025

Qwen3-235B-A22B-Thinking-2507

Новая версия флагманской MoE модели Qwen3-235B-A22B в серии Qwen 3 с усовершенствованным «мышлением» и расширенным контекстом в 262K токенов. Она работает только в режиме thinking, при этом демонстрирует state-of-the-art результаты среди лучших открытых и проприетарных thinking-моделей, превосходя многие известные бренды в математических вычислениях, программировании и логических задачах. Идеальный вариант для сложных исследовательских задач с продвинутыми агентскими и аналитическими возможностями.

размышляющая

русскоязычная

25.07.2025

Qwen3-Coder-30B-A3B-Instruct

Компактная MoE-модель с архитектурой из 30.5B общих параметров, из которых активируются только 3.3B на токен, созданная специально для помощи в написании программного кода. Модель обладает агентскими возможностями, поддерживает контекст в 262144 токенов и демонстрирует отличную производительность при относительно низких затратах по ресурсам. Эти качества делают ее отличным выбором для использования в качестве ассистента программиста, QA системы внутри платформ, обучающих программированию, а также и для интеграции в инструменты с функцией автозаполнения кода.

русскоязычная

для кодинга

22.07.2025

Qwen3-Coder-480B-A35B-Instruct

Флагманская модель агентного программирования от Alibaba с архитектурой Mixture-of-Experts (480 млрд параметров, 35 млрд активных) и нативной поддержкой контекста 256K токенов. Сценарии применения Qwen3-Coder охватывают весь спектр современной разработки — от создания интерактивных веб-приложений до модернизации legacy-систем, включая автономную разработку функций, охватывающих backend API, frontend компоненты и базы данных.

русскоязычная

для кодинга

22.07.2025

Qwen3-235B-A22B-Instruct-2507

Обновление флагманской MoE-модели Qwen 3 с 235B параметров (22B активных), нативным контекстом 262144 токенов и поддержкой 119 языков. При ее реализации разработчики отказались от гибридного режима, поэтому модель поддерживает только non-thinking mode, но качество доработки позволяет модели существенно опережать конкурентов и демонстрировать невероятные результаты в математике, программировании и логическом мышлении. Есть и FP8-версия, которая обеспечивает возможность промышленного развертывания с 50% экономией памяти.

русскоязычная

21.07.2025

T-pro-it-2.0

Первая российская языковая модель с 32 миллиардами параметров и гибридным режимом рассуждений, сочетающая революционную эффективность обработки русского языка с возможностью глубокого аналитического мышления для решения задач любой сложности. Модель обеспечивает двукратную экономию вычислительных ресурсов по сравнению с зарубежными аналогами при превосходном качестве, открывая новые возможности для автономных ИИ-агентов.

размышляющая

русскоязычная

18.07.2025

Kimi-K2-Instruct

Огромная MoE модель содержащая 1 триллион параметров. Модель специально создана для автономного выполнения сложных задач, использования инструментов и взаимодействия с внешними системами. Kimi K2 не просто отвечает на вопросы — она действует, это новое поколение ИИ-ассистентов, способных самостоятельно планировать, выполнять и контролировать многошаговые процессы без постоянного участия человека, именно поэтому разработчики рекомендуют использование модели в агентских системах.

русскоязычная

11.07.2025

ERNIE-4.5-VL-28B-A3B-PT

Компактная мультимодальная модель с архитектурой Mixture-of-Experts (28B общих параметров, 3B активных), способная обрабатывать текст, изображения и видео с контекстом до 131K токенов. Модель использует инновационную гетерогенную MoE-архитектуру с раздельными экспертами для текста и визуальных данных, обеспечивая эффективную обработку мультимодальной информации без ущерба для качества работы с текстом. Поддерживает два режима: стандартный (быстрый отклик) и режим рассуждений (улучшенная аналитика для сложных задач).

размышляющая

мультимодальная

28.06.2025