Продукты

Облачные серверы

Облачные серверы с посекундной тарификацией. Изолированные ресурсы дадут максимальную производительность для вашего проекта.

GPU-серверы

Облачные серверы с современными графическими ускорителями RTX и Tesla для игр, рендеринга, стриминга, работы с 3Д-графикой, искусственным интеллектом.

H200

H100 NVL

H100

RTX 5090

RTX 4090

RTX 3090

RTX 3080

A100

RTX A5000

A10

RTX 2080 Ti

A2

Tesla T4

Tesla V100

Все GPU-серверы

CPU-серверы

Облачные серверы с высокопроизводительными центральными процессорами Intel Xeon Gold 2-го, 3-го и 5-го поколений, доступные на 100% процессорного времени.
SSD-серверы NVMe-серверы
Все CPU-серверы

Immers Foundation Models

Автоматизированный каталог проверенных open-source моделей с готовыми конфигурациями для быстрого деплоя. Запускайте нейросетевые модели без оплаты за токены.

Выбрать модель

Выделенные серверы

Арендуйте физически выделенный сервер на длительный срок с помесячной оплатой. Соберите конфигурацию с использованием современных комлектующих: процессоров Intel Xeon Gold 2-го, 3-го и 5-го поколений, до 10 новейших видеоускорителей RTX и Tesla и до 8192 ГБ RAM на сервер, SSD- и NVMe-дисков для дата-центров.

Выбрать выделенный сервер

Маркетплейс

Используйте популярные и современные приложения в качестве эффективных инструментов для организации вашего проекта. Экономьте время с помощью предварительно настроенных образов, в которых уже установлены все необходимые компоненты.

Забудьте про ручную загрузку и установку программного обеспечения — просто разверните виртуальный сервер с готовым образом.
Нейронные сети 3D CUDA Docker / NGC Для игр Windows-образы Linux-образы
Все предустановленные образы
Возможности
Тарифы
FAQ
Контакты
Вход

Immers Foundation Models

В каталоге собраны наиболее популярные, свободно распространяемые нейросетевые модели от разработчиков со всего мира, включая большие языковые, мультимодальные и диффузионные модели. Попробуйте интересующие модели в одном месте.
Для знакомства с моделью и ее тестирования, вы можете воспользоваться публичным эндпоинтом. А для работы на постоянной основе, файнтюнинга или специфичных весов, лучше арендовать виртуальный или выделенный сервер с GPU.

GLM-5.2

Открытая MoE-модель от Z.ai с 753B параметров, из которых на каждый токен активируется лишь 39 миллиардов, оптимизированная для длительных агентных задач с контекстом в миллион токенов. Благодаря инновационной технике IndexShare и способностям в области логических рассуждений и программирования, она достигает уровня лучших закрытых моделей, становясь новым ориентиром в классе open‑source решений.

размышляющая

русскоязычная

для кодинга

можно попробовать

16.06.2026

Kimi-K2.7-Code

Открытая агентная модель от Moonshot AI на архитектуре MoE (1 трлн параметров, 32 млрд активируемых) с MLA-вниманием, нативной INT4-квантизацией и мультимодальностью (текст, изображения, видео). Модель оптимизирована для выполнения долгосрочных задач, сокращает расход thinking-токенов на 30% по сравнению с K2.6 и конкурирует с ведущими проприетарными решениями.

размышляющая

мультимодальная

русскоязычная

для кодинга

11.06.2026

NVIDIA-Nemotron-3-Ultra-550B-A55B

Флагманская языковая модель на 550 млрд параметров (55 млрд активных при каждом выводе) с гибридной архитектурой LatentMoE (Mamba-2 + MoE + Attention), контекстом до 1 млн токенов и настраиваемым режимом рассуждений. Модель обеспечивает рекордную пропускную способность инференса — до ~6× выше, чем у сравнимых открытых LLM, — при точности на уровне лучших мировых аналогов, что делает её оптимальным выбором для сложных агентных задач, длинноконтекстного анализа и высоконагруженных сценариев enterprise уровня.

размышляющая

для кодинга

03.06.2026

gemma-4-12B-it

Уникальная модель в линейке Gemma 4 с единой (Unified) архитектурой без энкодеров: визуальные и аудиоданные подаются напрямую в decoder-only трансформер через линейные проекции (и легкий embedder для изображений), что существенно устраняет задержку энкодинга и позволяет качественно обрабатывать все модальности. При размере всего 12B параметров модель подходит для запуска на ноутбуках с 16 ГБ VRAM и демонстрирует результаты, сопоставимые с моделью 26B MoE, на бенчмарках рассуждения, кодинга и мультимодального понимания.

размышляющая

мультимодальная

русскоязычная

03.06.2026

ideogram-4-nf4-diffusers

Это первая открытая модель генерации изображений от Ideogram. Это передовая базовая модель, обученная с нуля, а не усовершенствованная версия какой-либо существующей модели.

03.06.2026

MiniMax-M3

Передовая открытая мультимодальная модель с 428 миллиардами параметров (23B активных) и инновационным механизмом MiniMax Sparse Attention, обеспечивающим эффективную обработку контекста до 1 миллиона токенов. Модель уникальна своим сочетанием нативной мультимодальности, отличными навыками в области программирования и агентными возможностями, что позволяет ей конкурировать с ведущими закрытыми решениями.

размышляющая

мультимодальная

русскоязычная

для кодинга

02.06.2026

Lance

Унифицированная мультимодальная модель (Unified Multimodal Modeling), разработанная для демонстрации унифицированного подхода к пониманию, генерации и редактированию изображений и видео в рамках относительно небольшой модели и ограниченного вычислительного бюджета.

15.05.2026

DeepSeek-V4-Pro

Передовая MoE-модель на 1.6 трлн параметров (49 млрд активных), способная сверхэффективно обрабатывать контекст до 1 миллиона токенов благодаря инновационной гибридной архитектуре внимания – CSA+HCA. Модель уверенно лидирующие позиции по математике, программированию и агентным задачам, поддерживает три настраиваемых режима рассуждения («non-think», «think high», «think max») и потребляет почти в 10 раз меньше памяти KV-кэша по сравнению с предыдущими флагманами deepseek.

размышляющая

русскоязычная

для кодинга

22.04.2026

DeepSeek-V4-Flash

Открытая MoE‑модель из семейства DeepSeek V4, насчитывающая 284 млрд общих параметров при 13 млрд активных на токен и поддерживающая контекст до 1 млн токенов. Благодаря гибридному вниманию CSA + HCA она достигает экстремальной эффективности на сверхдлинных последовательностях. Модель демонстрирует близкие к Pro‑версии результаты в рассуждении, программировании и агентных задачах, будучи при этом гораздо менее требовательной к инфраструктуре.

размышляющая

русскоязычная

для кодинга

22.04.2026

Qwen3.6-27B

Qwen/Qwen3.6-27B — открытая плотная мультимодальная модель на 27B параметров с сильным фокусом на агентное программирование, работу с большими репозиториями и reasoning-задачи. Она поддерживает текст, изображения и видео, имеет нативный контекст 262K токенов, thinking/non-thinking режимы и по ряду ключевых бенчмарков обгоняет не только Qwen3.5-27B, но и более крупную MoE-модель Qwen3.5-397B-A17B.

размышляющая

мультимодальная

русскоязычная

для кодинга

21.04.2026

Qwen3.6-35B-A3B

Qwen/Qwen3.6-35B-A3B — открытая мультимодальная MoE-модель с 35B параметров, из которых на каждый токен активируется только около 3B, что снижает вычислительную нагрузку. Архитектура на основе Gated DeltaNet и Gated Attention обеспечивает высокую эффективность и экономию памяти. Модель поддерживает текст, изображения и видео, thinking/non-thinking режимы, контекст 262K токенов с расширением до 1M и особенно хорошо подходит для агентного программирования, работы с репозиториями и визуально-текстовых задач.

размышляющая

мультимодальная

русскоязычная

для кодинга

15.04.2026

Kimi-K2.6

Открытая мультимодальная модель от Moonshot AI ориентированная на работу с агентами. Архитектура Mixture-of-Experts с 1 трлн параметров (32 млрд активных на токен), поддерживающая окно контекста в 256K токенов и нативной INT4-квантизацией. Модель оптимизирована для длительных циклов программного решения задач, автономной работы и оркестрации «роя агентов», по этим направлениям она уверенно конкурирует с лучшими закрытыми моделями. Модель способна часами вести сложную инженерную работу, превращать визуальные макеты в готовые веб-приложения, декомпозировать и координировать до 300 параллельных суб-агентов в рамках одной сессии, что делает ее одним из лучших открытых решений для исследовательских задач и эффективного использования в качестве интеллектуального ядра в самых разных высокотехнологичных продуктах.

размышляющая

мультимодальная

русскоязычная

для кодинга

14.04.2026

ERNIE-Image-Turbo

Открытая модель для генерации изображений по тексту, разработанная командой ERNIE-Image в Baidu. Она построена на архитектуре Diffusion Transformer (DiT) и включает дополнительные компоненты для улучшения работы с текстом и структурированными задачами.

10.04.2026

MiniMax-M2.7

Первая модель, участвовавшая в собственной эволюции: в процессе разработки она сама строила навыки и оптимизировала своё обучение. Архитектура на базе 230B MoE (10B активных параметров) с полным вниманием обеспечивает стабильно высокое качество в сложных агентных и офисных задачах. На бенчмарках модель показывает результаты на уровне лучших закрытых решений. Идеально подходит для разработки автономных агентов, работы с офисными документами и комплексной автоматизации сложных профессиональных задач, выступая в роли «всезнающего и эмоционального AI-коллеги».

размышляющая

русскоязычная

для кодинга

09.04.2026

ERNIE-Image

07.04.2026

GLM-5.1

Флагманская MoE-модель (744 млрд общих / 40 млрд активных параметров) с механизмом разреженного внимания DSA, созданная для продолжительной автономной работы. Она занимает первое место на SWE‑Bench Pro и CyberGym, опережая на момент релиза все существующие модели (включая закрытые), и стабильно входит в число лидеров в других значимых бенчмарках, а главное — она сохраняет способность к прогрессу на сотнях итераций и тысячах вызовов инструментов, там, где многие модели теряют эффективность и стараются дать быстрый ответ GLM-5.1 продолжает искать лучшее решение.

размышляющая

русскоязычная

для кодинга

03.04.2026

GigaChat3.1-702B-A36B

Флагманская instruct-модель семейства GigaChat, основанная на архитектуре Mixture‑of‑Experts (MoE) с 702 млрд общих и 36 млрд активных параметров. Сочетание Multi‑head Latent Attention (MLA), Multi‑Token Prediction (MTP) и нативного обучения в FP8 обеспечивает рекордную производительность на длинных контекстах и значительно снижает потребление памяти. Модель по ряду показателей превосходит открытые аналоги уровня DeepSeek‑V3‑0324 и Qwen3‑235B‑A22B, поставляется под лицензией MIT, что делает доступным ее коммерческое использование.

русскоязычная

21.03.2026

GigaChat3.1-10B-A1.8B

GigaChat 3.1 Lightning — это компактная Mixture-of-Experts модель с 1.8 млрд активных параметров из 10 млрд общих, построенная на базе MLA внимания и поддерживающая MTP, что в сочетании с нативным FP8-обучением обеспечивает отличную скорость и качество. Модель занимает лидирующие позиции в своём классе и является одним из лучших решений для быстрых диалоговых AI-ассистентов, а также для запуска простых, но надежных агентных систем с поддержкой вызова инструментов и других функциональностей.

русскоязычная

21.03.2026

gemma-4-26B-A4B-it

Высокоэффективная модель на архитектуре смеси экспертов, которая при активации лишь 3.8B параметров обеспечивает 97% качества флагманской модели 31B. Оптимальный выбор для сложных агентных и аналитических задач с умеренными требованиями к вычислительным ресурсам.

размышляющая

мультимодальная

русскоязычная

для кодинга

можно попробовать

11.03.2026

gemma-4-31B-it

Флагманская плотная модель семейства gemma-4, c 31B параметров она лишь немного уступает крупнейшим по размеру проприетарным и открытым аналогам. Нативная мультимодальность, мультиязычность, контекстное окно в 256K токенов, гибридный механизм внимания Sliding window для снижения требований к памяти и в совокупности - идеальный выбор для задач, требующих качественных рассуждений и глубокого анализа.

размышляющая

мультимодальная

русскоязычная

для кодинга

11.03.2026