Модели

  • В каталоге собраны наиболее популярные, свободно распространяемые нейросетевые модели от разработчиков со всего мира, включая большие языковые, мультимодальные и диффузионные модели. Попробуйте интересующие модели в одном месте.
  • Для знакомства с моделью и ее тестирования, вы можете воспользоваться публичным эндпоинтом. А для работы на постоянной основе, файнтюнинга или специфичных весов, лучше арендовать виртуальный или выделенный сервер с GPU.

Wan2.2-I2V-A14B-Diffusers

Модель предназначена для генерации видео на основе входного изображения (Image-to-Video, I2V). Она входит в семейство Wan2.2, улучшенных моделей генерации видео, и реализует архитектуру Mixture-of-Experts (MoE) для повышения емкости модели при сохранении вычислительных затрат.

28.07.2025

Wan2.2-T2V-A14B-Diffusers

Модель T2V-A14B поддерживает генерацию 5-секундных видео в разрешениях 480P и 720P. Построенная на основе архитектуры Mixture-of-Experts (MoE), она обеспечивает исключительное качество генерации видео. На новом бенчмарке Wan-Bench 2.0 модель превосходит ведущие коммерческие решения по большинству ключевых показателей оценки.

28.07.2025

Wan2.2-TI2V-5B-Diffusers

Это Text-to-Video и Image-to-Video модель на основе диффузионной архитектуры, разработанная в рамках проекта Wan2.2. Модель содержит 5 миллиардов параметров и использует высококомпрессивный кодировщик Wan2.2-VAE с соотношением сжатия 4×16×16. Она поддерживает генерацию видео в разрешении 720p (1280×704 или 704×1280) с частотой кадров 24 fps, и может работать на потребительских GPU, таких как NVIDIA RTX 4090.

28.07.2025

GLM-4.5

Гибридная модель с 355B параметров, объединяющая продвинутые рассуждения, программирование с артефактами и агентные возможности в единой MoE архитектуре с увеличенным количеством скрытых слоев. На момент выхода модель занимает 3-е место в мировом рейтинге по среднему показателю на 12 ключевых бенчмарках. Особенно впечатляет ее возможности в генерации готовых веб-приложений, интерактивных презентаций и сложного программного кода. При этом пользователям достаточно просто объяснить модели как должна работать программа и какой результат они хотят видеть.   

размышляющая
русскоязычная
28.07.2025

GLM-4.5-Air

Качественая агент-ориентированная модель с 106B параметров, оптимизированная для быстрого инференса и умеренных аппаратных требований, сохраняющая ключевые возможности гибридного рассуждения и общей функциональности. На момент релиза модель занимает 6-е место в мировом рейтинге по 12 ключевым бенчмаркам, демонстрируя исключительную скорость и превосходные результаты в реальных сценариях разработки. Разработчики особенно подчеркивают эффективность ее использования в задачах автозаполнения и корректировки програмного кода для фронтэнда. 

размышляющая
русскоязычная
28.07.2025

Qwen3-235B-A22B-Thinking-2507

Новая версия флагманской MoE модели Qwen3-235B-A22B в серии Qwen 3 с усовершенствованным «мышлением» и расширенным контекстом в 262K токенов. Она работает только в режиме thinking, при этом демонстрирует state-of-the-art результаты среди лучших открытых и проприетарных thinking-моделей, превосходя многие известные бренды в математических вычислениях, программировании и логических задачах. Идеальный вариант для сложных исследовательских задач с продвинутыми агентскими и аналитическими возможностями.

размышляющая
русскоязычная
25.07.2025

Qwen3-Coder-30B-A3B-Instruct

Компактная MoE-модель с архитектурой из 30.5B общих параметров, из которых активируются только 3.3B на токен, созданная специально для помощи в написании программного кода. Модель обладает агентскими возможностями, поддерживает контекст в 262144 токенов и демонстрирует отличную производительность при относительно низких затратах по ресурсам. Эти качества делают ее отличным выбором для использования в качестве ассистента программиста, QA системы внутри платформ, обучающих программированию, а также и для интеграции в инструменты с функцией автозаполнения кода.

русскоязычная
для кодинга
22.07.2025

Qwen3-Coder-480B-A35B-Instruct

Флагманская модель агентного программирования от Alibaba с архитектурой Mixture-of-Experts (480 млрд параметров, 35 млрд активных) и нативной поддержкой контекста 256K токенов. Сценарии применения Qwen3-Coder охватывают весь спектр современной разработки — от создания интерактивных веб-приложений до модернизации legacy-систем, включая автономную разработку функций, охватывающих backend API, frontend компоненты и базы данных.

русскоязычная
для кодинга
22.07.2025

Qwen3-235B-A22B-Instruct-2507

Обновление флагманской MoE-модели Qwen 3 с 235B параметров (22B активных), нативным контекстом 262144 токенов и поддержкой 119 языков. При ее реализации разработчики отказались от гибридного режима, поэтому модель поддерживает только non-thinking mode, но качество доработки позволяет модели существенно опережать конкурентов и демонстрировать невероятные результаты в математике, программировании и логическом мышлении. Есть и FP8-версия, которая обеспечивает возможность промышленного развертывания с 50% экономией памяти.

русскоязычная
21.07.2025

T-pro-it-2.0

Первая российская языковая модель с 32 миллиардами параметров и гибридным режимом рассуждений, сочетающая революционную эффективность обработки русского языка с возможностью глубокого аналитического мышления для решения задач любой сложности. Модель обеспечивает двукратную экономию вычислительных ресурсов по сравнению с зарубежными аналогами при превосходном качестве, открывая новые возможности для автономных ИИ-агентов.

размышляющая
русскоязычная
18.07.2025

Kimi-K2-Instruct

Огромная MoE модель содержащая 1 триллион параметров. Модель специально создана для автономного выполнения сложных задач, использования инструментов и взаимодействия с внешними системами. Kimi K2 не просто отвечает на вопросы — она действует, это новое поколение ИИ-ассистентов, способных самостоятельно планировать, выполнять и контролировать многошаговые процессы без постоянного участия человека, именно поэтому разработчики рекомендуют использование модели в агентских системах.

русскоязычная
11.07.2025

ERNIE-4.5-VL-28B-A3B-PT

Компактная мультимодальная модель с архитектурой Mixture-of-Experts (28B общих параметров, 3B активных), способная обрабатывать текст, изображения и видео с контекстом до 131K токенов. Модель использует инновационную гетерогенную MoE-архитектуру с раздельными экспертами для текста и визуальных данных, обеспечивая эффективную обработку мультимодальной информации без ущерба для качества работы с текстом. Поддерживает два режима: стандартный (быстрый отклик) и режим рассуждений (улучшенная аналитика для сложных задач).

размышляющая
мультимодальная
28.06.2025

MiniMax-M1-40k

Большая MoE модель с 456B параметров, огромным контекстом в 1 000 000 токенов и бюджетом размышлений в 40 000 токенов. Благодаря архитектурным инновациям модель более экономному по потреблению ресурсов в сравнении с аналогами схожего размера, что позволяет эффективно использовать ее для решения широкого спектра задач интеллектуального анализа и работы агентов.

размышляющая
русскоязычная
16.06.2025

MiniMax-M1-80k

Эффективное рассуждение с максимальными возможностями и минимальными потреблением ресурсов.  456B параметров, контекст - 1 000 000 токенов, Lightning Attention -новый подход к механизму внимания, повышенный бюджет размышлений - 80 000 токенов. Это - максимальная производительность для решения самых сложных исследовательских и продуктовых задач в области математики, программирования, биоинформатики, юриспруденции, финансового сектора и т. д.

размышляющая
русскоязычная
16.06.2025

DeepSeek-R1-0528

DeepSeek-R1-0528 - это первое значительное обновление популярной серии DeepSeek R1, выпущенное 28 мая 2025 года. Разработчики изменили подходы к глубине мышления, количество параметров увеличилось до 685 млрд, как результат - рост более 10 % пунктов практически по всем значимым бенчмаркам  в сравнении с версией от 22.01.2025.

размышляющая
русскоязычная
28.05.2025

DeepSeek-R1-0528-Qwen3-8B

DeepSeek-R1-0528-Qwen3-8B — компактная модель на базе Qwen3 c 8 млрд параметрами, дистиллированная от флагманской версии DeepSeek-R1-0528, достигающая SOTA результатов среди open-source моделей в категории. Модель идеально подходит для развертывания в условиях ограниченных ресурсов, сохраняя продвинутые способности математического и логического рассуждения от модели учителя.

русскоязычная
28.05.2025

VisualClozePipeline-384

VisualClozePipeline-384 —модель для генерации изображений с визуальным контекстом.

15.05.2025

Phi-4-reasoning

Phi-4-reasoning - это небольшая 14-миллиардная рассуждающая модель, уверенно конкурирующая с гораздо более крупными моделями в математике, программировании и научных вопросах. Модель идеально подходит для образовательных и исследовательских приложений, где требуется высокое качество логического мышления при эффективном использовании вычислительных ресурсов.

размышляющая
30.04.2025

Qwen3-235B-A22B

Qwen3-235B-A22B — это флагманская open-source MoE-модель с 235B общих параметров (22B активных) и контекстом 40K токенов, обеспечивающая качество на уровне лучших проприетарных проектов. Модель предназначена для критически важных государственных систем, фундаментальных исследований и флагманских продуктов, где требуется максимальное качество современного ИИ.

размышляющая
русскоязычная
29.04.2025

Qwen3-0.6B

Qwen3-0.6B — это ультракомпактная языковая модель с 600 млн параметров и контекстом 40K токенов, оптимизированная для мобильных устройств и edge-вычислений. Модель обеспечивает быстрый инференс с минимальным потреблением ресурсов и идеально подходит для IoT-приложений.

размышляющая
русскоязычная
29.04.2025