Модели

  • В каталоге собраны наиболее популярные, свободно распространяемые нейросетевые модели от разработчиков со всего мира, включая большие языковые, мультимодальные и диффузионные модели. Попробуйте интересующие модели в одном месте.
  • Для знакомства с моделью и ее тестирования, вы можете воспользоваться публичным эндпоинтом. А для работы на постоянной основе, файнтюнинга или специфичных весов, лучше арендовать виртуальный или выделенный сервер с GPU.

Chroma1-HD

Chroma — это модель с 8,9 миллиардами параметров, основанная на архитектуре FLUX.1-schnell.

27.01.2025

Qwen2.5-VL-7B-Instruct

Qwen2.5-VL-7B - мощная мультимодальная модель с 7 миллиардами параметров, обеспечивающая оптимальный баланс между высокой производительностью и эффективностью. Модель предназначенная для применения в задачах анализа сложных документов, видеопотоков и агентского взаимодействия.

мультимодальная
русскоязычная
26.01.2025

Qwen2.5-VL-3B-Instruct

Qwen2.5-VL-3B - компактная мультимодальная модель с 3 миллиардами параметров, оптимизированная для edge-развертывания, но при этом обладающая выдающимися возможностями понимании изображений, видео и реализации агентских задач.

мультимодальная
русскоязычная
26.01.2025

Qwen2.5-7B-Instruct-1M

Qwen2.5-7B-1M — это компактная, но мощная модель с 7.6B параметров. Благодаря технологиям разреженного внимания она способна обрабатывать до 1 миллиона токенов контекста с отличной скоростью. Модель является идеальным решением для организаций, которым требуется высокопроизводительный анализ длинных документов при оптимальном использовании ресурсов.

русскоязычная
23.01.2025

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-32B — модель, построенная на основе дистилляции крупной MoE reasoning-модели экспертного уровня, устанавливающая новые рекорды среди open-source dense-моделей. Подходит для научных, корпоративных и образовательных платформ с высокими требованиями к логике и анализу.

русскоязычная
20.01.2025

DeepSeek-R1

DeepSeek-R1 — уникальная размышляющая модель с 671 млрд параметров обученная на базе RL, с поддержкой длинных CoT, специализирующаяся на многошаговых рассуждениях и логическом анализе. Незаменима для задач, требующих обоснованных выводов и прозрачной цепочки мышления.

размышляющая
русскоязычная
20.01.2025

DeepSeek-R1-Distill-Qwen-1.5B

DeepSeek-R1-Distill-1.5B — компактная модель, благодаря дистилляции обладающая хорошими навыками рассуждения. Идеально подходит для быстрого анализа текста для мобильных и edge-приложений.

русскоязычная
20.01.2025

DeepSeek-V3

DeepSeek-V3 - мощная MoE-модель с 671 млрд параметров и 16 экспертами, одна из самых популярных open-source альтернатив, способная конкурировать с коммерческими аналогами. Благодаря контексту в 128K токенов и высокой точности генерации, идеально подходит для решения профессиональных задач — от анализа сложных данных до создания качественного креативного контента.

русскоязычная
26.12.2024

Phi-4

Phi-4 - флагманская компактная модель от Microsoft с 14 млрд параметров с фокусом на эффективность при ограниченном контексте в 16K токенов. Оптимальна для задач, где важны скорость отклика и точность ответов в рамках коротких взаимодействий.

12.12.2024

Llama-3.3-70B-Instruct

Llama-3.3-70B — языковая модель с поддержкой 8 языков, большим контекстом (128k токенов) и высокой точностью, идеально подходящая для ассистентских и диалоговых систем. По словам разработчиков по производительности она не уступает Llama 3.1 c 405 млрд параметров.

06.12.2024

FLUX.1-Kontext-dev

FLUX.1 Kontext [dev] — rectified flow transformer, содержащий 12 миллиардов параметров, способный редактировать изображения на основе текстовых инструкций.

21.11.2024

FLUX.1-Fill-dev

FLUX.1 Fill [dev] — это rectified flow transformer, содержащий 12 миллиардов параметров, который способен заполнять области в существующих изображениях на основе текстового описания.

21.11.2024

FLUX.1-Depth-dev

FLUX.1 Depth [dev] — это rectified flow transformer, содержащий 12 миллиардов параметров, способный генерировать изображения на основе текстового описания, сохраняя структуру заданного входного изображения. 

21.11.2024

FLUX.1-Canny-dev

FLUX.1 Canny [dev] — это rectified flow transformer, содержащий 12 миллиардов параметров, который способен генерировать изображения на основе текстового описания, сохраняя структуру заданного входного изображения.

21.11.2024

Shuttle 3 Diffusion

Shuttle 3 Diffusion — это модель для генерации изображений на основе текстовых подсказок (text-to-image), способная создавать детализированные и разнообразные изображения за четыре шага. Она обеспечивает улучшенное качество изображений, понимание сложных подсказок, эффективное использование ресурсов и повышенную детализацию.

12.11.2024

CogVideoX1.5-5B

CogVideoX1.5-5B — это открытая модель генерации видео по тексту, аналогичная коммерческой модели QingYing. Она предназначена для создания видео на основе текстовых запросов, поддерживает английский язык, а также генерацию из изображений (версия CogVideoX1.5-5B-I2V). Модель доступна на платформах Hugging Face, ModelScope и WiseModel.

02.11.2024

Stable Diffusion 3.5 Medium

Это, модель генерации изображения по текстовому описанию на основе мультимодального диффузионного трансформера с улучшениями (MMDiT-X), которая демонстрирует улучшенную производительность в таких аспектах, как качество изображений, типографика, понимание сложных подсказок и эффективность использования ресурсов.

29.10.2024

mochi-1-preview

Mochi-1 — это модель для генерации видео, разработанная Genmo. Она представляет собой open-source решение с высокой детализацией движения и соответствием подсказкам (prompt adherence), уменьшающее разрыв между закрытыми и открытыми системами генерации видео.

22.10.2024

Stable Diffusion 3.5 Large Turbo

Модель генерации изображения по текстовому описанию на основе Мультимодального диффузионного трансформера с улучшениями (MMDiT-X)., которая демонстрирует улучшенную производительность в таких аспектах, как качество изображений, типографика, понимание сложных подсказок и эффективность использования ресурсов.

22.10.2024

Stable Diffusion 3.5 Large

Модель генерации изображения по текстовому описанию на основе мультимодального диффузионного трансформера с улучшениями (MMDiT-X), которая демонстрирует улучшенную производительность в таких аспектах, как качество изображений, типографика, понимание сложных подсказок и эффективность использования ресурсов.

22.10.2024