Модели

  • В каталоге собраны наиболее популярные, свободно распространяемые нейросетевые модели от разработчиков со всего мира, включая большие языковые, мультимодальные и диффузионные модели. Попробуйте интересующие модели в одном месте.
  • Для знакомства с моделью и ее тестирования, вы можете воспользоваться публичным эндпоинтом. А для работы на постоянной основе, файнтюнинга или специфичных весов, лучше арендовать виртуальный или выделенный сервер с GPU.

Qwen2.5-14B-Instruct

Qwen2.5-14B использует 14 млрд параметров, обрабатывает контекст в 128K токенов, она сохраняет скорость легких моделей и добавляет к ней высокую производительность и точность средних. Оптимальна для управления базами знаний и комплексных отраслевых решений на базе ИИ.

русскоязычная
16.09.2024

Qwen2.5-7B-Instruct

Qwen2.5-7B: Универсальная модель с 7 млрд параметров и контекстом до 128K токенов. Выделяется поддержкой сложных задач, в том числе умением работать со структурированной информацией, высокой точностью и хорошо подходит для бизнес-ассистентов и систем автоматизации отчетов.

русскоязычная
16.09.2024

Qwen2.5-0.5B-Instruct

Qwen2.5-0.5B - ультра-компактная модель с 500 млн параметров, оптимизированная для быстрого развертывания и решения базовых задач на устройствах с минимальными ресурсами. Идеально подходит для чат-ботов, мобильных приложений и встраиваемых систем, где критичны низкое энергопотребление и высокая скорость обработки.

русскоязычная
16.09.2024

FLUX.1-schnell

FLUX.1 [schnell] — это трансформер с технологией "rectified flow" с 12 миллиардами параметров, способный генерировать изображения на основе текстовых описаний.

01.08.2024

FLUX.1-dev

FLUX.1 [dev] — это трансформер с технологией "rectified flow" с 12 миллиардами параметров, способный генерировать изображения на основе текстовых описаний.

01.08.2024

Qwen2-57B-A14B-Instruct

Qwen2-57B-A14B — это мультиязычная MoE модель с 57 млрд параметров, оптимизированная для сложных задач генерации текста в вопросно-ответных системах, аналитики и программирования при высокой экономии ресурсов и вычислительной эффективности.

русскоязычная
27.07.2024

Qwen2-72B-Instruct

Qwen2-72B — это флагманская модель второй серии с 72 млрд параметров и контекстным окном в 128K, обеспечивающая производительность уровня ведущих проприетарных моделей. Модель подходит для самых требовательных к точности вариантов применения.

русскоязычная
24.07.2024

Qwen2-7B-Instruct

Qwen2-7B - с 7 млрд параметров, обеспечивающая высокую производительность и точность. Модель эффективно работает на GPU среднего класса и служит основой для создания специализированных решений в различных доменах.

русскоязычная
24.07.2024

Qwen2-1.5B-Instruct

Qwen2-1.5B – легкая сбалансированная модель с 1,5 млрд параметров, предназначенная для простых задач на локальных машинах и небольших серверах. Модель обеспечивает хорошую производительность в задачах генерации текста, обобщения, перевода при умеренных требованиях к ресурсам.

русскоязычная
24.07.2024

Qwen2-0.5B-Instruct

Qwen2-0.5B – ультракомпактная модель с 0,5 миллиарда параметров и контекстом в 32K, оптимизированная для развертывания на мобильных устройствах и IoT-системах. Подходит для создания простых приложений и систем автодополнения текста.

русскоязычная
24.07.2024

Llama-3.1-8B-Instruct

Невероятно популярная в сообществе многоязычная модель, обученная на 15 триллионах токенов, 8 миллиардами параметров и контекстным окном в 128K. Модель адаптирована для решения широкого круга задач, поддерживает вызов функций и идеально подходит для создания интеллектуальных диалоговых систем, программных ассистентов и агентских приложений.

23.07.2024

llama-3-8b-gpt-4o-ru1.0

Доработанная версия Llama-3-8B-Instruct, обученная с использованием высококачественного синтетического датасета, сгенерированного моделью GPT-4o и оптимизированная для работы с русским языком. Модель сочетает компактный размер (8B параметров) с высокими результатами в русском языке, превосходя в этом аспекте GPT-3.5-turbo и сохраняя качество работы на английском на уровне базовой версии, что делает её мощным и сбалансированным решением для русскоязычных диалоговых систем.

русскоязычная
можно попробовать
29.06.2024

Phi-3.5-mini-instruct

Phi-3.5-mini — компактная и высокоэффективная языковая модель, способная работать на мобильных и edge-устройствах, обеспечивая качество генерации, сравнимое с крупными моделями. Благодаря оптимизированному обучению на качественных данных и поддержке мультиязычности, она идеально подходит для чат-ботов, образовательных приложений и задач с ограниченными вычислительными ресурсами.

русскоязычная
23.04.2024

Llama-3-8B-Instruct

Легендарная open-source модель, выпущенная в апреле 2024 года, которая стала одной из отправных точек бурного развития экосистемы, открытого ИИ. 8-миллиардная версия сочетает компактность с высокой производительностью, использует техники группового внимания (GQA), что в сочетании с обучением на 15+ триллионах токенов, обеспечивает быструю и качественную генерацию текста и кода и доступность для локального развёртывания.

русскоязычная
17.04.2024

Playground v2.5 – 1024px Aesthetic Model

Модель Playground v2.5 разработана для генерации высокоэстетичных изображений размером 1024x1024 пикселей, включая портреты и пейзажи. Она является преемником Playground v2 и демонстрирует превосходство над такими моделями, как SDXL, PixArt-α, DALL-E 3 и Midjourney 5.2 по результатам пользовательских исследований в области эстетического качества.

16.02.2024

Dreamshaper XL v2 Turbo

Это модель для генерации изображений на основе текстовых запросов (text-to-image), основанная на архитектуре Stable Diffusion XL (SDXL). Она представляет собой дообученную (fine-tuned) версию базовой модели stabilityai/stable-diffusion-xl-base-1.0.

07.02.2024

Stable Diffusion XL-Turbo

SDXL-Turbo — это дистиллированная версия SDXL 1.0, обученная для синтеза в реальном времени.

27.11.2023

Kandinsky 3.0

Kandinsky-3 — это диффузионная модель для генерации изображений на основе текстового описания, разработанная на основе предыдущих версий семейства Kandinsky2-x. Она улучшена за счет увеличения объема данных, включая информацию, связанную с русской культурой, что позволяет генерировать изображения, отражающие эту тематику. Модель также демонстрирует улучшенное понимание текста и повышение качества визуальных результатов благодаря увеличению размеров текстового энкодера и модели Diffusion U-Net.

21.11.2023

Stable Video Diffusion Image-to-Video (SVD-Image-to-Video)

Это диффузионная модель, разработанная Stability AI для генерации коротких видеоклипов на основе статичного изображения (image-to-video). Модель создает видео длиной до 4 секунд (25 кадров при разрешении 576×1024), используя входное изображение в качестве условного кадра.

20.11.2023

whisper-large-v3

Самая популярная модель автоматического распознавания речи (ASR) от OpenAI, обученная на 5 миллионах часов размеченных аудиоданных. Она поддерживает многоязычную транскрибацию и перевод на английский, демонстрируя точность и устойчивость к различным акустическим условиям без необходимости дополнительной настройки.

русскоязычная
07.11.2023