Qwen3-0.6B — это самая компактная модель в серии, содержащая 600 миллионов параметров и поддерживающая контекстное окно в 32,000 токенов. Модель построена на архитектуре из 28 слоев с 16 головами внимания для запросов и 8 головами для ключей и значений, что обеспечивает эффективное использование вычислительных ресурсов при сохранении высокого качества обработки текста. Несмотря на свой компактный размер, модель обучена на 36 триллионах токенов и поддерживает 119 языков и диалектов, что делает ее исключительно универсальной для своего класса.
Основным преимуществом Qwen3-0.6B является её исключительная эффективность при минимальных требованиях к ресурсам. Модель специально предназначена для развертывания на мобильных устройствах, edge-вычислениях и IoT-приложениях, где критичны низкое энергопотребление и быстрый инференс. Несмотря на компактный размер, модель демонстрирует впечатляющие результаты в задачах общего понимания языка, простых диалогах и базовой обработке текста.
Qwen3-0.6B идеально подходит для приложений с жесткими ограничениями по памяти и вычислительным ресурсам: чат-боты для мобильных приложений, встроенные AI-ассистенты, системы быстрой обработки текста и базовые задачи NLP, такие как текстовая классификация, извлечение информации и автоматическое реферирование.
Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
---|---|---|---|---|---|---|---|
16 | 32768 | 160 | 1 | 37,04 ₽ | Запустить | ||
16 | 16384 | 160 | 1 | 40,83 ₽ | Запустить | ||
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | ||
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | ||
16 | 24576 | 160 | 1 | 78,53 ₽ | Запустить | ||
16 | 32768 | 160 | 1 | 103,04 ₽ | Запустить | ||
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 230,77 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 456,27 ₽ | Запустить |
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
---|---|---|---|---|---|---|---|
16 | 32768 | 160 | 1 | 37,04 ₽ | Запустить | ||
16 | 16384 | 160 | 1 | 40,83 ₽ | Запустить | ||
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | ||
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | ||
16 | 24576 | 160 | 1 | 78,53 ₽ | Запустить | ||
16 | 32768 | 160 | 1 | 103,04 ₽ | Запустить | ||
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 230,77 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 456,27 ₽ | Запустить |
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
---|---|---|---|---|---|---|---|
16 | 32768 | 160 | 1 | 37,04 ₽ | Запустить | ||
16 | 16384 | 160 | 1 | 40,83 ₽ | Запустить | ||
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | ||
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | ||
16 | 24576 | 160 | 1 | 78,53 ₽ | Запустить | ||
16 | 32768 | 160 | 1 | 103,04 ₽ | Запустить | ||
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 230,77 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 456,27 ₽ | Запустить |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.