Qwen2-7B представляет собой полнофункциональную языковую модель с 7 миллиардами параметров, разработанную для обеспечения высокой производительности в широком спектре задач. Модель содержит 28 слоев, использует 28 голов внимания всего и 4 головы на ключ-значение, что обеспечивает оптимальный баланс между производительностью и эффективностью памяти. Архитектура включает все современные улучшения, включая Grouped Query Attention, Dual Chunk Attention с YARN, и оптимизированные механизмы позиционного кодирования RoPE.
Модель обучена на том же высококачественном датасете объемом 7 триллионов токенов, что и более крупные варианты серии. Это обеспечивает качество ответов модели в различных областях знания и позволяет демонстрировать конкурентные результаты на стандартных бенчмарках. При этом модель поддерживает расширенное контекстное окно 128K и демонстрирует превосходные многоязычные способности.
Qwen2-7B отличается возможностью эффективно работать на GPU среднего класса, делая передовые AI-возможности доступными для более широкого круга пользователей и организаций. Модель подходит для создания приложений, анализ больших документов, исследовательских и образовательных целей, а также служит отличной основой для дообучения под специфические задачи и домены, предлагая хороший компромисс между возможностями и требованиями к ресурсам.
Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
---|---|---|---|---|---|---|---|
16 | 32768 | 160 | 1 | 37,04 ₽ | Запустить | ||
16 | 16384 | 160 | 1 | 40,83 ₽ | Запустить | ||
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | ||
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | ||
16 | 24576 | 160 | 1 | 78,53 ₽ | Запустить | ||
16 | 32768 | 160 | 1 | 103,04 ₽ | Запустить | ||
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 230,77 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 456,27 ₽ | Запустить |
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
---|---|---|---|---|---|---|---|
16 | 32768 | 160 | 1 | 37,04 ₽ | Запустить | ||
16 | 16384 | 160 | 1 | 40,83 ₽ | Запустить | ||
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | ||
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | ||
16 | 24576 | 160 | 1 | 78,53 ₽ | Запустить | ||
16 | 32768 | 160 | 1 | 103,04 ₽ | Запустить | ||
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 230,77 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 456,27 ₽ | Запустить |
Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
---|---|---|---|---|---|---|---|
16 | 32768 | 160 | 1 | 46,94 ₽ | Запустить | ||
16 | 32768 | 160 | 2 | 51,34 ₽ | Запустить | ||
12 | 65536 | 160 | 2 | 61,37 ₽ | Запустить | ||
16 | 32768 | 160 | 2 | 71,14 ₽ | Запустить | ||
16 | 24576 | 160 | 1 | 78,53 ₽ | Запустить | ||
16 | 32762 | 160 | 2 | 86,54 ₽ | Запустить | ||
16 | 32768 | 160 | 1 | 103,04 ₽ | Запустить | ||
12 | 65536 | 160 | 1 | 107,57 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 141,77 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 230,77 ₽ | Запустить | ||
16 | 65536 | 160 | 1 | 456,27 ₽ | Запустить |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.