Qwen2.5-7B-1M представляет собой современную компактную модель построенную на передовой Transformer-архитектуре с интеграцией ключевых инноваций таких как: Rotary Positional Embeddings (RoPE) для эффективного кодирования позиционной информации, SwiGLU активационной функции для нелинейных преобразований, RMSNorm с пре-нормализацией для стабильного обучения и механизма Attention QKV bias. Архитектура включает 28 слоев с Grouped Query Attention (GQA), что обеспечивает оптимальное использование KV-кэша и снижение вычислительных затрат.
Главная особенность модели – способность обрабатывать до 1,010,000 токенов входного контекста! Это эквивалентно обработке 10 полноформатных романов, 150 часов речевых транскриптов или 30,000 строк кода в одном запросе. Dual Chunk Attention (DCA) разделяет последовательности на чанки и перераспределяет относительные позиции, обеспечивая стабильную работу на сверхдлинных контекстах, а интеграция с YaRN attention scaling повышает фокусировку внимания на ключевой информации даже при обработке очень длинных последовательностей. Как результат модель демонстрирует выдающуюся точность в задачах поиска информации в очень больших документах, достигая более 80% точности даже при контексте в 1 миллион токенов.
Qwen2.5-7B-1M открывает новые возможности в области обработки документов, автоматизации анализа и интеллектуальных помощников. Модель идеально подходит для юридического анализа объемных контрактов и документации, научных исследований, разработки ПО с анализом больших кодовых баз и создания систем технической поддержки с доступом к обширным базам знаний. В образовательной сфере модель способна анализировать целые учебники и создавать комплексные образовательные материалы, а в бизнес-аналитике — обрабатывать объемные отчеты и извлекать ключевые инсайты для принятия решений.
| Наименование модели | Контекст | Тип | GPU | TPS | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
1 010 000 |
16 | 65536 | 160 | 4 | 144,97 ₽ | Запустить | |
1 010 000 |
32 | 131072 | 160 | 6 | 147,44 ₽ | Запустить | |
1 010 000 |
16 | 131072 | 160 | 4 | 209,04 ₽ | Запустить | |
1 010 000 |
16 | 65536 | 160 | 1 | 230,77 ₽ | Запустить | |
1 010 000 |
16 | 65536 | 160 | 4 | 276,97 ₽ | Запустить | |
1 010 000 |
64 | 262144 | 320 | 3 | 347,52 ₽ | Запустить | |
1 010 000 |
16 | 65536 | 160 | 4 | 369,37 ₽ | Запустить | |
1 010 000 |
16 | 98304 | 160 | 3 | 387,41 ₽ | Запустить | |
1 010 000 |
16 | 65536 | 160 | 1 | 456,27 ₽ | Запустить | |
1 010 000 |
16 | 131072 | 160 | 1 | 623,04 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
1 010 000 |
16 | 65536 | 160 | 4 | 144,97 ₽ | Запустить | |
1 010 000 |
32 | 131072 | 160 | 6 | 147,44 ₽ | Запустить | |
1 010 000 |
16 | 131072 | 160 | 4 | 209,04 ₽ | Запустить | |
1 010 000 |
16 | 65536 | 160 | 1 | 230,77 ₽ | Запустить | |
1 010 000 |
16 | 65536 | 160 | 4 | 276,97 ₽ | Запустить | |
1 010 000 |
64 | 262144 | 320 | 3 | 347,52 ₽ | Запустить | |
1 010 000 |
16 | 65536 | 160 | 4 | 369,37 ₽ | Запустить | |
1 010 000 |
16 | 98304 | 160 | 3 | 387,41 ₽ | Запустить | |
1 010 000 |
16 | 65536 | 160 | 1 | 456,27 ₽ | Запустить | |
1 010 000 |
16 | 131072 | 160 | 1 | 623,04 ₽ | Запустить | |
| Наименование | vCPU | ОЗУ, МБ | Диск, ГБ | GPU | |||
|---|---|---|---|---|---|---|---|
1 010 000 |
32 | 131072 | 160 | 6 | 147,44 ₽ | Запустить | |
1 010 000 |
16 | 131072 | 160 | 4 | 156,24 ₽ | Запустить | |
1 010 000 |
16 | 131072 | 160 | 4 | 209,04 ₽ | Запустить | |
1 010 000 |
16 | 131072 | 160 | 1 | 242,04 ₽ | Запустить | |
1 010 000 |
16 | 98304 | 320 | 4 | 284,16 ₽ | Запустить | |
1 010 000 |
64 | 262144 | 320 | 3 | 347,52 ₽ | Запустить | |
1 010 000 |
16 | 98304 | 320 | 4 | 376,56 ₽ | Запустить | |
1 010 000 |
16 | 98304 | 160 | 3 | 387,41 ₽ | Запустить | |
1 010 000 |
16 | 131072 | 160 | 1 | 467,54 ₽ | Запустить | |
1 010 000 |
16 | 131072 | 160 | 1 | 623,04 ₽ | Запустить | |
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.