T-Pro 2.0 новая российская большая языковая модель с гибридным режимом рассуждений. Модель базируется на архитектуре Qwen3-32B, но с кардинально переработанной системой токенизации и дообучения. Модель включает 32 миллиарда параметров и поддерживает контекст длиной до 40K токенов с возможностью расширения до 128K через RoPE scaling. Гибридный режим рассуждений позволяет модели динамически переключаться между быстрыми ответами на простые вопросы и глубоким многоступенчатым анализом для сложных задач. Ключевой технической особенностью стала новый подход к токенизации русского языка — модель использует на 30% меньше токенов для передачи того же смысла по сравнению с исходной Qwen3. Это достигнуто за счет расширения кириллической части словаря более чем в пять раз при сохранении общего размера токенизатора. Дополнительно внедрена технология speculative decoding с использованием EAGLE-архитектуры, которая позволяет предсказывать сразу несколько токенов одновременно, ускоряя генерацию почти в два раза. Обучение включало три этапа: предобучение на 40B инструктивных токенов (треть из которых — reasoning-данные), supervised fine-tuning на ~500K высококачественных инструкций, и preference tuning на ~100K тщательно отобранных примеров.
Benchmark-результаты демонстрируют безоговорочное лидерство среди открытых моделей класса ~32B параметров: MERA (0.660), ruMMLU (0.790), Ru Arena Hard (0.876), значительно превосходя Qwen3 32B и другие конкурирующие решения. В reasoning-бенчмарках модель показывает выдающиеся результаты на русскоязычных версиях AIME (0.646) и математических олимпиадах собственного бенчмарка T-Math (0.799). Особенно впечатляющими оказались результаты в диалоговых аренах, где T-Pro 2.0 достигает 87.6% в Ru Arena Hard при использовании режима рассуждений.
Экономическая эффективность модели поражает воображение – она обеспечивает двукратную экономию вычислительных ресурсов по сравнению с китайскими аналогами Qwen3 и DeepSeek R1-Distil для русскоязычных задач. T-Pro 2.0 открывает безграничные возможности для автоматизации и создания интеллектуальных агентов нового поколения. В корпоративной среде модель превосходно справляется с обработкой сложных клиентских обращений, автоматизацией рутинных офисных процессов, генерацией и анализом документов, написанием технического кода. Модель доступна под лицензией Apache 2.0, что означает полную свободу использования, модификации и дообучения на собственных данных. Поддержка популярных фреймворков (SGLang, HuggingFace Transformers, vLLM) обеспечивает простую интеграцию в существующую инфраструктуру. Модель сочетает лучшее качество в своем классе с практичностью внедрения, предлагая российскую альтернативу зарубежным гигантам с полным контролем над технологией.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
40 960 pipeline |
3 | 78,57 ₽ | 1,64 | Запустить | ||
40 960 tensor |
2 | 83,37 ₽ | 1,89 | Запустить | ||
40 960 tensor |
4 | 85,77 ₽ | 2,83 | Запустить | ||
40 960 pipeline |
3 | 94,64 ₽ | 1,64 | Запустить | ||
40 960 tensor |
4 | 99,74 ₽ | 1,03 | Запустить | ||
40 960 tensor |
2 | 109,77 ₽ | 1,89 | Запустить | ||
40 960 tensor |
4 | 112,24 ₽ | 2,83 | Запустить | ||
40 960 tensor |
2 | 139,77 ₽ | 1,89 | Запустить | ||
40 960 tensor |
2 | 171,77 ₽ | 1,89 | Запустить | ||
40 960 tensor |
2 | 198,54 ₽ | 3,33 | Запустить | ||
40 960 |
1 | 211,77 ₽ | 5,02 | Запустить | ||
40 960 tensor |
2 | 261,77 ₽ | 3,33 | Запустить | ||
40 960 |
1 | 341,77 ₽ | 5,02 | Запустить | ||
40 960 |
1 | 367,41 ₽ | 6,28 | Запустить | ||
40 960 |
1 | 423,04 ₽ | 10,51 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
40 960 tensor |
4 | 85,77 ₽ | 1,33 | Запустить | ||
40 960 tensor |
4 | 112,24 ₽ | 1,33 | Запустить | ||
40 960 pipeline |
3 | 119,81 ₽ | 2,30 | Запустить | ||
40 960 tensor |
4 | 139,96 ₽ | 4,21 | Запустить | ||
40 960 tensor |
2 | 198,54 ₽ | 1,83 | Запустить | ||
40 960 pipeline |
3 | 204,41 ₽ | 2,30 | Запустить | ||
40 960 tensor |
4 | 209,04 ₽ | 4,21 | Запустить | ||
40 960 |
1 | 211,77 ₽ | 3,52 | Запустить | ||
40 960 pipeline |
3 | 252,41 ₽ | 2,30 | Запустить | ||
40 960 tensor |
4 | 257,77 ₽ | 4,21 | Запустить | ||
40 960 tensor |
2 | 261,77 ₽ | 1,83 | Запустить | ||
40 960 tensor |
4 | 321,77 ₽ | 4,21 | Запустить | ||
40 960 |
1 | 341,77 ₽ | 3,52 | Запустить | ||
40 960 |
1 | 367,41 ₽ | 4,78 | Запустить | ||
40 960 |
1 | 423,04 ₽ | 9,01 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
40 960 tensor |
4 | 157,01 ₽ | 1,08 | Запустить | ||
40 960 tensor |
4 | 264,96 ₽ | 1,08 | Запустить | ||
40 960 tensor |
4 | 328,96 ₽ | 1,08 | Запустить | ||
40 960 pipeline |
3 | 347,52 ₽ | 1,33 | Запустить | ||
40 960 |
1 | 368,18 ₽ | 1,65 | Запустить | ||
40 960 pipeline |
3 | 388,18 ₽ | 1,33 | Запустить | ||
40 960 tensor |
4 | 417,92 ₽ | 3,96 | Запустить | ||
40 960 |
1 | 423,81 ₽ | 5,88 | Запустить | ||
40 960 tensor |
2 | 440,74 ₽ | 7,34 | Запустить | ||
40 960 tensor |
4 | 514,59 ₽ | 3,96 | Запустить | ||
40 960 tensor |
2 | 700,74 ₽ | 7,34 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.