Qwen2.5-72B является флагманской открытой моделью серии с 72 миллиардами параметров, 80 слоями и архитектурой 64/8 голов внимания, представляя вершину возможностей открытых языковых моделей от Alibaba. Модель поддерживает контекст в 128K токенов с генерацией до 8K токенов, что позволяет анализировать несколько документов и создавать подробный контент с исключительной точностью.
Модель обучена на расширенном наборе данных в 18 триллионов токенов с улучшенной фильтрацией и включением специализированных данных по математике и программированию, что позволяет показывает выдающиеся результаты в широком спектре задач. Отсюда следует яркая особенность Qwen2.5-72B - достижение state-of-the-art результатов среди открытых моделей при значительно меньшем размере по сравнению с конкурентами. Согласно техническому отчету, модель демонстрирует конкурентоспособную производительность с Llama-3-405B-Instruct, которая в 5 раз больше по размеру.
Qwen2.5-72B распространяется по специальной исследовательской лицензией Qwen и предназначена для проектов, требующих максимального качества обработки естественного языка. Модель идеально подходит для фундаментальных исследований в области ИИ, создания передовых ИИ-продуктов, обучения и fine-tuning специализированных моделей, а также как основа для разработки мультимодальных систем и специализированных агентов.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 pipeline |
3 | 119,81 ₽ | 1,33 | Запустить | ||
32 768 tensor |
4 | 144,97 ₽ | 3,12 | Запустить | ||
32 768 pipeline |
6 | 147,44 ₽ | 2,05 | Запустить | ||
32 768 pipeline |
3 | 204,41 ₽ | 1,63 | Запустить | ||
32 768 tensor |
4 | 209,04 ₽ | 3,12 | Запустить | ||
32 768 |
1 | 211,77 ₽ | 3,12 | Запустить | ||
32 768 pipeline |
3 | 252,41 ₽ | 1,62 | Запустить | ||
32 768 tensor |
4 | 257,77 ₽ | 3,51 | Запустить | ||
32 768 tensor |
2 | 261,77 ₽ | 1,27 | Запустить | ||
32 768 tensor |
4 | 321,77 ₽ | 3,50 | Запустить | ||
32 768 |
1 | 341,77 ₽ | 3,12 | Запустить | ||
32 768 |
1 | 367,41 ₽ | 4,40 | Запустить | ||
32 768 tensor |
2 | 411,81 ₽ | 10,08 | Запустить | ||
32 768 |
1 | 423,04 ₽ | 8,69 | Запустить | ||
32 768 tensor |
2 | 839,97 ₽ | 21,23 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 tensor |
8 | 7,52 | Запустить | |||
32 768 |
1 | 368,18 ₽ | 1,05 | Запустить | ||
32 768 |
1 | 423,81 ₽ | 5,35 | Запустить | ||
32 768 tensor |
2 | 440,74 ₽ | 6,74 | Запустить | ||
32 768 tensor |
2 | 441,52 ₽ | 6,74 | Запустить | ||
32 768 tensor |
4 | 514,59 ₽ | 3,03 | Запустить | ||
32 768 pipeline |
6 | 521,74 ₽ | 3,46 | Запустить | ||
32 768 tensor |
8 | 671,74 ₽ | 7,49 | Запустить | ||
32 768 tensor |
2 | 700,74 ₽ | 36,33 | 6,73 | Запустить | |
32 768 tensor |
2 | 840,74 ₽ | 17,88 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 pipeline |
3 | 657,66 ₽ | 7,17 | Запустить | ||
32 768 tensor |
8 | 671,74 ₽ | 1,13 | Запустить | ||
32 768 tensor |
2 | 729,47 ₽ | 2,93 | Запустить | ||
32 768 pipeline |
6 | 791,74 ₽ | 1,11 | Запустить | ||
32 768 tensor |
4 | 816,34 ₽ | 14,30 | Запустить | ||
32 768 tensor |
2 | 840,74 ₽ | 11,52 | Запустить | ||
32 768 tensor |
2 | 840,74 ₽ | 11,52 | Запустить | ||
32 768 tensor |
4 | 848,44 ₽ | 14,30 | Запустить | ||
32 768 tensor |
8 | 1 031,74 ₽ | 6,89 | Запустить | ||
32 768 pipeline |
3 | 1 047,66 ₽ | 7,15 | Запустить | ||
32 768 tensor |
4 | 1 336,34 ₽ | 14,28 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.