Qwen2.5-72B является флагманской открытой моделью серии с 72 миллиардами параметров, 80 слоями и архитектурой 64/8 голов внимания, представляя вершину возможностей открытых языковых моделей от Alibaba. Модель поддерживает контекст в 128K токенов с генерацией до 8K токенов, что позволяет анализировать несколько документов и создавать подробный контент с исключительной точностью.
Модель обучена на расширенном наборе данных в 18 триллионов токенов с улучшенной фильтрацией и включением специализированных данных по математике и программированию, что позволяет показывает выдающиеся результаты в широком спектре задач. Отсюда следует яркая особенность Qwen2.5-72B - достижение state-of-the-art результатов среди открытых моделей при значительно меньшем размере по сравнению с конкурентами. Согласно техническому отчету, модель демонстрирует конкурентоспособную производительность с Llama-3-405B-Instruct, которая в 5 раз больше по размеру.
Qwen2.5-72B распространяется по специальной исследовательской лицензией Qwen и предназначена для проектов, требующих максимального качества обработки естественного языка. Модель идеально подходит для фундаментальных исследований в области ИИ, создания передовых ИИ-продуктов, обучения и fine-tuning специализированных моделей, а также как основа для разработки мультимодальных систем и специализированных агентов.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 pipeline |
3 | 119,81 ₽ | 1,61 | Запустить | ||
32 768 tensor |
4 | 144,97 ₽ | 3,52 | Запустить | ||
32 768 pipeline |
6 | 147,44 ₽ | 3,02 | Запустить | ||
32 768 tensor |
2 | 198,54 ₽ | 1,14 | Запустить | ||
32 768 pipeline |
3 | 204,41 ₽ | 1,61 | Запустить | ||
32 768 tensor |
4 | 209,04 ₽ | 3,52 | Запустить | ||
32 768 |
1 | 211,77 ₽ | 2,83 | Запустить | ||
32 768 pipeline |
3 | 252,41 ₽ | 1,61 | Запустить | ||
32 768 tensor |
4 | 257,77 ₽ | 3,52 | Запустить | ||
32 768 tensor |
2 | 261,77 ₽ | 1,14 | Запустить | ||
32 768 tensor |
4 | 321,77 ₽ | 3,52 | Запустить | ||
32 768 |
1 | 341,77 ₽ | 2,83 | Запустить | ||
32 768 |
1 | 367,41 ₽ | 4,09 | Запустить | ||
32 768 |
1 | 423,04 ₽ | 8,32 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 pipeline |
6 | 312,70 ₽ | 4,69 | Запустить | ||
32 768 pipeline |
3 | 347,52 ₽ | 1,12 | Запустить | ||
32 768 |
1 | 367,41 ₽ | 1,44 | Запустить | ||
32 768 pipeline |
3 | 387,41 ₽ | 1,12 | Запустить | ||
32 768 tensor |
4 | 388,21 ₽ | 3,75 | Запустить | ||
32 768 tensor |
2 | 411,81 ₽ | 7,13 | Запустить | ||
32 768 tensor |
8 | 411,97 ₽ | 8,51 | Запустить | ||
32 768 |
1 | 423,04 ₽ | 5,67 | Запустить | ||
32 768 tensor |
4 | 513,04 ₽ | 3,75 | Запустить | ||
32 768 pipeline |
6 | 520,97 ₽ | 4,69 | Запустить | ||
32 768 tensor |
8 | 670,97 ₽ | 8,51 | Запустить | ||
32 768 tensor |
2 | 699,97 ₽ | 7,13 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
32 768 pipeline |
3 | 657,66 ₽ | 6,30 | Запустить | ||
32 768 tensor |
2 | 729,47 ₽ | 1,87 | Запустить | ||
32 768 pipeline |
6 | 791,74 ₽ | 1,23 | Запустить | ||
32 768 tensor |
4 | 816,34 ₽ | 13,25 | Запустить | ||
32 768 tensor |
2 | 840,74 ₽ | 10,33 | Запустить | ||
32 768 tensor |
8 | 1 031,74 ₽ | 6,49 | Запустить | ||
32 768 pipeline |
3 | 1 047,66 ₽ | 6,30 | Запустить | ||
32 768 tensor |
4 | 1 336,34 ₽ | 13,25 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.