Phi-3.5-mini — это последняя модель из третьей серии малых языковых моделей Microsoft Phi, которая сочетает в себе компактность и высокую производительность. Модель построена на архитектуре с 3.8 млрд параметров и способна работать локально даже на современных смартфонах, что делает её одной из самых доступных и эффективных языковых моделей на рынке. Благодаря использованию тщательно отобранных и синтетических данных для обучения, Phi-3.5-mini демонстрирует результаты, сравнимые с гораздо более крупными моделями, такими как GPT-3.5 и Mixtral 8x7B, но при этом требует в разы меньше вычислительных ресурсов.
Уникальность Phi-3.5-mini заключается в подходе к обучению: вместо простого увеличения размера модели разработчики сделали ставку на качество и релевантность данных. Использование тщательно фильтрованных веб-источников и синтетических примеров позволило добиться “data optimal regime” — максимальной отдачи от каждого параметра модели. Это позволило Phi-3.5-mini показать выдающиеся результаты в задачах рассуждения, математики, программирования и диалогов, оставаясь при этом компактной и быстрой.
Сценарии использования Phi-3.5-mini особенно актуальны для edge-устройств, мобильных приложений, чат-ботов, образовательных платформ, а также для задач, где важна приватность и автономная работа без подключения к облаку. Модель отлично подходит для создания многоязычных ассистентов, генерации и анализа текста, решения математических и логических задач, а также для интеграции в продукты с ограниченными вычислительными ресурсами.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
44 000 |
1 | 46,94 ₽ | 1,05 | Запустить | ||
44 000 tensor |
2 | 48,14 ₽ | 1,34 | Запустить | ||
44 000 tensor |
2 | 51,34 ₽ | 1,34 | Запустить | ||
44 000 |
1 | 73,73 ₽ | 1,05 | Запустить | ||
44 000 pipeline |
3 | 74,84 ₽ | 1,24 | Запустить | ||
44 000 |
1 | 91,14 ₽ | 1,05 | Запустить | ||
44 000 tensor |
4 | 99,74 ₽ | 1,70 | Запустить | ||
44 000 |
1 | 107,57 ₽ | 1,49 | Запустить | ||
44 000 tensor |
2 | 109,77 ₽ | 2,23 | Запустить | ||
131 072 pipeline |
3 | 119,81 ₽ | 1,15 | Запустить | ||
44 000 pipeline |
3 | 127,37 ₽ | 1,07 | Запустить | ||
44 000 |
1 | 141,77 ₽ | 1,49 | Запустить | ||
131 072 tensor |
4 | 144,97 ₽ | 1,54 | Запустить | ||
131 072 pipeline |
6 | 147,44 ₽ | 1,44 | Запустить | ||
44 000 tensor |
4 | 162,57 ₽ | 1,47 | Запустить | ||
131 072 tensor |
2 | 198,54 ₽ | 1,05 | Запустить | ||
131 072 pipeline |
3 | 204,41 ₽ | 1,15 | Запустить | ||
131 072 tensor |
4 | 209,04 ₽ | 1,54 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 1,40 | Запустить | ||
131 072 pipeline |
3 | 252,41 ₽ | 1,15 | Запустить | ||
131 072 tensor |
4 | 257,77 ₽ | 1,54 | Запустить | ||
131 072 tensor |
2 | 261,77 ₽ | 1,05 | Запустить | ||
131 072 tensor |
4 | 321,77 ₽ | 1,54 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 1,40 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 1,66 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 2,54 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
44 000 tensor |
2 | 48,14 ₽ | 1,26 | Запустить | ||
44 000 tensor |
2 | 51,34 ₽ | 1,26 | Запустить | ||
44 000 pipeline |
3 | 74,84 ₽ | 1,16 | Запустить | ||
44 000 tensor |
2 | 83,37 ₽ | 2,15 | Запустить | ||
44 000 tensor |
4 | 99,74 ₽ | 1,62 | Запустить | ||
44 000 |
1 | 107,57 ₽ | 1,41 | Запустить | ||
44 000 tensor |
2 | 109,77 ₽ | 2,15 | Запустить | ||
131 072 pipeline |
3 | 119,81 ₽ | 1,12 | Запустить | ||
44 000 pipeline |
3 | 127,37 ₽ | 0,99 | Запустить | ||
44 000 tensor |
2 | 139,77 ₽ | 2,15 | Запустить | ||
44 000 |
1 | 141,77 ₽ | 1,41 | Запустить | ||
131 072 tensor |
4 | 144,97 ₽ | 1,52 | Запустить | ||
131 072 pipeline |
6 | 147,44 ₽ | 1,41 | Запустить | ||
44 000 tensor |
4 | 162,57 ₽ | 1,39 | Запустить | ||
44 000 tensor |
2 | 171,77 ₽ | 2,15 | Запустить | ||
131 072 tensor |
2 | 198,54 ₽ | 1,02 | Запустить | ||
131 072 pipeline |
3 | 204,41 ₽ | 1,12 | Запустить | ||
131 072 tensor |
4 | 209,04 ₽ | 1,52 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 1,37 | Запустить | ||
131 072 pipeline |
3 | 252,41 ₽ | 1,12 | Запустить | ||
131 072 tensor |
4 | 257,77 ₽ | 1,52 | Запустить | ||
131 072 tensor |
2 | 261,77 ₽ | 1,02 | Запустить | ||
131 072 tensor |
4 | 321,77 ₽ | 1,52 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 1,37 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 1,64 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 2,52 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
44 000 tensor |
2 | 48,14 ₽ | 1,00 | Запустить | ||
44 000 tensor |
2 | 51,34 ₽ | 1,00 | Запустить | ||
44 000 tensor |
2 | 83,37 ₽ | 1,90 | Запустить | ||
44 000 tensor |
4 | 99,74 ₽ | 1,36 | Запустить | ||
44 000 |
1 | 107,57 ₽ | 1,16 | Запустить | ||
44 000 tensor |
2 | 109,77 ₽ | 1,90 | Запустить | ||
131 072 pipeline |
3 | 119,81 ₽ | 1,03 | Запустить | ||
44 000 tensor |
2 | 139,77 ₽ | 1,90 | Запустить | ||
44 000 |
1 | 141,77 ₽ | 1,16 | Запустить | ||
131 072 tensor |
4 | 144,97 ₽ | 1,43 | Запустить | ||
131 072 pipeline |
6 | 147,44 ₽ | 1,33 | Запустить | ||
44 000 tensor |
4 | 162,57 ₽ | 1,14 | Запустить | ||
44 000 tensor |
2 | 171,77 ₽ | 1,90 | Запустить | ||
131 072 pipeline |
3 | 204,41 ₽ | 1,03 | Запустить | ||
131 072 tensor |
4 | 209,04 ₽ | 1,43 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 1,29 | Запустить | ||
131 072 pipeline |
3 | 252,41 ₽ | 1,03 | Запустить | ||
131 072 tensor |
4 | 257,77 ₽ | 1,43 | Запустить | ||
131 072 tensor |
4 | 321,77 ₽ | 1,43 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 1,29 | Запустить | ||
131 072 pipeline |
3 | 347,52 ₽ | 1,48 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 1,55 | Запустить | ||
131 072 tensor |
4 | 382,57 ₽ | 2,03 | Запустить | ||
131 072 pipeline |
3 | 387,41 ₽ | 1,48 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 2,43 | Запустить | ||
131 072 tensor |
4 | 513,04 ₽ | 2,03 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.