Phi-4-multimodal-instruct — это мультимодальная модель с открытым исходным кодом от Microsoft, обрабатывающая текст, изображения и аудио в едином архитектурном решении. Она построена на основе технологий Phi-3.5 и Phi-4.0, с расширенным контекстным окном в 128K токенов и поддержкой 23 языков для текста (в том числе русский), 8 языков для аудио и английского для визуальных задач. Модель оптимизирована для сред с ограниченными вычислительными ресурсами и сценариев с низкой задержкой, демонстрируя сильные результаты в математике, логике, распознавании речи, переводе и анализе изображений.
Единая нейросеть обрабатывает текст, изображения (OCR, таблицы, диаграммы) и аудио (распознавание, перевод, суммаризация). Например, в тестах DocVQA модель достигает 93.2% точности, превосходя Gemini-2.0-Flash (92.1%)
Модель идеально подходит для мультисенсорных приложений - совместная обработка аудио и изображений (например, анализ видео с субтитрами). При этом, благодаря оптимизации через Microsoft Olive и ONNX GenAI Runtime, модель может развертываться на edge-устройствах, включая смартфоны и IoT-системы, даже с ограниченными вычислительными ресурсами.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 |
1 | 46,94 ₽ | 1,03 | Запустить | ||
131 072 tensor |
2 | 48,14 ₽ | 1,33 | Запустить | ||
131 072 tensor |
2 | 51,34 ₽ | 1,33 | Запустить | ||
131 072 |
1 | 73,73 ₽ | 1,03 | Запустить | ||
131 072 tensor |
3 | 74,84 ₽ | 1,23 | Запустить | ||
131 072 |
1 | 91,14 ₽ | 1,03 | Запустить | ||
131 072 |
1 | 107,57 ₽ | 1,48 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 2,23 | Запустить | ||
131 072 tensor |
3 | 127,37 ₽ | 1,06 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 1,48 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 4,18 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 4,18 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 4,97 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 7,61 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 tensor |
2 | 48,14 ₽ | 1,16 | Запустить | ||
131 072 tensor |
2 | 51,34 ₽ | 1,16 | Запустить | ||
131 072 tensor |
3 | 74,84 ₽ | 1,06 | Запустить | ||
131 072 tensor |
2 | 83,37 ₽ | 2,06 | Запустить | ||
131 072 |
1 | 107,57 ₽ | 1,32 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 2,06 | Запустить | ||
131 072 tensor |
2 | 139,77 ₽ | 2,06 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 1,32 | Запустить | ||
131 072 tensor |
4 | 162,57 ₽ | 1,30 | Запустить | ||
131 072 tensor |
2 | 171,77 ₽ | 2,06 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 4,02 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 4,02 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 4,81 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 7,45 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 tensor |
3 | 78,57 ₽ | 1,53 | Запустить | ||
131 072 tensor |
2 | 83,37 ₽ | 1,69 | Запустить | ||
131 072 tensor |
3 | 94,64 ₽ | 1,53 | Запустить | ||
131 072 tensor |
4 | 99,74 ₽ | 1,15 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 1,69 | Запустить | ||
131 072 tensor |
2 | 139,77 ₽ | 1,69 | Запустить | ||
131 072 tensor |
2 | 171,77 ₽ | 1,69 | Запустить | ||
131 072 tensor |
2 | 198,54 ₽ | 2,59 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 3,65 | Запустить | ||
131 072 tensor |
2 | 261,77 ₽ | 2,59 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 3,65 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 4,43 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 7,08 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.