Gemma 3 4B – компактный ИИ от компании Google Deep Mind, предлагающая отличный баланс между размером и функциональностью. В отличие от базовой версии 1B, модель 4B поддерживает мультимодальные входы: текст, изображения (разрешение до 896x896 пикселей) и короткие видео. Например, модель может распознавать объекты и текст на изображениях, например, извлекать данные с чеков или этикеток. Для обработки изображений используется визуальный энкодер SigLIP, который сегментирует большие файлы автоматически.
Инновационная архитектура и эффективное соотношение локального и глобального внимания 5:1 для оптимизации памяти позволяет поддерживать работу с контекстным окном до 128K токенов. Gemma 3 4B поддерживает 35 языков в том числе русский. Реализованы возможности вызова функций (function calling), что позволяет интегрироваться с API для автоматизации задач, например генерации SQL-запросов или преобразования данных.
Модель отлично подходит для создания интеллектуальных помощников и быстрой обработки документов и изображений, что делает её идеальным выбором для разработчиков, которым нужны мультимодальные функции без значительных вычислительных затрат.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 |
1 | 29,33 ₽ | 2,09 | Запустить | ||
131 072 |
1 | 33,74 ₽ | 2,09 | Запустить | ||
131 072 |
1 | 46,94 ₽ | 4,13 | Запустить | ||
131 072 tensor |
2 | 61,37 ₽ | 2,91 | Запустить | ||
131 072 |
1 | 73,73 ₽ | 4,13 | Запустить | ||
131 072 tensor |
2 | 86,54 ₽ | 2,40 | Запустить | ||
131 072 |
1 | 91,14 ₽ | 4,13 | Запустить | ||
131 072 |
1 | 107,57 ₽ | 6,18 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 9,56 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 6,18 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 18,45 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 18,45 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 22,03 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 34,05 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 |
1 | 29,33 ₽ | 2,32 | Запустить | ||
131 072 |
1 | 34,23 ₽ | 1,04 | Запустить | ||
131 072 |
1 | 33,74 ₽ | 2,32 | Запустить | ||
131 072 |
1 | 46,94 ₽ | 4,37 | Запустить | ||
131 072 |
1 | 51,34 ₽ | 0,79 | Запустить | ||
131 072 |
1 | 73,73 ₽ | 4,37 | Запустить | ||
131 072 |
1 | 91,14 ₽ | 4,37 | Запустить | ||
131 072 |
1 | 107,57 ₽ | 6,41 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 9,80 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 6,41 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 18,69 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 18,69 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 22,27 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 34,29 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 |
1 | 29,33 ₽ | 0,94 | Запустить | ||
131 072 |
1 | 33,74 ₽ | 17,61 | 0,94 | Запустить | |
131 072 |
1 | 46,94 ₽ | 38,23 | 2,98 | Запустить | |
131 072 tensor |
2 | 61,37 ₽ | 1,76 | Запустить | ||
131 072 |
1 | 73,73 ₽ | 53,83 | 2,98 | Запустить | |
131 072 tensor |
2 | 86,54 ₽ | 1,25 | Запустить | ||
131 072 |
1 | 91,14 ₽ | 68,01 | 2,98 | Запустить | |
131 072 |
1 | 107,57 ₽ | 5,03 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 8,41 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 88,28 | 5,03 | Запустить | |
131 072 |
1 | 211,77 ₽ | 92,36 | 17,30 | Запустить | |
131 072 |
1 | 341,77 ₽ | 105,71 | 17,30 | Запустить | |
131 072 |
1 | 367,41 ₽ | 20,88 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 32,90 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.