Gemma-4-E2B-it — это самая компактная и энергоэффективная модель в линейке, предназначенная для работы в условиях предельно ограниченных ресурсов. Как и версия E4B, модель использует технику Per-Layer Embeddings (PLE), позволяющую достичь высокой производительности при минимальном потреблении памяти. Общий объем параметров модели составляет 5.1 миллиарда, но во время вывода активна лишь эффективная часть — 2.3 миллиарда. Модель построена на 35 слоях, поддерживает контекстное окно в 128 тысяч токенов и использует гибридное внимание со скользящим окном на 512 токенов.
E2B является полностью мультимодальной и способна обрабатывать не только текст и изображения, но и аудио (оснащена аудио-энкодером на ~300M параметров). Этот набор возможностей при крайне низких требованиях к памяти делает модель уникальной в своём классе. Разработчики подчеркивают, что E2B специально спроектирована для эффективного локального использования на ноутбуках и мобильных устройствах. По оценкам сообщества, модель способна работать на устройствах с оперативной памятью менее 1.5 ГБ, включая смартфоны.
Несмотря на скромный размер, E2B демонстрирует впечатляющие результаты. По многочисленным независимым оценкам сообщества, эта модель превосходит Gemma-3 27B в некоторых задачах несмотря на то, что её эффективный размер в 12 раз меньше. Разработчики особенно рекомендуют E2B для рутинных агентных процессов, задач оптического распознавания символов (OCR) и сценариев, где критически важны низкая задержка и возможность инференса на периферийных устройствах. При этом лицензия Apache 2.0 открывает широкие возможности для внедрения модели в самые разнообразные коммерческие приложения.
С рекомендации по использованию модели от разработчиков можно ознакомиться по этой ссылке - https://ai.google.dev/gemma/docs/core/model_card_4?hl=ru
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 |
1 | 29,33 ₽ | 6,00 | Запустить | ||
131 072 |
1 | 33,74 ₽ | 6,00 | Запустить | ||
131 072 |
1 | 46,94 ₽ | 14,48 | Запустить | ||
131 072 tensor |
2 | 61,37 ₽ | 9,42 | Запустить | ||
131 072 |
1 | 73,73 ₽ | 14,48 | Запустить | ||
131 072 tensor |
2 | 86,54 ₽ | 7,30 | Запустить | ||
131 072 |
1 | 91,14 ₽ | 14,48 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 36,96 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 22,95 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 73,80 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 73,80 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 88,63 | Запустить | ||
131 072 tensor |
2 | 411,81 ₽ | 155,60 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 138,42 | Запустить | ||
131 072 tensor |
2 | 839,97 ₽ | 284,84 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 |
1 | 29,33 ₽ | 3,97 | Запустить | ||
131 072 |
1 | 33,74 ₽ | 3,97 | Запустить | ||
131 072 |
1 | 46,94 ₽ | 12,44 | Запустить | ||
131 072 tensor |
2 | 61,37 ₽ | 7,38 | Запустить | ||
131 072 |
1 | 73,73 ₽ | 12,44 | Запустить | ||
131 072 tensor |
2 | 86,54 ₽ | 5,26 | Запустить | ||
131 072 |
1 | 91,14 ₽ | 12,44 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 34,92 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 20,92 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 71,76 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 71,76 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 86,59 | Запустить | ||
131 072 tensor |
2 | 411,81 ₽ | 153,57 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 136,38 | Запустить | ||
131 072 tensor |
2 | 839,97 ₽ | 282,81 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
131 072 |
1 | 29,33 ₽ | 2,77 | Запустить | ||
131 072 |
1 | 33,74 ₽ | 2,77 | Запустить | ||
131 072 |
1 | 46,94 ₽ | 11,25 | Запустить | ||
131 072 tensor |
2 | 61,37 ₽ | 6,19 | Запустить | ||
131 072 |
1 | 73,73 ₽ | 11,25 | Запустить | ||
131 072 tensor |
2 | 86,54 ₽ | 4,07 | Запустить | ||
131 072 |
1 | 91,14 ₽ | 11,25 | Запустить | ||
131 072 tensor |
2 | 109,77 ₽ | 33,73 | Запустить | ||
131 072 |
1 | 141,77 ₽ | 19,72 | Запустить | ||
131 072 |
1 | 211,77 ₽ | 70,57 | Запустить | ||
131 072 |
1 | 341,77 ₽ | 70,57 | Запустить | ||
131 072 |
1 | 367,41 ₽ | 85,40 | Запустить | ||
131 072 tensor |
2 | 411,81 ₽ | 152,37 | Запустить | ||
131 072 |
1 | 423,04 ₽ | 135,19 | Запустить | ||
131 072 tensor |
2 | 839,97 ₽ | 281,61 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.