Продукты

Облачные серверы

Облачные серверы с посекундной тарификацией. Изолированные ресурсы дадут максимальную производительность для вашего проекта.

GPU-серверы

Облачные серверы с современными графическими ускорителями RTX и Tesla для игр, рендеринга, стриминга, работы с 3Д-графикой, искусственным интеллектом.

H200

H100 NVL

H100

RTX 5090

RTX 4090

RTX 3090

RTX 3080

A100

RTX A5000

A10

RTX 2080 Ti

A2

Tesla T4

Tesla V100

Все GPU-серверы

CPU-серверы

Облачные серверы с высокопроизводительными центральными процессорами Intel Xeon Gold 2-го, 3-го и 5-го поколений, доступные на 100% процессорного времени.
SSD-серверы NVMe-серверы
Все CPU-серверы

Выделенные серверы

Арендуйте физически выделенный сервер на длительный срок с помесячной оплатой. Соберите конфигурацию с использованием современных комлектующих: процессоров Intel Xeon Gold 2-го, 3-го и 5-го поколений, до 10 новейших видеоускорителей RTX и Tesla и до 8192 ГБ RAM на сервер, SSD- и NVMe-дисков для дата-центров.

Выбрать выделенный сервер

Маркетплейс

Используйте популярные и современные приложения в качестве эффективных инструментов для организации вашего проекта. Экономьте время с помощью предварительно настроенных образов, в которых уже установлены все необходимые компоненты.

Забудьте про ручную загрузку и установку программного обеспечения — просто разверните виртуальный сервер с готовым образом.
Нейронные сети 3D CUDA Docker / NGC Для игр Windows-образы Linux-образы
Все предустановленные образы
Возможности
Тарифы
FAQ
Контакты
Вход

Gemma-3-12B

мультимодальная

русскоязычная

Gemma 3 12B — это сбалансированная мультимодальная языковая модель среднего размера, разработанная Google DeepMind для решения узкоспециализированных профессиональных задач. Обладая 12 миллиардами параметров, модель сочетает высокую производительность с вычислительной эффективностью и поддерживает широкий спектр возможностей: от анализа текста до обработки изображений. Gemma 3 12B преобразует визуальные данные в токены, обеспечивая глубокое понимание изображений. Технология "Pan&Scan" позволяет адаптивно обрабатывать изображения с любыми пропорциями, сохраняя детализацию при масштабировании до разрешения 896×896.

Ещё одной ключевой особенностью является расширенное контекстное окно на уровне 128K токенов. Это позволяет модели обрабатывать длинные юридические документы, научные статьи одном запросе без потери контекста.Многоязычная поддержка охватывает более 140 языков, включая русский, а улучшенный токенизатор от Gemini 2.0, обеспечивает высокое качество перевода, генерации текста и кросс-языкового анализа. А поддержка квантования от разработчиков делает возможным запуск модели даже на потребительских GPU без существенной потери качества.

Таким образом, Gemma 3 12B представляет собой универсальный инструмент для решения задач в области анализа данных, обработки документов, извлечения данных из визуальных источников — с возможностью локального запуска и масштабируемой интеграцией в современные AI-инфраструктуры.

Дата анонса: 12.03.2025
Параметров: 12B
Контекст: 132K
Слоев: 48, с полным вниманием: 8
Тип внимания: Sliding Window Attention
Разработчик: Google DeepMind
Версия Transformers: 4.50.0.dev0
Лицензия: gemma

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами бесплатно для теста инференса и знакомства с Gemma-3-12B. Получить токен для доступа к API вы можете на странице управления токенами после регистрации и верификации.

Наименование модели	Контекст	Тип	GPU	Статус	Ссылка


        Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

получить максимальную производительность эндпоинта,
получить полный контекст для обработки больших запросов и диалогов,
обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации сервера для хостинга Gemma-3-12B

Цены:

Наименование	GPU	Цена, час	Цена, месяц	Параллельность (макс.)
teslaa10-1.16.32.160 131 072	1	46,94 ₽	33 796,80 ₽	1,45	Запустить
teslat4-2.16.32.160 131 072 tensor	2	48,14 ₽	34 660,80 ₽	1,88	Запустить
teslaa2-2.16.32.160 131 072 tensor	2	51,34 ₽	36 964,80 ₽	1,88	Запустить
rtx2080ti-2.12.64.160 131 072 tensor	2	61,37 ₽	44 186,40 ₽	1,05	Запустить
rtx3090-1.16.24.160 131 072	1	73,73 ₽	53 085,60 ₽	1,45	Запустить
rtx4090-1.16.32.160 131 072	1	91,14 ₽	65 620,80 ₽	1,45	Запустить
teslav100-1.12.64.160 131 072	1	107,57 ₽	77 450,40 ₽	2,11	Запустить
rtxa5000-2.16.64.160.nvlink 131 072 tensor	2	109,77 ₽	79 034,40 ₽	3,21	Запустить
rtx3080-3.16.64.160 131 072 pipeline	3	127,37 ₽	91 706,40 ₽	1,48	Запустить
rtx5090-1.16.64.160 131 072	1	141,77 ₽	102 074,40 ₽	2,11	Запустить
rtx3080-4.16.64.160 131 072 tensor	4	162,57 ₽	117 050,40 ₽	2,08	Запустить
teslaa100-1.16.64.160 131 072	1	211,77 ₽	152 474,40 ₽	6,11	Запустить
h100-1.16.64.160 131 072	1	341,77 ₽	246 074,40 ₽	6,11	Запустить
h100nvl-1.16.96.160 131 072	1	367,41 ₽	264 535,20 ₽	7,27	Запустить
h200-1.16.128.160 131 072	1	423,04 ₽	304 588,80 ₽	11,18	Запустить

Цены:

Наименование	GPU	Цена, час	Цена, месяц	Параллельность (макс.)
teslat4-2.16.32.160 131 072 tensor	2	48,14 ₽	34 660,80 ₽	1,03	Запустить
teslaa2-2.16.32.160 131 072 tensor	2	51,34 ₽	36 964,80 ₽	1,03	Запустить
teslaa10-2.16.64.160 131 072 tensor	2	83,37 ₽	60 026,40 ₽	2,36	Запустить
rtx2080ti-4.16.32.160 131 072 tensor	4	99,74 ₽	71 812,80 ₽	1,56	Запустить
teslav100-1.12.64.160 131 072	1	107,57 ₽	77 450,40 ₽	1,26	Запустить
rtxa5000-2.16.64.160.nvlink 131 072 tensor	2	109,77 ₽	79 034,40 ₽	2,36	Запустить
rtx3090-2.16.64.160 131 072 tensor	2	139,77 ₽	100 634,40 ₽	2,36	Запустить
rtx5090-1.16.64.160 131 072	1	141,77 ₽	102 074,40 ₽	1,26	Запустить
rtx3080-4.16.64.160 131 072 tensor	4	162,57 ₽	117 050,40 ₽	1,23	Запустить
rtx4090-2.16.64.160 131 072 tensor	2	171,77 ₽	123 674,40 ₽	2,36	Запустить
teslaa100-1.16.64.160 131 072	1	211,77 ₽	152 474,40 ₽	5,25	Запустить
h100-1.16.64.160 131 072	1	341,77 ₽	246 074,40 ₽	5,25	Запустить
h100nvl-1.16.96.160 131 072	1	367,41 ₽	264 535,20 ₽	6,42	Запустить
h200-1.16.128.160 131 072	1	423,04 ₽	304 588,80 ₽	10,33	Запустить

Цены:

Наименование	GPU	Цена, час	Цена, месяц	Параллельность (макс.)
teslat4-3.32.64.160 131 072 pipeline	3	78,57 ₽	56 570,40 ₽	1,05	Запустить
teslaa10-2.16.64.160 131 072 tensor	2	83,37 ₽	60 026,40 ₽	1,28	Запустить
teslat4-4.16.64.160 131 072 tensor	4	85,77 ₽	61 754,40 ₽	2,15	Запустить
teslaa2-3.32.128.160 131 072 pipeline	3	94,64 ₽	68 140,80 ₽	1,05	Запустить
rtxa5000-2.16.64.160.nvlink 131 072 tensor	2	109,77 ₽	79 034,40 ₽	1,28	Запустить
teslaa2-4.32.128.160 131 072 tensor	4	112,24 ₽	80 812,80 ₽	2,15	Запустить
rtx3090-2.16.64.160 131 072 tensor	2	139,77 ₽	100 634,40 ₽	1,28	Запустить
rtx4090-2.16.64.160 131 072 tensor	2	171,77 ₽	123 674,40 ₽	1,28	Запустить
teslav100-2.16.64.240 131 072 tensor	2	198,54 ₽	142 948,80 ₽	2,61	Запустить
teslaa100-1.16.64.160 131 072	1	211,77 ₽	152 474,40 ₽	4,17	Запустить
rtx5090-2.16.64.160 131 072 tensor	2	261,77 ₽	188 474,40 ₽	2,61	Запустить
h100-1.16.64.160 131 072	1	341,77 ₽	246 074,40 ₽	4,17	Запустить
h100nvl-1.16.96.160 131 072	1	367,41 ₽	264 535,20 ₽	5,34	Запустить
h200-1.16.128.160 131 072	1	423,04 ₽	304 588,80 ₽	9,25	Запустить

Связанные модели

Gemma-3-1B

Gemma-3-4B

Gemma-3-27B

gemma-3-270m

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.

Gemma-3-12B

Публичный эндпоинт

Частный сервер

Рекомендуемые конфигурации сервера для хостинга Gemma-3-12B

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Связанные модели

Остались вопросы?