Gemma-3-12B

мультимодальная
русскоязычная

Gemma 3 12B — это сбалансированная мультимодальная языковая модель среднего размера, разработанная Google DeepMind для решения узкоспециализированных профессиональных задач. Обладая 12 миллиардами параметров, модель сочетает высокую производительность с вычислительной эффективностью и поддерживает широкий спектр возможностей: от анализа текста до обработки изображений. Gemma 3 12B преобразует визуальные данные в токены, обеспечивая глубокое понимание изображений. Технология "Pan&Scan" позволяет адаптивно обрабатывать изображения с любыми пропорциями, сохраняя детализацию при масштабировании до разрешения 896×896.

Ещё одной ключевой особенностью является расширенное контекстное окно на уровне 128K токенов. Это позволяет модели обрабатывать длинные юридические документы, научные статьи одном запросе без потери контекста.Многоязычная поддержка охватывает более 140 языков, включая русский, а улучшенный токенизатор от Gemini 2.0, обеспечивает высокое качество перевода, генерации текста и кросс-языкового анализа. А поддержка квантования от разработчиков делает возможным запуск модели даже на потребительских GPU без существенной потери качества.

Таким образом, Gemma 3 12B представляет собой универсальный инструмент для решения задач в области анализа данных, обработки документов, извлечения данных из визуальных источников — с возможностью локального запуска и масштабируемой интеграцией в современные AI-инфраструктуры.


Дата анонса: 12.03.2025
Параметров: 12B
Контекст: 131K
Слоев: 48, с полным вниманием: 8
Тип внимания: Sliding Window Attention
Потребление памяти: 18.9 ГБ в точности 4 бит
Разработчик: Google DeepMind
Версия Transformers: 4.50.0.dev0
Версия Ollama: 0.6
Лицензия: gemma

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами бесплатно для теста инференса и знакомства с Gemma-3-12B. Получить токен для доступа к API вы можете на странице управления токенами после регистрации и верификации.
Наименование модели Контекст Тип GPU TPS Статус Ссылка
Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

  • получить максимальную производительность эндпоинта,
  • получить полный контекст для обработки больших запросов и диалогов,
  • обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
  • использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации для хостинга Gemma-3-12B

Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
teslaa10-1.16.32.160
131 072
16 32768 160 1 46,94 ₽ Запустить
teslat4-2.16.32.160
131 072
16 32768 160 2 48,14 ₽ Запустить
teslaa2-2.16.32.160
131 072
16 32768 160 2 51,34 ₽ Запустить
rtx2080ti-3.12.24.120
131 072
12 24576 120 3 74,84 ₽ Запустить
rtx3090-1.16.24.160
131 072
16 24576 160 1 78,53 ₽ Запустить
rtx4090-1.16.32.160
131 072
16 32768 160 1 103,04 ₽ Запустить
teslav100-1.12.64.160
131 072
12 65536 160 1 107,57 ₽ Запустить
rtxa5000-2.16.64.160.nvlink
131 072
16 65536 160 2 109,77 ₽ Запустить
rtx3080-3.16.64.160
131 072
16 65536 160 3 127,37 ₽ Запустить
rtx5090-1.16.64.160
131 072
16 65536 160 1 141,77 ₽ Запустить
teslaa100-1.16.64.160
131 072
16 65536 160 1 230,77 ₽ Запустить
teslah100-1.16.64.160
131 072
16 65536 160 1 456,27 ₽ Запустить
h200-1.16.128.160
131 072
16 131072 160 1 623,04 ₽ Запустить
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
teslat4-2.16.32.160
131 072
16 32768 160 2 48,14 ₽ Запустить
teslaa2-2.16.32.160
131 072
16 32768 160 2 51,34 ₽ Запустить
teslaa10-2.16.64.160
131 072
16 65536 160 2 83,37 ₽ Запустить
rtx2080ti-3.16.64.160
131 072
16 65536 160 3 84,47 ₽ Запустить
teslav100-1.12.64.160
131 072
12 65536 160 1 107,57 ₽ Запустить
rtxa5000-2.16.64.160.nvlink
131 072
16 65536 160 2 109,77 ₽ Запустить
rtx5090-1.16.64.160
131 072
16 65536 160 1 141,77 ₽ Запустить
rtx3090-2.16.64.160
131 072
16 65536 160 2 149,37 ₽ Запустить
rtx3080-4.16.64.160
131 072
16 65536 160 4 162,57 ₽ Запустить
rtx4090-2.16.64.160
131 072
16 65536 160 2 195,57 ₽ Запустить
teslaa100-1.16.64.160
131 072
16 65536 160 1 230,77 ₽ Запустить
teslah100-1.16.64.160
131 072
16 65536 160 1 456,27 ₽ Запустить
h200-1.16.128.160
131 072
16 131072 160 1 623,04 ₽ Запустить
Цены:
Наименование vCPU ОЗУ, МБ Диск, ГБ GPU Цена, час
teslat4-3.32.64.160
131 072
32 65536 160 3 78,57 ₽ Запустить
teslaa10-2.16.64.160
131 072
16 65536 160 2 83,37 ₽ Запустить
teslaa2-3.32.128.160
131 072
32 131072 160 3 94,64 ₽ Запустить
rtxa5000-2.16.64.160.nvlink
131 072
16 65536 160 2 109,77 ₽ Запустить
rtx3090-2.16.64.160
131 072
16 65536 160 2 149,37 ₽ Запустить
rtx4090-2.16.64.160
131 072
16 65536 160 2 195,57 ₽ Запустить
teslav100-2.16.64.240
131 072
16 65535 240 2 198,54 ₽ Запустить
teslaa100-1.16.64.160
131 072
16 65536 160 1 230,77 ₽ Запустить
rtx5090-2.16.64.160
131 072
16 65536 160 2 261,77 ₽ Запустить
teslah100-1.16.64.160
131 072
16 65536 160 1 456,27 ₽ Запустить
h200-1.16.128.160
131 072
16 131072 160 1 623,04 ₽ Запустить

Связанные модели

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.