Продукты

Облачные серверы

Облачные серверы с посекундной тарификацией. Изолированные ресурсы дадут максимальную производительность для вашего проекта.

GPU-серверы

Облачные серверы с современными графическими ускорителями RTX и Tesla для игр, рендеринга, стриминга, работы с 3Д-графикой, искусственным интеллектом.

H200

H100 NVL

H100

RTX 5090

RTX 4090

RTX 3090

RTX 3080

A100

RTX A5000

A10

RTX 2080 Ti

A2

Tesla T4

Tesla V100

Все GPU-серверы

CPU-серверы

Облачные серверы с высокопроизводительными центральными процессорами Intel Xeon Gold 2-го, 3-го и 5-го поколений, доступные на 100% процессорного времени.
SSD-серверы NVMe-серверы
Все CPU-серверы

Выделенные серверы

Арендуйте физически выделенный сервер на длительный срок с помесячной оплатой. Соберите конфигурацию с использованием современных комлектующих: процессоров Intel Xeon Gold 2-го, 3-го и 5-го поколений, до 10 новейших видеоускорителей RTX и Tesla и до 8192 ГБ RAM на сервер, SSD- и NVMe-дисков для дата-центров.

Выбрать выделенный сервер

Маркетплейс

Используйте популярные и современные приложения в качестве эффективных инструментов для организации вашего проекта. Экономьте время с помощью предварительно настроенных образов, в которых уже установлены все необходимые компоненты.

Забудьте про ручную загрузку и установку программного обеспечения — просто разверните виртуальный сервер с готовым образом.
Нейронные сети 3D CUDA Docker / NGC Для игр Windows-образы Linux-образы
Все предустановленные образы
Возможности
Тарифы
FAQ
Контакты
Вход

whisper-large-v3

русскоязычная

Модель Whisper large-v3 представляет собой последнюю и наиболее совершенную версию в семействе ASR моделей от OpenAI. Модель разработана для решения широкого спектра задач обработки речи в рамках единого фреймворка. В отличие от традиционных ASR-систем, требующих сложных пайплайнов из нескольких специализированных компонентов, Whisper использует унифицированную архитектуру sequence-to-sequence. Это позволяет модели выполнять не только транскрипцию речи, но и такие задачи, как идентификация языка, голосовая активность и перевод на английский язык, обрабатывая аудио «из коробки» без дообучения.

Архитектурно large-v3 базируется на проверенном трансформере encoder-decoder, сохранив общую структуру предыдущих версий (large и large-v2), но с двумя ключевыми улучшениями. Во-первых, модель использует 128 мел-частотных бинов для обработки входного аудиосигнала вместо 80, используемых ранее, что позволяет захватывать более тонкие детали аудио, особенно важные для языков с богатой тональностью и сложной фонетикой. Во-вторых, large-v3 была обучена с помощью зарекомендовавшего себя метода слабо контролируемого обучения (weak supervision) на внушительном объеме данных – около 5 млн часов. Также в модель был добавлен новый языковой токен для кантонского диалекта. По сравнению с предшественником Whisper large-v2, новая модель показывает снижение количества ошибок на 10-20% для широкого спектра языков, что делает её наиболее точной версией среди всех выпущенных OpenAI.

Whisper large-v3 идеально подходит для автоматического создания субтитров к видео, лекциям, подкастам, вебинарам и интервью на множестве языков, причём возможность возвращать таймкоды на уровне слов или предложений значительно упрощает этот процесс. Также она может использоваться для перевода аудиоконтента или служить основой для систем голосового управления, диктовки текста, а также для анализа звонков в контакт-центрах, автоматически определяя тему разговора и ключевые требования. Наконец, модель является отличной отправной точкой для исследователей, которые могут дообучать её под узкоспециализированные задачи с использованием небольшого объема размеченных данных.

Дата анонса: 07.11.2023
Параметров: 2B
Контекст: 448
Слоев: 32
Тип внимания: Full Attention
Разработчик: OpenAI
Версия Transformers: 4.36.0.dev0
Лицензия: Apache 2.0

Публичный эндпоинт

Воспользуйтесь нашими готовыми публичными эндпоинтами бесплатно для теста инференса и знакомства с whisper-large-v3. Получить токен для доступа к API вы можете на странице управления токенами после регистрации и верификации.

Наименование модели	Контекст	Тип	GPU	Статус	Ссылка


        Для данной модели пока нет публичных эндпоинтов.

Частный сервер

Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.

Мы рекомендуем создание частных инстансов в случаях, если необходимо:

получить максимальную производительность эндпоинта,
получить полный контекст для обработки больших запросов и диалогов,
обеспечить максимальную безопасность, для обработки данных в выделенном изолированном пространстве,
использовать кастомизированные веса: fine-tuned версии или lora-адаптеры.

Рекомендуемые конфигурации сервера для хостинга whisper-large-v3

Цены:

Наименование	GPU	Цена, час	Цена, месяц	Параллельность (макс.)
teslat4-1.16.16.160	1	29,33 ₽	21 117,60 ₽	8,36	Запустить
rtx2080ti-1.10.16.500	1	34,23 ₽	24 645,60 ₽	4,95	Запустить
teslaa2-1.16.32.160	1	33,74 ₽	24 292,80 ₽	8,36	Запустить
teslaa10-1.16.32.160	1	46,94 ₽	33 796,80 ₽	13,82	Запустить
rtx3080-1.16.32.160	1	51,34 ₽	36 964,80 ₽	4,26	Запустить
rtx3090-1.16.24.160	1	73,73 ₽	53 085,60 ₽	13,82	Запустить
rtx4090-1.16.32.160	1	91,14 ₽	65 620,80 ₽	13,82	Запустить
teslav100-1.12.64.160	1	107,57 ₽	77 450,40 ₽	19,28	Запустить
rtxa5000-2.16.64.160.nvlink tensor	2	109,77 ₽	79 034,40 ₽	28,31	Запустить
rtx5090-1.16.64.160	1	141,77 ₽	102 074,40 ₽	19,28	Запустить
teslaa100-1.16.64.160	1	211,77 ₽	152 474,40 ₽	52,05	Запустить
h100-1.16.64.160	1	341,77 ₽	246 074,40 ₽	52,05	Запустить
h100nvl-1.16.96.160	1	367,41 ₽	264 535,20 ₽	61,61	Запустить
h200-1.16.128.160	1	423,04 ₽	304 588,80 ₽	93,69	Запустить

Цены:

Наименование	GPU	Цена, час	Цена, месяц	Параллельность (макс.)
teslat4-1.16.16.160	1	29,33 ₽	21 117,60 ₽	7,83	Запустить
rtx2080ti-1.10.16.500	1	34,23 ₽	24 645,60 ₽	4,42	Запустить
teslaa2-1.16.32.160	1	33,74 ₽	24 292,80 ₽	7,83	Запустить
teslaa10-1.16.32.160	1	46,94 ₽	33 796,80 ₽	13,30	Запустить
rtx3080-1.16.32.160	1	51,34 ₽	36 964,80 ₽	3,74	Запустить
rtx3090-1.16.24.160	1	73,73 ₽	53 085,60 ₽	13,30	Запустить
rtx4090-1.16.32.160	1	91,14 ₽	65 620,80 ₽	13,30	Запустить
teslav100-1.12.64.160	1	107,57 ₽	77 450,40 ₽	18,76	Запустить
rtxa5000-2.16.64.160.nvlink tensor	2	109,77 ₽	79 034,40 ₽	27,78	Запустить
rtx5090-1.16.64.160	1	141,77 ₽	102 074,40 ₽	18,76	Запустить
teslaa100-1.16.64.160	1	211,77 ₽	152 474,40 ₽	51,52	Запустить
h100-1.16.64.160	1	341,77 ₽	246 074,40 ₽	51,52	Запустить
h100nvl-1.16.96.160	1	367,41 ₽	264 535,20 ₽	61,08	Запустить
h200-1.16.128.160	1	423,04 ₽	304 588,80 ₽	93,17	Запустить

Цены:

Наименование	GPU	Цена, час	Цена, месяц	Параллельность (макс.)
teslat4-1.16.16.160	1	29,33 ₽	21 117,60 ₽	6,84	Запустить
rtx2080ti-1.10.16.500	1	34,23 ₽	24 645,60 ₽	3,42	Запустить
teslaa2-1.16.32.160	1	33,74 ₽	24 292,80 ₽	6,84	Запустить
teslaa10-1.16.32.160	1	46,94 ₽	33 796,80 ₽	12,30	Запустить
rtx3080-1.16.32.160	1	51,34 ₽	36 964,80 ₽	2,74	Запустить
rtx3090-1.16.24.160	1	73,73 ₽	53 085,60 ₽	12,30	Запустить
rtx4090-1.16.32.160	1	91,14 ₽	65 620,80 ₽	12,30	Запустить
teslav100-1.12.64.160	1	107,57 ₽	77 450,40 ₽	17,76	Запустить
rtxa5000-2.16.64.160.nvlink tensor	2	109,77 ₽	79 034,40 ₽	26,79	Запустить
rtx5090-1.16.64.160	1	141,77 ₽	102 074,40 ₽	17,76	Запустить
teslaa100-1.16.64.160	1	211,77 ₽	152 474,40 ₽	50,53	Запустить
h100-1.16.64.160	1	341,77 ₽	246 074,40 ₽	50,53	Запустить
h100nvl-1.16.96.160	1	367,41 ₽	264 535,20 ₽	60,08	Запустить
h200-1.16.128.160	1	423,04 ₽	304 588,80 ₽	92,17	Запустить

Связанные модели

Остались вопросы?

Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.

whisper-large-v3

Публичный эндпоинт

Частный сервер

Рекомендуемые конфигурации сервера для хостинга whisper-large-v3

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Подписаться на уведомление о доступности

Связанные модели

Остались вопросы?