Модель Llama-3-8B по праву считается одной из самых известных и популярных моделей в истории открытого искусственного интеллекта. Выпущенная 18 апреля 2024 года, она ознаменовала собой поворотный момент, сделав технологии, используемые в передовых ИИ моделях доступными для широкого круга исследователей и разработчиков. Именно Llama 3 стала катализатором того бурного роста open-source проектов и стартапов в сфере ИИ, доказав, что открытые модели могут успешно конкурировать с коммерческими аналогами, не только с позиции гибкости настройки и дообучения, но и с позиции качества работы.
В основе модели лежит архитектура трансформера с использованием механизма Grouped-Query Attention (GQA). В отличие от стандартного MHA, GQA позволяет значительно снизить нагрузку на память и ускоряет генерацию. Модель работает с контекстом в 8192 токенов и использует токенизатор со словарем в 128 256 токенов, что позволяет ей эффективно обрабатывать сложные мультиязычные запросы.
Уникальность Llama-3-8B во многом обусловлена беспрецедентным на момент ее выхода масштабом и качеством обучения. Базовая модель была предобучена на более чем 15 триллионах токенов — это в 7 раз больше, чем у предшественника Llama 2. Данные, собранные из общедоступных источников, тщательно фильтровались для обеспечения высокого качества. Для получения инструктивной версии (-Instruct) использовалась двухэтапная процедура: сначала контролируемая тонкая настройка (SFT) на миллионах примеров, а затем выравнивание с предпочтениями человека с помощью обучения с подкреплением на основе обратной связи (RLHF). Это позволило сделать модель не только чрезвычайно полезной (helpful), но и значительно снизить количество ложных отказов (refusals).
Благодаря своим характеристикам Llama-3-8B до сих пор имеет широчайший спектр практических применений. Ключевым свойством является простота ее дообучения и адаптации. Эта особенность позволяет использовать модель как основу для создания диалоговых систем и инструментов анализа текста, так и в качестве идеальной «песочницы» для исследовательских экспериментов с тонкой настройкой под узкоспециализированные домены, такие как юриспруденция или медицина. Более того, сочетание открытой коммерческой лицензии, невысоких требований к «железу» и легкости кастомизации сделало её выбором номер один для стартапов и быстрого прототипирования, позволяя эффективно создавать MVP в самых разных предметных областях.
| Наименование модели | Контекст | Тип | GPU | Статус | Ссылка |
|---|
Для данной модели пока нет публичных эндпоинтов.
Арендуйте собственный физически выделенный инстанс с почасовой оплатой или на длительный срок с помесячной оплатой.
Мы рекомендуем создание частных инстансов в случаях, если необходимо:
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
8192 |
1 | 29,33 ₽ | 6,56 | Запустить | ||
8192 |
1 | 34,23 ₽ | 2,06 | Запустить | ||
8192 |
1 | 33,74 ₽ | 6,56 | Запустить | ||
8192 |
1 | 46,94 ₽ | 13,76 | Запустить | ||
8192 |
1 | 51,34 ₽ | 1,16 | Запустить | ||
8192 |
1 | 73,73 ₽ | 13,76 | Запустить | ||
8192 |
1 | 91,14 ₽ | 13,76 | Запустить | ||
8192 |
1 | 107,57 ₽ | 20,96 | Запустить | ||
8192 tensor |
2 | 109,77 ₽ | 32,86 | Запустить | ||
8192 |
1 | 141,77 ₽ | 20,96 | Запустить | ||
8192 |
1 | 211,77 ₽ | 64,16 | Запустить | ||
8192 |
1 | 341,77 ₽ | 64,16 | Запустить | ||
8192 |
1 | 367,41 ₽ | 76,76 | Запустить | ||
8192 |
1 | 423,04 ₽ | 119,06 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
8192 |
1 | 29,33 ₽ | 3,44 | Запустить | ||
8192 |
1 | 33,74 ₽ | 3,44 | Запустить | ||
8192 |
1 | 46,94 ₽ | 10,64 | Запустить | ||
8192 tensor |
2 | 61,37 ₽ | 6,34 | Запустить | ||
8192 |
1 | 73,73 ₽ | 10,64 | Запустить | ||
8192 tensor |
2 | 86,54 ₽ | 4,54 | Запустить | ||
8192 |
1 | 91,14 ₽ | 10,64 | Запустить | ||
8192 |
1 | 107,57 ₽ | 17,84 | Запустить | ||
8192 tensor |
2 | 109,77 ₽ | 29,74 | Запустить | ||
8192 |
1 | 141,77 ₽ | 17,84 | Запустить | ||
8192 |
1 | 211,77 ₽ | 61,04 | Запустить | ||
8192 |
1 | 341,77 ₽ | 61,04 | Запустить | ||
8192 |
1 | 367,41 ₽ | 73,64 | Запустить | ||
8192 |
1 | 423,04 ₽ | 115,94 | Запустить | ||
| Наименование | GPU | TPS | Параллельность (макс.) | |||
|---|---|---|---|---|---|---|
8192 |
1 | 46,94 ₽ | 4,14 | Запустить | ||
8192 tensor |
2 | 48,14 ₽ | 8,84 | Запустить | ||
8192 tensor |
2 | 51,34 ₽ | 8,84 | Запустить | ||
8192 |
1 | 73,73 ₽ | 4,14 | Запустить | ||
8192 pipeline |
3 | 74,84 ₽ | 7,24 | Запустить | ||
8192 |
1 | 91,14 ₽ | 4,14 | Запустить | ||
8192 tensor |
4 | 99,74 ₽ | 14,64 | Запустить | ||
8192 |
1 | 107,57 ₽ | 11,34 | Запустить | ||
8192 tensor |
2 | 109,77 ₽ | 23,24 | Запустить | ||
8192 pipeline |
3 | 127,37 ₽ | 4,54 | Запустить | ||
8192 |
1 | 141,77 ₽ | 11,34 | Запустить | ||
8192 tensor |
4 | 162,57 ₽ | 11,04 | Запустить | ||
8192 |
1 | 211,77 ₽ | 54,54 | Запустить | ||
8192 |
1 | 341,77 ₽ | 54,54 | Запустить | ||
8192 |
1 | 367,41 ₽ | 67,14 | Запустить | ||
8192 |
1 | 423,04 ₽ | 109,44 | Запустить | ||
Свяжитесь с нашей специализированной группой поддержки по нейросетям nn@immers.cloud или отправьте ваш запрос в отдел продаж sale@immers.cloud.