Mistral NeMo 12B: новинка от NVIDIA и Mistral AI AI Модель

Мистраль AI и модель NVIDIA Mistral NeMo 12B

Мистраль AI и NVIDIA выпустили Mistral NeMo 12B — современную языковую модель, призванную произвести революцию в корпоративной среде AI приложений. Эта усовершенствованная модель, которая может похвастаться 12 миллиардов параметров, обещают беспрецедентную точность, гибкость и эффективность. что делает его универсальным инструментом для различных нужд предприятия.

Mistral NeMo 12B предназначен для решения широкого спектра задач, в том числе chatbots, многоязычная обработка, кодирование и обобщение. Одной из его выдающихся особенностей является впечатляющий контекстное окно до 128,000 XNUMX токенов, что позволяет модели обрабатывать и понимать обширную и сложную информацию более последовательно, чем ее предшественники.

Гийом Лампле, соучредитель и главный научный сотрудник Мистраль ИИ, подчеркнул важность этого сотрудничества:

Нам повезло сотрудничать с командой NVIDIA, используя их первоклассное оборудование и программное обеспечение. Вместе мы разработали модель с беспрецедентной точностью, гибкостью, высокой эффективностью и поддержкой корпоративного уровня и безопасностью благодаря NVIDIA AI Корпоративное развертывание.

Производительность Mistral NeMo в многоязычных тестах
Источник изображения — Mistral AI Блог

Mistral NeMo 12B был обучен на облаке NVIDIA DGX AI платформа, которая обеспечивает масштабируемый доступ к новейшей архитектуре NVIDIA. Эта модель использует NVIDIA TensorRT-LLM для ускорения вывода и платформа разработки NVIDIA NeMo для создания пользовательских генеративный ИИ модели. Такое сочетание гарантирует, что Mistral NeMo 12B обеспечивает высокую производительность в различных приложениях.

Одним из ключевых технологических достижений Mistral NeMo 12B является использование формата данных FP8 для вывода модели. Это уменьшает размер памяти и ускоряет развертывание без ущерба для точности. Кроме того, модель's архитектура позволяет ему поместиться на память одной NVIDIA L40S, NVIDIA GeForce RTX 4090 или NVIDIA RTX 4500 GPU, что делает его высокоэффективным и экономичным.

Mistral NeMo 12B предназначен для глобального применения. надежные многоязычные возможности. Он превосходно владеет такими языками, как английский, французский, немецкий, испанский, итальянский, португальский, китайский, японский, корейский, арабский и хинди. Такой широкий языковой уровень достигается благодаря новому токенизатору Tekken, который основан на Tiktoken и обучен более чем 100 языкам. Tekken примерно на 30% более эффективен при сжатии исходного кода и нескольких основных языков по сравнению с предыдущими токенизаторами, что делает его значительным достижением в области обработки естественного языка.

Степень сжатия Mistral NeMo Tekken
Источник изображения — Mistral AI Блог

Упакованный в виде микросервиса вывода NVIDIA NIM, Мистраль НеМо 12Б предлагает оптимизированный по производительности вывод с помощью движков NVIDIA TensorRT-LLM. Этот контейнерный формат обеспечивает простоту развертывания в различных средах, обеспечивая повышенную гибкость для корпоративных приложений. Модель также поставляется с комплексной поддержкой, прямым доступом к NVIDIA AI экспертов и определенные соглашения об уровне обслуживания, гарантирующие надежную и стабильную работу.

Мистраль НеМо 12Б's освобождение под Лицензия Apache 2.0 поощряет инновации и поддерживает более широкое AI сообщество. Этот подход с открытым исходным кодом, вероятно, ускорит модель's принятие среди исследователей и предприятий, способствуя разработке передовых AI решения. Модель's веса размещены на ОбниматьЛицо, что делает их легко доступными для разработчиков и исследователей, чтобы они могли экспериментировать и адаптироваться к своим конкретным потребностям.

Оставьте комментарий

Ваш электронный адрес не будет опубликован. Обязательные поля помечены * *

Этот сайт использует Akismet для уменьшения количества спама. Узнайте, как обрабатываются данные ваших комментариев.

Присоединяйтесь к команде Aimojo Племя!

Присоединяйтесь к более чем 76,200 XNUMX участникам, чтобы получать инсайдерские советы каждую неделю! 
???? БОНУС: Получите наши 200 долларов “AI «Мастерский набор инструментов» БЕСПЛАТНО при регистрации!

Топ AI Инструменты
ЛайтLLM

Один шлюз. Более 100 программ магистратуры. Полный контроль затрат. AI Инфраструктурный уровень для серьезных инженерных команд.

LibreПеревести

API машинного перевода с открытым исходным кодом, созданный для разработчиков, которые владеют своими данными. Самостоятельно размещаемая нейронная система перевода с приоритетом конфиденциальности для команд и разработчиков.

Синтра ИИ 

Поставить 12 AI Сотрудники, которые будут работать и управлять всем вашим бизнесом в автоматическом режиме. AI Командная платформа, созданная для индивидуальных предпринимателей и растущих малых и средних предприятий.

LibreChat

Одна платформа. Каждая AI Модель. Ваши данные остаются вашими. Открытый исходный код AI Чат-хаб, созданный для команд, которые отказываются от привязки к конкретному поставщику.

Агент Гермеса

Самостоятельно размещенный AI Агент, который учится, запоминает и с каждым днем ​​становится умнее. Автономный агент с открытым исходным кодом для разработчиков, инженеров и команд MLOps.