Mistral NeMo 12B:NVIDIA 和 Mistral AI 的全新 AI 型号

寒冷西北风 AI 以及 NVIDIA Mistral NeMo 12B 型号

寒冷西北风 AI 和 NVIDIA 推出了 Mistral NeMo 12B,这是一款旨在彻底改变企业 AI 应用。这款先进的模型,拥有 12 亿个参数,保证无与伦比的准确性、灵活性和效率, 使其成为满足各种企业需求的多功能工具。

Mistral NeMo 12B 的设计初衷是完成各种任务,包括 聊天机器人、多语言处理、编码和摘要。其突出特点之一是令人印象深刻的 上下文窗口最多可容纳 128,000 个 token使得该模型能够比以前模型更连贯地处理和理解广泛而复杂的信息。

Guillaume Lample,联合创始人兼首席科学家 西北风人工智能,强调了此次合作的重要意义:

我们很荣幸能与 NVIDIA 团队合作,利用他们顶尖的硬件和软件。在 ​​NVIDIA 的帮助下,我们共同开发了一个具有前所未有的准确性、灵活性、高效率以及企业级支持和安全性的模型。 AI 企业部署。

Mistral NeMo 在多语言基准测试中的表现
Img 来源- Mistral AI 博客

Mistral NeMo 12B 在 NVIDIA DGX Cloud 上进行训练 AI 平台,提供对最新 NVIDIA 架构的可扩展访问。该模型利用 NVIDIA TensorRT-LLM 可加速推理性能 以及用于构建定制的 NVIDIA NeMo 开发平台 生成式人工智能 型号。这种组合确保 Mistral NeMo 12B 能够在各种应用中提供高性能。

Mistral NeMo 12B 的一项关键技术进步是使用 FP8 数据格式进行模型推理。这减少了内存大小,加快了部署速度,同时又不影响准确性。此外,该模型's 架构允许它适合 单个 NVIDIA L40S、NVIDIA GeForce RTX 4090 或 NVIDIA RTX 4500 GPU使其高效且具有成本效益。

Mistral NeMo 12B 专为全球应用而设计,具有 强大的多语言能力。它擅长英语、法语、德语、西班牙语、意大利语、葡萄牙语、中文、日语、韩语、阿拉伯语和印地语等语言。这种广泛的语言能力是通过新的 Tekken 分词器实现的,它基于 Tiktoken 并经过 100 多种语言的训练。与之前的分词器相比,Tekken 在压缩源代码和几种主要语言方面的效率提高了约 30%,使其成为 自然语言处理.

Mistral NeMo Tekken 压缩率
Img 来源- Mistral AI 博客

打包为 NVIDIA NIM 推理微服务, 米斯特拉尔 NeMo 12B 借助 NVIDIA TensorRT-LLM 引擎,提供性能优化的推理能力。这种容器化格式支持在各种环境中轻松部署,为企业应用提供增强的灵活性。该模型还提供全面的支持,可直接访问 NVIDIA AI 专家和明确的服务级别协议,确保可靠和一致的性能。

米斯特拉尔 NeMo 12B's 根据释放 Apache 2.0许可证 鼓励创新并支持更广泛的 AI 社区。这种开源方法可能会加速模型's 研究人员和企业采用,促进先进 AI 解决方案。该模型's 权重托管在 拥抱脸使开发人员和研究人员可以随时尝试并适应他们的特定需求。

发表评论

您的电邮地址不会被公开。 必填项 *

本网站使用Akismet来减少垃圾邮件。 了解您的评论数据是如何被处理的。

即刻加入 Aimojo 部落!

每周加入 76,200 多名会员获取内幕消息! 
🎁 奖金: 获得我们的 200 美元“AI 注册即可免费获得“精通工具包”!

热门 AI 工具
爱马仕代理人

自托管 AI 每天都在学习、记忆和变得更聪明的智能体 面向开发人员、工程师和 MLOps 团队的开源自主代理

多格拉

亲身经历 AI 基础设施零平台费用,数据完全控制。 面向需要速度、合规性和自主性的团队的开源语音代理。

Crawl4AI

将任何网页转化为干净的、可用于LLM(法学硕士)的数据 AI 代理商和 RAG 管道 专为大型语言模型构建的开源网络爬虫。

浓度

为生产级应用提供支持的开源矢量数据库 AI 恢复 RAG 流水线和 LLM 内存的首选嵌入存储库

聊天机器人人工智能

重新掌控你的生活 AI 无需支付额外费用即可使用工作流程 专为高级用户打造的、以隐私为先的开源 ChatGPT 用户界面

© 2023 - 2026 版权所有 | 成为 AI 专业版 | 用心打造