Mistral NeMo 12B：NVIDIA 和 Mistral AI 的全新 AI 型号

2年前 0 1426

寒冷西北风 AI 和 NVIDIA 推出了 Mistral NeMo 12B，这是一款旨在彻底改变企业 AI 应用。这款先进的模型，拥有 12 亿个参数，保证无与伦比的准确性、灵活性和效率， 使其成为满足各种企业需求的多功能工具。

Mistral NeMo 12B 的设计初衷是完成各种任务，包括聊天机器人、多语言处理、编码和摘要。其突出特点之一是令人印象深刻的 上下文窗口最多可容纳 128,000 个 token使得该模型能够比以前模型更连贯地处理和理解广泛而复杂的信息。

Guillaume Lample，联合创始人兼首席科学家西北风人工智能，强调了此次合作的重要意义：

我们很荣幸能与 NVIDIA 团队合作，利用他们顶尖的硬件和软件。在 NVIDIA 的帮助下，我们共同开发了一个具有前所未有的准确性、灵活性、高效率以及企业级支持和安全性的模型。 AI 企业部署。

Mistral NeMo 在多语言基准测试中的表现 — ***Img 来源- Mistral AI 博客***

Mistral NeMo 12B 在 NVIDIA DGX Cloud 上进行训练 AI 平台，提供对最新 NVIDIA 架构的可扩展访问。该模型利用 NVIDIA TensorRT-LLM 可加速推理性能 以及用于构建定制的 NVIDIA NeMo 开发平台生成式人工智能型号。这种组合确保 Mistral NeMo 12B 能够在各种应用中提供高性能。

Mistral NeMo 12B 的一项关键技术进步是使用 FP8 数据格式进行模型推理。这减少了内存大小，加快了部署速度，同时又不影响准确性。此外，该模型's 架构允许它适合 单个 NVIDIA L40S、NVIDIA GeForce RTX 4090 或 NVIDIA RTX 4500 GPU使其高效且具有成本效益。

Mistral NeMo 12B 专为全球应用而设计，具有 强大的多语言能力。它擅长英语、法语、德语、西班牙语、意大利语、葡萄牙语、中文、日语、韩语、阿拉伯语和印地语等语言。这种广泛的语言能力是通过新的 Tekken 分词器实现的，它基于 Tiktoken 并经过 100 多种语言的训练。与之前的分词器相比，Tekken 在压缩源代码和几种主要语言方面的效率提高了约 30%，使其成为自然语言处理.

Mistral NeMo Tekken 压缩率 — ***Img 来源- Mistral AI 博客***

打包为 NVIDIA NIM 推理微服务，米斯特拉尔 NeMo 12B 借助 NVIDIA TensorRT-LLM 引擎，提供性能优化的推理能力。这种容器化格式支持在各种环境中轻松部署，为企业应用提供增强的灵活性。该模型还提供全面的支持，可直接访问 NVIDIA AI 专家和明确的服务级别协议，确保可靠和一致的性能。

米斯特拉尔 NeMo 12B's 根据释放 Apache 2.0许可证 鼓励创新并支持更广泛的 AI 社区。这种开源方法可能会加速模型's 研究人员和企业采用，促进先进 AI 解决方案。该模型's 权重托管在拥抱脸使开发人员和研究人员可以随时尝试并适应他们的特定需求。