
寒冷西北风 AI 和 NVIDIA 推出了 Mistral NeMo 12B,这是一款旨在彻底改变企业 AI 应用。这款先进的模型,拥有 12 亿个参数,保证无与伦比的准确性、灵活性和效率, 使其成为满足各种企业需求的多功能工具。
Mistral NeMo 12B 的设计初衷是完成各种任务,包括 聊天机器人、多语言处理、编码和摘要。其突出特点之一是令人印象深刻的 上下文窗口最多可容纳 128,000 个 token使得该模型能够比以前模型更连贯地处理和理解广泛而复杂的信息。
Guillaume Lample,联合创始人兼首席科学家 西北风人工智能,强调了此次合作的重要意义:
我们很荣幸能与 NVIDIA 团队合作,利用他们顶尖的硬件和软件。在 NVIDIA 的帮助下,我们共同开发了一个具有前所未有的准确性、灵活性、高效率以及企业级支持和安全性的模型。 AI 企业部署。

Mistral NeMo 12B 在 NVIDIA DGX Cloud 上进行训练 AI 平台,提供对最新 NVIDIA 架构的可扩展访问。该模型利用 NVIDIA TensorRT-LLM 可加速推理性能 以及用于构建定制的 NVIDIA NeMo 开发平台 生成式人工智能 型号。这种组合确保 Mistral NeMo 12B 能够在各种应用中提供高性能。
Mistral NeMo 12B 的一项关键技术进步是使用 FP8 数据格式进行模型推理。这减少了内存大小,加快了部署速度,同时又不影响准确性。此外,该模型's 架构允许它适合 单个 NVIDIA L40S、NVIDIA GeForce RTX 4090 或 NVIDIA RTX 4500 GPU使其高效且具有成本效益。
Mistral NeMo 12B 专为全球应用而设计,具有 强大的多语言能力。它擅长英语、法语、德语、西班牙语、意大利语、葡萄牙语、中文、日语、韩语、阿拉伯语和印地语等语言。这种广泛的语言能力是通过新的 Tekken 分词器实现的,它基于 Tiktoken 并经过 100 多种语言的训练。与之前的分词器相比,Tekken 在压缩源代码和几种主要语言方面的效率提高了约 30%,使其成为 自然语言处理.

打包为 NVIDIA NIM 推理微服务, 米斯特拉尔 NeMo 12B 借助 NVIDIA TensorRT-LLM 引擎,提供性能优化的推理能力。这种容器化格式支持在各种环境中轻松部署,为企业应用提供增强的灵活性。该模型还提供全面的支持,可直接访问 NVIDIA AI 专家和明确的服务级别协议,确保可靠和一致的性能。
米斯特拉尔 NeMo 12B's 根据释放 Apache 2.0许可证 鼓励创新并支持更广泛的 AI 社区。这种开源方法可能会加速模型's 研究人员和企业采用,促进先进 AI 解决方案。该模型's 权重托管在 拥抱脸使开发人员和研究人员可以随时尝试并适应他们的特定需求。

