Mistral NeMo 12B: NVIDIAとMistral AIの新しい AI モデル

2年前 0 1427

ミストラル AI NVIDIAは、エンタープライズに革命を起こすために設計された最先端の言語モデルであるMistral NeMo 12Bを発表しました。 AI アプリケーション。この先進的なモデルは、 12億のパラメータは、比類のない精度、柔軟性、効率性を約束します。 さまざまな企業のニーズに対応する多目的ツールになります。

ミストラル・ネモ12Bは、以下の幅広いタスクで優れた性能を発揮するように設計されています。チャットボット、多言語処理、コーディング、要約などの機能を備えています。その際立った特徴の1つは、印象的な 最大128,000トークンのコンテキストウィンドウこれにより、モデルは、以前のモデルよりも一貫して広範囲かつ複雑な情報を処理および理解できるようになります。

ギヨーム・ランプル、共同創設者兼主任科学者ミストラルAIは、このコラボレーションの重要性を強調しました。

私たちは、NVIDIAチームと協力し、彼らの最高レベルのハードウェアとソフトウェアを活用できることを幸運に思います。NVIDIAのおかげで、これまでにない精度、柔軟性、高効率性、そしてエンタープライズグレードのサポートとセキュリティを備えたモデルを開発することができました。 AI エンタープライズ展開。

多言語ベンチマークにおけるMistral NeMoのパフォーマンス — ***画像ソース - ミストラル AI Blog***

ミストラルNeMo 12BはNVIDIA DGXクラウドでトレーニングされました AI 最新のNVIDIAアーキテクチャへのスケーラブルなアクセスを提供するプラットフォーム。このモデルは 推論パフォーマンスを高速化する NVIDIA TensorRT-LLM NVIDIA NeMo開発プラットフォームでカスタムビルドを実現 generative AI モデル。この組み合わせにより、Mistral NeMo 12B はさまざまなアプリケーションで高いパフォーマンスを発揮します。

Mistral NeMo 12Bにおける重要な技術的進歩の一つは、モデル推論にFP8データ形式を採用したことです。これによりメモリサイズが削減され、精度を損なうことなく展開が高速化されます。さらに、モデルは's 建築により、 単一のNVIDIA L40S、NVIDIA GeForce RTX 4090、または NVIDIA RTX 4500 GPU非常に効率的でコスト効率に優れています。

ミストラルネモ12Bは、グローバルな用途向けに設計されており、 強力な多言語機能英語、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、中国語、日本語、韓国語、アラビア語、ヒンディー語などの言語に優れています。この幅広い言語能力は、Tiktokenをベースとし、100以上の言語でトレーニングされた新しいTekkenトークナイザーによって実現されています。Tekkenは、以前のトークナイザーと比較して、ソースコードといくつかの主要言語の圧縮効率が約30％向上しており、大きな進歩となっています。自然言語処理.

ミストラルネモ鉄拳圧縮率 — ***画像ソース - ミストラル AI Blog***

NVIDIA NIM推論マイクロサービスとしてパッケージ化され、ミストラルネモ 12B NVIDIA TensorRT-LLMエンジンによるパフォーマンス最適化された推論を提供します。このコンテナ化されたフォーマットは、様々な環境への導入を容易にし、エンタープライズアプリケーションの柔軟性を高めます。このモデルには包括的なサポートが付属しており、NVIDIAへの直接アクセスも可能です。 AI 専門家と定義されたサービスレベル契約により、信頼性と一貫性のあるパフォーマンスが保証されます。

ミストラルネモ 12B's リリース Apache 2.0ライセンス イノベーションを奨励し、より広範な AI コミュニティ。このオープンソースのアプローチは、モデルを加速させる可能性がある。's 研究者や企業に導入され、高度な技術開発を促進する AI ソリューション。モデル's ウェイトはホストされています抱き合う顔開発者や研究者がすぐに利用でき、特定のニーズに合わせて実験したり適応したりできるようになります。