Mistral NeMo 12B: la nuova intelligenza artificiale di NVIDIA e Mistral AI Modello

anni fa, 2 0 1426

Mistral AI e modello NVIDIA Mistral NeMo 12B

Mistral AI e NVIDIA hanno lanciato Mistral NeMo 12B, un modello linguistico all'avanguardia progettato per rivoluzionare l'azienda AI applicazioni. Questo modello avanzato, vantando 12 miliardi di parametri, promette precisione, flessibilità ed efficienza senza precedenti, rendendolo uno strumento versatile per varie esigenze aziendali.

Il Mistral NeMo 12B è progettato per eccellere in una vasta gamma di compiti, tra cui chatbots, elaborazione, codifica e riepilogo multilingue. Una delle sue caratteristiche più straordinarie è l'impressionante finestra di contesto fino a 128,000 token, consentendo al modello di elaborare e comprendere informazioni estese e complesse in modo più coerente rispetto ai suoi predecessori.

Guillaume Lample, co-fondatore e capo scienziato di Maestrale AI, ha evidenziato l'importanza di questa collaborazione:

Abbiamo il privilegio di collaborare con il team NVIDIA, sfruttando i loro hardware e software di alto livello. Insieme, abbiamo sviluppato un modello con precisione, flessibilità, elevata efficienza e supporto e sicurezza di livello enterprise senza precedenti, grazie a NVIDIA. AI Implementazione aziendale.

Prestazioni di Mistral NeMo su benchmark multilingue — ***Fonte Img- Mistral AI Blog***

Il Mistral NeMo 12B è stato addestrato su NVIDIA DGX Cloud AI piattaforma, che fornisce accesso scalabile all'ultima architettura NVIDIA. Questo modello utilizza NVIDIA TensorRT-LLM per prestazioni di inferenza accelerate e la piattaforma di sviluppo NVIDIA NeMo per la creazione di soluzioni personalizzate IA generativa Modelli. Questa combinazione garantisce che il Mistral NeMo 12B offra prestazioni elevate in diverse applicazioni.

Uno dei principali progressi tecnologici del Mistral NeMo 12B è l'utilizzo del formato dati FP8 per l'inferenza del modello. Questo riduce le dimensioni della memoria e velocizza l'implementazione senza compromettere la precisione. Inoltre, il modello's l'architettura gli consente di adattarsi al memoria di una singola NVIDIA L40S, NVIDIA GeForce RTX 4090 o NVIDIA RTX GPU 4500, rendendolo altamente efficiente ed economico.

Mistral NeMo 12B è progettato per applicazioni globali, con robuste funzionalità multilingue. Eccelle in lingue come inglese, francese, tedesco, spagnolo, italiano, portoghese, cinese, giapponese, coreano, arabo e hindi. Questa ampia competenza linguistica si ottiene attraverso il nuovo tokenizzatore Tekken, basato su Tiktoken e addestrato in oltre 100 lingue. Tekken è circa il 30% più efficiente nel comprimere il codice sorgente e diversi linguaggi principali rispetto ai tokenizzatori precedenti, il che lo rende un progresso significativo nella elaborazione del linguaggio naturale.

Tasso di compressione Mistral NeMo Tekken — ***Fonte Img- Mistral AI Blog***

Confezionato come microservizio di inferenza NIM NVIDIA, Mistral NeMo 12B Offre inferenza ottimizzata per le prestazioni con i motori NVIDIA TensorRT-LLM. Questo formato containerizzato consente una facile implementazione in diversi ambienti, offrendo maggiore flessibilità per le applicazioni aziendali. Il modello offre inoltre supporto completo e accesso diretto a NVIDIA. AI esperti e accordi definiti sul livello di servizio, garantendo prestazioni affidabili e costanti.

Mistral NeMo 12B's rilascio ai sensi della Licenza Apache 2.0 incoraggia l'innovazione e sostiene la più ampia AI comunità. Questo approccio open source probabilmente accelererà il modello's adozione tra ricercatori e imprese, facilitando lo sviluppo di tecnologie avanzate AI soluzioni. Il modello's i pesi sono ospitati su abbracciare il viso, rendendoli prontamente disponibili per sviluppatori e ricercatori affinché possano sperimentarli e adattarli alle loro esigenze specifiche.