Mistral NeMo 12B: NVIDIA en Mistral AI's nieuwe AI Model

2 jaar geleden 0 1427

mistral AI en NVIDIA Mistral NeMo 12B-model

mistral AI en NVIDIA hebben de Mistral NeMo 12B gelanceerd, een state-of-the-art taalmodel dat is ontworpen om de zakelijke markt te revolutioneren AI toepassingen. Dit geavanceerde model, met 12 miljard parameters, belooft ongeëvenaarde nauwkeurigheid, flexibiliteit en efficiëntie, waardoor het een veelzijdige tool is voor verschillende bedrijfsbehoeften.

De Mistral NeMo 12B is ontworpen om uit te blinken in een breed scala aan taken, waaronder chatbots, meertalige verwerking, codering en samenvatting. Een van de opvallende kenmerken is het indrukwekkende contextvenster van maximaal 128,000 tokens, waardoor het model uitgebreide en complexe informatie op coherentere wijze kan verwerken en begrijpen dan zijn voorgangers.

Guillaume Lample, mede-oprichter en hoofdwetenschapper van Mistral-AIbenadrukte het belang van deze samenwerking:

We zijn blij dat we mogen samenwerken met het NVIDIA-team en gebruik kunnen maken van hun hoogwaardige hardware en software. Samen hebben we een model ontwikkeld met ongekende nauwkeurigheid, flexibiliteit, hoge efficiëntie en ondersteuning en beveiliging op enterpriseniveau, dankzij NVIDIA. AI Implementatie in ondernemingen.

Mistral NeMo-prestaties op meertalige benchmarks — ***Afb. Bron - Mistral AI Blog***

De Mistral NeMo 12B is getraind op de NVIDIA DGX Cloud AI platform, dat schaalbare toegang biedt tot de nieuwste NVIDIA-architectuur. Dit model maakt gebruik van NVIDIA TensorRT-LLM voor versnelde inferentieprestaties en het NVIDIA NeMo-ontwikkelplatform voor het bouwen van maatwerk generatieve AI modellen. Deze combinatie zorgt ervoor dat de Mistral NeMo 12B hoge prestaties levert in diverse toepassingen.

Een van de belangrijkste technologische ontwikkelingen in de Mistral NeMo 12B is het gebruik van het FP8-dataformaat voor modelinferentie. Dit vermindert de geheugenruimte en versnelt de implementatie zonder de nauwkeurigheid in gevaar te brengen. Bovendien's architectuur maakt het mogelijk om op de geheugen van een enkele NVIDIA L40S, NVIDIA GeForce RTX 4090, of NVIDIA RTX 4500 GPU, waardoor het zeer efficiënt en kosteneffectief is.

Mistral NeMo 12B is ontworpen voor wereldwijde toepassingen, met robuuste meertalige mogelijkheden. Het blinkt uit in talen als Engels, Frans, Duits, Spaans, Italiaans, Portugees, Chinees, Japans, Koreaans, Arabisch en Hindi. Deze brede taalvaardigheid wordt bereikt door de nieuwe Tekken-tokenizer, die gebaseerd is op Tiktoken en getraind is in meer dan 100 talen. Tekken is ongeveer 30% efficiënter in het comprimeren van de broncode en verschillende belangrijke talen vergeleken met eerdere tokenizers, waardoor het een aanzienlijke vooruitgang is op het gebied van natuurlijke taalverwerking.

Mistral NeMo Tekken-compressiesnelheid — ***Afb. Bron - Mistral AI Blog***

Verpakt als een NVIDIA NIM-inferentiemicroservice, Mistral NeMo 12B Biedt prestatiegeoptimaliseerde inferentie met NVIDIA TensorRT-LLM-engines. Dit containerformaat maakt eenvoudige implementatie in verschillende omgevingen mogelijk, wat zorgt voor meer flexibiliteit voor bedrijfsapplicaties. Het model wordt ook geleverd met uitgebreide ondersteuning en directe toegang tot NVIDIA. AI experts en vastgelegde serviceniveauovereenkomsten, waardoor betrouwbare en consistente prestaties worden gegarandeerd.

Mistral NeMo 12B's vrijlating onder de Apache 2.0-licentie stimuleert innovatie en ondersteunt de bredere AI community. Deze open-sourcebenadering zal de ontwikkeling van het model waarschijnlijk versnellen's acceptatie onder onderzoekers en bedrijven, waardoor de ontwikkeling van geavanceerde technologieën wordt vergemakkelijkt AI oplossingen. Het model's gewichten worden gehost op KnuffelenGezicht, waardoor ze direct beschikbaar zijn voor ontwikkelaars en onderzoekers om mee te experimenteren en zich aan te passen aan hun specifieke behoeften.