Mistral NeMo 12B: NVIDIA dan Mistral AI Baru AI Pilih Model

mistral AI dan NVIDIA Mistral NeMo Model 12B

mistral AI dan NVIDIA telah meluncurkan Mistral NeMo 12B, model bahasa canggih yang dirancang untuk merevolusi perusahaan AI aplikasi. Model canggih ini, yang membanggakan 12 miliar parameter, menjanjikan akurasi, fleksibilitas, dan efisiensi yang tak tertandingi, menjadikannya alat serbaguna untuk berbagai kebutuhan perusahaan.

Mistral NeMo 12B dirancang untuk unggul dalam berbagai tugas, termasuk chatbots, pemrosesan multibahasa, pengkodean, dan ringkasan. Salah satu fiturnya yang menonjol adalah yang mengesankan jendela konteks hingga 128,000 token, memungkinkan model untuk memproses dan memahami informasi yang luas dan kompleks secara lebih koheren dibandingkan pendahulunya.

Guillaume Lample, salah satu pendiri dan kepala ilmuwan AI Mistral, menyoroti pentingnya kolaborasi ini:

Kami beruntung dapat berkolaborasi dengan tim NVIDIA, memanfaatkan perangkat keras dan perangkat lunak terbaik mereka. Bersama-sama, kami telah mengembangkan model dengan akurasi, fleksibilitas, efisiensi tinggi, dan dukungan serta keamanan tingkat perusahaan yang belum pernah ada sebelumnya berkat NVIDIA. AI Penerapan pada perusahaan.

Performa Mistral NeMo pada benchmark multibahasa
Sumber Gambar- Mistral AI Blog

Mistral NeMo 12B dilatih pada NVIDIA DGX Cloud AI platform, yang menyediakan akses terukur ke arsitektur NVIDIA terbaru. Model ini memanfaatkan NVIDIA TensorRT-LLM untuk akselerasi performa inferensi dan platform pengembangan NVIDIA NeMo untuk membangun kustom AI generatif model. Kombinasi ini memastikan Mistral NeMo 12B memberikan kinerja tinggi di beragam aplikasi.

Salah satu kemajuan teknologi utama dalam Mistral NeMo 12B adalah penggunaan format data FP8 untuk inferensi model. Hal ini mengurangi ukuran memori dan mempercepat penerapan tanpa mengurangi akurasi. Selain itu, model's Arsitekturnya memungkinkan untuk disesuaikan dengan memori satu NVIDIA L40S, NVIDIA GeForce RTX 4090, atau NVIDIA RTX GPU 4500, menjadikannya sangat efisien dan hemat biaya.

Mistral NeMo 12B dirancang untuk aplikasi global, dengan kemampuan multibahasa yang kuat. Ia unggul dalam bahasa seperti Inggris, Prancis, Jerman, Spanyol, Italia, Portugis, Cina, Jepang, Korea, Arab, dan Hindi. Kemahiran linguistik yang luas ini dicapai melalui tokenizer Tekken baru, yang didasarkan pada Tiktoken dan dilatih dalam lebih dari 100 bahasa. Tekken sekitar 30% lebih efisien dalam mengompresi kode sumber dan beberapa bahasa utama dibandingkan dengan tokenizer sebelumnya, menjadikannya kemajuan yang signifikan dalam hal ini. pemrosesan bahasa alami.

Tingkat kompresi Mistral NeMo Tekken
Sumber Gambar- Mistral AI Blog

Dikemas sebagai layanan mikro inferensi NIM NVIDIA, Mistral NeMo 12B menawarkan inferensi yang dioptimalkan kinerjanya dengan mesin NVIDIA TensorRT-LLM. Format yang dikontainerisasi ini memungkinkan penyebaran yang mudah di berbagai lingkungan, memberikan fleksibilitas yang lebih baik untuk aplikasi perusahaan. Model ini juga dilengkapi dengan dukungan yang komprehensif, akses langsung ke NVIDIA AI para ahli, dan perjanjian tingkat layanan yang ditetapkan, guna memastikan kinerja yang andal dan konsisten.

Mistral NeMo 12B's rilis di bawah Lisensi 2.0 Apache mendorong inovasi dan mendukung masyarakat luas AI komunitas. Pendekatan sumber terbuka ini kemungkinan akan mempercepat model's adopsi di antara peneliti dan perusahaan, memfasilitasi pengembangan teknologi canggih AI Solusi. Model's bobot dihosting di MemelukWajah, menjadikannya tersedia bagi pengembang dan peneliti untuk bereksperimen dan beradaptasi dengan kebutuhan spesifik mereka.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai *

Situs ini menggunakan Akismet untuk mengurangi spam. Pelajari bagaimana data komentar Anda diproses.

bergabung dengan Aimojo Suku!

Bergabunglah dengan 76,200+ anggota untuk mendapatkan tips orang dalam setiap minggu! 
🎁 BONUS: Dapatkan $200 kami “AI “Mastery Toolkit” GRATIS jika Anda mendaftar!

Tren AI Tools
LiteLLM

Satu Gerbang. 100+ LLM. Pengendalian Biaya Total. The AI Lapisan Infrastruktur untuk Tim Rekayasa yang Serius.

Terjemahan Gratis

API Terjemahan Mesin Sumber Terbuka yang Dibangun untuk Pengembang yang Memiliki Data Mereka Sendiri Layanan penerjemahan neural mandiri dengan mengutamakan privasi untuk tim dan pengembang.

Sintra AI 

Masukkan 12 AI Karyawan untuk Bekerja dan Menjalankan Seluruh Bisnis Anda Secara Otomatis The AI Platform tim yang dibangun untuk pendiri tunggal dan UKM yang sedang berkembang.

LibreChat

Satu Platform. Semuanya AI Model. Data Anda Tetap Milik Anda. Sumber terbuka AI Pusat obrolan yang dibangun untuk tim yang menolak ketergantungan pada satu vendor.

Agen Hermes

Hosting Mandiri AI Agen yang Belajar, Mengingat, dan Menjadi Lebih Pintar Setiap Hari Agen otonom sumber terbuka untuk pengembang, insinyur, dan tim MLOps.

© Hak Cipta 2023 - 2026 | Menjadi Anggota AI Pro | Dibuat dengan ♥