JetBrains Rilis Mellum2, Model AI 12B yang Dioptimalkan untuk Coding dan Pemrosesan Bahasa

0 1 menit baca

Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains

JetBrains resmi meluncurkan Mellum2, model AI terbaru berbasis arsitektur Mixture-of-Experts (MoE) yang dirancang untuk menangani tugas pemrograman dan pemrosesan bahasa alami secara efisien.

Model ini memiliki total 12 miliar parameter, tetapi hanya mengaktifkan sekitar 2,5 miliar parameter untuk setiap token yang diproses. Pendekatan tersebut memungkinkan Mellum2 memberikan performa tinggi dengan kebutuhan komputasi yang lebih rendah dibanding model berukuran serupa.

Fokus pada Coding dan Bahasa Alami

Berbeda dari model yang dirancang untuk penggunaan umum, Mellum2 dikembangkan dengan fokus pada kebutuhan developer dan aplikasi produktivitas.

Selain digunakan untuk penyelesaian kode (code completion), model ini juga dapat menangani berbagai tugas bahasa alami seperti pencarian informasi, penjadwalan, klasifikasi, hingga pemeriksaan data.

JetBrains menyebut pendekatan ini memungkinkan model tetap responsif untuk penggunaan real-time tanpa mengorbankan kualitas hasil.

Menggunakan Arsitektur Mixture-of-Experts

Mellum2 mengadopsi arsitektur Mixture-of-Experts atau MoE, sebuah teknik yang memungkinkan model hanya mengaktifkan sebagian parameter yang dibutuhkan saat memproses permintaan.

Dengan cara ini, biaya inferensi dapat ditekan sekaligus meningkatkan kecepatan respons.

Model ini tersedia dalam format teks dan kode, serta dirilis menggunakan lisensi Apache 2.0 yang memungkinkan penggunaan secara luas, termasuk untuk kebutuhan komersial.

Diklaim Lebih Cepat dari Model Sejenis

Menurut laporan teknis yang dirilis JetBrains, Mellum2 telah diuji pada berbagai benchmark yang mencakup pemrograman, penalaran, dan tugas ilmiah.

Hasil pengujian menunjukkan performa yang kompetitif dibanding sejumlah model open source lain di kelasnya. JetBrains juga mengklaim Mellum2 mampu memberikan kecepatan inferensi lebih dari dua kali lipat pada beberapa skenario penggunaan.

Keunggulan tersebut membuat model ini menarik bagi tim yang membutuhkan AI cepat untuk membantu workflow pengembangan perangkat lunak.

Cocok untuk Berbagai Skenario Pengembangan

JetBrains menyoroti beberapa penggunaan utama Mellum2, termasuk sistem retrieval-augmented generation (RAG), routing model AI, orkestrasi agen, hingga penggunaan di lingkungan privat yang memerlukan perlindungan kode sumber dan data internal.

Karena ukuran dan efisiensinya, Mellum2 juga dapat digunakan sebagai model pendukung dalam sistem AI yang lebih besar tanpa membutuhkan sumber daya komputasi berlebihan.

Dengan peluncuran ini, JetBrains menambah daftar model AI open source yang ditujukan untuk membantu pengembang membangun aplikasi berbasis kecerdasan buatan dengan lebih cepat dan efisien.

Sumber: Baca artikel asli di sini