MiMo-V2.5 Dibuka Untuk Publik, Xiaomi Tawarkan AI Multimodal yang Ternyata Butuh Tenaga Besar

Xiaomi kembali menarik perhatian pasar kecerdasan buatan lewat peluncuran MiMo-V2.5, sebuah model AI open-weight yang diklaim punya kemampuan agentic tingkat tinggi dan pemahaman multimodal. Model ini juga dibuka untuk akses publik melalui Hugging Face, API resmi, dan AI Studio.

Kehadiran MiMo-V2.5 bukan sekadar menambah daftar model baru dari Xiaomi. Perusahaan menempatkannya sebagai model yang mampu menangani teks, gambar, dan video, sekaligus bersaing di tugas yang selama ini menjadi tolok ukur utama model AI modern, seperti coding dan pemahaman visual.

Dua varian untuk kebutuhan yang berbeda

MiMo-V2.5 hadir dalam dua versi dengan skala yang tidak sama. Varian standar membawa 310B total parameter dan 15B active parameter, sedangkan versi MiMo-V2.5-Pro jauh lebih besar dengan 1.02T total parameter dan 42B active parameter.

Perbedaan skala itu menunjukkan arah penggunaan yang berbeda. Versi standar tampak disiapkan untuk efisiensi, sementara varian Pro diposisikan untuk kebutuhan komputasi yang lebih besar dan beban kerja yang lebih berat.

Xiaomi juga menyebut model ini mendukung context window hingga 1 juta token. Kapasitas tersebut memberi ruang bagi pemrosesan konteks yang sangat panjang, mulai dari dokumen besar hingga percakapan berlapis yang membutuhkan ingatan konteks lebih luas.

Agentic jadi nilai jual utama

Salah satu sorotan terbesar dari MiMo-V2.5 ada pada kemampuan agentic. Xiaomi menyebut model ini memiliki “frontier-level agentic capability”, istilah yang merujuk pada kemampuan AI menjalankan tugas secara lebih terstruktur dan kompleks.

Dalam praktiknya, kemampuan itu membuat model tidak hanya menjawab perintah sederhana. Model ini juga dirancang untuk mengelola alur kerja yang lebih panjang, bertahap, dan saling terkait.

Xiaomi mengklaim MiMo-V2.5 mencatat hasil terbaik pada benchmark internal untuk tugas agentic. Klaim tersebut menjadi penting karena Xiaomi memang menempatkan agentic sebagai salah satu pembeda utama model ini dari kompetitor di kelasnya.

Klaim kuat di coding dan multimodal

Di luar kemampuan agentic, Xiaomi juga menyoroti performa pada uji coding internal bernama MiMo Coding Bench. Pada benchmark ini, versi yang lebih kecil disebut mampu menyamai MiMo-V2.5-Pro yang lebih besar, tetapi dengan biaya hanya setengahnya.

Pada sisi visual, Xiaomi menegaskan bahwa MiMo-V2.5 dibangun sebagai model native multimodal. Artinya, kemampuan memahami teks, gambar, dan video sudah menjadi bagian inti dari desain serta pelatihannya, bukan sekadar tambahan di tahap akhir.

Perusahaan menyebut model ini dilatih menggunakan 48 triliun token. Skala pelatihan tersebut memperlihatkan ambisi Xiaomi untuk menempatkan MiMo-V2.5 di jajaran model AI kelas atas yang bisa dipakai untuk banyak jenis tugas.

Xiaomi juga mengklaim hasil benchmark pemahaman gambar dan video MiMo-V2.5 berada pada level yang setara dengan model closed-source. Dengan begitu, model ini tidak hanya ditonjolkan sebagai kuat di teks dan coding, tetapi juga di pemrosesan konten visual.

Akses terbuka, tetapi kebutuhan perangkat tetap berat

Status open-weight membuat MiMo-V2.5 lebih mudah dijangkau dibanding model tertutup. Xiaomi membuka akses lewat Hugging Face, API resmi, dan AI Studio agar pengembang maupun pengguna bisa lebih leluasa menguji kemampuannya.

Namun, keterbukaan bobot tidak otomatis berarti model ini mudah dijalankan di perangkat umum. Referensi menyebut kebutuhan menjalankan model secara lokal menuntut mesin kelas berat seperti Mac Studio dengan spesifikasi tinggi.

Bahkan GPU konsumen disebut tidak memiliki VRAM yang cukup untuk menjalankan model ini secara lokal. Nvidia RTX 5090 juga disebut belum memadai untuk memenuhi kebutuhan konfigurasi yang dibutuhkan.

Langkah Xiaomi di tengah persaingan model open-weight

Peluncuran MiMo-V2.5 menambah daftar pemain besar yang ikut mendorong tren model open-weight. Persaingan kini bukan hanya terjadi pada model tertutup, tetapi juga pada model yang bobotnya dibuka untuk publik dan komunitas pengembang.

Dengan kombinasi klaim agentic yang kuat, dukungan multimodal native, dan context window 1 juta token, Xiaomi mencoba menempatkan MiMo-V2.5 sebagai model yang besar di atas kertas sekaligus lebih terbuka dalam akses. Relevansi akhirnya akan sangat ditentukan oleh pengujian lebih luas di Hugging Face, API resmi, dan pemakaian langsung oleh komunitas pengembang.

Source: www.gsmarena.com
Exit mobile version