Keluhan Pengguna Memaksa Google Menata Ulang Kuota Gemini, Prompt Berat Tak Lagi Boros Jatah

Redaksi Octopus

03/06/2026

Google mengubah cara Gemini mengurangi kuota setelah banyak pengguna merasa akses mereka terlalu cepat habis saat menjalankan tugas berat. Kini, satu prompt tidak lagi dibiarkan menyedot jatah secara berlebihan, sehingga pemakaian terasa lebih masuk akal bagi pengguna yang sering bekerja dengan perintah kompleks.

Perubahan ini muncul setelah sistem kuota baru yang diperkenalkan usai I/O 2026 dinilai terlalu ketat. Saat itu, Gemini beralih dari model berbasis jumlah prompt ke kuota lima jam dan kuota mingguan, tetapi cara hitungnya justru membuat akses cepat terkuras ketika dipakai untuk tugas besar.

Kuota Tidak Lagi Terkuras oleh Satu Prompt

Masalah paling besar dirasakan saat pengguna menjalankan Gemini 3.1 Pro untuk permintaan yang besar atau mengunggah file berukuran besar. Beban komputasi pada jenis tugas seperti ini jauh lebih tinggi dibandingkan permintaan teks biasa, sehingga satu interaksi bisa terasa sangat mahal bagi jatah penggunaan.

Google kini membatasi seberapa besar porsi kuota yang dapat dihabiskan oleh satu prompt. Dengan begitu, penggunaan Gemini diharapkan lebih tahan lama, terutama bagi pengguna yang tidak hanya memakai model untuk percakapan singkat.

Error Tidak Lagi Memakan Jatah

Perubahan lain yang penting ada pada penanganan error. Jika Gemini menampilkan error, interaksi itu tidak akan lagi dihitung ke kuota, dan hanya penyelesaian yang berhasil yang akan mengurangi batas penggunaan.

Langkah ini menghapus salah satu sumber frustrasi terbesar bagi pengguna aktif. Sebelumnya, percobaan yang gagal tetap bisa menghabiskan jatah, terutama saat permintaan yang diproses memang berat dan rawan gagal di tengah jalan.

Josh Woodward, Vice President of Google AI Studio, Gemini, dan Google Labs di Google, juga mengatakan perusahaan sudah memperbaiki bug terkait Omni di X. Bug tersebut sebelumnya membuat kuota Gemini sebagian pengguna terkuras lebih besar dari seharusnya.

Fitur Berat Dibuat Lebih Transparan

Google juga menambah rincian penggunaan agar pengguna lebih mudah memahami apa yang menghabiskan kuota. Ini penting karena fitur seperti Deep Research dan tugas berat lain memakai token serta komputasi yang lebih besar dibanding prompt teks biasa.

Dengan tampilan pemakaian yang lebih jelas dan notifikasi yang lebih rinci, pengguna diharapkan bisa melihat perbedaan antara kuota lima jam dan kuota mingguan. Transparansi ini menjadi jawaban atas keluhan bahwa kuota terasa habis tanpa penjelasan yang cukup.

Salah satu perubahan yang paling menarik datang dari Gemini 3.1 Flash-Lite. Menurut Josh Woodward, prompt yang dijalankan di model ini tidak akan dihitung terhadap batas penggunaan.

Artinya, Flash-Lite bisa menjadi jalur cadangan ketika kuota model lain menipis atau menunggu reset. Untuk tugas yang tidak membutuhkan model lebih berat, kebijakan ini memberi ruang yang lebih longgar.

Aplikasi Juga Dibuat Lebih Konsisten

Google tidak hanya menyentuh hitungan kuota, tetapi juga perilaku aplikasi Gemini. Setelah pengguna memilih model tertentu, aplikasi kini akan mengingat pilihan itu dan menjadikannya default untuk sesi berikutnya.

Perubahan ini membuat pengalaman penggunaan terasa lebih konsisten. Model baru akan muncul saat batas penggunaan tercapai, lalu Gemini beralih ke model yang lebih ringan sesuai kondisi yang tersedia.

Penyesuaian ini bukan yang pertama sejak Google memakai kuota berbasis komputasi. Setelah sistem baru diperkenalkan, Google tercatat sudah dua kali melipatgandakan batas penggunaan hingga totalnya naik tiga kali lipat pada masing-masing putaran penyesuaian.

Rangkaian langkah itu menunjukkan Google masih terus mencari titik seimbang. Di satu sisi, beban komputasi AI tetap harus dikendalikan, tetapi di sisi lain pengguna yang menjalankan tugas kompleks juga membutuhkan akses yang tidak cepat habis.

Source: www.androidpolice.com