Claude Opus 4.8 Makin Jujur Dan Sulit Dipakai Menipu, Biaya Fast Mode Turun Drastis

Anthropic membawa Claude Opus 4.8 dengan penekanan yang tidak hanya soal kemampuan kerja, tetapi juga soal perilaku model. Perusahaan ini menyebut model barunya lebih jujur, lebih sulit menipu, dan lebih aman saat dipakai untuk membantu pengguna dalam situasi yang penuh ketidakpastian.

Perubahan itu menjadi penting karena Claude kini tidak sekadar dinilai dari skor benchmark. Anthropic tampak ingin menunjukkan bahwa model flagship tetap bisa kuat, tetapi juga lebih dapat dipercaya ketika dipakai untuk tugas yang berisiko salah atau memerlukan keputusan yang hati-hati.

Lebih jujur saat tidak yakin

Salah satu sorotan utama dari Opus 4.8 adalah kecenderungannya untuk mengakui ketidakpastian. Anthropic menyebut model ini lebih mungkin mengatakan bahwa ia belum yakin daripada buru-buru membuat kesimpulan atau mengeluarkan klaim yang belum terverifikasi tentang pekerjaannya sendiri.

Dalam evaluasi internal, model ini juga disebut empat kali lebih kecil kemungkinannya untuk tidak melaporkan cacat pada kode yang ditulisnya. Bagi pengguna yang memakai Claude untuk pemrograman, audit, atau peninjauan kode, karakter seperti ini bisa membantu mengurangi risiko masalah yang lolos tanpa terdeteksi.

Anthropic juga mengatakan Opus 4.8 mencapai tingkat baru pada pengukuran sifat prososial yang digunakan perusahaan. Model ini disebut lebih cenderung mendukung otonomi pengguna dan bertindak untuk kepentingan terbaik pengguna.

Kinerja naik, tapi fokusnya bukan hanya angka

Di luar aspek perilaku, Anthropic menyebut Opus 4.8 dibangun di atas kekuatan Opus 4.7. Perusahaan itu juga mengatakan model baru ini mencatat skor benchmark yang lebih baik hampir di semua aspek dibanding pendahulunya.

Meski begitu, pesan yang disampaikan Anthropic tidak berhenti pada peningkatan performa mentah. Perusahaan tampaknya ingin menegaskan bahwa peningkatan keandalan dan keamanan penggunaan sama pentingnya dengan hasil pengujian teknis.

Pendekatan ini membuat Opus 4.8 terasa relevan untuk pengguna yang butuh model tangguh, tetapi juga ingin mengurangi risiko ketika model bekerja dalam konteks yang sensitif. Dalam praktiknya, kejujuran model saat ragu bisa sama pentingnya dengan jawaban yang cepat.

Fast mode kini jauh lebih murah

Selain perubahan pada perilaku model, Anthropic juga menurunkan biaya fast mode secara signifikan. Pada Opus 4.8, fast mode untuk respons yang lebih cepat disebut menjadi tiga kali lebih murah daripada sebelumnya.

Penurunan biaya ini membuka ruang pemakaian yang lebih luas untuk permintaan sederhana. Pengguna bisa menjalankan tugas cepat tanpa terlalu khawatir token habis terlalu cepat, terutama saat alur kerja membutuhkan banyak interaksi singkat.

Langkah ini muncul di saat biaya pemakaian AI semakin diperhatikan. Model kelas atas sering kali kuat, tetapi harga pakainya bisa membatasi eksperimen dan penggunaan harian yang intensif.

Dengan fast mode yang lebih murah, Anthropic tampak ingin membuat model flagship tetap praktis dipakai untuk kebutuhan sehari-hari. Pengguna juga mendapat opsi yang lebih masuk akal ketika tidak selalu membutuhkan mode pemrosesan paling berat.

Kontrol baru untuk kedalaman jawaban

Bersamaan dengan peluncuran Opus 4.8, Claude juga mendapat fitur Effort yang muncul di model selector. Opsi ini menyediakan pilihan Low, Medium, High, dan Max untuk mengatur seberapa dalam model bekerja.

Pengaturan yang lebih rendah ditujukan untuk hasil yang lebih cepat. Sebaliknya, pengaturan yang lebih tinggi membuat AI berpikir lebih lama dan menghasilkan jawaban yang lebih rinci.

Anthropic mengingatkan bahwa effort yang lebih tinggi akan menghabiskan token jauh lebih cepat. Perusahaan itu merekomendasikan mode Max hanya untuk tugas yang paling sulit.

Fitur ini memberi kontrol yang lebih jelas atas pertukaran antara kecepatan, detail, dan biaya. Dalam penggunaan harian, pengaturan seperti ini bisa membantu membedakan kebutuhan antara tanya jawab singkat, analisis kompleks, dan pekerjaan teknis yang lebih dalam.

Alur kerja besar untuk Claude Code

Anthropic juga memperkenalkan Dynamic workflows dalam status research preview. Fitur ini ditujukan untuk membantu pengguna menangani persoalan yang lebih besar di Claude Code.

Cara kerjanya dibuat cukup ambisius. Pengguna cukup memberi satu tugas, lalu Claude dapat merencanakan pekerjaan itu dan menjalankannya dengan ratusan subagent secara simultan sebelum memverifikasi hasilnya.

Pendekatan ini menunjukkan arah pengembangan Anthropic ke alur kerja AI yang tidak hanya menjawab pertanyaan, tetapi juga membagi, menjalankan, dan memeriksa pekerjaan secara otomatis. Bagi pengembang, hal ini berpotensi mempercepat tugas yang kompleks dan bertahap.

Claude Opus 4.8 sudah tersedia secara luas mulai hari ini. Anthropic juga menyebut sedang menyiapkan model kelas Mythos yang akan dirilis dalam beberapa minggu ke depan.

Source: www.androidauthority.com

Baca Juga

Back to top button