← Back to news
ZBuild News

Panduan Lengkap Claude Sonnet 4.6: Benchmarks, Pricing, Capabilities, dan Kapan Menggunakannya (2026)

Panduan definitif untuk Claude Sonnet 4.6 — model mid-tier Anthropic yang dirilis pada 17 Februari 2026. Mencakup semua benchmarks (SWE-bench 79.6%, OSWorld 72.5%, ARC-AGI-2 58.3%), API pricing ($3/$15 per million tokens), extended thinking, 1M context window, dan perbandingan mendetail dengan Opus 4.6 dan GPT-5.4.

Published
2026-03-27T00:00:00.000Z
Author
ZBuild Team
Reading Time
12 min read
claude sonnet 4.6 guidesonnet 4.6 benchmarksclaude sonnet pricingclaude sonnet 4.6 reviewsonnet 4.6 vs opusclaude 4.6 api
Panduan Lengkap Claude Sonnet 4.6: Benchmarks, Pricing, Capabilities, dan Kapan Menggunakannya (2026)
ZBuild Teamid
XLinkedIn

Poin Utama

Claude Sonnet 4.6 adalah model AI berkinerja tinggi yang paling hemat biaya yang tersedia pada March 2026. Dengan harga $3/$15 per million tokens, model ini memberikan skor benchmark dalam jarak yang sangat dekat dengan model yang biayanya 3-5x lebih mahal — dan pengembang memilihnya dibandingkan flagship Anthropic sebelumnya Opus 4.5 sebanyak 59% dari waktu penggunaan. Baik Anda sedang membangun aplikasi berbasis AI, menggunakannya untuk bantuan pengkodean, atau memproses dokumen dalam skala besar, Sonnet 4.6 mencapai titik keseimbangan ideal antara kapabilitas dan biaya yang tidak tertandingi oleh pesaing mana pun.


Claude Sonnet 4.6: Semua yang Perlu Anda Ketahui

Rilis dan Posisi

Anthropic merilis Claude Sonnet 4.6 pada February 17, 2026. Model ini berada di tengah-tengah keluarga model Claude 4.6:

ModelPosisiHarga (Input/Output per M tokens)
Claude Opus 4.6Flagship, kapabilitas tertinggiTingkat harga lebih tinggi
Claude Sonnet 4.6Rasio harga-performa terbaik$3 / $15
Claude Haiku 4.6Tercepat, paling hemat biayaTingkat harga lebih rendah

Sonnet 4.6 dijelaskan oleh Anthropic sebagai "peningkatan penuh dari keterampilan model dalam pengkodean, penggunaan komputer, penalaran konteks panjang, perencanaan agen, desain, dan pekerjaan pengetahuan" — bukan peningkatan bertahap melainkan langkah generasional maju dari Sonnet 4.5.

Harganya tetap identik dengan Sonnet 4.5 sebelumnya, menjadikan ini murni peningkatan kapabilitas dengan biaya yang sama — sebuah kejadian langka di pasar model AI di mana peningkatan performa biasanya disertai dengan kenaikan harga.


Benchmarks: Data Lengkap

Benchmark Pengkodean

BenchmarkSonnet 4.6Opus 4.6GPT-5.4Catatan
SWE-bench Verified79.6%80.8%~80%Resolusi masalah GitHub yang nyata
SWE-bench Pro~45%57.7%Rekayasa baru yang lebih sulit
Terminal-Bench 2.065.4%75.1%Pengkodean terminal otonom

Sumber: Berbagai agregator benchmark

Skor 79.6% milik Sonnet 4.6 di SWE-bench Verified menempatkannya dalam selisih 1.2 poin persentase dari Opus 4.6 — model flagship yang biayanya jauh lebih mahal. Untuk sebagian besar tugas pengkodean, perbedaan ini tidak terasa dalam praktiknya.

Benchmark Kecerdasan Umum

BenchmarkSonnet 4.6Apa yang Diukur
OSWorld72.5%Penggunaan komputer dan tugas tingkat OS
ARC-AGI-258.3%Pemecahan masalah baru (naik dari 13.6%)
GDPval-AA1633 EloTugas kantor dan administratif
Finance Agent63.3%Analisis keuangan dan penalaran

Sumber: Pengumuman Anthropic, Digital Applied

Hasil ARC-AGI-2 adalah yang paling luar biasa: peningkatan 4.3x dari 13.6% menjadi 58.3%, mewakili perolehan generasi tunggal terbesar pada benchmark ini untuk model AI mana pun. ARC-AGI-2 menguji pemecahan masalah baru — kemampuan untuk mengidentifikasi pola dan menerapkan penalaran pada masalah yang belum pernah dilihat model sebelumnya. Ini menunjukkan peningkatan mendasar dalam kapabilitas penalaran Sonnet 4.6, bukan sekadar data pelatihan yang lebih baik.

Data Preferensi Pengembang

Angka benchmark menceritakan sebagian dari kisahnya. Data preferensi pengembang menceritakan sisanya:

Preferensi atas Opus 4.5 sangat mencolok. Sonnet 4.6 — model tingkat menengah — lebih disukai daripada model termahal dari generasi sebelumnya. Ini mencerminkan pola konsisten dalam pengembangan AI di mana model tingkat menengah yang lebih baru sering kali melampaui flagship yang lebih tua.


Harga: Rincian Lengkap

Harga API

TierInputOutputKasus Penggunaan
Standard$3/M tokens$15/M tokensAplikasi real-time
Batch$1.50/M tokens$7.50/M tokensPemrosesan asinkron, pekerjaan massal

Sumber: Halaman harga Anthropic

Biaya dalam Praktiknya

Untuk membuat harga menjadi nyata, berikut adalah perkiraan biaya dunia nyata berdasarkan pola penggunaan tipikal:

TugasPerkiraan Biaya
Meninjau PR 500 baris$0.02-0.05
Membuat fitur baru (multi-file)$0.10-0.30
Menganalisis seluruh codebase (50K baris)$0.50-1.50
Hari pengkodean yang berat (8 jam, penggunaan aktif)$1-3
Menjalankan coding agent selama 1 jam$2-8
Pemrosesan Batch 1,000 dokumen$5-20

Perbandingan dengan Model Pesaing

ModelInput/MOutput/MSWE-benchEfisiensi Biaya
Claude Sonnet 4.6$3$1579.6%Rasio terbaik
Claude Opus 4.6Lebih tinggiLebih tinggi80.8%Premium
GPT-5.4BervariasiBervariasi~80%Kompetitif
DeepSeek V3~$0.50~$2Lebih rendahTermurah

Sonnet 4.6 menawarkan rasio biaya-performa terbaik jika Anda memperhitungkan skor SWE-bench per dolar yang dihabiskan. Opus 4.6 mendapat skor sedikit lebih tinggi tetapi biayanya jauh lebih mahal. GPT-5.4 kompetitif pada beberapa benchmark tetapi Sonnet 4.6 menang di SWE-bench Verified. DeepSeek V3 jauh lebih murah tetapi mendapat skor yang jauh lebih rendah pada benchmark pengkodean.

Harga Platform

Jika Anda mengakses Sonnet 4.6 melalui produk dan bukan langsung melalui API:

PlatformBiayaBagaimana Sonnet 4.6 Tersedia
Claude.ai Free$0Pesan terbatas per hari
Claude.ai Pro$20/monthPenggunaan yang diperluas, prioritas
Claude.ai Max$100/monthPenggunaan berat, 5x batas Pro
Claude Code (Max)$20/monthTermasuk dalam langganan
Cursor Pro$20/monthTersedia melalui kumpulan kredit
Amazon BedrockBayar sesuai penggunaanHarga per-token yang sama
Google Vertex AIBayar sesuai penggunaanHarga per-token yang sama

Pendalaman Kapabilitas Utama

1. Extended Thinking dengan Adaptive Mode

Extended thinking memungkinkan Sonnet 4.6 menalar masalah kompleks langkah demi langkah sebelum menghasilkan respons. Adaptive mode, fitur baru di 4.6, secara otomatis menyesuaikan kedalaman pemikiran berdasarkan kompleksitas tugas:

  • Pertanyaan sederhana (definisi, pencarian fakta): Respons cepat dengan pemikiran minimal
  • Tugas moderat (pembuatan kode, peringkasan): Rantai pemikiran singkat untuk struktur
  • Penalaran kompleks (matematika multi-langkah, keputusan arsitektur, debugging): Pemikiran mendalam dengan chain-of-thought yang luas

Pendekatan adaptif ini menghilangkan kebutuhan untuk mengaktifkan/menonaktifkan pemikiran secara manual untuk tugas yang berbeda. Model sebelumnya mengharuskan pengembang untuk mengaktifkan extended thinking secara eksplisit, yang sering kali mengakibatkan pemborosan tokens pada kueri sederhana atau penalaran yang tidak memadai pada kueri yang sulit.

Dalam praktiknya: Extended thinking paling berharga untuk mendebug masalah kompleks, keputusan arsitektural, dan pembuatan kode multi-langkah di mana model perlu mempertimbangkan batasan di beberapa file. Untuk penyelesaian kode sederhana atau tanya jawab cepat, beban tambahannya dapat diabaikan berkat adaptive mode.

2. 1M Token Context Window

Sonnet 4.6 mendukung 1M token context window — kini tersedia secara umum tanpa memerlukan header beta. Ini kira-kira setara dengan:

  • 3-4 juta karakter
  • 75,000 baris kode
  • 15-20 codebase ukuran rata-rata
  • 4-5 novel panjang penuh

Ini menjadikan Sonnet 4.6 sebagai model kelas Sonnet pertama yang mendukung analisis seluruh codebase dalam satu prompt. Sebelumnya, hanya model tingkat Opus yang menawarkan context window sebesar ini.

Implikasi praktis:

  • Memuat seluruh codebase microservice untuk debugging lintas file
  • Menganalisis set dokumentasi lengkap untuk penulisan teknis
  • Memproses seluruh rangkaian kontrak untuk tinjauan hukum
  • Membandingkan beberapa dokumen besar secara bersamaan

Pertimbangan biaya: Satu prompt penuh 1M token berbiaya $3 hanya untuk input tokens. Untuk sebagian besar tugas, Anda tidak memerlukan konteks penuh — memuat 50K-200K tokens mencakup sebagian besar kasus penggunaan dengan biaya $0.15-0.60 per prompt.

3. Peningkatan Kemampuan Pengkodean

Berdasarkan skor SWE-bench 79.6% dan data preferensi pengembang, Sonnet 4.6 memberikan peningkatan terukur dalam:

  • Penalaran multi-file: Memahami bagaimana perubahan dalam satu file memengaruhi file lain di seluruh proyek
  • Kepatuhan terhadap instruksi: Kepatuhan yang lebih tepat terhadap pedoman pengkodean, konvensi gaya, dan persyaratan spesifik
  • Berkurangnya overengineering: Menghasilkan kode yang lebih sederhana dan lebih mudah dipelihara, alih-alih solusi yang terlalu diabstraksi
  • Penanganan kesalahan: Identifikasi dan penanganan edge cases yang lebih baik dalam kode yang dihasilkan
  • Pembuatan pengujian: Cakupan pengujian yang lebih komprehensif dengan asersi yang bermakna

4. Computer Use (Beta)

Sonnet 4.6 dapat berinteraksi dengan antarmuka komputer — mengklik tombol, mengisi formulir, menavigasi aplikasi, dan mengambil tangkapan layar. Skor benchmark OSWorld sebesar 72.5% mencerminkan kapabilitas nyata di bidang ini, meskipun masih dalam tahap beta.

Kasus penggunaan meliputi: pengujian UI otomatis, entri data lintas aplikasi, web scraping dengan interaksi, dan otomatisasi aplikasi desktop.

5. Penggunaan Tool yang Tersedia Secara Umum

Beberapa kapabilitas yang sebelumnya dalam tahap beta kini tersedia secara umum dengan Sonnet 4.6:

  • Web search dan web fetch: Claude dapat mencari di internet dan mengambil konten web
  • Eksekusi kode: Lingkungan sandboxed untuk menjalankan dan menguji kode
  • Memory tool: Menyimpan informasi di berbagai percakapan
  • Penanganan file: Mengunggah dan menganalisis file secara langsung

Fitur GA ini memungkinkan alur kerja agen yang lebih mumpuni di mana Sonnet 4.6 dapat melakukan riset, pengkodean, pengujian, dan iterasi secara mandiri — tanpa campur tangan manusia secara manual di setiap langkah.


Sonnet 4.6 vs. Opus 4.6: Mana yang Harus Dipilih

Ini adalah pertanyaan paling umum yang dihadapi pengembang saat memilih model Claude. Berikut adalah jawaban berbasis data:

DimensiSonnet 4.6Opus 4.6Pemenang
SWE-bench Verified79.6%80.8%Opus (sedikit)
Harga (input/M)$3Lebih tinggiSonnet
Harga (output/M)$15Lebih tinggiSonnet
Context window1M tokens1M tokensSeri
Extended thinkingYa (adaptif)YaSeri
Agent TeamsTidakYaOpus
Preferensi pengembang (vs Opus 4.5)59% lebih sukaSonnet
KecepatanLebih cepatLebih lambatSonnet

Pilih Sonnet 4.6 Saat:

  • Biaya menjadi pertimbangan. Sonnet memberikan 98.5% dari skor SWE-bench milik Opus dengan biaya yang jauh lebih rendah. Untuk sebagian besar tugas pengkodean, perbedaan kualitas tidak terasa.
  • Kecepatan menjadi pertimbangan. Sonnet menghasilkan respons lebih cepat daripada Opus, yang penting untuk sesi pengkodean interaktif.
  • Anda sedang membangun aplikasi. Untuk produk bertenaga API di mana Anda membayar per token dalam skala besar, biaya Sonnet yang lebih rendah menghasilkan penghematan yang signifikan.
  • Tugas pengkodean standar. Implementasi fitur, perbaikan bug, peninjauan kode, pembuatan pengujian, dokumentasi — Sonnet menangani semua ini dengan kualitas mendekati Opus.

Pilih Opus 4.6 Saat:

  • Akurasi maksimum pada masalah kompleks. Untuk penalaran multi-file yang benar-benar sulit di seluruh 100+ file codebase, tambahan 1.2% pada SWE-bench mencerminkan perbedaan kualitas yang berarti.
  • Agent Teams. Jika Anda memerlukan koordinasi agen paralel — beberapa agen AI yang bekerja secara bersamaan di berbagai bagian codebase — Opus diperlukan.
  • Keputusan arsitektur baru. Saat membuat keputusan teknis satu kali dengan taruhan tinggi, peningkatan kualitas yang sedikit tersebut membenarkan biayanya.
  • Anda menggunakan Claude Code secara intensif. Jika Claude Code adalah alat pengembangan utama Anda dan Anda menggunakan paket Max, menggunakan Opus biayanya sama dengan Sonnet dalam langganan tersebut.

Jawaban Praktis

Sebagian besar pengembang harus menjadikan Sonnet 4.6 sebagai default dan beralih ke Opus 4.6 hanya untuk masalah spesifik yang sulit. Dalam pengujian Claude Code, pengembang memilih Sonnet 4.6 dibandingkan Sonnet 4.5 sebanyak 70% dari waktu penggunaan — artinya bahkan dalam pengujian Anthropic sendiri, model tingkat menengah adalah pilihan harian yang lebih disukai.


Sonnet 4.6 vs. GPT-5.4: Head-to-Head

DimensiSonnet 4.6GPT-5.4Pemenang
SWE-bench Verified79.6%~80%Seri (dalam margin)
SWE-bench Pro57.7%GPT-5.4
Terminal-Bench 2.075.1%GPT-5.4
OSWorld72.5%Sonnet (secara default)
ARC-AGI-258.3%Sonnet (secara default)
Harga (input/M)$3BervariasiSebanding
Context window1M1M (Pro)Seri

Sumber: Perbandingan Portkey

Jawaban bernuansa: GPT-5.4 lebih kuat pada masalah rekayasa baru (SWE-bench Pro) dan pengkodean terminal otonom (Terminal-Bench 2.0). Sonnet 4.6 lebih kuat pada tugas pengkodean standar (SWE-bench Verified) dan pengenalan pola baru (ARC-AGI-2). Banyak pengembang profesional menggunakan keduanya: GPT-5.4 untuk pembuatan prototipe dan masalah baru, Sonnet 4.6 atau Opus 4.6 untuk pengkodean multi-file yang mendalam dan analisis codebase besar.


Praktik Terbaik untuk Menggunakan Sonnet 4.6

Untuk Pengembang API

  1. Gunakan Batch API untuk tugas non-real-time. Dengan harga 50% dari harga standar ($1.50/$7.50 per M tokens), pemrosesan batch jauh lebih murah untuk tugas yang dapat mentoleransi pemrosesan asinkron.

  2. Sesuaikan ukuran konteks Anda. Satu prompt penuh 1M token berbiaya $3 untuk input tokens. Sebagian besar tugas memerlukan 10K-100K tokens konteks. Bersikaplah selektif tentang apa yang Anda sertakan.

  3. Manfaatkan extended thinking untuk masalah sulit. Adaptive mode menanganinya secara otomatis, tetapi Anda dapat secara eksplisit meminta penalaran yang lebih dalam untuk keputusan kritis.

  4. Cache konteks yang berulang. Jika Anda mengirimkan konteks codebase yang sama di beberapa permintaan, prompt caching dari Anthropic dapat mengurangi biaya input hingga 90%.

Untuk Pengguna Claude Code

  1. Jadikan Sonnet 4.6 sebagai default untuk pekerjaan harian. Beralih ke Opus 4.6 hanya untuk masalah multi-file yang kompleks di mana kualitas lebih penting daripada kecepatan.

  2. Gunakan extended thinking untuk keputusan arsitektural. Saat merencanakan fitur baru atau refactoring, biarkan model berpikir mendalam sebelum menghasilkan kode.

  3. Manfaatkan 1M context window. Muat seluruh codebase Anda untuk sesi debugging lintas file daripada memasukkan file satu per satu.

Untuk Pembangun Produk

  1. Mulai dengan Sonnet 4.6, tingkatkan secara selektif. Bangun aplikasi Anda pada Sonnet 4.6 dan hanya rute kueri sulit tertentu ke Opus 4.6.

  2. Gunakan output terstruktur. Peningkatan kepatuhan terhadap instruksi pada Sonnet 4.6 membuatnya lebih andal untuk pembuatan JSON/output terstruktur.

  3. Uji dengan data nyata. Skor benchmark adalah rata-rata — kasus penggunaan spesifik Anda mungkin lebih condong ke satu model daripada yang lain. Jalankan pengujian A/B dengan data aktual Anda.


Membangun Aplikasi dengan Sonnet 4.6

Kombinasi kemampuan pengkodean yang kuat dari Sonnet 4.6, harga yang wajar, dan 1M context window menjadikannya tulang punggung yang sangat baik untuk aplikasi bertenaga AI. Baik Anda membangun asisten pengkodean, penganalisis dokumen, atau alur kerja otomatis, model ini menangani lapisan kecerdasan secara efektif.

Untuk lapisan aplikasi itu sendiri — frontend, backend, database, dan infrastruktur deployment — alat seperti ZBuild dapat mempercepat pengembangan secara signifikan. Daripada mengkodekan setiap operasi CRUD dan panel admin dari awal, pembangun aplikasi visual menangani pola standar sementara Sonnet 4.6 memberi daya pada fitur AI. Kombinasi ini memungkinkan pengembang solo dan tim kecil untuk merilis produk bertenaga AI lebih cepat daripada menggunakan salah satu pendekatan saja.


Apa Selanjutnya untuk Model Claude

Berdasarkan ritme rilis Anthropic dan pernyataan publik:

  • Claude 4.6 Haiku diharapkan melengkapi keluarga model 4.6 sebagai opsi tercepat dan paling hemat biaya
  • Peningkatan model berlanjut melalui optimasi pasca-pelatihan — Anthropic secara historis merilis versi yang ditingkatkan dari model yang ada di antara rilis utama
  • Perluasan penggunaan tool — computer use, eksekusi kode, dan memori semuanya berkembang dari tahap beta ke kapabilitas siap produksi
  • Infrastruktur agen — Agent Teams (saat ini hanya untuk Opus) mungkin diperluas ke model tingkat Sonnet

Lintasan keluarga model Claude sudah jelas: setiap generasi memberikan performa yang jauh lebih baik dengan harga yang sama atau lebih rendah. Sonnet 4.6 yang mencapai performa mendekati Opus 4.5 dengan harga Sonnet adalah contoh terbaru dari pola ini.


Putusan

Claude Sonnet 4.6 adalah rekomendasi default untuk sebagian besar pengembang dan pembangun aplikasi pada 2026. Kombinasi dari 79.6% SWE-bench, $3/$15 per million tokens, 1M context window, dan adaptive extended thinking menciptakan model yang menangani 95%+ tugas dunia nyata dengan rasio biaya-performa terbaik yang tersedia.

Gunakan Opus 4.6 saat Anda membutuhkan kualitas absolut terbaik untuk pekerjaan yang kompleks dan berisiko tinggi. Gunakan GPT-5.4 saat Anda membutuhkan performa superior pada masalah rekayasa baru. Gunakan Sonnet 4.6 untuk hal lainnya — yang mana, bagi sebagian besar pengembang, adalah hampir sepanjang waktu.


Sumber

Back to all news
Enjoyed this article?
FAQ

Common questions

Apa itu Claude Sonnet 4.6 dan kapan dirilis?+
Claude Sonnet 4.6 adalah model AI mid-tier Anthropic, dirilis pada 17 Februari 2026. Model ini mencetak skor 79.6% pada SWE-bench Verified dan 72.5% pada OSWorld, seharga $3/$15 per million tokens (input/output), dan mendukung 1M token context window. Developer memilihnya dibandingkan flagship sebelumnya Opus 4.5 sebanyak 59% kali.
Berapa biaya Claude Sonnet 4.6?+
Standard API pricing adalah $3 per million input tokens dan $15 per million output tokens. Batch API pricing 50% lebih murah pada $1.50/$7.50 per million tokens. Dalam Claude Code dengan paket Max ($20/month), Sonnet 4.6 sudah termasuk dalam langganan. Satu hari penuh coding dengan Sonnet 4.6 melalui API membutuhkan biaya sekitar $1-3.
Bagaimana perbandingan Claude Sonnet 4.6 dengan Opus 4.6?+
Sonnet 4.6 mencetak skor 79.6% pada SWE-bench (dalam rentang 1.2% dari skor Opus 4.6 sebesar 80.8%) dengan biaya yang jauh lebih rendah — $3/$15 dibandingkan pricing Opus yang lebih tinggi. Developer lebih memilih Sonnet 4.6 daripada Opus 4.5 sebanyak 59% kali. Opus 4.6 masih lebih baik untuk complex multi-file reasoning dan Agent Teams, tetapi Sonnet 4.6 menawarkan cost-performance ratio terbaik dalam keluarga Claude.
Apa itu extended thinking dalam Claude Sonnet 4.6?+
Extended thinking memungkinkan Sonnet 4.6 melakukan reasoning melalui masalah kompleks langkah demi langkah sebelum menghasilkan respons. Mode adaptive, yang baru di 4.6, secara otomatis menyesuaikan kedalaman pemikiran berdasarkan kompleksitas tugas — pertanyaan sederhana mendapat respons cepat sementara reasoning yang kompleks memicu thinking chains yang lebih dalam. Ini meningkatkan akurasi pada tugas matematika, logika, dan multi-step coding.
Dapatkah Claude Sonnet 4.6 menangani seluruh codebase dalam satu prompt?+
Ya. Sonnet 4.6 mendukung 1M token context window (tersedia secara umum, tidak memerlukan beta header), yang kira-kira setara dengan 3-4 juta karakter atau sekitar 75,000 baris kode. Ini menjadikannya model kelas Sonnet pertama yang mampu melakukan analisis codebase lengkap dalam satu prompt.
Recommended Tools

Useful follow-ups related to this article.

Browse All Tools

Bangun dengan ZBuild

Ubah ide Anda menjadi aplikasi yang berfungsi — tanpa coding.

46.000+ developer membangun dengan ZBuild bulan ini

Coba sendiri

Jelaskan yang Anda inginkan — ZBuild membangunnya untuk Anda.

46.000+ developer membangun dengan ZBuild bulan ini
More Reading

Related articles