Apa itu Claude Sonnet 4.6 dan kapan dirilis?

Claude Sonnet 4.6 adalah model AI mid-tier Anthropic, dirilis pada 17 Februari 2026. Model ini mencetak skor 79.6% pada SWE-bench Verified dan 72.5% pada OSWorld, seharga $3/$15 per million tokens (input/output), dan mendukung 1M token context window. Developer memilihnya dibandingkan flagship sebelumnya Opus 4.5 sebanyak 59% kali.

Berapa biaya Claude Sonnet 4.6?

Standard API pricing adalah $3 per million input tokens dan $15 per million output tokens. Batch API pricing 50% lebih murah pada $1.50/$7.50 per million tokens. Dalam Claude Code dengan paket Max ($20/month), Sonnet 4.6 sudah termasuk dalam langganan. Satu hari penuh coding dengan Sonnet 4.6 melalui API membutuhkan biaya sekitar $1-3.

Bagaimana perbandingan Claude Sonnet 4.6 dengan Opus 4.6?

Sonnet 4.6 mencetak skor 79.6% pada SWE-bench (dalam rentang 1.2% dari skor Opus 4.6 sebesar 80.8%) dengan biaya yang jauh lebih rendah — $3/$15 dibandingkan pricing Opus yang lebih tinggi. Developer lebih memilih Sonnet 4.6 daripada Opus 4.5 sebanyak 59% kali. Opus 4.6 masih lebih baik untuk complex multi-file reasoning dan Agent Teams, tetapi Sonnet 4.6 menawarkan cost-performance ratio terbaik dalam keluarga Claude.

Dapatkah Claude Sonnet 4.6 menangani seluruh codebase dalam satu prompt?

Ya. Sonnet 4.6 mendukung 1M token context window (tersedia secara umum, tidak memerlukan beta header), yang kira-kira setara dengan 3-4 juta karakter atau sekitar 75,000 baris kode. Ini menjadikannya model kelas Sonnet pertama yang mampu melakukan analisis codebase lengkap dalam satu prompt.

Poin Utama

Claude Sonnet 4.6 adalah model AI berkinerja tinggi yang paling hemat biaya yang tersedia pada March 2026. Dengan harga $3/$15 per million tokens, model ini memberikan skor benchmark dalam jarak yang sangat dekat dengan model yang biayanya 3-5x lebih mahal — dan pengembang memilihnya dibandingkan flagship Anthropic sebelumnya Opus 4.5 sebanyak 59% dari waktu penggunaan. Baik Anda sedang membangun aplikasi berbasis AI, menggunakannya untuk bantuan pengkodean, atau memproses dokumen dalam skala besar, Sonnet 4.6 mencapai titik keseimbangan ideal antara kapabilitas dan biaya yang tidak tertandingi oleh pesaing mana pun.

Claude Sonnet 4.6: Semua yang Perlu Anda Ketahui

Q: Apa itu extended thinking dalam Claude Sonnet 4.6?

Extended thinking memungkinkan Sonnet 4.6 melakukan reasoning melalui masalah kompleks langkah demi langkah sebelum menghasilkan respons. Mode adaptive, yang baru di 4.6, secara otomatis menyesuaikan kedalaman pemikiran berdasarkan kompleksitas tugas — pertanyaan sederhana mendapat respons cepat sementara reasoning yang kompleks memicu thinking chains yang lebih dalam. Ini meningkatkan akurasi pada tugas matematika, logika, dan multi-step coding.

Rilis dan Posisi

Anthropic merilis Claude Sonnet 4.6 pada February 17, 2026. Model ini berada di tengah-tengah keluarga model Claude 4.6:

Model	Posisi	Harga (Input/Output per M tokens)
Claude Opus 4.6	Flagship, kapabilitas tertinggi	Tingkat harga lebih tinggi
Claude Sonnet 4.6	Rasio harga-performa terbaik	$3 / $15
Claude Haiku 4.6	Tercepat, paling hemat biaya	Tingkat harga lebih rendah

Sonnet 4.6 dijelaskan oleh Anthropic sebagai "peningkatan penuh dari keterampilan model dalam pengkodean, penggunaan komputer, penalaran konteks panjang, perencanaan agen, desain, dan pekerjaan pengetahuan" — bukan peningkatan bertahap melainkan langkah generasional maju dari Sonnet 4.5.

Harganya tetap identik dengan Sonnet 4.5 sebelumnya, menjadikan ini murni peningkatan kapabilitas dengan biaya yang sama — sebuah kejadian langka di pasar model AI di mana peningkatan performa biasanya disertai dengan kenaikan harga.

Benchmarks: Data Lengkap

Benchmark Pengkodean

Benchmark	Sonnet 4.6	Opus 4.6	GPT-5.4	Catatan
SWE-bench Verified	79.6%	80.8%	~80%	Resolusi masalah GitHub yang nyata
SWE-bench Pro	—	~45%	57.7%	Rekayasa baru yang lebih sulit
Terminal-Bench 2.0	—	65.4%	75.1%	Pengkodean terminal otonom

Sumber: Berbagai agregator benchmark

Skor 79.6% milik Sonnet 4.6 di SWE-bench Verified menempatkannya dalam selisih 1.2 poin persentase dari Opus 4.6 — model flagship yang biayanya jauh lebih mahal. Untuk sebagian besar tugas pengkodean, perbedaan ini tidak terasa dalam praktiknya.

Benchmark Kecerdasan Umum

Benchmark	Sonnet 4.6	Apa yang Diukur
OSWorld	72.5%	Penggunaan komputer dan tugas tingkat OS
ARC-AGI-2	58.3%	Pemecahan masalah baru (naik dari 13.6%)
GDPval-AA	1633 Elo	Tugas kantor dan administratif
Finance Agent	63.3%	Analisis keuangan dan penalaran

Sumber: Pengumuman Anthropic, Digital Applied

Hasil ARC-AGI-2 adalah yang paling luar biasa: peningkatan 4.3x dari 13.6% menjadi 58.3%, mewakili perolehan generasi tunggal terbesar pada benchmark ini untuk model AI mana pun. ARC-AGI-2 menguji pemecahan masalah baru — kemampuan untuk mengidentifikasi pola dan menerapkan penalaran pada masalah yang belum pernah dilihat model sebelumnya. Ini menunjukkan peningkatan mendasar dalam kapabilitas penalaran Sonnet 4.6, bukan sekadar data pelatihan yang lebih baik.

Data Preferensi Pengembang

Angka benchmark menceritakan sebagian dari kisahnya. Data preferensi pengembang menceritakan sisanya:

Pengembang memilih Sonnet 4.6 dibandingkan Sonnet 4.5 sebanyak 70% dari waktu penggunaan dalam pengujian Claude Code
Pengembang memilih Sonnet 4.6 dibandingkan flagship sebelumnya Opus 4.5 sebanyak 59% dari waktu penggunaan
Alasan utama yang disebutkan: kepatuhan terhadap instruksi yang lebih baik, berkurangnya overengineering, output yang lebih ringkas

Preferensi atas Opus 4.5 sangat mencolok. Sonnet 4.6 — model tingkat menengah — lebih disukai daripada model termahal dari generasi sebelumnya. Ini mencerminkan pola konsisten dalam pengembangan AI di mana model tingkat menengah yang lebih baru sering kali melampaui flagship yang lebih tua.

Harga: Rincian Lengkap

Harga API

Tier	Input	Output	Kasus Penggunaan
Standard	$3/M tokens	$15/M tokens	Aplikasi real-time
Batch	$1.50/M tokens	$7.50/M tokens	Pemrosesan asinkron, pekerjaan massal

Sumber: Halaman harga Anthropic

Biaya dalam Praktiknya

Untuk membuat harga menjadi nyata, berikut adalah perkiraan biaya dunia nyata berdasarkan pola penggunaan tipikal:

Tugas	Perkiraan Biaya
Meninjau PR 500 baris	$0.02-0.05
Membuat fitur baru (multi-file)	$0.10-0.30
Menganalisis seluruh codebase (50K baris)	$0.50-1.50
Hari pengkodean yang berat (8 jam, penggunaan aktif)	$1-3
Menjalankan coding agent selama 1 jam	$2-8
Pemrosesan Batch 1,000 dokumen	$5-20

Perbandingan dengan Model Pesaing

Model	Input/M	Output/M	SWE-bench	Efisiensi Biaya
Claude Sonnet 4.6	$3	$15	79.6%	Rasio terbaik
Claude Opus 4.6	Lebih tinggi	Lebih tinggi	80.8%	Premium
GPT-5.4	Bervariasi	Bervariasi	~80%	Kompetitif
DeepSeek V3	~$0.50	~$2	Lebih rendah	Termurah

Sonnet 4.6 menawarkan rasio biaya-performa terbaik jika Anda memperhitungkan skor SWE-bench per dolar yang dihabiskan. Opus 4.6 mendapat skor sedikit lebih tinggi tetapi biayanya jauh lebih mahal. GPT-5.4 kompetitif pada beberapa benchmark tetapi Sonnet 4.6 menang di SWE-bench Verified. DeepSeek V3 jauh lebih murah tetapi mendapat skor yang jauh lebih rendah pada benchmark pengkodean.

Harga Platform

Jika Anda mengakses Sonnet 4.6 melalui produk dan bukan langsung melalui API:

Platform	Biaya	Bagaimana Sonnet 4.6 Tersedia
Claude.ai Free	$0	Pesan terbatas per hari
Claude.ai Pro	$20/month	Penggunaan yang diperluas, prioritas
Claude.ai Max	$100/month	Penggunaan berat, 5x batas Pro
Claude Code (Max)	$20/month	Termasuk dalam langganan
Cursor Pro	$20/month	Tersedia melalui kumpulan kredit
Amazon Bedrock	Bayar sesuai penggunaan	Harga per-token yang sama
Google Vertex AI	Bayar sesuai penggunaan	Harga per-token yang sama

Pendalaman Kapabilitas Utama

1. Extended Thinking dengan Adaptive Mode

Extended thinking memungkinkan Sonnet 4.6 menalar masalah kompleks langkah demi langkah sebelum menghasilkan respons. Adaptive mode, fitur baru di 4.6, secara otomatis menyesuaikan kedalaman pemikiran berdasarkan kompleksitas tugas:

Pertanyaan sederhana (definisi, pencarian fakta): Respons cepat dengan pemikiran minimal
Tugas moderat (pembuatan kode, peringkasan): Rantai pemikiran singkat untuk struktur
Penalaran kompleks (matematika multi-langkah, keputusan arsitektur, debugging): Pemikiran mendalam dengan chain-of-thought yang luas

Pendekatan adaptif ini menghilangkan kebutuhan untuk mengaktifkan/menonaktifkan pemikiran secara manual untuk tugas yang berbeda. Model sebelumnya mengharuskan pengembang untuk mengaktifkan extended thinking secara eksplisit, yang sering kali mengakibatkan pemborosan tokens pada kueri sederhana atau penalaran yang tidak memadai pada kueri yang sulit.

Dalam praktiknya: Extended thinking paling berharga untuk mendebug masalah kompleks, keputusan arsitektural, dan pembuatan kode multi-langkah di mana model perlu mempertimbangkan batasan di beberapa file. Untuk penyelesaian kode sederhana atau tanya jawab cepat, beban tambahannya dapat diabaikan berkat adaptive mode.

2. 1M Token Context Window

Sonnet 4.6 mendukung 1M token context window — kini tersedia secara umum tanpa memerlukan header beta. Ini kira-kira setara dengan:

3-4 juta karakter
75,000 baris kode
15-20 codebase ukuran rata-rata
4-5 novel panjang penuh

Ini menjadikan Sonnet 4.6 sebagai model kelas Sonnet pertama yang mendukung analisis seluruh codebase dalam satu prompt. Sebelumnya, hanya model tingkat Opus yang menawarkan context window sebesar ini.

Implikasi praktis:

Memuat seluruh codebase microservice untuk debugging lintas file
Menganalisis set dokumentasi lengkap untuk penulisan teknis
Memproses seluruh rangkaian kontrak untuk tinjauan hukum
Membandingkan beberapa dokumen besar secara bersamaan

Pertimbangan biaya: Satu prompt penuh 1M token berbiaya $3 hanya untuk input tokens. Untuk sebagian besar tugas, Anda tidak memerlukan konteks penuh — memuat 50K-200K tokens mencakup sebagian besar kasus penggunaan dengan biaya $0.15-0.60 per prompt.

3. Peningkatan Kemampuan Pengkodean

Berdasarkan skor SWE-bench 79.6% dan data preferensi pengembang, Sonnet 4.6 memberikan peningkatan terukur dalam:

Penalaran multi-file: Memahami bagaimana perubahan dalam satu file memengaruhi file lain di seluruh proyek
Kepatuhan terhadap instruksi: Kepatuhan yang lebih tepat terhadap pedoman pengkodean, konvensi gaya, dan persyaratan spesifik
Berkurangnya overengineering: Menghasilkan kode yang lebih sederhana dan lebih mudah dipelihara, alih-alih solusi yang terlalu diabstraksi
Penanganan kesalahan: Identifikasi dan penanganan edge cases yang lebih baik dalam kode yang dihasilkan
Pembuatan pengujian: Cakupan pengujian yang lebih komprehensif dengan asersi yang bermakna

4. Computer Use (Beta)

Sonnet 4.6 dapat berinteraksi dengan antarmuka komputer — mengklik tombol, mengisi formulir, menavigasi aplikasi, dan mengambil tangkapan layar. Skor benchmark OSWorld sebesar 72.5% mencerminkan kapabilitas nyata di bidang ini, meskipun masih dalam tahap beta.

Kasus penggunaan meliputi: pengujian UI otomatis, entri data lintas aplikasi, web scraping dengan interaksi, dan otomatisasi aplikasi desktop.

5. Penggunaan Tool yang Tersedia Secara Umum

Beberapa kapabilitas yang sebelumnya dalam tahap beta kini tersedia secara umum dengan Sonnet 4.6:

Web search dan web fetch: Claude dapat mencari di internet dan mengambil konten web
Eksekusi kode: Lingkungan sandboxed untuk menjalankan dan menguji kode
Memory tool: Menyimpan informasi di berbagai percakapan
Penanganan file: Mengunggah dan menganalisis file secara langsung

Fitur GA ini memungkinkan alur kerja agen yang lebih mumpuni di mana Sonnet 4.6 dapat melakukan riset, pengkodean, pengujian, dan iterasi secara mandiri — tanpa campur tangan manusia secara manual di setiap langkah.

Sonnet 4.6 vs. Opus 4.6: Mana yang Harus Dipilih

Ini adalah pertanyaan paling umum yang dihadapi pengembang saat memilih model Claude. Berikut adalah jawaban berbasis data:

Dimensi	Sonnet 4.6	Opus 4.6	Pemenang
SWE-bench Verified	79.6%	80.8%	Opus (sedikit)
Harga (input/M)	$3	Lebih tinggi	Sonnet
Harga (output/M)	$15	Lebih tinggi	Sonnet
Context window	1M tokens	1M tokens	Seri
Extended thinking	Ya (adaptif)	Ya	Seri
Agent Teams	Tidak	Ya	Opus
Preferensi pengembang (vs Opus 4.5)	59% lebih suka	—	Sonnet
Kecepatan	Lebih cepat	Lebih lambat	Sonnet

Pilih Sonnet 4.6 Saat:

Biaya menjadi pertimbangan. Sonnet memberikan 98.5% dari skor SWE-bench milik Opus dengan biaya yang jauh lebih rendah. Untuk sebagian besar tugas pengkodean, perbedaan kualitas tidak terasa.
Kecepatan menjadi pertimbangan. Sonnet menghasilkan respons lebih cepat daripada Opus, yang penting untuk sesi pengkodean interaktif.
Anda sedang membangun aplikasi. Untuk produk bertenaga API di mana Anda membayar per token dalam skala besar, biaya Sonnet yang lebih rendah menghasilkan penghematan yang signifikan.
Tugas pengkodean standar. Implementasi fitur, perbaikan bug, peninjauan kode, pembuatan pengujian, dokumentasi — Sonnet menangani semua ini dengan kualitas mendekati Opus.

Pilih Opus 4.6 Saat:

Akurasi maksimum pada masalah kompleks. Untuk penalaran multi-file yang benar-benar sulit di seluruh 100+ file codebase, tambahan 1.2% pada SWE-bench mencerminkan perbedaan kualitas yang berarti.
Agent Teams. Jika Anda memerlukan koordinasi agen paralel — beberapa agen AI yang bekerja secara bersamaan di berbagai bagian codebase — Opus diperlukan.
Keputusan arsitektur baru. Saat membuat keputusan teknis satu kali dengan taruhan tinggi, peningkatan kualitas yang sedikit tersebut membenarkan biayanya.
Anda menggunakan Claude Code secara intensif. Jika Claude Code adalah alat pengembangan utama Anda dan Anda menggunakan paket Max, menggunakan Opus biayanya sama dengan Sonnet dalam langganan tersebut.

Jawaban Praktis

Sebagian besar pengembang harus menjadikan Sonnet 4.6 sebagai default dan beralih ke Opus 4.6 hanya untuk masalah spesifik yang sulit. Dalam pengujian Claude Code, pengembang memilih Sonnet 4.6 dibandingkan Sonnet 4.5 sebanyak 70% dari waktu penggunaan — artinya bahkan dalam pengujian Anthropic sendiri, model tingkat menengah adalah pilihan harian yang lebih disukai.

Sonnet 4.6 vs. GPT-5.4: Head-to-Head

Dimensi	Sonnet 4.6	GPT-5.4	Pemenang
SWE-bench Verified	79.6%	~80%	Seri (dalam margin)
SWE-bench Pro	—	57.7%	GPT-5.4
Terminal-Bench 2.0	—	75.1%	GPT-5.4
OSWorld	72.5%	—	Sonnet (secara default)
ARC-AGI-2	58.3%	—	Sonnet (secara default)
Harga (input/M)	$3	Bervariasi	Sebanding
Context window	1M	1M (Pro)	Seri

Sumber: Perbandingan Portkey

Jawaban bernuansa: GPT-5.4 lebih kuat pada masalah rekayasa baru (SWE-bench Pro) dan pengkodean terminal otonom (Terminal-Bench 2.0). Sonnet 4.6 lebih kuat pada tugas pengkodean standar (SWE-bench Verified) dan pengenalan pola baru (ARC-AGI-2). Banyak pengembang profesional menggunakan keduanya: GPT-5.4 untuk pembuatan prototipe dan masalah baru, Sonnet 4.6 atau Opus 4.6 untuk pengkodean multi-file yang mendalam dan analisis codebase besar.

Praktik Terbaik untuk Menggunakan Sonnet 4.6

Untuk Pengembang API

Gunakan Batch API untuk tugas non-real-time. Dengan harga 50% dari harga standar ($1.50/$7.50 per M tokens), pemrosesan batch jauh lebih murah untuk tugas yang dapat mentoleransi pemrosesan asinkron.
Sesuaikan ukuran konteks Anda. Satu prompt penuh 1M token berbiaya $3 untuk input tokens. Sebagian besar tugas memerlukan 10K-100K tokens konteks. Bersikaplah selektif tentang apa yang Anda sertakan.
Manfaatkan extended thinking untuk masalah sulit. Adaptive mode menanganinya secara otomatis, tetapi Anda dapat secara eksplisit meminta penalaran yang lebih dalam untuk keputusan kritis.
Cache konteks yang berulang. Jika Anda mengirimkan konteks codebase yang sama di beberapa permintaan, prompt caching dari Anthropic dapat mengurangi biaya input hingga 90%.

Untuk Pengguna Claude Code

Jadikan Sonnet 4.6 sebagai default untuk pekerjaan harian. Beralih ke Opus 4.6 hanya untuk masalah multi-file yang kompleks di mana kualitas lebih penting daripada kecepatan.
Gunakan extended thinking untuk keputusan arsitektural. Saat merencanakan fitur baru atau refactoring, biarkan model berpikir mendalam sebelum menghasilkan kode.
Manfaatkan 1M context window. Muat seluruh codebase Anda untuk sesi debugging lintas file daripada memasukkan file satu per satu.

Untuk Pembangun Produk

Mulai dengan Sonnet 4.6, tingkatkan secara selektif. Bangun aplikasi Anda pada Sonnet 4.6 dan hanya rute kueri sulit tertentu ke Opus 4.6.
Gunakan output terstruktur. Peningkatan kepatuhan terhadap instruksi pada Sonnet 4.6 membuatnya lebih andal untuk pembuatan JSON/output terstruktur.
Uji dengan data nyata. Skor benchmark adalah rata-rata — kasus penggunaan spesifik Anda mungkin lebih condong ke satu model daripada yang lain. Jalankan pengujian A/B dengan data aktual Anda.

Membangun Aplikasi dengan Sonnet 4.6

Kombinasi kemampuan pengkodean yang kuat dari Sonnet 4.6, harga yang wajar, dan 1M context window menjadikannya tulang punggung yang sangat baik untuk aplikasi bertenaga AI. Baik Anda membangun asisten pengkodean, penganalisis dokumen, atau alur kerja otomatis, model ini menangani lapisan kecerdasan secara efektif.

Untuk lapisan aplikasi itu sendiri — frontend, backend, database, dan infrastruktur deployment — alat seperti ZBuild dapat mempercepat pengembangan secara signifikan. Daripada mengkodekan setiap operasi CRUD dan panel admin dari awal, pembangun aplikasi visual menangani pola standar sementara Sonnet 4.6 memberi daya pada fitur AI. Kombinasi ini memungkinkan pengembang solo dan tim kecil untuk merilis produk bertenaga AI lebih cepat daripada menggunakan salah satu pendekatan saja.

Apa Selanjutnya untuk Model Claude

Berdasarkan ritme rilis Anthropic dan pernyataan publik:

Claude 4.6 Haiku diharapkan melengkapi keluarga model 4.6 sebagai opsi tercepat dan paling hemat biaya
Peningkatan model berlanjut melalui optimasi pasca-pelatihan — Anthropic secara historis merilis versi yang ditingkatkan dari model yang ada di antara rilis utama
Perluasan penggunaan tool — computer use, eksekusi kode, dan memori semuanya berkembang dari tahap beta ke kapabilitas siap produksi
Infrastruktur agen — Agent Teams (saat ini hanya untuk Opus) mungkin diperluas ke model tingkat Sonnet

Lintasan keluarga model Claude sudah jelas: setiap generasi memberikan performa yang jauh lebih baik dengan harga yang sama atau lebih rendah. Sonnet 4.6 yang mencapai performa mendekati Opus 4.5 dengan harga Sonnet adalah contoh terbaru dari pola ini.

Putusan

Claude Sonnet 4.6 adalah rekomendasi default untuk sebagian besar pengembang dan pembangun aplikasi pada 2026. Kombinasi dari 79.6% SWE-bench, $3/$15 per million tokens, 1M context window, dan adaptive extended thinking menciptakan model yang menangani 95%+ tugas dunia nyata dengan rasio biaya-performa terbaik yang tersedia.

Gunakan Opus 4.6 saat Anda membutuhkan kualitas absolut terbaik untuk pekerjaan yang kompleks dan berisiko tinggi. Gunakan GPT-5.4 saat Anda membutuhkan performa superior pada masalah rekayasa baru. Gunakan Sonnet 4.6 untuk hal lainnya — yang mana, bagi sebagian besar pengembang, adalah hampir sepanjang waktu.

Panduan Lengkap Claude Sonnet 4.6: Benchmarks, Pricing, Capabilities, dan Kapan Menggunakannya (2026)