Klíčové poznatky
Claude Sonnet 4.6 je nejefektivnější vysoce výkonný AI model dostupný v March 2026. Při ceně $3/$15 za million tokens dosahuje výsledků v benchmarku na dosah od modelů stojících 3-5x více — a vývojáři jej zvolili před vlastní předchozí vlajkovou lodí Anthropic Opus 4.5 v 59% případů. Ať už stavíte AI aplikace, používáte jej pro pomoc s kódováním nebo zpracováváte dokumenty ve velkém měřítku, Sonnet 4.6 představuje ideální rovnováhu mezi schopnostmi a cenou, které se žádný konkurent nevyrovná.
Claude Sonnet 4.6: Vše, co potřebujete vědět
Uvedení a postavení na trhu
Anthropic vydal Claude Sonnet 4.6 dne February 17, 2026. V rodině modelů Claude 4.6 zaujímá prostřední pozici:
| Model | Postavení na trhu | Ceny (Vstup/Výstup na M tokens) |
|---|---|---|
| Claude Opus 4.6 | Vlajková loď, nejvyšší schopnosti | Vyšší cenová úroveň |
| Claude Sonnet 4.6 | Nejlepší poměr cena-výkon | $3 / $15 |
| Claude Haiku 4.6 | Nejrychlejší, nejefektivnější | Nižší cenová úroveň |
Sonnet 4.6 je společností Anthropic popisován jako "kompletní upgrade dovedností modelu v oblasti kódování, používání počítače, uvažování v dlouhém kontextu, plánování agentů, designu a znalostní práce" — nejedná se o postupné zlepšování, ale o generační skok vpřed oproti Sonnet 4.5.
Ceny zůstávají identické s předchozím Sonnet 4.5, což z něj činí čistý upgrade schopností za stejnou cenu — což je na trhu AI modelů vzácný jev, kdy zlepšení výkonu obvykle doprovází zvýšení cen.
Benchmarky: Kompletní data
Benchmarky kódování
| Benchmark | Sonnet 4.6 | Opus 4.6 | GPT-5.4 | Poznámky |
|---|---|---|---|---|
| SWE-bench Verified | 79.6% | 80.8% | ~80% | Řešení reálných problémů na GitHub |
| SWE-bench Pro | — | ~45% | 57.7% | Náročnější neotřelé inženýrství |
| Terminal-Bench 2.0 | — | 65.4% | 75.1% | Autonomní kódování v terminálu |
Zdroj: Více agregátorů benchmarků
Výsledek 79.6% u Sonnet 4.6 v SWE-bench Verified jej řadí do rozmezí 1.2 procentního bodu od Opus 4.6 — vlajkového modelu, který stojí výrazně více. Pro drtivou většinu kódovacích úloh je tento rozdíl v praxi nepostřehnutelný.
Benchmarky obecné inteligence
| Benchmark | Sonnet 4.6 | Co měří |
|---|---|---|
| OSWorld | 72.5% | Používání počítače a úlohy na úrovni OS |
| ARC-AGI-2 | 58.3% | Řešení nových problémů (nárůst z 13.6%) |
| GDPval-AA | 1633 Elo | Kancelářské a administrativní úkoly |
| Finance Agent | 63.3% | Finanční analýza a uvažování |
Zdroj: Oznámení Anthropic, Digital Applied
Výsledek ARC-AGI-2 je nejpozoruhodnější: 4.3x zlepšení z 13.6% na 58.3%, což představuje největší nárůst v rámci jedné generace v tomto benchmarku u jakéhokoli AI modelu. ARC-AGI-2 testuje řešení nových problémů — schopnost identifikovat vzorce a aplikovat uvažování na problémy, které model nikdy předtím neviděl. To naznačuje zásadní zlepšení v schopnostech uvažování modelu Sonnet 4.6, nikoli pouze lepší trénovací data.
Data o preferencích vývojářů
Čísla z benchmarků vyprávějí část příběhu. Data o preferencích vývojářů doplňují zbytek:
- Vývojáři si zvolili Sonnet 4.6 před Sonnet 4.5 v 70% případů během testování Claude Code
- Vývojáři si zvolili Sonnet 4.6 před předchozí vlajkovou lodí Opus 4.5 v 59% případů
- Hlavní uváděné důvody: lepší dodržování instrukcí, méně překombinovaná řešení (overengineering), stručnější výstupy
Preference před Opus 4.5 je obzvláště působivá. Sonnet 4.6 — model střední úrovně — byl upřednostňován před nejdražším modelem předchozí generace. To odráží konzistentní vzorec ve vývoji AI, kde novější modely střední třídy často překonávají starší vlajkové lodě.
Ceny: Kompletní rozpis
API ceny
| Úroveň | Vstup | Výstup | Případ použití |
|---|---|---|---|
| Standard | $3/M tokens | $15/M tokens | Aplikace v reálném čase |
| Batch | $1.50/M tokens | $7.50/M tokens | Asynchronní zpracování, hromadné úlohy |
Zdroj: Cenová stránka Anthropic
Kolik to stojí v praxi
Aby byly ceny hmatatelné, zde jsou odhady nákladů v reálném světě na základě typických vzorců používání:
| Úloha | Přibližná cena |
|---|---|
| Revize PR o 500 řádcích | $0.02-0.05 |
| Generování nové funkce (více souborů) | $0.10-0.30 |
| Analýza celého codebase (50K řádků) | $0.50-1.50 |
| Náročný den kódování (8 hodin, aktivní používání) | $1-3 |
| Běh kódovacího agenta po dobu 1 hodiny | $2-8 |
| Dávkové zpracování 1,000 dokumentů | $5-20 |
Srovnání s konkurenčními modely
| Model | Vstup/M | Výstup/M | SWE-bench | Efektivita nákladů |
|---|---|---|---|---|
| Claude Sonnet 4.6 | $3 | $15 | 79.6% | Nejlepší poměr |
| Claude Opus 4.6 | Vyšší | Vyšší | 80.8% | Prémiové |
| GPT-5.4 | Různé | Různé | ~80% | Konkurenceschopné |
| DeepSeek V3 | ~$0.50 | ~$2 | Nižší | Nejlevnější |
Sonnet 4.6 nabízí nejlepší poměr cena-výkon, pokud započítáte skóre SWE-bench na utracený dolar. Opus 4.6 má o něco vyšší skóre, ale stojí výrazně více. GPT-5.4 je v některých benchmarcích konkurenceschopný, ale Sonnet 4.6 vítězí v SWE-bench Verified. DeepSeek V3 je dramaticky levnější, ale v benchmarcích kódování dosahuje výrazně nižších výsledků.
Ceny platforem
Pokud k Sonnet 4.6 přistupujete prostřednictvím produktů a nikoli přímo přes API:
| Platforma | Cena | Jak je Sonnet 4.6 k dispozici |
|---|---|---|
| Claude.ai Free | $0 | Omezený počet zpráv za den |
| Claude.ai Pro | $20/month | Rozšířené používání, priorita |
| Claude.ai Max | $100/month | Intenzivní používání, 5x limity Pro |
| Claude Code (Max) | $20/month | Zahrnuto v předplatném |
| Cursor Pro | $20/month | Dostupné přes credit pool |
| Amazon Bedrock | Platba za použití | Stejná cena za token |
| Google Vertex AI | Platba za použití | Stejná cena za token |
Detailní pohled na klíčové schopnosti
1. Rozšířené uvažování s adaptivním režimem
Rozšířené uvažování (extended thinking) umožňuje modelu Sonnet 4.6 promýšlet složité problémy krok za krokem před vygenerováním odpovědi. Adaptivní režim, novinka ve verzi 4.6, automaticky upravuje hloubku uvažování na základě složitosti úkolu:
- Jednoduché otázky (definice, vyhledávání faktů): Rychlá odpověď s minimálním uvažováním
- Středně náročné úkoly (generování kódu, shrnutí): Krátký řetězec uvažování pro strukturu
- Složité uvažování (vícekroková matematika, architektonická rozhodnutí, ladění): Hluboké uvažování s rozsáhlým řetězcem myšlenek (chain-of-thought)
Tento adaptivní přístup eliminuje potřebu ručně přepínat uvažování pro různé úkoly. Předchozí modely vyžadovaly, aby vývojáři explicitně povolili rozšířené uvažování, což často vedlo k plýtvání tokens u jednoduchých dotazů nebo k nedostatečnému uvažování u těch těžkých.
V praxi: Rozšířené uvažování je nejcennější pro ladění složitých problémů, architektonická rozhodnutí a vícekrokové generování kódu, kde model musí zvážit omezení napříč více soubory. Pro jednoduché doplňování kódu nebo rychlé otázky a odpovědi je režie díky adaptivnímu režimu zanedbatelná.
2. Kontextové okno 1M tokens
Sonnet 4.6 podporuje kontextové okno o velikosti 1M tokens — nyní obecně dostupné bez nutnosti beta verze. To je přibližně:
- 3-4 miliony znaků
- 75,000 řádků kódu
- 15-20 průměrně velkých codebase
- 4-5 románů v plné délce
Díky tomu je Sonnet 4.6 prvním modelem třídy Sonnet, který podporuje analýzu celého codebase v rámci jednoho promptu. Dříve nabízely takto velká kontextová okna pouze modely úrovně Opus.
Praktické důsledky:
- Načtení celých codebase mikroslužeb pro ladění napříč soubory
- Analýza kompletních sad dokumentace pro technické psaní
- Zpracování celých sad smluv pro právní revizi
- Porovnání více velkých dokumentů současně
Úvaha o nákladech: Prompt s plnými 1M tokens stojí $3 jen za vstupní tokens. Pro většinu úkolů nepotřebujete plný kontext — načtení 50K-200K tokens pokryje drtivou většinu případů použití při ceně $0.15-0.60 za prompt.
3. Vylepšené schopnosti kódování
Na základě výsledku 79.6% v SWE-bench a dat o preferencích vývojářů přináší Sonnet 4.6 měřitelná zlepšení v:
- Uvažování napříč více soubory: Pochopení toho, jak změny v jednom souboru ovlivňují ostatní soubory v celém projektu
- Dodržování instrukcí: Přesnější dodržování pokynů pro kódování, stylových konvencí a specifických požadavků
- Méně překombinování (overengineering): Generování jednoduššího a lépe udržovatelného kódu namísto nadměrně abstrahovaných řešení
- Zpracování chyb: Lepší identifikace a ošetření okrajových případů v generovaném kódu
- Generování testů: Komplexnější pokrytí testy se smysluplnými asercemi
4. Computer Use (Beta)
Sonnet 4.6 může interagovat s počítačovými rozhraními — klikat na tlačítka, vyplňovat formuláře, procházet aplikace a pořizovat snímky obrazovky. Skóre v benchmarku OSWorld 72.5% odráží skutečné schopnosti v této oblasti, i když zůstává v beta verzi.
Případy použití zahrnují: automatizované testování UI, zadávání dat napříč aplikacemi, web scraping s interakcí a automatizaci desktopových aplikací.
5. Obecně dostupná práce s nástroji (Tool Use)
Několik funkcí, které byly dříve v beta verzi, jsou nyní se Sonnet 4.6 obecně dostupné (GA):
- Web search a web fetch: Claude může prohledávat internet a získávat webový obsah
- Code execution: Sandboxed prostředí pro spouštění a testování kódu
- Memory tool: Uchovává informace napříč konverzacemi
- Zpracování souborů: Nahrávání a analýza souborů přímo
Tyto GA funkce umožňují schopnější agentní workflow, kde Sonnet 4.6 může nezávisle provádět výzkum, kódovat, testovat a iterovat — bez nutnosti lidského zásahu v každém kroku.
Sonnet 4.6 vs. Opus 4.6: Který si vybrat
Toto je nejčastější otázka, které vývojáři čelí při výběru modelu Claude. Zde je odpověď podložená daty:
| Dimenze | Sonnet 4.6 | Opus 4.6 | Vítěz |
|---|---|---|---|
| SWE-bench Verified | 79.6% | 80.8% | Opus (minimálně) |
| Cena (vstup/M) | $3 | Vyšší | Sonnet |
| Cena (výstup/M) | $15 | Vyšší | Sonnet |
| Kontextové okno | 1M tokens | 1M tokens | Nerozhodně |
| Rozšířené uvažování | Ano (adaptivní) | Ano | Nerozhodně |
| Agent Teams | Ne | Ano | Opus |
| Preference vývojářů (vs Opus 4.5) | 59% preferovalo | — | Sonnet |
| Rychlost | Rychlejší | Pomalejší | Sonnet |
Zvolte Sonnet 4.6, když:
- Záleží na nákladech. Sonnet poskytuje 98.5% skóre SWE-bench modelu Opus za zlomek ceny. Pro většinu kódovacích úloh je rozdíl v kvalitě nepostřehnutelný.
- Záleží na rychlosti. Sonnet generuje odpovědi rychleji než Opus, což je důležité pro interaktivní kódování.
- Stavíte aplikace. U produktů poháněných API, kde platíte za token ve velkém měřítku, se nižší náklady modelu Sonnet promítají do významných úspor.
- Standardní kódovací úlohy. Implementace funkcí, opravy chyb, revize kódu, generování testů, dokumentace — Sonnet zvládá toto vše v kvalitě blízké Opus.
Zvolte Opus 4.6, když:
- Maximální přesnost u složitých problémů. Pro skutečně náročné uvažování napříč soubory v codebase s více než 100 soubory představuje oněch 1.2% v SWE-bench smysluplný rozdíl v kvalitě.
- Agent Teams. Pokud potřebujete paralelní koordinaci agentů — více AI agentů pracujících současně na různých částech codebase — je vyžadován Opus.
- Nová architektonická rozhodnutí. Při provádění jednorázových, vysoce důležitých technických rozhodnutí ospravedlňuje mírné zlepšení kvality vyšší náklady.
- Intenzivně používáte Claude Code. Pokud je Claude Code vaším hlavním vývojovým nástrojem a máte tarif Max, stojí používání Opus v rámci předplatného stejně jako Sonnet.
Praktická odpověď
Většina vývojářů by měla standardně používat Sonnet 4.6 a na Opus 4.6 přecházet pouze u specifických těžkých problémů. V testování Claude Code vývojáři upřednostňovali Sonnet 4.6 před Sonnet 4.5 v 70% případů — což znamená, že i v rámci vlastního testování společnosti Anthropic je model střední třídy preferovaným nástrojem pro každodenní práci.
Sonnet 4.6 vs. GPT-5.4: Přímé srovnání
| Dimenze | Sonnet 4.6 | GPT-5.4 | Vítěz |
|---|---|---|---|
| SWE-bench Verified | 79.6% | ~80% | Nerozhodně |
| SWE-bench Pro | — | 57.7% | GPT-5.4 |
| Terminal-Bench 2.0 | — | 75.1% | GPT-5.4 |
| OSWorld | 72.5% | — | Sonnet (automaticky) |
| ARC-AGI-2 | 58.3% | — | Sonnet (automaticky) |
| Cena (vstup/M) | $3 | Různé | Srovnatelné |
| Kontextové okno | 1M | 1M (Pro) | Nerozhodně |
Detailní odpověď: GPT-5.4 je silnější v řešení nových inženýrských problémů (SWE-bench Pro) a autonomním kódování v terminálu (Terminal-Bench 2.0). Sonnet 4.6 je silnější v běžných kódovacích úlohách (SWE-bench Verified) a rozpoznávání nových vzorců (ARC-AGI-2). Mnoho profesionálních vývojářů používá oba: GPT-5.4 pro prototypování a nové problémy, Sonnet 4.6 nebo Opus 4.6 pro hloubkové kódování ve více souborech a analýzu velkých codebase.
Osvědčené postupy pro používání Sonnet 4.6
Pro vývojáře využívající API
-
Používejte Batch API pro úlohy mimo reálný čas. Při 50% standardní ceny ($1.50/$7.50 na M tokens) je dávkové zpracování dramaticky levnější pro úkoly, které snesou asynchronní zpracování.
-
Přizpůsobte velikost kontextu. Prompt s plnými 1M tokens stojí $3 za vstupní tokens. Většina úkolů vyžaduje 10K-100K tokens kontextu. Buďte selektivní v tom, co zahrnete.
-
Využívejte rozšířené uvažování pro těžké problémy. Adaptivní režim to řeší automaticky, ale u kritických rozhodnutí můžete explicitně požádat o hlubší uvažování.
-
Cacheujte opakující se kontext. Pokud posíláte stejný kontext codebase v rámci více požadavků, caching promptů od Anthropic může snížit vstupní náklady až o 90%.
Pro uživatele Claude Code
-
Pro každodenní práci používejte Sonnet 4.6. Na Opus 4.6 přepínejte pouze u složitých problémů zahrnujících více souborů, kde na kvalitě záleží více než na rychlosti.
-
Používejte rozšířené uvažování pro architektonická rozhodnutí. Při plánování nové funkce nebo refaktorování nechte model hluboce přemýšlet, než vygeneruje kód.
-
Využívejte 1M kontextové okno. Načtěte celý svůj codebase pro ladění napříč soubory, místo abyste soubory vkládali jeden po druhém.
Pro tvůrce produktů
-
Začněte se Sonnet 4.6, upgradujte selektivně. Postavte svou aplikaci na Sonnet 4.6 a pouze specifické náročné dotazy směrujte na Opus 4.6.
-
Používejte strukturované výstupy. Zlepšené dodržování instrukcí u modelu Sonnet 4.6 jej činí spolehlivějším pro generování JSON/strukturovaných výstupů.
-
Testujte s reálnými daty. Výsledky benchmarků jsou průměry — váš konkrétní případ použití může favorizovat jeden model nad druhým. Spusťte A/B testy se svými skutečnými daty.
Vývoj aplikací se Sonnet 4.6
Kombinace silných schopností kódování, rozumné ceny a 1M kontextového okna činí ze Sonnet 4.6 vynikající základ pro AI aplikace. Ať už stavíte asistenta pro kódování, analyzátor dokumentů nebo automatizované workflow, model efektivně zvládá vrstvu inteligence.
Pro samotnou aplikační vrstvu — frontend, backend, databázi a infrastrukturu pro nasazení — mohou nástroje jako ZBuild výrazně urychlit vývoj. Místo kódování každé CRUD operace a administrátorského panelu od nuly se vizuální tvůrce aplikací postará o standardní vzorce, zatímco Sonnet 4.6 pohání AI funkce. Tato kombinace umožňuje nezávislým vývojářům a malým týmům dodávat AI produkty rychleji než kterýkoli z těchto přístupů samostatně.
Co čeká modely Claude příště
Na základě tempa vydávání Anthropic a veřejných prohlášení:
- Claude 4.6 Haiku má doplnit rodinu modelů 4.6 jako nejrychlejší a nejefektivnější varianta
- Zlepšování modelů pokračuje prostřednictvím optimalizace po tréninku — Anthropic v minulosti vydával vylepšené verze stávajících modelů mezi hlavními verzemi
- Rozšířené používání nástrojů — používání počítače, spouštění kódu a paměť se vyvíjejí z beta verze do schopností připravených pro produkci
- Infrastruktura agentů — Agent Teams (aktuálně pouze pro Opus) se mohou rozšířit i na modely úrovně Sonnet
Trajektorie rodiny modelů Claude je jasná: každá generace přináší výrazně lepší výkon za stejnou nebo nižší cenu. Dosažení výkonu blízkého Opus 4.5 modelem Sonnet 4.6 za ceny Sonnet je nejnovějším příkladem tohoto vzorce.
Verdikt
Claude Sonnet 4.6 je výchozím doporučením pro většinu vývojářů a tvůrců aplikací v 2026. Kombinace 79.6% v SWE-bench, ceny $3/$15 za million tokens, 1M kontextového okna a adaptivního rozšířeného uvažování vytváří model, který zvládne 95%+ reálných úkolů při nejlepším dostupném poměru cena-výkon.
Opus 4.6 používejte, když potřebujete absolutně nejlepší kvalitu pro složitou práci s vysokými sázkami. GPT-5.4 používejte, když potřebujete špičkový výkon u nových inženýrských problémů. Pro vše ostatní používejte Sonnet 4.6 — což je pro většinu vývojářů většinu času.
Zdroje
- Introducing Claude Sonnet 4.6 - Anthropic
- What's New in Claude 4.6 - Claude API Docs
- Claude Pricing - Anthropic
- Claude Sonnet 4.6 Benchmarks & Pricing Guide - Digital Applied
- Claude Sonnet 4.6 in Production - Caylent
- Claude Sonnet 4.6 API Pricing - PricePerToken
- Claude Sonnet 4.6 Specs - Galaxy.ai
- Claude Sonnet 4.6 Performance Analysis - Artificial Analysis
- Claude Sonnet 4.6 Review - Eesel
- Claude Sonnet 4.6 Review - Medium
- Extended Thinking Deep Dive - Medium
- Claude Sonnet 4.6 Coding Skills - InfoWorld
- Claude Sonnet 4.6 Review - ComputerTech
- GPT-5.4 vs Claude Opus 4.6 - Portkey
- Building with Extended Thinking - Claude API Docs
- Claude Sonnet 4.6 Specs - UCStrategies