Mi az a Claude Sonnet 4.6 és mikor jelent meg?

A Claude Sonnet 4.6 az Anthropic középkategóriás AI modellje, amely 2026. február 17-én jelent meg. 79.6%-ot ért el a SWE-bench Verified teszten és 72.5%-ot az OSWorld-ön, az ára $3/$15 millió tokenenként (input/output), és támogatja az 1M token context window-t. A fejlesztők az esetek 59%-ában ezt választották a korábbi csúcsmodell, az Opus 4.5 helyett.

Mennyibe kerül a Claude Sonnet 4.6?

A standard API árazás $3 millió input tokenenként és $15 millió output tokenenként. A Batch API árazás 50%-kal olcsóbb, $1.50/$7.50 millió tokenenként. A Claude Code Max plan előfizetésben ($20/hó) a Sonnet 4.6 benne van a csomagban. Egy intenzív kódolással töltött nap a Sonnet 4.6 használatával API-n keresztül körülbelül $1-3-ba kerül.

Hogyan viszonyul a Claude Sonnet 4.6 az Opus 4.6-hoz?

A Sonnet 4.6 79.6%-ot ért el a SWE-bench teszten (ami 1.2%-on belül van az Opus 4.6 80.8%-os eredményéhez képest), miközben lényegesen kevesebbe kerül — $3/$15 az Opus magasabb árazásával szemben. A fejlesztők az esetek 59%-ában jobban kedvelték a Sonnet 4.6-ot az Opus 4.5-nél. Az Opus 4.6 továbbra is jobb a komplex, több fájlt érintő érveléshez és az Agent Teams feladatokhoz, de a Sonnet 4.6 kínálja a legjobb ár-érték arányt a Claude családban.

Mi az az extended thinking a Claude Sonnet 4.6-ban?

Az extended thinking lehetővé teszi a Sonnet 4.6 számára, hogy lépésről lépésre végiggondolja a komplex problémákat a válaszadás előtt. A 4.6-ban újdonságnak számító adaptive mode automatikusan módosítja a gondolkodási mélységet a feladat bonyolultsága alapján — az egyszerű kérdésekre gyors választ ad, míg a komplex érvelés mélyebb gondolati láncokat indít el. Ez javítja a pontosságot a matematikai, logikai és több lépésből álló kódolási feladatoknál.

Képes a Claude Sonnet 4.6 egy teljes kódbázist kezelni egyetlen promptban?

Igen. A Sonnet 4.6 támogatja az 1M token context window-t (általánosan elérhető, nincs szükség béta fejlécre), ami nagyjából 3-4 millió karaktert vagy körülbelül 75 000 sornyi kódot jelent. Ez teszi az első Sonnet-osztályú modellé, amely képes egy teljes kódbázis elemzésére egyetlen promptban.

Fő megállapítás

A Claude Sonnet 4.6 a legköltséghatékonyabb nagy teljesítményű AI modell, amely March 2026-ban elérhető. $3/$15 per millió tokens áron olyan benchmark pontszámokat nyújt, amelyek karnyújtásnyira vannak a 3-5x drágább modellekétől — a fejlesztők pedig az Anthropic saját korábbi zászlóshajójával, az Opus 4.5-tel szemben 59%-ban ezt választották. Akár AI-alapú alkalmazásokat épít, akár kódolási segítségre használja, vagy dokumentumokat dolgoz fel nagy mennyiségben, a Sonnet 4.6 megtalálja azt az ideális egyensúlyt a képességek és a költségek között, amelyet egyetlen versenytárs sem tud felülmúlni.

Claude Sonnet 4.6: Minden, amit tudni érdemes

Megjelenés és pozicionálás

Az Anthropic February 17, 2026-án jelentette meg a Claude Sonnet 4.6-ot. Ez a modell a Claude 4.6 modellcsalád középső tagja:

Modell	Pozicionálás	Árazás (Input/Output per M tokens)
Claude Opus 4.6	Zászlóshajó, legmagasabb képességek	Magasabb árazási kategória
Claude Sonnet 4.6	Legjobb ár-teljesítmény arány	$3 / $15
Claude Haiku 4.6	Leggyorsabb, legköltséghatékonyabb	Alacsonyabb árazási kategória

Az Anthropic a Sonnet 4.6-ot úgy jellemezte, mint a "modell képességeinek teljes körű frissítését a kódolás, a computer use, a long-context reasoning, az agent planning, a design és a szellemi munka területén" — nem csupán egy fokozatos javulásról, hanem generációs ugrásról van szó a Sonnet 4.5-höz képest.

Az árazás megegyezik a korábbi Sonnet 4.5-tel, így ez egy tiszta képességbeli frissítés változatlan költségek mellett — ami ritka jelenség az AI modellek piacán, ahol a teljesítmény javulása általában áremeléssel jár.

Benchmarks: A teljes adatsor

Kódolási benchmarkok

Benchmark	Sonnet 4.6	Opus 4.6	GPT-5.4	Megjegyzések
SWE-bench Verified	79.6%	80.8%	~80%	Valós GitHub issue feloldás
SWE-bench Pro	—	~45%	57.7%	Nehezebb újszerű mérnöki feladatok
Terminal-Bench 2.0	—	65.4%	75.1%	Autonóm terminál kódolás

Forrás: Több benchmark aggregátor

A Sonnet 4.6 79.6%-os eredménye a SWE-bench Verified teszten 1.2 százalékponton belül helyezi el az Opus 4.6-hoz képest — amely a lényegesen drágább zászlóshajó modell. A kódolási feladatok túlnyomó többségénél ez a különbség a gyakorlatban észrevehetetlen.

Általános intelligencia benchmarkok

Benchmark	Sonnet 4.6	Mit mér?
OSWorld	72.5%	Computer use és OS-szintű feladatok
ARC-AGI-2	58.3%	Újszerű problémamegoldás (13.6%-ról indulva)
GDPval-AA	1633 Elo	Irodai és adminisztratív feladatok
Finance Agent	63.3%	Pénzügyi elemzés és következtetés

Forrás: Anthropic bejelentés, Digital Applied

Az ARC-AGI-2 eredmény a legfigyelemreméltóbb: 4.3x-os javulás 13.6%-ról 58.3%-ra, ami az eddigi legnagyobb egyetlen generáció alatt elért növekedés ezen a benchmarkon bármely AI modell esetében. Az ARC-AGI-2 az újszerű problémamegoldást teszteli — azt a képességet, hogy a modell felismer-e mintákat és alkalmaz-e logikai következtetéseket olyan problémákon, amelyeket korábban soha nem látott. Ez a Sonnet 4.6 érvelési képességeinek alapvető fejlődésére utal, nem csupán jobb tanítóadatokra.

Fejlesztői preferencia adatok

A benchmark számok csak a történet egy részét mesélik el. A fejlesztői preferencia adatok adják meg a többit:

A fejlesztők a Sonnet 4.6-ot választották a Sonnet 4.5-tel szemben az esetek 70%-ában a Claude Code tesztelése során.
A fejlesztők a Sonnet 4.6-ot választották a korábbi zászlóshajó Opus 4.5-tel szemben az esetek 59%-ában.
A megnevezett fő okok: pontosabb utasításkövetés, kevesebb túlbonyolítás (overengineering), tömörebb kimenetek.

Az Opus 4.5-tel szembeni preferencia különösen feltűnő. A Sonnet 4.6 — a középszintű modell — népszerűbb volt, mint az előző generáció legdrágább modellje. Ez egy konzisztens mintát tükröz az AI fejlesztésben, ahol az újabb középszintű modellek gyakran felülmúlják a régebbi zászlóshajókat.

Árazás: Teljes részletezés

API árazás

Kategória	Input	Output	Felhasználási mód
Standard	$3/M tokens	$15/M tokens	Valós idejű alkalmazások
Batch	$1.50/M tokens	$7.50/M tokens	Aszinkron feldolgozás, tömeges feladatok

Forrás: Anthropic pricing page

Mit jelent ez a költségek terén a gyakorlatban

Hogy az árazás kézzelfogható legyen, íme a valós használati mintákon alapuló becsült költségek:

Feladat	Hozzávetőleges költség
Egy 500 soros PR áttekintése	$0.02-0.05
Új funkció generálása (több fájlos)	$0.10-0.30
Teljes codebase elemzése (50K sor)	$0.50-1.50
Aktív kódolással töltött nap (8 óra)	$1-3
Egy coding agent futtatása 1 órán át	$2-8
1,000 dokumentum batch feldolgozása	$5-20

Összehasonlítás a konkurens modellekkel

Modell	Input/M	Output/M	SWE-bench	Költséghatékonyság
Claude Sonnet 4.6	$3	$15	79.6%	Legjobb arány
Claude Opus 4.6	Magasabb	Magasabb	80.8%	Prémium
GPT-5.4	Változó	Változó	~80%	Versenyképes
DeepSeek V3	~$0.50	~$2	Alacsonyabb	Legolcsóbb

A Sonnet 4.6 kínálja a legjobb költség-teljesítmény arányt, ha az elköltött dolláronkénti SWE-bench pontszámot nézzük. Az Opus 4.6 minimálisan magasabb pontszámot ér el, de jelentősen többe kerül. A GPT-5.4 versenyképes bizonyos benchmarkokon, de a Sonnet 4.6 győz a SWE-bench Verified teszten. A DeepSeek V3 drasztikusan olcsóbb, de érdemben gyengébb eredményt ér el a kódolási benchmarkokon.

Platform árazás

Ha a Sonnet 4.6-ot termékeken keresztül éri el, nem közvetlenül az API használatával:

Platform	Költség	Hogyan érhető el a Sonnet 4.6
Claude.ai Free	$0	Korlátozott napi üzenetszám
Claude.ai Pro	$20/month	Kibővített használat, prioritás
Claude.ai Max	$100/month	Intenzív használat, a Pro korlát 5x-öse
Claude Code (Max)	$20/month	A feliratkozás része
Cursor Pro	$20/month	Credit pool-on keresztül érhető el
Amazon Bedrock	Használat alapú	Ugyanaz a per-token árazás
Google Vertex AI	Használat alapú	Ugyanaz a per-token árazás

Főbb képességek részletes elemzése

1. Extended Thinking az Adaptive Mode segítségével

Az extended thinking lehetővé teszi a Sonnet 4.6 számára, hogy lépésről lépésre végiggondolja a komplex problémákat a válasz generálása előtt. A 4.6-ban újdonságként bevezetett adaptive mode automatikusan beállítja a gondolkodás mélységét a feladat bonyolultsága alapján:

Egyszerű kérdések (definíciók, tények keresése): Gyors válasz minimális gondolkodással.
Közepes feladatok (kódgenerálás, összegzés): Rövid gondolkodási lánc a struktúra felépítéséhez.
Komplex érvelés (többlépcsős matek, architektúrális döntések, debugging): Mély gondolkodás kiterjedt chain-of-thought folyamattal.

Ez az adaptív megközelítés feleslegessé teszi a gondolkodási funkció manuális kapcsolgatását a különböző feladatokhoz. A korábbi modellek megkövetelték a fejlesztőktől az extended thinking kifejezett engedélyezését, ami gyakran felesleges tokens pazarláshoz vezetett egyszerű kérdéseknél, vagy elégtelen érveléshez a nehéz feladatoknál.

A gyakorlatban: Az extended thinking leginkább komplex hibák keresésekor (debugging), architektúrális döntéseknél és többlépcsős kódgenerálásnál értékes, ahol a modellnek több fájlra kiterjedő korlátokat kell figyelembe vennie. Egyszerű kódkiegészítések vagy gyors kérdezz-felelek esetén a többletköltség elhanyagolható az adaptive mode-nak köszönhetően.

2. 1M Token Context Window

A Sonnet 4.6 támogatja az 1M tokenes context window-t — amely immár általánosan elérhető, beta jelzés nélkül. Ez körülbelül:

3-4 millió karakter
75,000 sornyi kód
15-20 átlagos hosszúságú codebase
4-5 teljes terjedelmű regény

Ez teszi a Sonnet 4.6-ot az első Sonnet-osztályú modellé, amely támogatja a teljes codebase elemzését egyetlen promptban. Korábban csak az Opus-szintű modellek kínáltak ekkora context window-t.

Gyakorlati jelentőség:

Teljes microservice kódalapok betöltése fájlokon átívelő hibakereséshez.
Teljes dokumentációs készletek elemzése technikai szövegíráshoz.
Teljes szerződéscsomagok feldolgozása jogi átvilágításhoz.
Több nagy dokumentum egyidejű összehasonlítása.

Költségek figyelembevétele: Egy teljes 1M tokenes prompt önmagában $3-ba kerül az input tokens költségei miatt. A legtöbb feladathoz nincs szükség a teljes kontextusra — 50K-200K tokens betöltése a használati esetek túlnyomó többségét lefedi, prompteként $0.15-0.60 áron.

3. Továbbfejlesztett kódolási képességek

A SWE-bench 79.6%-os eredménye és a fejlesztői preferencia adatok alapján a Sonnet 4.6 mérhető javulást mutat az alábbi területeken:

Több fájlos érvelés: Megérti, hogy az egyik fájlban végrehajtott módosítások hogyan érintik a projekt többi fájlját.
Utasításkövetés: Precízebb betartása a kódolási irányelveknek, stíluskonvencióknak és specifikus követelményeknek.
Kevesebb túlbonyolítás: Egyszerűbb, könnyebben karbantartható kódot generál a túlságosan absztrakt megoldások helyett.
Hibakezelés: Az edge case-ek jobb azonosítása és kezelése a generált kódban.
Tesztgenerálás: Átfogóbb tesztlefedettség értelmes assertion-ökkel.

4. Computer Use (Beta)

A Sonnet 4.6 képes interakcióba lépni számítógépes felületekkel — gombokra kattintani, űrlapokat kitölteni, alkalmazásokban navigálni és screenshotokat készíteni. A 72.5%-os OSWorld benchmark pontszám valódi képességet tükröz ezen a területen, bár a funkció továbbra is beta fázisban van.

Felhasználási területek: automatizált UI tesztelés, adatbevitel alkalmazások között, web scraping interakcióval és asztali alkalmazások automatizálása.

5. Általánosan elérhető Tool Use

Számos korábban beta fázisban lévő képesség vált általánosan elérhetővé a Sonnet 4.6-tal:

Web search és web fetch: A Claude képes keresni az interneten és lekérni webes tartalmakat.
Code execution: Sandboxed környezet kódok futtatásához és teszteléséhez.
Memory tool: Információkat őriz meg a beszélgetések között.
Fájlkezelés: Fájlok közvetlen feltöltése és elemzése.

Ezek a GA (General Availability) funkciók képessé teszik az agent jellegű munkafolyamatokat, ahol a Sonnet 4.6 önállóan tud kutatni, kódolni, tesztelni és iterálni — anélkül, hogy minden lépésnél emberi beavatkozásra lenne szükség.

Sonnet 4.6 vs. Opus 4.6: Melyiket válasszuk

Ez a leggyakoribb kérdés, amivel a fejlesztők szembesülnek a Claude modell kiválasztásakor. Íme az adatvezérelt válasz:

Dimenzió	Sonnet 4.6	Opus 4.6	Győztes
SWE-bench Verified	79.6%	80.8%	Opus (minimálisan)
Ár (input/M)	$3	Magasabb	Sonnet
Ár (output/M)	$15	Magasabb	Sonnet
Context window	1M tokens	1M tokens	Döntetlen
Extended thinking	Igen (adaptív)	Igen	Döntetlen
Agent Teams	Nem	Igen	Opus
Fejlesztői preferencia (vs Opus 4.5)	59% preferálta	—	Sonnet
Sebesség	Gyorsabb	Lassabb	Sonnet

Válassza a Sonnet 4.6-ot, ha:

Számít a költség. A Sonnet az Opus SWE-bench pontszámának 98.5%-át nyújtja a költségek töredékéért. A legtöbb kódolási feladatnál a minőségbeli különbség észrevehetetlen.
Számít a sebesség. A Sonnet gyorsabban generál válaszokat, mint az Opus, ami fontos az interaktív kódolási folyamatoknál.
Alkalmazásokat épít. Olyan API-alapú termékeknél, ahol nagy mennyiségben fizet a tokens használatért, a Sonnet alacsonyabb ára jelentős megtakarítást eredményez.
Standard kódolási feladatok. Funkciók implementálása, hibajavítások, kódátnézés, tesztgenerálás, dokumentáció — a Sonnet mindezt az Opus-hoz közeli minőségben végzi el.

Válassza az Opus 4.6-ot, ha:

Maximális pontosságra van szükség komplex problémáknál. Valóban nehéz, 100+ fájlos kódalapokon átívelő érvelésnél a SWE-bench-en elért extra 1.2% érdemi minőségi különbséget jelenthet.
Agent Teams. Ha párhuzamos agent koordinációra van szüksége — ahol több AI agent dolgozik egyszerre a codebase különböző részein —, az Opus szükséges.
Újszerű architektúrális döntések. Amikor egyszeri, nagy téttel bíró technikai döntéseket hoz, a minimális minőségi javulás igazolja a magasabb költséget.
Intenzíven használja a Claude Code-ot. Ha a Claude Code az elsődleges fejlesztői eszköze és a Max előfizetést használja, az Opus használata ugyanannyiba kerül, mint a Sonneté az előfizetésen belül.

A gyakorlati válasz

A legtöbb fejlesztőnek érdemes az alapértelmezettnek a Sonnet 4.6-ot tekintenie, és csak specifikus, nehéz problémák esetén váltani az Opus 4.6-ra. A Claude Code tesztelése során a fejlesztők 70%-ban a Sonnet 4.6-ot választották a Sonnet 4.5-tel szemben — ami azt jelenti, hogy még az Anthropic saját tesztjeiben is a középszintű modell a preferált napi munkaeszköz.

Sonnet 4.6 vs. GPT-5.4: Összecsapás

Dimenzió	Sonnet 4.6	GPT-5.4	Győztes
SWE-bench Verified	79.6%	~80%	Döntetlen (hibahatáron belül)
SWE-bench Pro	—	57.7%	GPT-5.4
Terminal-Bench 2.0	—	75.1%	GPT-5.4
OSWorld	72.5%	—	Sonnet (alapértelmezés szerint)
ARC-AGI-2	58.3%	—	Sonnet (alapértelmezés szerint)
Ár (input/M)	$3	Változó	Összemérhető
Context window	1M	1M (Pro)	Döntetlen

Forrás: Portkey összehasonlítás

Az árnyalt válasz: A GPT-5.4 erősebb az újszerű mérnöki problémákban (SWE-bench Pro) és az autonóm terminál kódolásban (Terminal-Bench 2.0). A Sonnet 4.6 erősebb a standard kódolási feladatokban (SWE-bench Verified) és az újszerű mintafelismerésben (ARC-AGI-2). Sok professzionális fejlesztő mindkettőt használja: GPT-5.4-et a prototípus készítéshez és az újszerű problémákhoz, Sonnet 4.6-ot vagy Opus 4.6-ot pedig a mély, több fájlos kódoláshoz és a nagy kódalapok elemzéséhez.

Legjobb gyakorlatok a Sonnet 4.6 használatához

API fejlesztőknek

Használja a Batch API-t a nem valós idejű feladatokhoz. A standard ár 50%-áért ($1.50/$7.50 per M tokens), a batch feldolgozás drasztikusan olcsóbb az olyan feladatoknál, amelyek elviselik az aszinkron feldolgozást.
Méretezze megfelelően a kontextust. Egy teljes 1M tokenes prompt $3-ba kerül csak az input tokens miatt. A legtöbb feladathoz elegendő a 10K-100K tokens kontextus. Legyen szelektív azzal kapcsolatban, hogy mit tesz bele.
Használja az extended thinking-et a nehéz problémákhoz. Az adaptive mode ezt automatikusan kezeli, de a kritikus döntéseknél kifejezetten kérhet mélyebb érvelést.
Gyorsítótárazza az ismétlődő kontextust. Ha ugyanazt a codebase kontextust küldi el több kérésben, az Anthropic prompt caching funkciója akár 90%-kal is csökkentheti az input költségeket.

Claude Code felhasználóknak

Használja alapértelmezettként a Sonnet 4.6-ot a napi munkához. Csak olyan komplex, több fájlt érintő problémáknál váltson az Opus 4.6-ra, ahol a minőség fontosabb a sebességnél.
Alkalmazza az extended thinking-et architektúrális döntéseknél. Új funkció tervezésekor vagy refaktorálásnál hagyja, hogy a modell mélyen átgondolja a feladatot a kódgenerálás előtt.
Használja ki az 1M-es context window-t. Töltse be a teljes kódalapot a fájlokon átívelő hibakeresési munkamenetekhez, ahelyett, hogy fájlonként adagolná az információkat.

Termékfejlesztőknek

Kezdje a Sonnet 4.6-tal, és szelektíven váltson magasabb szintre. Építse az alkalmazását Sonnet 4.6-ra, és csak a specifikus, nehéz lekérdezéseket irányítsa az Opus 4.6-hoz.
Használjon strukturált kimeneteket. A Sonnet 4.6 továbbfejlesztett utasításkövetése megbízhatóbbá teszi a JSON/strukturált kimenetek generálását.
Teszteljen valós adatokkal. A benchmark pontszámok átlagok — az Ön specifikus felhasználási esete kedvezhet az egyik modellnek a másikkal szemben. Végezzen A/B teszteket saját adataival.

Alkalmazások építése a Sonnet 4.6 használatával

A Sonnet 4.6 az erős kódolási képesség, a kedvező árazás és az 1M-es context window kombinációjának köszönhetően kiváló alapja az AI-alapú alkalmazásoknak. Akár kódolási asszisztenst, dokumentumelemzőt vagy automatizált munkafolyamatot épít, a modell hatékonyan kezeli az intelligencia réteget.

Magához az alkalmazási réteghez — a frontend, backend, adatbázis és a deployment infrastruktúrához — az olyan eszközök, mint a ZBuild, jelentősen felgyorsíthatják a fejlesztést. Ahelyett, hogy minden CRUD műveletet és admin panel-t a semmiből kódolna, egy vizuális app builder kezeli a standard mintákat, miközben a Sonnet 4.6 az AI funkciókat működteti. Ez a kombináció lehetővé teszi a solo fejlesztők és kis csapatok számára, hogy gyorsabban adjanak ki AI-alapú termékeket, mint bármelyik megközelítés önmagában.

Mi várható a Claude modellek terén

Az Anthropic kiadási ütemterve és nyilvános nyilatkozatai alapján:

A Claude 4.6 Haiku várhatóan teljessé teszi a 4.6 modellcsaládot a leggyorsabb és legköltséghatékonyabb opcióként.
Modellfejlesztések folytatódnak a post-training optimalizáción keresztül — az Anthropic korábban is adott ki javított verziókat a főbb verziók között.
Kibővített tool use — a computer use, a code execution és a memory funkciók mind a béta állapotból a produkciós szintű képességek felé fejlődnek.
Agent infrastruktúra — Az Agent Teams (jelenleg csak Opus-exkluzív) kiterjedhet a Sonnet-szintű modellekre is.

A Claude modellcsalád pályája egyértelmű: minden generáció érdemben jobb teljesítményt nyújt azonos vagy alacsonyabb áron. A Sonnet 4.6, amely közel Opus 4.5 szintű teljesítményt ér el Sonnet árazás mellett, a legújabb példa erre a mintára.

Végszó

A Claude Sonnet 4.6 az alapértelmezett ajánlás a legtöbb fejlesztő és alkalmazásépítő számára 2026-ban. A 79.6%-os SWE-bench, a $3/$15 per millió tokens ár, az 1M-es context window és az adaptive extended thinking olyan modellt alkot, amely a valós feladatok több mint 95%-át a legjobb elérhető ár-teljesítmény aránnyal kezeli.

Használja az Opus 4.6-ot, ha a létező legjobb minőségre van szüksége komplex, nagy téttel bíró munkákhoz. Használja a GPT-5.4-et, ha kiemelkedő teljesítményre van szüksége újszerű mérnöki problémáknál. Használja a Sonnet 4.6-ot minden máshoz — ami a legtöbb fejlesztő számára az idő nagy részét lefedi.

Claude Sonnet 4.6 teljes útmutató: Benchmarks, árazás, képességek és mikor érdemes használni (2026)