Hvad er Claude Sonnet 4.6, og hvornår blev den udgivet?

Claude Sonnet 4.6 er Anthropic's mid-tier AI-model, udgivet den 17. februar 2026. Den scorer 79,6% på SWE-bench Verified og 72,5% på OSWorld, koster $3/$15 pr. million tokens (input/output), og understøtter et 1M token context window. Udviklere valgte den frem for det tidligere flagskib Opus 4.5 i 59% af tilfældene.

Hvor meget koster Claude Sonnet 4.6?

Standard API-priser er $3 pr. million input tokens og $15 pr. million output tokens. Batch API-priser er 50% lavere til $1,50/$7,50 pr. million tokens. I Claude Code med Max-planen ($20/måned), er Sonnet 4.6 inkluderet i abonnementet. En travl dag med kodning med Sonnet 4.6 via API koster omkring $1-3.

Hvordan sammenlignes Claude Sonnet 4.6 med Opus 4.6?

Sonnet 4.6 scorer 79,6% på SWE-bench (inden for 1,2% af Opus 4.6's 80,8%), mens den koster betydeligt mindre — $3/$15 mod Opus' højere priser. Udviklere foretrak Sonnet 4.6 frem for Opus 4.5 i 59% af tilfældene. Opus 4.6 er stadig bedre til kompleks multi-file reasoning og Agent Teams, men Sonnet 4.6 tilbyder det bedste cost-performance-forhold i Claude-familien.

Hvad er extended thinking i Claude Sonnet 4.6?

Extended thinking lader Sonnet 4.6 ræsonnere gennem komplekse problemer trin for trin, før den genererer et svar. Den adaptive tilstand, ny i 4.6, justerer automatisk dybden af tænkningen baseret på opgavens kompleksitet — simple spørgsmål får hurtige svar, mens komplekse ræsonnementer udløser dybere thinking chains. Dette forbedrer nøjagtigheden på matematik, logik og komplekse kodningsopgaver.

Kan Claude Sonnet 4.6 håndtere en hel codebase i én prompt?

Ja. Sonnet 4.6 understøtter et 1M token context window (generelt tilgængeligt, intet beta-header påkrævet), hvilket svarer til omtrent 3-4 millioner tegn eller cirka 75.000 linjer kode. Dette gør det til den første model i Sonnet-klassen, der er i stand til fuld codebase-analyse i en enkelt prompt.

Vigtigste indsigt

Claude Sonnet 4.6 er den mest omkostningseffektive AI-model med høj ydeevne, der er tilgængelig i March 2026. Til $3/$15 pr. million tokens leverer den benchmark-score tæt på modeller, der koster 3-5x mere — og udviklere valgte den frem for Anthropic's own previous flagship Opus 4.5 59% af gangene. Uanset om du bygger AI-baserede applikationer, bruger den til kodningsassistance eller behandler dokumenter i stor skala, rammer Sonnet 4.6 det ideelle punkt mellem formåen og omkostninger, som ingen konkurrent matcher.

Claude Sonnet 4.6: Alt hvad du behøver at vide

Udgivelse og positionering

Anthropic udgav Claude Sonnet 4.6 den February 17, 2026. Den placerer sig i midten af Claude 4.6-modelfamilien:

Model	Positionering	Prissætning (Input/Output pr. M tokens)
Claude Opus 4.6	Flagskib, højeste formåen	Højere prisniveau
Claude Sonnet 4.6	Bedste pris-ydelsesforhold	$3 / $15
Claude Haiku 4.6	Hurtigste, mest omkostningseffektive	Lavere prisniveau

Sonnet 4.6 beskrives af Anthropic som en "fuld opgradering af modellens færdigheder på tværs af kodning, computerbrug, ræsonnement med lang kontekst, agentplanlægning, design og vidensarbejde" — ikke en trinvis forbedring, men et generationsskifte fremad fra Sonnet 4.5.

Prissætningen forbliver identisk med den tidligere Sonnet 4.5, hvilket gør dette til en ren opgradering af formåen til samme pris — en sjælden begivenhed på markedet for AI-modeller, hvor forbedringer i ydeevne normalt følger med prisstigninger.

Benchmark: De komplette data

Benchmark for kodning

Benchmark	Sonnet 4.6	Opus 4.6	GPT-5.4	Noter
SWE-bench Verified	79.6%	80.8%	~80%	Løsning af reelle GitHub-problemer
SWE-bench Pro	—	~45%	57.7%	Sværere nyudvikling
Terminal-Bench 2.0	—	65.4%	75.1%	Autonom terminal-kodning

Kilde: Flere benchmark-aggregatorer

Sonnet 4.6's 79.6% på SWE-bench Verified placerer den inden for 1,2 procentpoint fra Opus 4.6 — flagskibsmodellen, der koster betydeligt mere. For langt de fleste kodningsopgaver er denne forskel umærkelig i praksis.

Benchmark for generel intelligens

Benchmark	Sonnet 4.6	Hvad det måler
OSWorld	72.5%	Computerbrug og opgaver på OS-niveau
ARC-AGI-2	58.3%	Ny problemløsning (op fra 13.6%)
GDPval-AA	1633 Elo	Kontor- og administrative opgaver
Finance Agent	63.3%	Finansiel analyse og ræsonnement

Kilde: Anthropic-meddelelse, Digital Applied

ARC-AGI-2-resultatet er det mest bemærkelsesværdige: en 4.3x forbedring fra 13.6% til 58.3%, hvilket repræsenterer den største gevinst i en enkelt generation på dette benchmark for nogen AI-model. ARC-AGI-2 tester ny problemløsning — evnen til at identificere mønstre og anvende ræsonnement på problemer, som modellen aldrig har set før. Dette tyder på fundamentale forbedringer i Sonnet 4.6's ræsonnementsevner, ikke kun bedre træningsdata.

Data om udviklerpræferencer

Benchmark-tallene fortæller en del af historien. Data om udviklerpræferencer fortæller resten:

Udviklere valgte Sonnet 4.6 frem for Sonnet 4.5 70% af gangene i Claude Code-test
Udviklere valgte Sonnet 4.6 frem for det tidligere flagskib Opus 4.5 59% af gangene
Vigtigste årsager angivet: bedre instruktionsfølgning, mindre over-engineering, mere præcise outputs

Præferencen over Opus 4.5 er særligt slående. Sonnet 4.6 — modellen i mellemlaget — blev foretrukket frem for den foregående generations dyreste model. Dette afspejler et konsistent mønster i AI-udvikling, hvor nyere modeller i mellemlaget ofte overgår ældre flagskibe.

Prissætning: Komplet oversigt

API-prissætning

Niveau	Input	Output	Use Case
Standard	$3/M tokens	$15/M tokens	Realtidsapplikationer
Batch	$1.50/M tokens	$7.50/M tokens	Asynkron behandling, bulk-opgaver

Kilde: Anthropic prissætningsside

Hvad det koster i praksis

For at gøre prissætningen håndgribelig er her estimater for omkostninger i den virkelige verden baseret på typiske brugsmønstre:

Opgave	Omtrentlig omkostning
Gennemgang af en PR på 500 linjer	$0.02-0.05
Generering af en ny funktion (flere filer)	$0.10-0.30
Analyse af en komplet kodebase (50K linjer)	$0.50-1.50
En tung kodningsdag (8 timer, aktiv brug)	$1-3
Kørsel af en kodningsagent i 1 time	$2-8
Batch-behandling af 1.000 dokumenter	$5-20

Sammenligning med konkurrerende modeller

Model	Input/M	Output/M	SWE-bench	Omkostningseffektivitet
Claude Sonnet 4.6	$3	$15	79.6%	Bedste forhold
Claude Opus 4.6	Højere	Højere	80.8%	Premium
GPT-5.4	Varierer	Varierer	~80%	Konkurrencedygtig
DeepSeek V3	~$0.50	~$2	Lavere	Billigst

Sonnet 4.6 tilbyder det bedste pris-ydelsesforhold, når man medregner SWE-bench-score pr. brugt dollar. Opus 4.6 scorer marginalt højere, men koster betydeligt mere. GPT-5.4 er konkurrencedygtig på nogle benchmarks, men Sonnet 4.6 vinder på SWE-bench Verified. DeepSeek V3 er dramatisk billigere, men scorer væsentligt lavere på kodningsbenchmarks.

Platformspriser

Hvis du tilgår Sonnet 4.6 gennem produkter i stedet for direkte via API:

Platform	Omkostning	Hvordan Sonnet 4.6 er tilgængelig
Claude.ai Gratis	$0	Begrænsede beskeder pr. dag
Claude.ai Pro	$20/måned	Udvidet brug, prioritet
Claude.ai Max	$100/måned	Tung brug, 5x Pro-grænser
Claude Code (Max)	$20/måned	Inkluderet i abonnement
Cursor Pro	$20/måned	Tilgængelig via kreditpulje
Amazon Bedrock	Betaling pr. brug	Samme prissætning pr. token
Google Vertex AI	Betaling pr. brug	Samme prissætning pr. token

Dybere dyk ned i nøglefunktioner

1. Extended Thinking med Adaptive Mode

Extended thinking lader Sonnet 4.6 ræsonnere gennem komplekse problemer trin for trin, før den genererer et svar. Den adaptive mode, ny i 4.6, justerer automatisk dybden af tænkningen baseret på opgavens kompleksitet:

Simple spørgsmål (definitioner, faktuelle opslag): Hurtigt svar med minimal tænkning
Moderate opgaver (kodegenerering, opsummering): Kort tænkekæde for struktur
Komplekst ræsonnement (matematik i flere trin, arkitekturbeslutninger, debugging): Dyb tænkning med omfattende chain-of-thought

Denne adaptive tilgang eliminerer behovet for manuelt at slå tænkning til/fra for forskellige opgaver. Tidligere modeller krævede, at udviklere eksplicit aktiverede extended thinking, hvilket ofte resulterede i spildte tokens på simple forespørgsler eller utilstrækkeligt ræsonnement på svære opgaver.

I praksis: Extended thinking er mest værdifuld til debugging af komplekse problemer, arkitekturbeslutninger og kodegenerering i flere trin, hvor modellen skal overveje begrænsninger på tværs af flere filer. For simple kodefærdiggørelser eller hurtig Q&A er overheaden minimal takket være adaptive mode.

2. 1M Token Context Window

Sonnet 4.6 understøtter et 1M token context window — nu generelt tilgængeligt uden krav om beta-header. Dette svarer til ca.:

3-4 millioner tegn
75.000 linjer kode
15-20 gennemsnitlige kodebaser
4-5 romaner i fuld længde

Dette gør Sonnet 4.6 til den første model i Sonnet-klassen, der understøtter fuld analyse af kodebasen i en enkelt prompt. Tidligere tilbød kun modeller på Opus-niveau context windows af denne størrelse.

Praktiske konsekvenser:

Indlæs hele microservice-kodebaser til debugging på tværs af filer
Analysér komplette dokumentationssæt til teknisk skrivning
Behandl hele kontraktsæt til juridisk gennemgang
Sammenlign flere store dokumenter samtidigt

Omkostningsovervejelse: En fuld prompt på 1M tokens koster $3 alene i input-tokens. For de fleste opgaver har du ikke brug for den fulde kontekst — indlæsning af 50K-200K tokens dækker langt de fleste use cases til $0.15-0.60 pr. prompt.

3. Forbedrede kodningsevner

Baseret på SWE-bench-scoren på 79.6% og data om udviklerpræferencer leverer Sonnet 4.6 målbare forbedringer i:

Ræsonnement på tværs af flere filer: Forståelse af hvordan ændringer i én fil påvirker andre filer på tværs af projektet
Instruktionsfølgning: Mere præcis overholdelse af kodningsretningslinjer, stilkonventioner og specifikke krav
Mindre over-engineering: Generering af enklere kode, der er lettere at vedligeholde, i stedet for over-abstraherede løsninger
Fejlhåndtering: Bedre identifikation og håndtering af kanttilfælde i genereret kode
Testgenerering: Mere omfattende testdækning med meningsfulde assertions

4. Computer Use (Beta)

Sonnet 4.6 kan interagere med computergrænseflader — klikke på knapper, udfylde formularer, navigere i applikationer og tage screenshots. OSWorld benchmark-scoren på 72.5% afspejler reel formåen på dette område, selvom det stadig er i beta.

Use cases inkluderer: automatiseret UI-test, dataindtastning på tværs af applikationer, web-scraping med interaktion og automatisering af desktop-applikationer.

5. Generelt tilgængelig Tool Use

Flere funktioner, der tidligere var i beta, er nu generelt tilgængelige med Sonnet 4.6:

Web search og web fetch: Claude kan søge på internettet og hente webindhold
Code execution: Sandkasse-miljø til kørsel og test af kode
Memory tool: Gemmer information på tværs af samtaler
File handling: Upload og analysér filer direkte

Disse GA-funktioner muliggør mere kapable agent-arbejdsflow, hvor Sonnet 4.6 selvstændigt kan undersøge, kode, teste og iterere — uden manuel menneskelig indgriben ved hvert trin.

Sonnet 4.6 vs. Opus 4.6: Hvilken skal man vælge?

Dette er det mest almindelige spørgsmål, udviklere står over for, når de vælger en Claude-model. Her er det datadrevne svar:

Dimension	Sonnet 4.6	Opus 4.6	Vinder
SWE-bench Verified	79.6%	80.8%	Opus (marginalt)
Pris (input/M)	$3	Højere	Sonnet
Pris (output/M)	$15	Højere	Sonnet
Context window	1M tokens	1M tokens	Uafgjort
Extended thinking	Ja (adaptiv)	Ja	Uafgjort
Agent-teams	Nej	Ja	Opus
Udviklerpræference (vs Opus 4.5)	59% foretrak	—	Sonnet
Hastighed	Hurtigere	Langsommere	Sonnet

Vælg Sonnet 4.6 når:

Omkostninger betyder noget. Sonnet leverer 98.5% af Opus's SWE-bench-score til en brøkdel af prisen. For de fleste kodningsopgaver er kvalitetsforskellen umærkelig.
Hastighed betyder noget. Sonnet genererer svar hurtigere end Opus, hvilket betyder noget for interaktive kodningssessioner.
Du bygger applikationer. For API-baserede produkter, hvor du betaler pr. token i stor skala, akkumuleres Sonnets lavere omkostninger til betydelige besparelser.
Standard kodningsopgaver. Implementering af funktioner, fejlrettelser, kodegennemgang, testgenerering, dokumentation — Sonnet håndterer alt dette i en kvalitet tæt på Opus.

Vælg Opus 4.6 når:

Maksimal nøjagtighed på komplekse problemer. For virkelig svære ræsonnementer på tværs af kodebaser med 100+ filer afspejler de ekstra 1,2% på SWE-bench betydelige kvalitetsforskelle.
Agent-teams. Hvis du har brug for parallel agent-koordinering — flere AI-agenter, der arbejder samtidigt på forskellige dele af en kodebase — er Opus påkrævet.
Nye arkitekturbeslutninger. Når du træffer tekniske beslutninger med stor betydning én gang, retfærdiggør den marginale kvalitetsforbedring omkostningerne.
Du bruger Claude Code intensivt. Hvis Claude Code er dit primære udviklingsværktøj, og du er på Max-abonnementet, koster det det samme at bruge Opus som Sonnet inden for abonnementet.

Det praktiske svar

De fleste udviklere bør bruge Sonnet 4.6 som standard og kun skifte til Opus 4.6 til specifikke svære problemer. I Claude Code-test valgte udviklere Sonnet 4.6 frem for Sonnet 4.5 70% af gangene — hvilket betyder, at selv i Anthropic's egne test er modellen i mellemlaget den foretrukne til dagligt brug.

Sonnet 4.6 vs. GPT-5.4: Direkte sammenligning

Dimension	Sonnet 4.6	GPT-5.4	Vinder
SWE-bench Verified	79.6%	~80%	Uafgjort
SWE-bench Pro	—	57.7%	GPT-5.4
Terminal-Bench 2.0	—	75.1%	GPT-5.4
OSWorld	72.5%	—	Sonnet (standard)
ARC-AGI-2	58.3%	—	Sonnet (standard)
Pris (input/M)	$3	Varierer	Sammenlignelig
Context window	1M	1M (Pro)	Uafgjort

Kilde: Portkey-sammenligning

Det nuancerede svar: GPT-5.4 er stærkere til nye ingeniørmæssige problemer (SWE-bench Pro) og autonom terminal-kodning (Terminal-Bench 2.0). Sonnet 4.6 er stærkere til standard kodningsopgaver (SWE-bench Verified) og ny mønstergenkendelse (ARC-AGI-2). Mange professionelle udviklere bruger begge: GPT-5.4 til prototyping og nye problemer, Sonnet 4.6 eller Opus 4.6 til dyb kodning i flere filer og analyse af store kodebaser.

Bedste praksis for brug af Sonnet 4.6

For API-udviklere

Brug Batch API til ikke-realtidsopgaver. Til 50% af standardprisen ($1.50/$7.50 pr. M tokens) er batch-behandling dramatisk billigere for opgaver, der kan tåle asynkron behandling.
Tilpas din kontekst. En fuld prompt på 1M tokens koster $3 i input-tokens. De fleste opgaver har brug for 10K-100K tokens kontekst. Vær selektiv med, hvad du inkluderer.
Udnyt extended thinking til svære problemer. Adaptive mode håndterer dette automatisk, men du kan eksplicit anmode om dybere ræsonnement til kritiske beslutninger.
Cache gentaget kontekst. Hvis du sender den samme kodebase-kontekst på tværs af flere anmodninger, kan Anthropic's prompt caching reducere input-omkostningerne med op til 90%.

For Claude Code-brugere

Brug Sonnet 4.6 som standard til det daglige arbejde. Skift kun til Opus 4.6 til komplekse problemer med mange filer, hvor kvalitet betyder mere end hastighed.
Brug extended thinking til arkitekturbeslutninger. Når du planlægger en ny funktion eller refaktorering, så lad modellen tænke dybt, før den genererer kode.
Udnyt 1M context window. Indlæs hele din kodebase til debugging-sessioner på tværs af filer i stedet for at sende filer én ad gangen.

For produktbyggere

Start med Sonnet 4.6, opgradér selektivt. Byg din applikation på Sonnet 4.6 og send kun specifikke svære forespørgsler videre til Opus 4.6.
Brug strukturerede outputs. Sonnet 4.6's forbedrede instruktionsfølgning gør den mere pålidelig til generering af JSON/struktureret output.
Test med reelle data. Benchmark-score er gennemsnit — dit specifikke use case kan favorisere én model frem for en anden. Kør A/B-test med dine faktiske data.

Opbygning af applikationer med Sonnet 4.6

Sonnet 4.6's kombination af stærk kodningsevne, rimelig prissætning og 1M context window gør den til en fremragende rygrad for AI-baserede applikationer. Uanset om du bygger en kodningsassistent, dokumentanalysator eller et automatiseret arbejdsflow, håndterer modellen intelligenslaget effektivt.

For selve applikationslaget — frontend, backend, database og implementeringsinfrastruktur — kan værktøjer som ZBuild fremskynde udviklingen betydeligt. I stedet for at kode hver CRUD-operation og administrationspanel fra bunden, håndterer en visuel app-builder standardmønstrene, mens Sonnet 4.6 driver AI-funktionerne. Denne kombination lader solo-udviklere og små teams levere AI-baserede produkter hurtigere end nogen af tilgangene alene.

Hvad er det næste for Claude-modeller

Baseret på Anthropic's udgivelsesrytme og offentlige udtalelser:

Claude 4.6 Haiku forventes at fuldende 4.6-modelfamilien som den hurtigste og mest omkostningseffektive løsning
Modelforbedringer fortsætter gennem post-træningsoptimering — Anthropic har historisk set udgivet forbedrede versioner af eksisterende modeller mellem de store udgivelser
Udvidet Tool Use — computerbrug, kørsel af kode og hukommelse er alle ved at udvikle sig fra beta til produktionsklare funktioner
Agent-infrastruktur — Agent-teams (i øjeblikket kun til Opus) kan blive udvidet til modeller på Sonnet-niveau

Claude-modelfamiliens kurs er klar: hver generation leverer markant bedre ydeevne til samme eller lavere pris. Sonnet 4.6, der opnår en ydeevne tæt på Opus 4.5 til Sonnet-priser, er det nyeste eksempel på dette mønster.

Dommen

Claude Sonnet 4.6 er standardanbefalingen til de fleste udviklere og applikationsbyggere i 2026. Kombinationen af 79.6% SWE-bench, $3/$15 pr. million tokens, 1M context window og adaptive extended thinking skaber en model, der håndterer 95%+ af opgaverne i den virkelige verden til det bedste pris-ydelsesforhold, der findes.

Brug Opus 4.6, når du har brug for den absolut bedste kvalitet til komplekst arbejde med høj risiko. Brug GPT-5.4, når du har brug for overlegen ydeevne på nye ingeniørmæssige problemer. Brug Sonnet 4.6 til alt andet — hvilket for de fleste udviklere er størstedelen af tiden.

Claude Sonnet 4.6 komplet guide: Benchmarks, priser, funktioner, og hvornår den skal bruges (2026)