Is Claude Sonnet 4.6 goed genoeg om Opus 4.6 te vervangen?

Voor 85-90% van de taken, ja. Sonnet 4.6 evenaart Opus 4.6 binnen 1.2 punten op SWE-bench (79.6% vs 80.8%) en scoort gelijk op computer use (72.5% vs 72.7%). Het enige gebied waarop Opus aanzienlijk voorloopt, is PhD-level reasoning (91.3% vs 74.1% op GPQA Diamond) en long-context reliability (76% vs 18.5% op MRCR v2). Tegen 5x lagere cost is Sonnet de juiste standaardkeuze voor de meeste developers.

Wat is het prijsverschil tussen Sonnet 4.6 en Opus 4.6?

Opus 4.6 kost $15/$75 per miljoen input/output tokens. Sonnet 4.6 kost $3/$15 per miljoen tokens. Dat maakt Opus 5x duurder voor zowel input als output. Een taak die $1 kost op Sonnet, kost $5 op Opus. Voor high-volume production use loopt dit verschil op tot duizenden dollars per maand.

Ondersteunt alleen Opus 4.6 Agent Teams?

Ja. Agent Teams — de mogelijkheid om meerdere Claude-instanties parallel te laten werken vanuit een enkele orchestrator — is momenteel exclusief voor Opus 4.6 in Claude Code. Sonnet 4.6 ondersteunt geen Agent Teams, wat betekent dat je met Sonnet werk niet kunt paralleliseren over meerdere agents.

Welk model is beter voor coding?

Beide zijn uitstekend. Op SWE-bench Verified scoort Opus 4.6 80.8% en Sonnet 4.6 79.6% — een verschil van 1.2 punten dat binnen de foutmarge valt voor de meeste praktische taken. Sonnet 4.6 wordt door developers in 59% van de gevallen verkozen boven de eerdere Opus 4.5. Voor cost-sensitive coding workflows is Sonnet 4.6 de duidelijke winnaar.

Wanneer moet ik absoluut Opus 4.6 gebruiken in plaats van Sonnet 4.6?

Gebruik Opus 4.6 voor drie scenario's: (1) Agent Teams — wanneer je parallelle multi-agent workflows nodig hebt, (2) long-running agent sessions die het behoud van context over 500K+ tokens vereisen zonder kwaliteitsverlies, en (3) PhD-level scientific reasoning taken waarbij het verschil van 17 punten op GPQA van belang is. Voor al het andere is Sonnet 4.6 tegen 5x lagere cost de betere keuze.

Belangrijkste inzichten

Programmeren is vrijwel identiek: 80.8% vs 79.6% op SWE-bench Verified — een verschil van 1.2 punten dat verdwijnt in dagelijks gebruik Source.
Opus kost 5x meer: $15/$75 vs $3/$15 per miljoen tokens — Sonnet bespaart je 80% op elke API call Source.
Agent Teams is alleen voor Opus: De mogelijkheid om parallelle Claude instanties te draaien is de meest overtuigende reden om Opus te gebruiken Source.
Redeneren is het echte verschil: 91.3% vs 74.1% op GPQA Diamond — een kloof van 17 punten op wetenschap van PhD-niveau Source.
Computer use is een gelijkspel: 72.5% vs 72.7% op OSWorld — Sonnet is hier de voor de hand liggende keuze gezien het 5x prijsvoordeel Source.

Claude Sonnet 4.6 vs Opus 4.6: Elke dimensie vergeleken

Anthropic's Claude 4.6 generatie levert twee modellen die dezelfde architectuur delen maar fundamenteel verschillende doelen dienen. Sonnet 4.6 (uitgebracht op February 17, 2026) is het werkpaard — snel, capabel en betaalbaar. Opus 4.6 (uitgebracht op February 5, 2026) is het vlaggenschip — het meest capabele model dat Anthropic ooit heeft gebouwd, met exclusieve functies die de premium prijs in specifieke scenario's rechtvaardigen.

Dit is de volledige technische vergelijking. Geen beknopte keuzehulp — een grondig onderzoek van elke dimensie die ertoe doet, met gegevens om elke claim te onderbouwen.

Specificaties in een oogopslag

Specificatie	Claude Sonnet 4.6	Claude Opus 4.6
Release Date	February 17, 2026	February 5, 2026
Input Cost	$3.00 / MTok	$15.00 / MTok
Output Cost	$15.00 / MTok	$75.00 / MTok
Cached Input	$0.30 / MTok	$1.50 / MTok
Context Window	1M tokens (beta)	1M tokens (GA)
Max Output	128K tokens	128K tokens
Extended Thinking	Ja (adaptief)	Ja (adaptief)
Computer Use	Ja	Ja
Agent Teams	Nee	Ja
Context Compaction	Ja (beta)	Ja

Beide modellen ondersteunen contexten van 1M tokens en een output van 128K, maar er is een subtiel verschil: de 1M context van Opus 4.6 is algemeen beschikbaar (GA), terwijl die van Sonnet 4.6 zich nog in de bètafase bevindt. In de praktijk werken beide betrouwbaar bij 1M tokens, maar het GA-label van Anthropic op Opus duidt op een groter vertrouwen in het gedrag bij lange contexten Source.

Benchmarkvergelijking: Het volledige plaatje

Programmeerbenchmarks

Benchmark	Sonnet 4.6	Opus 4.6	Verschil	Winnaar
SWE-bench Verified	79.6%	80.8%	1.2 pts	Opus (marginaal)
Terminal-Bench 2.0	~70%	~73%	~3 pts	Opus (marginaal)
HumanEval	~95%	~96%	~1 pt	Gelijkspel

Het SWE-bench verschil van 1.2 procentpunten is voor praktische doeleinden verwaarloosbaar. Beide modellen kunnen complexe, praktijkgerichte GitHub issues met hoge betrouwbaarheid afhandelen. Toen Sonnet 4.6 werd getest tegen het vorige vlaggenschip (Opus 4.5), gaven ontwikkelaars in 59% van de gevallen de voorkeur aan Sonnet 4.6 — een opmerkelijk resultaat voor een goedkoper model dat het vlaggenschip van de vorige generatie verslaat Source.

Redeneerbenchmarks

Benchmark	Sonnet 4.6	Opus 4.6	Verschil	Winnaar
GPQA Diamond	74.1%	91.3%	17.2 pts	Opus (beslissend)
Humanity's Last Exam	~35%	~45%	~10 pts	Opus (significant)
MATH	89%	~93%	~4 pts	Opus (gematigd)
MMLU-Pro	~82%	~87%	~5 pts	Opus (gematigd)

Dit is waar de modellen drastisch uiteenlopen. Het GPQA Diamond verschil — 17.2 procentpunten — is het grootste prestatieverschil tussen de twee modellen. GPQA test redeneren op universitair niveau in natuurkunde, scheikunde en biologie. Als je applicatie wetenschappelijk redeneren op PhD-niveau vereist, bevindt Opus 4.6 zich in een geheel andere klasse Source.

Agentic en Computer Use benchmarks

Benchmark	Sonnet 4.6	Opus 4.6	Verschil	Winnaar
OSWorld-Verified	72.5%	72.7%	0.2 pts	Gelijkspel
BrowseComp	~65%	~78%	~13 pts	Opus
MRCR v2 (8-needle, 1M)	~30%	76%	~46 pts	Opus (beslissend)

Hier zijn twee kritische inzichten:

Computer use is een nek-aan-nekrace. Met 72.5% vs 72.7% is er geen enkel praktisch verschil in GUI-automatiseringsmogelijkheden. Dit maakt Sonnet 4.6 de logische keuze voor computer-use taken — identieke prestaties tegen 20% van de kosten Source.
Betrouwbaarheid bij lange context komt niet eens in de buurt. Op de MRCR v2 benchmark (die multi-needle retrieval test over het volledige contextvenster van 1M), scoort Opus 4.6 76%, terwijl Sonnet 4.6 ongeveer 30% scoort. Voor taken waarbij het model een nauwkeurige herinnering moet behouden over zeer lange contexten — zoals het analyseren van volledige codebases of het verwerken van lange juridische documenten — is Opus aanzienlijk betrouwbaarder Source.

Kantoor- en kenniswerk

Benchmark	Sonnet 4.6	Opus 4.6	Verschil	Winnaar
GDPval-AA (Office Work)	1633 Elo	1606 Elo	27 Elo	Sonnet

Dit is een verrassend resultaat. Op GDPval-AA — die prestaties meet op praktijkgerichte kantoor- en kenniswerktaken — presteert Sonnet 4.6 feitelijk beter dan Opus 4.6 met 27 Elo punten. Voor taken zoals het schrijven van e-mails, het maken van presentaties, het samenvatten van vergaderingen en algemene zakelijke communicatie, is het goedkopere model aantoonbaar beter Source.

Functievergelijking: Verder dan benchmarks

Agent Teams (Alleen Opus)

Agent Teams is de meest overtuigende exclusieve functie van Opus 4.6. Het stelt je in staat om meerdere Claude Code agents op te starten vanuit één orchestrator, waarbij elke sub-agent in zijn eigen tmux paneel draait Source.

Hoe Agent Teams werken:

Je beschrijft een grote taak aan de orchestrator
De orchestrator splitst deze op in onafhankelijke subtaken
Elke subtaak wordt toegewezen aan een aparte Claude instantie
Elke instantie draait in zijn eigen tmux paneel met zijn eigen context
De orchestrator coördineert resultaten en beheert afhankelijkheden

Voorbeeld uit de praktijk: Je vraagt Claude om "Een nieuwe functie op te zetten: een gebruikersdashboard met analytics." De orchestrator kan het volgende aanmaken:

Agent 1: Backend API endpoints voor analytics data
Agent 2: Frontend React componenten voor het dashboard
Agent 3: Database migratie en seed data
Agent 4: Unit- en integratietesten

Alle vier werken tegelijkertijd, waardoor de werkelijke tijd met 3-4x wordt verminderd vergeleken met sequentiële uitvoering.

Waarom dit belangrijk is: Voor grote projecten waar taken geparalleliseerd kunnen worden, bieden Agent Teams een echte productiviteitsvermenigvuldiger. Deze functie alleen al rechtvaardigt de meerprijs van Opus voor teams die aan complexe producten werken.

Extended Thinking (Beide modellen)

Beide modellen ondersteunen extended thinking — de mogelijkheid om stap voor stap door complexe problemen "na te denken" voordat er wordt geantwoord. Ze implementeren dit echter verschillend:

Sonnet 4.6: Maakt gebruik van adaptief denken, waarbij het model contextuele aanwijzingen oppikt over hoeveel denkwerk er nodig is. Voor eenvoudige vragen antwoordt het snel. Voor complexe redeneringen schakelt het automatisch over naar dieper denken.

Opus 4.6: Maakt ook gebruik van adaptief denken, maar met een hoger plafond. Opus kan langere redeneringsketens aan en de coherentie behouden over meer denkstappen. Dit uit zich in de 17-punts GPQA-kloof — Opus kan "harder nadenken" wanneer het probleem daarom vraagt.

Beide modellen ondersteunen expliciete controle over het denkbudget via de API, waardoor je minimale en maximale denk-tokens per verzoek kunt instellen.

Context Compaction (Beide modellen)

Context compaction vat oudere context automatisch samen wanneer conversaties de contextlimiet naderen. In plaats van oude berichten af te kappen (waardoor informatie verloren gaat), creëert het model gecomprimeerde samenvattingen die belangrijke feiten en beslissingen behouden Source.

Beide modellen ondersteunen deze functie, maar de superieure prestaties van Opus 4.6 bij lange contexten (76% vs ~30% op MRCR v2) betekenen dat het meer nuance behoudt tijdens de compressie. De compressie van Sonnet 4.6 is functioneel, maar verliest af en toe subtiele details die Opus wel behoudt.

Computer Use (Beide modellen)

Beide modellen kunnen een computer bedienen met een virtuele muis en toetsenbord — knoppen klikken, formulieren invullen, op websites navigeren, spreadsheets bewerken. De capaciteit is vrijwel identiek (72.5% vs 72.7% op OSWorld), waardoor Sonnet 4.6 de duidelijke keuze is voor computer-use taken gezien het 5x prijsvoordeel Source.

Praktische computer-use toepassingen:

Geautomatiseerd invullen van formulieren in webapplicaties
End-to-end testen van webinterfaces
Data-extractie uit legacy systemen zonder API
Browserautomatisering met meerdere tabbladen voor onderzoekstaken

Kostenanalyse: De 5x factor

Het prijsverschil tussen Sonnet en Opus is niet subtiel — het is 5x over alle token-types.

Kostenvergelijking per taak

Taak	Tokens (ca.)	Sonnet 4.6 Kosten	Opus 4.6 Kosten	Besparing
Enkele code review	10K in / 5K out	$0.105	$0.525	80%
Functie-implementatie	50K in / 20K out	$0.45	$2.25	80%
Volledige codebase analyse	500K in / 10K out	$1.65	$8.25	80%
Lange agent-sessie	1M in / 100K out	$10.50	$52.50	80%

Maandelijkse kosten op schaal

Gebruiksniveau	Sonnet 4.6	Opus 4.6	Maandelijkse besparing
Licht (10M tokens/dag)	~$150/mnd	~$750/mnd	$600
Gemiddeld (50M tokens/dag)	~$750/mnd	~$3,750/mnd	$3,000
Zwaar (200M tokens/dag)	~$3,000/mnd	~$15,000/mnd	$12,000

Voor teams die aanzienlijke token-volumes verwerken, zijn de besparingen door Sonnet te gebruiken in plaats van Opus substantieel genoeg om extra technische medewerkers te financieren Source.

Het voordeel van caching

Beide modellen ondersteunen prompt caching, wat de kosten voor herhaalde contexten (zoals systeem-prompts of codebase-samenvattingen) drastisch verlaagt:

Token Type	Sonnet 4.6	Opus 4.6
Normale input	$3.00/MTok	$15.00/MTok
Cached input	$0.30/MTok	$1.50/MTok
Cache korting	90%	90%

Met caching wordt het absolute kostenverschil kleiner, maar de ratio van 5x blijft constant. Een goed gecachte Sonnet-pijplijn kan opmerkelijk betaalbaar zijn voor productiegebruik.

Snelheid en latentie

Metriek	Sonnet 4.6	Opus 4.6
Time to First Token	~1.0s	~2.5s
Output Speed	~85 tokens/s	~45 tokens/s
Relatieve snelheid	2x sneller	Basislijn
vs Vorige gen	30-50% sneller dan Sonnet 4.5	~20% sneller dan Opus 4.5

Sonnet 4.6 is ongeveer 2x sneller dan Opus 4.6 wat betreft zowel latentie als doorvoer. Voor gebruikersgerichte applicaties waar reactietijd de ervaring beïnvloedt, stapelt dit snelheidsvoordeel zich op met de kostenbesparingen om van Sonnet de standaardkeuze te maken Source.

In agentic loops waar het model herhaaldelijk wordt aangeroepen, is het snelheidsvoordeel van Sonnet bijzonder impactvol. Een agent-workflow van 10 stappen die 25 seconden per stap duurt op Opus, duurt ~12 seconden per stap op Sonnet — wat meer dan 2 minuten bespaart per uitvoering van de workflow.

Analyse van praktijkvoorbeelden

Praktijkvoorbeeld 1: Dagelijkse programmeerassistent

Aanbeveling: Sonnet 4.6

Voor het dagelijkse programmeerwerk — functies implementeren, bugs oplossen, tests schrijven, code reviewen — is de 1.2-punts kloof in SWE-bench onzichtbaar. Het snelheidsvoordeel van Sonnet 4.6 betekent snellere iteratiecycli, en de 5x kostenbesparing betekent dat je het vrijer kunt gebruiken zonder je zorgen te maken over de rekening.

Praktijkvoorbeeld 2: Complex project met parallelle werkstromen

Aanbeveling: Opus 4.6

Wanneer je Agent Teams nodig hebt om werk te parallelliseren over meerdere agents, is Opus de enige optie. Een groot refactoringproject dat een enkele agent 2 uur zou kosten, kan door 4 gecoördineerde agents in 40 minuten worden gedaan. De meerprijs wordt gerechtvaardigd door de tijdsbesparing.

Praktijkvoorbeeld 3: Computerautomatisering

Aanbeveling: Sonnet 4.6

Met vrijwel identieke OSWorld-scores (72.5% vs 72.7%) is er geen reden om de Opus-meerprijs te betalen voor computer-use taken. Of je nu webformulieren automatiseert, UI-flows test of data uit legacy-applicaties extraheert, Sonnet 4.6 levert dezelfde resultaten tegen 20% van de kosten.

Praktijkvoorbeeld 4: Wetenschappelijk onderzoek en analyse

Aanbeveling: Opus 4.6

De 17-punts GPQA Diamond kloof is beslissend. Voor taken die natuurkunde, scheikunde, biologie of geavanceerde wiskunde op PhD-niveau omvatten, vertoont Opus 4.6 substantieel sterker redeneervermogen. Onderzoeksteams en wetenschappelijke applicaties zouden budget moeten vrijmaken voor Opus.

Praktijkvoorbeeld 5: Productie API Backend

Aanbeveling: Sonnet 4.6

Voor productie-API's die eindgebruikers bedienen — chatbots, contentgeneratie, documentanalyse — is Sonnet 4.6 de duidelijke keuze. Snellere reactietijden verbeteren de gebruikerservaring, en de 5x kostenbesparing maakt use cases met een hoog volume economisch haalbaar.

Praktijkvoorbeeld 6: Langdurige agent-sessies

Aanbeveling: Opus 4.6

Als je agent-sessies regelmatig de 500K tokens context overschrijden, maakt de superieure betrouwbaarheid van Opus 4.6 bij lange contexten (76% vs ~30% op MRCR v2) een wezenlijk verschil. Sonnet 4.6 zal nog steeds functioneren bij lange contexten, maar verliest sneller aan precisie naarmate de context groeit.

Praktijkvoorbeeld 7: Applicaties bouwen

Aanbeveling: Begin met Sonnet 4.6, schaal op naar Opus wanneer nodig

Voor teams die applicaties bouwen — of ze nu traditioneel programmeren of visuele app-builders zoals ZBuild gebruiken — handelt Sonnet 4.6 de overgrote meerderheid van de taken af. Reserveer Opus voor de 10-15% van de taken die zijn unieke capaciteiten vereisen (Agent Teams, diep redeneren of precisie bij lange context).

De hybride strategie: Beide modellen gebruiken

De meest kosteneffectieve aanpak in 2026 is niet het kiezen van één model — het is het strategisch gebruiken van beide.

Routeringsregels

Taaktype	Model	Rationalisatie
Standaard programmeren	Sonnet 4.6	79.6% SWE-bench tegen 5x lagere kosten
Code review	Sonnet 4.6	Kwaliteit is vergelijkbaar, snelheid is 2x
Computer use	Sonnet 4.6	Identieke prestaties, 5x lagere kosten
Kantoorwerk	Sonnet 4.6	Scoort feitelijk beter dan Opus (1633 vs 1606 Elo)
Complexe multi-agent taken	Opus 4.6	Exclusief voor Agent Teams
Redeneren op PhD-niveau	Opus 4.6	91.3% vs 74.1% GPQA
Langdurige sessies (500K+)	Opus 4.6	76% vs ~30% MRCR v2
Architectuurbeslissingen	Opus 4.6	Beter in genuanceerde oordeelsvorming

Verwachte kostenverdeling

Met deze routeringsstrategie zullen de meeste teams Sonnet 4.6 gebruiken voor 85-90% van hun Claude API-aanroepen en Opus 4.6 voor de overige 10-15%. Dit verlaagt de gemiddelde kosten met 70-75% vergeleken met het gebruik van Opus voor alles, terwijl de kwaliteit behouden blijft waar die er het meest toe doet.

Hoe beide modellen zich verhouden tot de concurrentie

Noch Sonnet, noch Opus bestaat in een vacuüm. Hier zie je hoe ze zich verhouden tot de beste modellen van andere aanbieders:

Model	SWE-bench	GPQA Diamond	Prijs (Input)	Snelheid
Claude Opus 4.6	80.8%	91.3%	$15.00/MTok	Langzaam
GPT-5.4	80.0%	~88%	$2.50/MTok	Gemiddeld
Claude Sonnet 4.6	79.6%	74.1%	$3.00/MTok	Snel
Gemini 3 Flash	78.0%	90.4%	$0.50/MTok	Zeer Snel
GPT-5.3 Codex	77.3%	~75%	$1.75/MTok	Gemiddeld

Opmerkelijke observaties:

GPT-5.4 is een sterke concurrent voor $2.50/MTok input — goedkoper dan Sonnet 4.6 terwijl het Opus 4.6 evenaart op programmeren.
Gemini 3 Flash presteert beter dan Sonnet op GPQA (90.4% vs 74.1%) tegen een zesde van de kosten.
Opus 4.6 blijft over het algemeen de beste programmeur, maar GPT-5.4 zit er heel dicht tegenaan.

Het concurrentielandschap in 2026 is opmerkelijk krap aan de top. De keuze voor een model hangt steeds meer af van specifieke use case-vereisten in plaats van algemene ranglijsten.

De beslissing nemen

Kies standaard voor Sonnet 4.6 als je:

Een model voor algemeen programmeren en redeneren nodig hebt.
API-kosten wilt minimaliseren zonder in te leveren op kwaliteit.
Gebruikersgerichte applicaties bouwt waar snelheid van belang is.
Computer use gebruikt voor automatiseringstaken.
Kantoor- en kenniswerk afhandelt.
Apps bouwt met platforms zoals ZBuild en een betrouwbare, kosteneffectieve AI-backend nodig hebt.

Upgrade naar Opus 4.6 als je:

Agent Teams nodig hebt voor parallelle multi-agent workflows.
Werkt aan wetenschappelijke of wiskundige problemen op PhD-niveau.
Agent-sessies draait die regelmatig de 500K tokens overschrijden.
De absoluut hoogste programmeerkwaliteit nodig hebt, ongeacht de kosten.
Werkt aan problemen waarbij de 17-punts redeneerkloof van belang is.
Moeilijk vindbare informatie online moet opzoeken (BrowseComp voordeel).

De conclusie

Sonnet 4.6 is een van de meest indrukwekkende model-releases van 2026 — het levert 98.5% van de programmeerprestaties van Opus tegen 20% van de kosten, met 2x de snelheid. Voor de overgrote meerderheid van de ontwikkelaars is het niet alleen "goed genoeg" — het is de betere keuze.

Opus 4.6 blijft essentieel voor specifieke scenario's met hoge waarde: Agent Teams, diep redeneren en betrouwbaarheid bij lange contexten. Het is geen luxe — het is een gespecialiseerd gereedschap voor gespecialiseerde problemen.

Gebruik beide. Routeer intelligent. Betaal alleen voor Opus-kwaliteit wanneer je Opus-kwaliteit nodig hebt.

Claude Sonnet 4.6 vs Opus 4.6: De Volledige Technische Vergelijking (2026)

Belangrijkste inzichten

Claude Sonnet 4.6 vs Opus 4.6: Elke dimensie vergeleken

Specificaties in een oogopslag

Benchmarkvergelijking: Het volledige plaatje

Programmeerbenchmarks

Redeneerbenchmarks

Agentic en Computer Use benchmarks

Kantoor- en kenniswerk

Functievergelijking: Verder dan benchmarks

Agent Teams (Alleen Opus)

Extended Thinking (Beide modellen)

Context Compaction (Beide modellen)

Computer Use (Beide modellen)

Kostenanalyse: De 5x factor

Kostenvergelijking per taak

Maandelijkse kosten op schaal

Het voordeel van caching

Snelheid en latentie

Analyse van praktijkvoorbeelden

Praktijkvoorbeeld 1: Dagelijkse programmeerassistent

Praktijkvoorbeeld 2: Complex project met parallelle werkstromen

Praktijkvoorbeeld 3: Computerautomatisering

Praktijkvoorbeeld 4: Wetenschappelijk onderzoek en analyse

Praktijkvoorbeeld 5: Productie API Backend

Praktijkvoorbeeld 6: Langdurige agent-sessies

Praktijkvoorbeeld 7: Applicaties bouwen

De hybride strategie: Beide modellen gebruiken

Routeringsregels

Verwachte kostenverdeling

Hoe beide modellen zich verhouden tot de concurrentie

De beslissing nemen

Kies standaard voor Sonnet 4.6 als je:

Upgrade naar Opus 4.6 als je:

De conclusie

Bronnen

Common questions

Bouw met ZBuild

Stop met vergelijken — begin met bouwen

Related articles

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5: De definitieve AI-model vergelijking voor 2026

Claude Sonnet 4.6 Complete Guide: Benchmarks, Pricing, Capabilities, en Wanneer te gebruiken (2026)

Claude Sonnet 4.6 vs Gemini 3 Flash: Welk Mid-Tier AI-model wint in 2026?

Ik heb $500 uitgegeven aan het testen van Claude Sonnet 4.6 vs Opus 4.6 — Dit is wat ik heb ontdekt