Kas DeepSeek V4 on välja lastud?

DeepSeek V4 lansseeriti 2026. aasta märtsi alguses, kusjuures 'V4 Lite' variant ilmus 9. märtsil. Täismudel saavutab SWE-Bench Verified testis 81% ja maksab $0.30 miljoni sisendmärgise (input tokens) kohta — olles ligikaudu 10 korda odavam kui konkureerivad frontier-mudelid. Kaalud on saadaval Apache 2.0 litsentsi all.

Kui palju parameetreid on DeepSeek V4-l?

DeepSeek V4-l on ligikaudu 1 triljon parameetrit kokku, kasutades Mixture-of-Experts (MoE) arhitektuuri, kuid aktiveerib vaid ~37 miljardit märgise (token) kohta. See on umbes 50% rohkem parameetreid kui V3 671 miljardit, hoides samal ajal inferentsi kulud võrreldavad.

Mis on DeepSeek-i Engram mälusüsteem?

Engram on tingimuslik mäluarhitektuur, mida tutvustati DeepSeek-i 2026. aasta jaanuari teadustöös. See pakub O(1) deterministlikku teadmiste otsingut staatiliste mustrite, näiteks olemite nimede jaoks, saavutades 97% Needle-in-a-Haystack täpsuse miljoni märgise (token) skaalal. Optimaalne parameetrite jaotus on 20-25% Engram mälu ja 75-80% MoE arvutus.

Kuidas DeepSeek V4 võrdleb GPT-5.4 ja Claude Opus 4.6-ga?

DeepSeek V4 saavutab SWE-Bench Verified testis 81% (võrreldes Claude Opus 4.5 rekordi 80.9%-ga), toetab 1M märgist (token) konteksti ja on algupäraselt multimodaalne. Selle peamine eelis on maksumus: $0.30/M sisendmärgise kohta vs $2.50 GPT-5.4 puhul ja $15.00 Opus 4.6 puhul. See on avatud lähtekoodiga Apache 2.0 litsentsi all, samas kui konkurendid on suletud koodiga (proprietary).

Kas DeepSeek V4 on avatud lähtekoodiga?

Jah. DeepSeek V4 mudeli kaalud on välja lastud Apache 2.0 litsentsi all, muutes selle vabalt kättesaadavaks kohalikuks kasutuselevõtuks, peenhäälestamiseks (fine-tuning) ja piiranguteta äriliseks kasutamiseks. See jätkab DeepSeek-i V3-st alguse saanud avatud lähtekoodi traditsiooni.

Põhjalikud järeldused

1 trillion parameetrit, 37B aktiivsed: DeepSeek V4 kasutab Mixture-of-Experts architecture süsteemi, mis aktiveerib vaid ~37B parameetrit ühe token kohta — hoides inference kulud võrreldavad V3-ga, hoolimata 50% suuremast parameetrite koguarvust.
81% SWE-bench Verified: V4 pretendeerib kodeerimise benchmark kroonile — lüües Claude Opus 4.5 eelmist rekordit 80.9%.
Engram mälu on arhitektuurne läbimurre: Uus tingimuslik mälusüsteem, mis pakub O(1) teadmusotsingut, saavutades 97% täpsuse Needle-in-a-Haystack testis miljoni-tokeni skaalal.
10x odavam kui Lääne konkurendid: Hinnaga $0.30/M input tokens, V4 on suurusjärgu võrra odavam kui GPT-5.4 ($2.50) ja Claude ($3-15).
Open-source Apache 2.0 litsentsi all: Mudeli täielikud kaalud on saadaval lokaalseks juurutamiseks, fine-tuning'uks ja äriliseks kasutamiseks — ainus frontier-class mudel sellise avatuse tasemega.

DeepSeek V4: Open-source mudel, mis kirjutab ümber AI majandusloogikat

DeepSeek on seda jälle teinud. Pärast seda, kui V3 tõestas, et Hiina labor suudab luua frontier-class mudeleid murdosa eest Lääne kuludest, tõstab V4 panuseid tasemele, mis nõuab tähelepanu igalt arendajalt, startup'ilt ja ettevõttelt, kes teeb AI infrastruktuuri otsuseid.

Üks trillion parameetrit. Miljoni-tokeni kontekst. Natiivne multimodal. 81% SWE-bench Verified. Ja see kõik on open-source Apache 2.0 litsentsi all 10-40x madalamate inference kuludega kui Lääne konkurentidel.

Kas need väited peavad sõltumatu kontrolli all täielikult paika, on veel selgumisel. Kuid arhitektuuriuuendused — eriti Engram mälu — esindavad tõelisi edusamme, mis mõjutavad mudelite disaini kogu tööstuses sõltumata tulemustest.

Siin on kõik, mida teame seisuga March 2026.

Väljalaske ajakava

DeepSeek V4 tee väljalaskeni oli konarlik, mitmete viibimistega:

Kuupäev	Sündmus
January 2026	Engram teadustöö avaldamine — tingimusliku mälu arhitektuur
February 2026 (algus)	Algne väljalaske eesmärk — ebaõnnestus
February 2026 (keskpaik)	Teine väljalaskeaken — samuti ebaõnnestus
Märtsi algus 2026	Täielik V4 mudel käivitati
March 9, 2026	"V4 Lite" ilmus DeepSeek veebilehele
March 2026 (jätkuv)	Sõltumatu benchmarking ja kogukonna valideerimine

Viibiv ajakava tegelikult suurendas ootusi. Selleks ajaks, kui V4 käivitati, oli Engram teadustöö juba laialdaselt arutlusel ja ootused olid laes.

Arhitektuuri süvaanalüüs

Mixture-of-Experts triljoni skaalal

DeepSeek V4 jätkab MoE arhitektuuriga, mis tegi V3 nii efektiivseks, kuid skaleerib seda dramaatiliselt:

Mõõdik	DeepSeek V3	DeepSeek V4
Parameetrite koguarv	671B	~1T
Aktiivsed parameetrid	~37B	~37B
Kontekstiaken	128K	1M
Arhitektuur	MoE	MoE + Engram
Multimodal	Ainult tekst	Tekst + Pilt + Video
Litsents	Apache 2.0	Apache 2.0

Peamine tähelepanek: parameetrite koguarv kasvas 50%, kuid aktiivsete parameetrite arv ühe token kohta jäi konstantseks ~37B juurde. See tähendab, et V4-l on juurdepääs palju suuremale teadmiste hulgale ja võimekusele, ilma et inference kulud proportsionaalselt kasvaksid.

Engram: Mälurevolutsioon

Engram on V4 kõige olulisem arhitektuurne uuendus. Seda kirjeldati põhjalikult DeepSeek'i January 2026 teadustöös ("Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models") ning see lahendab Transformerite fundamentaalset piirangut.

Probleem: Traditsioonilised Transformerid käsitlevad igat teadmist samamoodi — läbi arvutuse. Olenemata sellest, kas mudel peab meenutama, et "Pariis on Prantsusmaa pealinn" (staatiline fakt) või arutlema keerulise koodi refaktoreerimise üle (dünaamiline arvutus), kasutab see sama attention mehhanismi. See on raiskav.

Engram'i lahendus: Lisada eraldi mälusüsteem staatilise, deterministliku teadmuse jaoks. Selle asemel, et arvutada vastust küsimusele "Mis on Prantsusmaa pealinn?" läbi mitme attention kihi, pakub Engram O(1) deterministlikku otsingut — sisuliselt õpitud hash-tabelit faktiteadmiste jaoks.

Peamine leid — Sparsity Allocation Law: DeepSeek uuringud paljastasid, et fikseeritud hõredate parameetrite eelarve juures on optimaalne jaotus ligikaudu 20-25% mälu (Engram) ja 75-80% arvutus (MoE). See suhe maksimeerib nii meenutamise täpsust kui ka arutlemisvõimet.

Mõju jõudlusele: Engram saavutab 97% Needle-in-a-Haystack täpsuse miljoni-tokeni konteksti skaalal, lahendades andmete kättesaamise degradeerumise probleemi, mis vaevab tavalisi Transformer arhitektuure. 1M tokeni juures langeb enamiku mudelite otsingu täpsus alla 80%. V4 koos Engram'iga säilitab 97%.

DeepSeek Sparse Attention (DSA)

Lisaks Engram'ile tutvustab V4 DeepSeek Sparse Attention süsteemi — attention mehhanismi, mis jaotab arvutusressurssi dünaamiliselt vastavalt sisendi keerukusele. Lihtsad tekstiosad saavad kerge attention'i; keerulised arutluskäigud saavad täieliku attention sügavuse.

See teeb miljoni-tokeni kontekstiakna praktiliseks. Ilma DSA-ta oleks 1M tokeni töötlemine kättesaamatult kallis isegi DeepSeek madalate kulude juures. Selle abil töödeldakse suurem osa kontekstiaknast efektiivselt, jättes täieliku arvutusvõimsuse nendele osadele, mis seda vajavad.

Manifold-Constrained Hyper-Connections

Kolmas arhitektuurne uuendus on Manifold-Constrained Hyper-Connections — tehnika, mis parandab gradientide liikumist treeningu ajal. Praktiline tulemus on stabiilsem treenimine triljoni-parameetri skaalal, mis selgitab osaliselt, kuidas DeepSeek treenis V4 murdosa eest Lääne kuludest.

Benchmark analüüs

Numbrid

Benchmark	DeepSeek V4	Claude Opus 4.5	GPT-5.4	Märkused
SWE-bench Verified	81%	80.9%	~82%	V4 lööb eelmist rekordit
HumanEval	90%	~88%	~90%	Koodi genereerimine
Kontekst (NIAH)	97% @ 1M	95% @ 200K	96% @ 1M	Engram'i eelis
Multimodal	Natiivne	N/A	Natiivne	Tekst + Pilt + Video

Hoiatus: Sõltumatu kontroll

Oluline on märkida, et seisuga March 2026 pärinevad paljud neist numbritest sise-benchmark'idest. Kuni kolmandate osapoolte hinnangud organisatsioonidelt nagu Artificial Analysis, LMSYS või sõltumatutelt uurijatelt ei ole väiteid täielikult kinnitanud, tuleks täpseid protsente käsitleda pigem ambitsioonikate kui lõplikena.

Siiski, V3 benchmark'id kinnitati suures osas sõltumatute testidega, mis annab DeepSeek usaldusväärsust, et need V4 numbrid on õiges suurusjärgus.

Hinnastamine: Kulurevolutsioon jätkub

DeepSeek V4 hinnastamine on selle kõige häirivam omadus:

Mudel	Sisendhind (1M tokeni kohta)	Väljundhind (1M tokeni kohta)	Cache Hit hind
DeepSeek V4	$0.30	$0.50	$0.03
GPT-5.4	$2.50	$15.00	N/A
Claude Sonnet 4.6	$3.00	$15.00	$0.30
Claude Opus 4.6	$15.00	$75.00	$1.50

Cache hit hinnastamine on eriti veenev: kui teie prompt'id jagavad ühist eesliidet (prefix) (mis on tootmisrakendustes peaaegu alati nii), maksavad vahemällu salvestatud sisend-tokenid vaid $0.03 miljoni kohta — see on 90% allahindlus.

Mida see praktikas tähendab

Tüüpilise rakenduse looja jaoks, kes töötleb 100M tokenit kuus:

Pakkuja	Kuutasu
DeepSeek V4	~$40-80
GPT-5.4	~$500-1,500
Claude Sonnet 4.6	~$600-1,800
Claude Opus 4.6	~$3,000-9,000

See 10-40x kulueelis on põhjus, miks DeepSeek on laiemale AI ökosüsteemile oluline. See teeb frontier-class AI kättesaadavaks indie-arendajatele, väikestele startup'idele ja kulusäästlikele ettevõtete meeskondadele.

Platvormid nagu ZBuild saavad integreerida DeepSeek V4-i taustamudelina, kandes need dramaatilised kulusäästud otse kasutajatele, kes ehitavad AI-toega rakendusi.

Natiivne Multimodal: Tekst, Pilt ja Video

Erinevalt V3-st (ainult tekst), on V4 natiivselt multimodal. Nagu teatas Financial Times, integreerib V4 teksti, pildi ja video genereerimise juba eel-treeningu faasis, selle asemel, et lisada nägemisvõime eraldi moodulina.

See on oluline, sest:

Valdkondadeülene arutlemine on sidusam — mudel mõistab natiivselt seoseid tekstikirjelduste ja visuaalse sisu vahel.
Pildi- ja videomõistmine — V4 suudab analüüsida ekraanipilte, diagramme ja videokaadreid koos tekstiga.
Genereerimise võimekused — varajased teated viitavad teksti-pildiks ja teksti-videoks genereerimisele, kuigi kvaliteedi hinnangud on alles tekkimas.

Arendajatele, kes ehitavad visuaalset sisu töötlevaid rakendusi — dokumendianalüüs, UI disain, video kokkuvõtted — välistab natiivne multimodal tugi vajaduse eraldi vision API-de järele.

Praktilised Multimodal kasutusjuhud

Natiivne multimodal integratsioon avab mitmeid praktilisi töövoogusid:

Kood ekraanipiltidelt: Esitage ekraanipilt UI disainist ja V4 genereerib vastava koodi — HTML/CSS, React komponendid või SwiftUI vaated.
Diagrammide mõistmine: Sisestage arhitektuuri diagrammid, vooskeemid või andmebaasi skeemid ja V4 selgitab disaini, tuvastab probleeme või genereerib rakenduskoodi.
Dokumendi töötlemine: Ekstraheerige struktureeritud andmeid skaneeritud dokumentidest, arvetest ja vormidest ilma eraldi OCR torustikuta.
Video kokkuvõtted: Töödeldakse videokaadreid, et luua kokkuvõtteid, transkriptsioone või tõsta esile võtmehetki.

Rakenduste loojatele nagu ZBuild tähendab natiivne multimodal seda, et kasutajad saavad üles laadida makette ja ekraanipilte otse rakenduse loomise töövoo osana — AI mõistab visuaalset konteksti ilma lisatööriistadeta.

Open-source mõju

DeepSeek V4 Apache 2.0 litsents on tõenäoliselt olulisem kui selle benchmark tulemused. Siin on see, mida see võimaldab:

Isemajutus

Organisatsioonid, millel on andmete suveräänsuse nõuded, saavad käitada V4-i oma infrastruktuuris. Ei mingeid API väljakutseid, andmed ei lahku hoonest, puudub sõltuvus teenusepakkujast. ~37B aktiivset parameetrit tokeni kohta teevad selle käitatavaks tippklassi ettevõtte GPU klastrites.

Fine-Tuning

Avatud kaalud võimaldavad valdkonnaspetsiifilist fine-tuning'ut — meditsiin, õigus, rahandus või mis tahes spetsialiseeritud valdkond. See on võimatu OpenAI või Anthropic'u suletud mudelitega.

Teadustöö

Täielikud arhitektuuri detailid ja treeningmetoodika võimaldavad teadlaskonnal ehitada DeepSeek uuenduste peale. Engram mälu, DSA ja Manifold-Constrained Hyper-Connections on kõik uurimiseks ja täiustamiseks saadaval.

Kulude kontroll

Isegi lisaks DeepSeek niigi madalatele API hindadele, võib suuremahuline isemajutus veelgi vähendada tokeni kulusid. Miljardeid tokeneid kuus töötlevate suuremahuliste rakenduste puhul võib V4 isemajutus olla 100x odavam kui suletud API hinnad.

DeepSeek V4 vs. V3: Kas peaksite uuendama?

Olemasolevate DeepSeek V3 kasutajate jaoks on siin uuendamise arvutuskäik:

Funktsioon	V3	V4	Uuendamise mõju
Kontekstiaken	128K	1M	Suur — võimaldab koodibaasi-skaalal analüüsi
SWE-bench	69%	81%	Suur — 12-punktiline parandus
Multimodal	Ainult tekst	Tekst + Pilt + Video	Keskmine — sõltub kasutusjuhust
Engram mälu	Ei	Jah	Suur — märkimisväärselt parem otsing
API hind	$0.27/M sisend	$0.30/M sisend	Madal — minimaalne hinnatõus
Arhitektuur	MoE	MoE + Engram + DSA	Suur — fundamentaalselt parem

Otsus: Uuendage. Kulude kasv on tühine ning võimekuse parandused — eriti Engram mälu ja miljoni-tokeni kontekst — on märkimisväärsed. Ainus põhjus V3 juurde jäämiseks on see, kui teil on tootmises olevad tööd, mis nõuavad teie praeguse mudeli täpset käitumuslikku järjepidevust.

Kuidas DeepSeek V4 sobitub arendajate ökosüsteemi

Indie-arendajatele ja startup'idele

V4 hinnastamine teeb frontier-class AI kättesaadavaks startup-eelarvega. Koos Apache 2.0 litsentsiga saate ehitada ja juurutada tootmisrakendusi ilma muretsemata API kulude skaleerimise pärast. Tööriistad nagu ZBuild, mis integreerivad mitmeid mudelipakkujaid, võimaldavad teil ära kasutada DeepSeek V4 kulueeliseid, säilitades samal ajal võimaluse suunata konkreetseid ülesandeid vajadusel teistele mudelitele.

Ettevõtete meeskondadele

Isemajutusvõimalus lahendab samaaegselt andmete suveräänsuse, vastavuse ja kuludega seotud mured. Fine-tuning võimekus tähendab, et saate ehitada valdkonnaspetsiifilisi mudeleid, mis ületavad teie konkreetses valdkonnas üldotstarbelisi alternatiive.

Teadlastele

Avatud arhitektuur on kullakaevandus. Engram mälu üksi avab mitmeid uurimissuundi — tingimuslikud mäluarhitektuurid, hõreduse jaotuse optimeerimine ja hübriidsed otsingu-arvutussüsteemid.

AI-tööstusele

V4 avaldab survet igale frontier mudeli pakkujale oma hinnastamist õigustama. Kui open-source mudel vastab või ületab suletud mudelite benchmark'e 10x madalama hinnaga, nihkub suletud mudelite väärtuspakkumine "paremalt jõudluselt" "paremale integratsioonile, toele ja usaldusväärsusele".

Riskid ja ebakindlus

Benchmark'ide kontroll

81% SWE-bench väide vajab sõltumatut kinnitust. DeepSeek on olnud V3 benchmark'idega usaldusväärne, kuid triljoni-parameetriga mudeleid on raskem järjepidevalt hinnata. Oodake ära Artificial Analysis ja LMSYS tulemused, enne kui teete infrastruktuuriotsuseid täpsete numbrite põhjal.

Geopoliitiline risk

DeepSeek on Hiina ettevõte ning USA-Hiina tehnoloogilised pinged jätkuvad. Ekspordikontrollid, API juurdepääsupiirangud või poliitiline surve võivad mõjutada kättesaadavust Lääne arendajatele. Isemajutus koos avatud kaaludega leevendab, kuid ei kõrvalda seda riski.

Multimodal kvaliteet

Multimodaalsed võimekused on V4 kõige vähem testitud aspekt. Pildi- ja videomõistmise kvaliteet vajab reaalset valideerimist peale sise-benchmark'ide.

Tugi ja usaldusväärsus

Open-source tähendab kogukonna tuge, mitte ettevõtte SLA-sid. Kui teie tootmisrakendus sõltub V4-st, vastutate ise tööaja, skaleerimise ja silumise eest. DeepSeek API teenus on olnud usaldusväärne, kuid see ei paku OpenAI või Anthropic'u ettevõtte tasemel tugistruktuuri.

Kokkuvõte

DeepSeek V4 on seni kõige olulisem 2026. aastal välja antud open-source AI mudel. Selle kombinatsioon triljoni-parameetri skaalast, Engram mälu innovatsioonist, miljoni-tokeni kontekstist, natiivsetest multimodaalsetest võimekustest ja agressiivselt madalast hinnast Apache 2.0 litsentsi all teeb sellest tõelise alternatiivi suletud frontier-mudelitele.

Hoiatused on tõesed — benchmark'ide kontrollimine kestab, geopoliitilised riskid on olemas ja ettevõtte tugi on piiratud. Kuid arendajatele ja organisatsioonidele, kes on valmis neis ebakindlustes navigeerima, pakub V4 frontier-class võimekust murdosa eest kuludest.

Kasutate te seda läbi DeepSeek API, majutate seda ise oma infrastruktuuris või kasutate seda läbi platvormide nagu ZBuild, mis integreerivad mitmeid mudelipakkujaid — DeepSeek V4 väärib kohta teie AI-tööriistakastis.

Korduma kippuvad küsimused

Kas ma saan DeepSeek V4 isemajutada tavakasutaja riistvaral?

Mitte praktiliselt. Kuigi mudel aktiveerib vaid ~37B parameetrit tokeni kohta, nõuab täieliku 1T parameetriga MoE mudeli majutamine märkimisväärset GPU mälu expert routing tabelite jaoks. Te vajate ettevõtte taseme GPU klastreid (mitu A100 või H100 seadet). Enamiku arendajate jaoks on DeepSeek API hinnaga $0.30/M sisend-tokenit palju kuluefektiivsem kui isemajutus, välja arvatud juhul, kui töötlete miljardeid tokeneid kuus.

Kuidas V4 Lite erineb täielikust V4 mudelist?

DeepSeek V4 Lite ilmus DeepSeek veebilehele March 9, 2026, kuid ametlikke spetsifikatsioone pole avaldatud. Tuginedes DeepSeek nimeandmise mustritele V3 puhul, viitab "Lite" tõenäoliselt destilleeritud või väiksemale variandile, mis on optimeeritud kiiruse ja kulu jaoks mõne võimekuse arvelt. Eeldatavasti on see kiirem ja odavam, kuid madalama jõudlusega keeruliste arutlusülesannete puhul.

Kas DeepSeek V4 on teatud teemade puhul tsensureeritud?

Nagu kõik Hiina AI mudelid, on ka DeepSeek V4-l sisu filtreerimine poliitiliselt tundlike teemade puhul, eriti nende, mis puudutavad Hiina poliitikat ja valitsemist. Üldiseks arendustööks, kodeerimiseks ja tehnilisteks kasutusjuhtudeks on filtreerimisel minimaalne mõju. Rakenduste puhul, mis hõlmavad tundlikku poliitilist sisu või piiranguteta genereerimist, on see asjakohane kaalutlus.

Milliste programmeerimiskeeltega saab V4 kõige paremini hakkama?

Tuginedes SWE-bench tulemustele (mis testivad peamiselt Pythonit, JavaScripti ja Javat), on V4 suurepärane peavoolu keeltes. Kogukonna raportid viitavad tugevale jõudlusele Pythonis, JavaScript/TypeScriptis, Javas, Go-s, Rustis ja C++ keeles. Vähem levinud keeled nagu Haskell, Elixir või Zig saavad tõenäoliselt nõrgemat tuge treeningandmete jaotuse tõttu.

Kuidas võrreldub DeepSeek V4 Llama 4-ga isemajutuse osas?

Mõlemad on open-source ja saadaval permissiivsete litsentside all. DeepSeek V4 MoE arhitektuur koos ~37B aktiivse parameetriga tokeni kohta pakub paremat jõudlust arvutuse kohta kui tihedad (dense) mudelid. Llama 4 eelis on Meta suurem ökosüsteem ja kogukonna tugi. Puhta võimekuse ja hinna suhte poolest võidab tõenäoliselt V4. Kogukonna tööriistade ja fine-tuning ökosüsteemi poolest võib Llama olla kättesaadavam.

DeepSeek V4 väljalase: spetsifikatsioonid, võrdlustestid ja kõik, mida teame 1T avatud lähtekoodiga mudeli kohta (2026)