主な要点
- 1 trillion パラメータ、37B アクティブ: DeepSeek V4 は Mixture-of-Experts architecture を採用しており、1 トークンあたり約 37B パラメータのみをアクティブにします。これにより、総パラメータ数が 50% 増加したにもかかわらず、推論コストを V3 と同等に抑えています。
- 81% SWE-bench Verified: V4 は コーディングベンチマークの王座を獲得 し、Claude Opus 4.5 の以前の記録である 80.9% を塗り替えました。
- Engram memory はアーキテクチャ上の画期的な進歩: 新しい条件付きメモリシステム により、O(1) の知識検索を実現し、1M トークンスケールの Needle-in-a-Haystack で 97% の精度を達成しました。
- 欧米の競合他社より 10倍 低価格: 入力 1M tokens あたり $0.30 という価格設定により、V4 は GPT-5.4 ($2.50) や Claude ($3-15) を桁違いに下回るコストを実現しています。
- Apache 2.0 の下でオープンソース化: モデルの全ウェイトがローカルデプロイ、Fine-tuning、および商用利用向けに公開されています。このレベルのオープン性を備えたフロンティア級モデルは他にありません。
DeepSeek V4: AI の経済学を書き換えるオープンソースモデル
DeepSeek がまたしてもやってのけました。V3 が、中国の研究所が欧米の数分の一のコストでフロンティア級のモデルを構築できることを証明した後、V4 は AI インフラの意思決定を行うすべての開発者、スタートアップ、企業が注目せざるを得ないレベルまでハードルを引き上げました。
1 trillion パラメータ。1M トークンのコンテキスト。ネイティブなマルチモーダル。81% SWE-bench Verified。そして、これらすべてが Apache 2.0 の下でオープンソース化され、欧米の競合他社よりも 10-40倍低い推論コスト で提供されています。
これらの主張が独立した精査の下で完全に維持されるかどうかは、まだ確認の最中です。しかし、アーキテクチャの革新、特に Engram memory は、業界全体のモデル設計に影響を与える真の進歩を表しています。
以下は、March 2026 時点で判明しているすべての情報です。
リリースタイムライン
DeepSeek V4 のリリースまでの道のりは平坦ではなく、複数回の遅延がありました。
| 日付 | イベント |
|---|---|
| January 2026 | Engram 論文公開 — 条件付きメモリアーキテクチャ |
| February 2026 (early) | 当初のリリース目標 — 延期 |
| February 2026 (mid) | 2度目のリリース目標 — 再び延期 |
| Early March 2026 | フル V4 モデル発表 |
| March 9, 2026 | DeepSeek のウェブサイトに "V4 Lite" が登場 |
| March 2026 (進行中) | 第三者によるベンチマークとコミュニティによる検証 |
リリースの遅れは、むしろ期待感を高める結果となりました。V4 が発表される頃には、Engram 論文はすでに広く議論されており、期待は最高潮に達していました。
アーキテクチャの詳細解説
兆規模の Mixture-of-Experts
DeepSeek V4 は、V3 を非常に効率的にした MoE アーキテクチャを継承しつつ、劇的にスケールアップ させています。
| 指標 | DeepSeek V3 | DeepSeek V4 |
|---|---|---|
| 総パラメータ数 | 671B | ~1T |
| アクティブパラメータ数 | ~37B | ~37B |
| コンテキストウィンドウ | 128K | 1M |
| アーキテクチャ | MoE | MoE + Engram |
| マルチモーダル | テキストのみ | テキスト + 画像 + 動画 |
| ライセンス | Apache 2.0 | Apache 2.0 |
重要な洞察:総パラメータ数は 50% 増加しましたが、1 トークンあたりのアクティブパラメータ数は ~37B のまま一定です。これは、V4 が推論コストを比例して増加させることなく、はるかに多くの知識と能力にアクセスできることを意味します。
Engram: メモリの革命
Engram は、V4 におけるアーキテクチャ上の最も重要な革新です。DeepSeek の January 2026 の論文 (「Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models」)で詳述されており、Transformers の根本的な限界に対処しています。
課題: 従来の Transformers は、すべての知識を計算を通じて同じように処理します。モデルが「パリはフランスの首都である」という静的な事実を思い出す必要がある場合でも、複雑なコードのリファクタリングという動的な計算について推論する必要がある場合でも、同じ Attention メカニズムを使用します。これは非効率的です。
Engram による解決策: 静的で決定論的な知識のために、別のメモリシステムを追加します。「フランスの首都は何ですか?」という問いへの答えを複数の Attention レイヤーを通じて計算する代わりに、Engram は O(1) の決定論的なルックアップ を提供します。これは本質的に、事実に関する知識のための学習済みハッシュテーブルです。
主要な発見 — スパース性割り当ての法則 (Sparsity Allocation Law): DeepSeek の研究により、固定されたスパースパラメータ予算の下では、最適な分割は約 20-25% のメモリ (Engram) と 75-80% の計算 (MoE) であることが明らかになりました。この比率により、想起精度と推論能力の両方が最大化されます。
パフォーマンスへの影響: Engram は、1M トークンのコンテキストスケールで 97% の Needle-in-a-Haystack 精度 を達成し、標準的な Transformer アーキテクチャを悩ませてきた検索精度の低下問題を解決しました。1M トークンでは、ほとんどのモデルの検索精度は 80% 以下に低下しますが、Engram を搭載した V4 は 97% を維持します。
DeepSeek Sparse Attention (DSA)
Engram に加え、V4 は DeepSeek Sparse Attention を導入しています。これは、入力の複雑さに基づいて計算を動的に割り当てる Attention メカニズムです。単純な文章には軽量な Attention を、複雑な推論が必要な文章にはフル深度の Attention を割り当てます。
これにより、1M トークンのコンテキストウィンドウが実用的になります。DSA がなければ、DeepSeek の低コストであっても 1M トークンの処理は非常に高価になります。DSA により、コンテキストウィンドウの大部分が効率的に処理され、フルパワーの計算はそれを必要とする部分のために予約されます。
Manifold-Constrained Hyper-Connections
3つ目のアーキテクチャ上の革新は、Manifold-Constrained Hyper-Connections です。これはトレーニング中の勾配フローを改善する手法です。その実際的な結果として、1 trillion パラメータスケールでのトレーニングがより安定し、DeepSeek が欧米の数分の一のコストで V4 をトレーニングできた理由の一部を説明しています。
ベンチマーク分析
数値データ
| ベンチマーク | DeepSeek V4 | Claude Opus 4.5 | GPT-5.4 | 備考 |
|---|---|---|---|---|
| SWE-bench Verified | 81% | 80.9% | ~82% | V4 が以前の記録を更新 |
| HumanEval | 90% | ~88% | ~90% | コード生成能力 |
| Context (NIAH) | 97% @ 1M | 95% @ 200K | 96% @ 1M | Engram の優位性 |
| マルチモーダル | ネイティブ | N/A | ネイティブ | テキスト + 画像 + 動画 |
注意事項:第三者による検証
March 2026 後半の時点で、これらの数値の多くは内部ベンチマークによるもの であることに注意が必要です。Artificial Analysis、LMSYS、または独立した研究者などの組織による第三者評価で主張が完全に確認されるまでは、正確なパーセンテージは確定的なものではなく、目標値として扱うべきです。
とはいえ、V3 のベンチマークは第三者テストによって概ね確認されており、DeepSeek が主張する V4 の数値が妥当な範囲内にあるという信頼性を与えています。
価格設定:コスト革命は続く
DeepSeek V4 の価格設定は、その最も破壊的な特徴です。
| モデル | 入力価格(1M tokens あたり) | 出力価格(1M tokens あたり) | キャッシュヒット価格 |
|---|---|---|---|
| DeepSeek V4 | $0.30 | $0.50 | $0.03 |
| GPT-5.4 | $2.50 | $15.00 | N/A |
| Claude Sonnet 4.6 | $3.00 | $15.00 | $0.30 |
| Claude Opus 4.6 | $15.00 | $75.00 | $1.50 |
特にキャッシュヒットの価格設定は強力です。プロンプトが共通のプレフィックスを共有している場合(プロダクション環境のアプリケーションではほぼ常にそうです)、キャッシュされた入力トークンのコストは わずか 1M tokens あたり $0.03 となり、90% の割引 が適用されます。
実践的な意味
月に 100M tokens を処理する典型的なアプリ開発者の場合:
| プロバイダー | 月額コスト |
|---|---|
| DeepSeek V4 | ~$40-80 |
| GPT-5.4 | ~$500-1,500 |
| Claude Sonnet 4.6 | ~$600-1,800 |
| Claude Opus 4.6 | ~$3,000-9,000 |
この 10-40倍 のコスト優位性が、AI エコシステム全体にとって DeepSeek が重要である理由です。これにより、個人開発者、小規模スタートアップ、コストに敏感な企業のチームでもフロンティア級の AI を利用できるようになります。
ZBuild のようなプラットフォームは、DeepSeek V4 をバックエンドモデルのオプションとして統合し、AI 搭載アプリケーションを構築するユーザーにこの劇的なコスト削減を直接還元することができます。
ネイティブなマルチモーダル:テキスト、画像、動画
テキストのみだった V3 とは異なり、V4 はネイティブなマルチモーダル です。Financial Times が報じたように、V4 はビジョンを別個のモジュールとして後付けするのではなく、事前学習の段階からテキスト、画像、動画の生成を統合しています。
これが重要な理由は以下の通りです:
- クロスモーダルな推論がより一貫している — モデルはテキストの説明と視覚的なコンテンツの関係をネイティブに理解します。
- 画像と動画の理解 — V4 はテキストと並行してスクリーンショット、図、動画フレームを分析できます。
- 生成能力 — 初期の報告ではテキストから画像、テキストから動画への生成が可能であることが示唆されていますが、品質評価はまだこれからです。
ドキュメント分析、UI デザイン、動画の要約など、視覚的コンテンツを処理するアプリケーションを構築する開発者にとって、ネイティブなマルチモーダルサポートにより、個別のビジョン API が不要になります。
実践的なマルチモーダルのユースケース
ネイティブなマルチモーダル統合により、いくつかの実践的なワークフローが可能になります:
- スクリーンショットからのコード生成: UI デザインのスクリーンショットを提供すると、V4 は対応するコード(HTML/CSS、React コンポーネント、または SwiftUI ビュー)を生成します。
- 図解の理解: アーキテクチャ図、フローチャート、データベーススキーマを読み込ませると、V4 は設計を説明し、問題を特定し、実装コードを生成します。
- ドキュメント処理: OCR パイプラインを別途用意することなく、スキャンされたドキュメント、請求書、フォームから構造化データを抽出します。
- 動画の要約: 動画フレームを処理して、要約、文字起こし、または重要な瞬間のハイライトを生成します。
ZBuild のようなアプリビルダーにとって、ネイティブマルチモーダルは、ユーザーがアプリ作成ワークフローの一環としてモックアップやスクリーンショットを直接アップロードできることを意味します。AI は追加のツールなしで視覚的なコンテキストを理解します。
オープンソースによる影響
DeepSeek V4 の Apache 2.0 ライセンスは、おそらくベンチマークスコアよりも重要です。これにより以下のことが可能になります:
セルフホスティング
データ主権の要件がある組織は、自社のインフラストラクチャで V4 を実行できます。API 呼び出しは不要で、データが外部に出ることもなく、ベンダーロックインもありません。1 トークンあたり ~37B のアクティブパラメータにより、ハイエンドのエンタープライズ GPU クラスタでの実行が可能です。
Fine-tuning
オープンなウェイトにより、医療、法律、金融、またはあらゆる専門分野に特化した Fine-tuning が可能になります。これは OpenAI や Anthropic のプロプライエタリなモデルでは不可能です。
研究
完全なアーキテクチャの詳細とトレーニング手法により、研究コミュニティは DeepSeek の革新を基にさらに発展させることができます。Engram memory、DSA、Manifold-Constrained Hyper-Connections はすべて、研究と改善のために利用可能です。
コスト管理
DeepSeek の元々低い API 価格を超えて、大規模なセルフホスティングはトークンあたりのコストをさらに削減できます。毎月数十億トークンを処理する高ボリュームのアプリケーションでは、V4 のセルフホスティングはプロプライエタリな API よりも 100倍安くなる可能性があります。
DeepSeek V4 vs. V3: アップグレードすべきか?
既存の DeepSeek V3 ユーザー向けのアップグレード判断基準は以下の通りです:
| 機能 | V3 | V4 | アップグレードの影響 |
|---|---|---|---|
| コンテキストウィンドウ | 128K | 1M | 高 — コードベース全体の分析が可能 |
| SWE-bench | 69% | 81% | 高 — 12ポイントの向上 |
| マルチモーダル | テキストのみ | テキスト + 画像 + 動画 | 中 — ユースケースに依存 |
| Engram Memory | なし | あり | 高 — 検索能力が劇的に向上 |
| API 価格 | $0.27/M 入力 | $0.30/M 入力 | 低 — 最小限のコスト増 |
| アーキテクチャ | MoE | MoE + Engram + DSA | 高 — 根本的に優れた構造 |
結論: アップグレードを推奨します。コスト増は無視できるレベルであり、能力の向上、特に Engram memory と 1M トークンのコンテキストは非常に実用的です。V3 に留まる唯一の理由は、現在のモデルの正確な挙動の一貫性を必要とするプロダクション環境のワークロードがある場合のみです。
デベロッパーエコシステムにおける DeepSeek V4 の位置付け
個人開発者およびスタートアップ向け
V4 の価格設定により、スタートアップの予算でもフロンティア級の AI が利用可能になります。Apache 2.0 ライセンスと組み合わせることで、API コストの増大を心配することなく、プロダクションアプリケーションを構築・デプロイできます。ZBuild のように複数のモデルプロバイダーを統合するツールを使用すれば、DeepSeek V4 のコスト優位性を享受しつつ、必要に応じて特定のタスクを他のモデルに振り分ける柔軟性も維持できます。
エンタープライズチーム向け
セルフホスティングのオプションは、データ主権、コンプライアンス、コストの懸念を同時に解決します。Fine-tuning 能力により、特定の垂直市場において汎用モデルを凌駕するドメイン特化型モデルを構築できます。
研究者向け
オープンなアーキテクチャは情報の宝庫です。Engram memory だけでも、条件付きメモリアーキテクチャ、スパース性割り当ての最適化、ハイブリッドな検索・計算システムなど、複数の研究方向を切り開きます。
AI 業界全体向け
V4 は、すべてのフロンティアモデルプロバイダーに対し、自社の価格設定を正当化するよう迫っています。オープンソースモデルがプロプライエタリなベンチマークに匹敵、あるいはそれを上回る性能を 10倍低いコストで提供する場合、クローズドモデルの価値提案は「より高いパフォーマンス」から「より優れた統合、サポート、信頼性」へとシフトします。
リスクと不確実性
ベンチマークの検証
81% SWE-bench の主張には第三者による確認が必要 です。DeepSeek は V3 のベンチマークにおいて信頼できる実績がありますが、1 trillion パラメータモデルを一貫して評価するのはより困難です。正確な数値に基づいてインフラの決定を行う前に、Artificial Analysis や LMSYS の結果を待つべきです。
地政学的リスク
DeepSeek は中国企業であり、米中間のテック分野の緊張は続いています。輸出規制、API アクセス制限、または政治的圧力により、欧米の開発者向けの可用性が影響を受ける可能性があります。オープンなウェイトでのセルフホスティングはこのリスクを軽減しますが、完全に排除するものではありません。
マルチモーダルの品質
マルチモーダル機能は V4 の中で最もテストが進んでいない部分です。画像や動画の理解品質については、内部ベンチマークを超えた現実世界での検証が必要です。
サポートと信頼性
オープンソースであることはコミュニティサポートを意味し、エンタープライズ向けの SLA ではありません。プロダクションアプリケーションが V4 に依存する場合、アップタイム、スケーリング、デバッグの責任はユーザー側にあります。DeepSeek の API サービスは信頼性が高いですが、OpenAI や Anthropic のようなエンタープライズサポートインフラは提供していません。
結論
DeepSeek V4 は、2026年 これまでにリリースされた中で最も重要なオープンソース AI モデルです。1 trillion パラメータという規模、Engram memory の革新、1M トークンのコンテキスト、ネイティブなマルチモーダル機能、そして Apache 2.0 ライセンスの下での圧倒的な低価格を組み合わせることで、プロプライエタリなフロンティアモデルに対する真の代替肢となっています。
注意事項は現実に存在します。ベンチマークの検証は進行中であり、地政学的リスクも存在し、エンタープライズサポートも限られています。しかし、それらの不確実性を乗り越える意欲のある開発者や組織にとって、V4 はフロンティア級の機能を数分の一のコストで提供してくれます。
DeepSeek の API を通じてアクセスするか、自社のインフラでセルフホストするか、あるいは ZBuild のような複数のモデルを統合するプラットフォームを利用するかにかかわらず、DeepSeek V4 はあなたの AI ツールキットに加える価値のある存在です。
よくある質問
DeepSeek V4 をコンシューマー向けハードウェアでセルフホストできますか?
現実的には不可能です。このモデルは 1 トークンあたり約 37B パラメータのみをアクティブにしますが、1T パラメータのフル MoE モデルをホストするには、エキスパートルーティングテーブルのために膨大な GPU メモリが必要です。エンタープライズグレードの GPU クラスタ(複数の A100 または H100)が必要になります。ほとんどの開発者にとって、月に数十億トークンを処理するのでない限り、入力 1M tokens あたり $0.30 という DeepSeek の API を利用する方がセルフホスティングよりもはるかにコスト効率が高いです。
V4 Lite はフル V4 モデルとどう違うのですか?
DeepSeek V4 Lite は March 9, 2026 に DeepSeek のウェブサイト に登場しましたが、公式のスペックは公開されていません。V3 における命名パターンに基づくと、「Lite」はおそらく速度とコストを最適化した、蒸留された、または小規模なバリアントであり、いくつかの機能が犠牲になっていると考えられます。より高速で安価ですが、複雑な推論タスクでのパフォーマンスは低下することが予想されます。
DeepSeek V4 は特定のトピックについて検閲されていますか?
すべての中国の AI モデルと同様に、DeepSeek V4 は政治的に敏感なトピック、特に中国の政治や統治に関連するものについてコンテンツフィルタリングを備えています。一般的な開発、コーディング、技術的なユースケースにおいては、フィルタリングの影響は最小限です。敏感な政治的コンテンツや無制限の生成を伴うアプリケーションの場合、これは正当な考慮事項となります。
V4 が最も得意とするプログラミング言語は何ですか?
Python、JavaScript、Java を主にテストする SWE-bench の結果に基づくと、V4 は主要な言語で優れた性能を発揮します。コミュニティの報告では、Python、JavaScript/TypeScript、Java、Go、Rust、C++ で高いパフォーマンスが示されています。Haskell、Elixir、Zig などの普及率の低い言語は、トレーニングデータの分布の関係でサポートが弱くなる可能性があります。
セルフホスティングにおいて DeepSeek V4 は Llama 4 と比べてどうですか?
どちらもオープンソースであり、寛容なライセンスで提供されています。DeepSeek V4 の MoE アーキテクチャ(1 トークンあたり約 37B アクティブパラメータ)は、密なモデル(Dense models)よりも計算あたりのパフォーマンスに優れています。Llama 4 の利点は、Meta のより大きなエコシステムとコミュニティサポートにあります。純粋なコストパフォーマンスでは V4 が勝る可能性が高いですが、コミュニティツールや Fine-tuning のエコシステムについては Llama の方がアクセスしやすいかもしれません。
出典
- DeepSeek V4: Engram Architecture Revealed
- DeepSeek V4: What's Next — Architecture, DSA, Engram & More
- Introl: DeepSeek V4's 1-Trillion Parameter Architecture
- ByteIota: DeepSeek V4 Targets 80.9% SWE-Bench Record
- CyberNews: DeepSeek V4 Review
- Evolink: DeepSeek V4 Release Date
- PromptZone: DeepSeek V4 Status Report March 2026
- VERTU: DeepSeek V4 Engram Architecture
- Kili Technology: DeepSeek V4 Guide
- Evermx: DeepSeek V4 Multimodal Launch
- RecodeChina: DeepSeek's Next Move
- DeepSeek V4 Status and Leaks