今後登場する DeepSeek V4 は歴史を繰り返すのでしょうか、それともそれを超えるのでしょうか? DeepSeek はかつて、ChatGPT に匹敵する最先端の LLM を構築するのに 1 億ドルと Nvidia H100 の倉庫は必要ないことを証明し、AI 業界に衝撃を与えました。
しかし、その誇大宣伝が静かに消え去った後、DeepSeek は V4 で復活しようとしています。 DeepSeek v4 のリリース日、新機能、期待できることについて説明するので、今後の展開を見逃すことはありません。
パート 1. DeepSeek とは何ですか?
DeepSeek は中国の杭州に設立された中国の AI 研究研究所で、過去 2 年間、OpenAI の ChatGPT などの AI 巨人に挑戦してきました。オープンソース ライセンスの下で大規模言語モデル (LLM) を構築およびリリースしており、注目を集め続けているのは、わずかな実行コストでどれだけの成果を提供できるかという点です。
同社は2025年初頭に、数学とコーディングのベンチマークでOpenAIのo1に匹敵する推論モデルであるDeepSeek R1をリリースしたとき、世界的な見出しを飾ったが、そのトレーニング費用は約600万ドルだったと言われている。参考までに、GPT-4 の訓練には 1 億ドル以上の費用がかかったと推定されています。このニュースにより、NVIDIA の時価総額は 1 日で 6,000 億ドル消え去りました。
その爆発的なスタートにもかかわらず、DeepSeek AI の勢いは年間を通じて鈍化しました。オープンソース モデル市場におけるシェアは、2025 年初めの約 50% から年末までに 25% 以下に低下しました。 12 か月で市場での地位の半分を失いました。
現在のバージョンと今後の V4 モデル
競合他社が急速に追いついたため、2025 年 12 月に DeepSeek V3 の下で 2 つの新しいモデル、 DeepSeek-V3.2 をリリースして戻ってきました。 およびDeepSeek-V3.2-Speciale 、どちらもウェブ、アプリ、API で無料で利用できます。
現在、DeepSeek は DeepSeek V4 の準備を進めていると伝えられています。以前のバージョンの弱点や、DeepSeek がマルチモーダルな競合他社に比べて明らかに遅れをとっていた分野(ビジュアル コンテンツ処理など)に対処することが期待されています。 、AI 検索 、 そして長期文脈記憶 .
パート 2. DeepSeek V4 のリリース日とこれまでにわかっていること
多くの人が待っていましたが、DeepSeek V4 のリリース日は会社自体によって確認されていません。 3 月初旬に、DeepSeek V4 Lite がプラットフォームに一時的に登場し、期待がさらに高まりました。一部の報道や初期の議論では、早ければ 2026 年 4 月に到着する可能性があると示唆されています。
ただし、V4 が実際に何をするために構築されているかをより明確に示す、アーキテクチャと内部ベンチマークに関する漏洩された詳細があります。
- コーディング: DeepSeek V4 のコーディング パフォーマンスは、SWE ベンチ検証で約 81% と、V3 の 69% から上昇していると言われていますが、独立した検証はまだ行われていません。 100 万トークンのコンテキスト ウィンドウを備えたモデルは、コードベース全体を 1 回のパスで処理できます。
- 長期記憶: V4 は、事実の想起と能動的な推論を分離するエングラム メモリ アーキテクチャを中心に構築されています。内部ベンチマークでは、100 万トークン規模で 97% の Needle-in-a-Haystack の精度を保証しています。
- マルチモーダル: テキストのみだった以前の DeepSeek モデルとは異なり、V4 はアドオンとしてではなく、事前トレーニング中にテキスト、画像、ビデオをネイティブに統合します。
このような展開にもかかわらず、NASDAQ や NYSE などの主要取引所で利用できる DeepSeek 株はまだありません。 DeepSeek は中国の非公開 AI スタートアップ企業で、中国のクオンツ ヘッジファンドである High-Flyer が全額出資し、所有しています。上場はしておらず、その計画も発表していません。
DeepSeek V4 の予想価格
V4 のコストは入力トークン 100 万件あたり 0.30 ドルになると予想されます。 および 100 万出力トークンあたり 0.50 ドル 。これは V3.2 よりわずかに高いですが、それでも GPT および Claude の主力モデルの価格をはるかに下回っています。 DeepSeek AI チャット プラットフォームは、個人ユーザーにとって引き続き無料です。
DeepSeek V4 を支えるテクノロジー
DeepSeek V4 が約束するすべての背後には、それを可能にする一連のアーキテクチャのアップグレードがあります。
1. MODEL1 アーキテクチャ
報告によると、MODEL1 は V4 の内部コードネームです。 mHC トレーニング フレームワークと、エングラム メモリを介して再設計されたキーバリュー (KV) キャッシュを組み合わせます。結果は数兆のパラメータ モデルです。 これは、数年前のはるかに小型のモデルには不十分だったハードウェア上で実行されます。これにより、DeepSeek V4 のシステム効率がさらに向上し、メモリ使用量が 40% 削減され、スパース FP8 デコーディングによって推論が 1.8 倍高速になったと報告されています。
2.スパース FP8 デコード
V4 はデフォルトで FP8 で動作します。FP8 は軽量で高速な処理フォーマットです。 。複雑な推論や数学など、より精度が必要なタスクの場合は、自動的に FP16 に切り替えることができます。リスクが高くなった場合でも、精度を犠牲にすることなく日常のタスクを迅速に行うことができます。
3.エングラムメモリモジュール
標準的な LLM が通常、事実の想起と能動的な推論を同じニューラル ネットワーク内に保持する場合、エングラムはそれらを分割します。 推論は高速処理のために GPU 上に留まり、実際のストレージは圧縮され、必要な場合にのみ呼び出されます .
4. mHC 最適化された残留接続
V4 がコストを上昇させることなく拡張できる大きな理由の 1 つは mHC です。追加のトレーニング オーバーヘッドは約 6.7% のみで、レイヤー間の情報の移動方法が改善されます。その結果、 この規模で通常予想されるコストの高騰を伴うことなく、 より高性能なモデルを入手できる 。 DeepSeek V4 の API 価格も、その規模にもかかわらず競争力を維持できます。
パート 3. DeepSeek モデルの比較:R1、V3、および V4
では、DeepSeek V4 は以前のバージョンと比べてどのように機能するのでしょうか?各世代で実際に何が変更されたのかをわかりやすくするために、3 つのモデルを並べて配置しました。
| R1 | V3 | V4 | ||
| パラメータ | 合計 6,710 億、アクティブ 370 億 | 合計 6,710 億、アクティブ 370 億 | 1 兆 (推定) | |
| コンテキスト ウィンドウ | 128,000 トークン | 128,000 トークン | 100 万トークン | |
| コーディングベンチマーク | OpenAI o1 と同等 | 69% が SWE ベンチで検証済み | 81% が SWE ベンチで検証済み (推定) | |
| 推論機能 | 純粋な思考連鎖推論モデル | ハイブリッド; R1 から抽出された推論 | ハイブリッド; Engram によるより深いロングコンテキスト推論 | |
| マルチモーダル | テキストのみ | テキストのみ | テキスト、画像、ビデオ (ネイティブ) | |
| API 価格 (入力) | $0.55/M トークン | $0.14 ~ $0.28/M トークン | $0.30/M トークン |
| ディープシーク V4 | GPT-5.4 | ジェミニ 3.1 プロ | クロード 作品 4.6 | |
| オープンソース | ||||
| 推論能力 | エングラム記憶力が高く、長い文脈の推論を向上させる | 92.8% GPQA | 94.3% GPQA | 91.3% GPQA |
| エージェント コーディング | 約 81% が SWE ベンチで検証済み (推定) | 80% SWE ベンチで検証済み | 80.6% が SWE ベンチで検証済み | 80.8% が SWE ベンチで検証済み |
| コンテキスト ウィンドウ | 100 万トークン | 272K トークン (標準); 100 万トークン (コーデックス) | 100 万トークン | 100 万トークン |
| 入力 (100 万トークンあたり) | $0.3 | $2.5 | $2 | $5 |
| 出力 (100 万トークンあたり) | $0.5 | $15 | $12 | $25 |
| 最適な用途 | コスト重視の API ワークロード、コーディング、オープンソースの柔軟性 | 多才さ、コンピュータの使用、知識労働 | 博士レベルの推論、研究、価格パフォーマンス | 複雑なコーディング、エージェント ワークフロー、エンタープライズ |
| エコシステム | オープンソース、自己ホスト可能 | 最大規模のサードパーティ統合 | Google Workspace との緊密な統合 | 強力な開発者ツール (カーソル、クロード コード) |
安全なダウンロード