DeepSeek V4のリリース状況と最新情報(2026年3月時点)
リリース概要
DeepSeek V4は2026年3月7日時点でまだリリースされていません。
2026年3月7日の調査で、以下の公式ソースを確認しました:
- DeepSeek公式サイト (deepseek.com): V3.2の発表のみ、V4への言及なし
- GitHub (github.com/deepseek-ai): 最新リポジトリはDeepSeek-V3、DeepSeek-R1、V4への言及なし
- API ドキュメント (api-docs.deepseek.com): モデルは
deepseek-chat/deepseek-reasoner(V3.2対応)のみ - HuggingFace (huggingface.co/deepseek-ai): 最新コレクションはDeepSeek-V3.2
最新版はDeepSeek-V3.2であり、V4に関する公式発表は一切存在しません。
現在の最新モデル構成
DeepSeekが現在提供している主要モデルは以下の通りです:
1. DeepSeek-V3.2(最新)
- 総パラメータ数: 671B(アクティブ: 37B)
- コンテキスト長: 128K
- アーキテクチャ: Mixture-of-Experts (MoE)
- 特徴: Multi-head Latent Attention (MLA)、補助損失なし負荷分散戦略
- 学習データ: 14.8兆トークン
2. DeepSeek-R1(推論特化型)
- ベースモデル: DeepSeek-V3-Base
- 特徴: 大規模強化学習(RL)による推論能力の向上
- 性能: OpenAI o1と同等の性能(数学・コード・推論タスク)
- 派生モデル: 1.5B、7B、8B、14B、32B、70Bの蒸留モデルを公開
技術的ハイライト
FP8混合精度トレーニング
DeepSeek-V3は初めて超大规模モデルでFP8トレーニングの実用性を検証しました。
中国製ハードウェア対応
- Huawei Ascend NPU: INT8/BF16での実行をサポート
- AMD GPU: SGLang経由でFP8/BF16に対応
- これにより、NVIDIA GPU以外での運用が可能になっています
高効率トレーニング
- 事前学習に必要なGPU時間: 2.664M H800 GPU時間
- トレーニングコストの大幅削減を実現
使い方
Web/アプリ
- 公式サイト: chat.deepseek.com
- DeepThinkモード: R1の推論機能を有効化
API
curl https://api.deepseek.com/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $DEEPSEEK_API_KEY" \
-d '{
"model": "deepseek-chat",
"messages": [{"role": "user", "content": "Hello!"}]
}'
deepseek-chat: V3.2(非思考モード)deepseek-reasoner: V3.2(思考モード)
ローカル実行
- SGLang、vLLM、LMDeploy、TensorRT-LLMに対応
- Hugging Faceからモデルをダウンロード可能
今後の展望
DeepSeekは急速にモデルを進化させており、V3.2へのアップデートからV4のリリースまでの期間は予測が困難です。R1の研究はNature 2025年号に掲載されるなど、学術的にも高い評価を受けています。V4のリリースについては、公式サイト(deepseek.com)およびGitHub(github.com/deepseek-ai)で公式発表を確認することをお勧めします。
参考リンク
- DeepSeek公式サイト
- DeepSeek-V3 GitHub
- DeepSeek-R1 GitHub
- DeepSeek API ドキュメント
- DeepSeek-V3 論文 (arXiv:2412.19437)
- DeepSeek-R1 論文 (arXiv:2501.12948)
最終更新: 2026年3月7日 04:44 JST
情報源: DeepSeek公式サイト、GitHub、HuggingFace、APIドキュメント、arXiv
調査方法: web_fetchによる公式サイト直接確認


コメント