DeepSeek V4のリリース状況と最新情報(2026年3月時点)

未分類
Picsum ID: 70

DeepSeek V4のリリース状況と最新情報(2026年3月時点)

リリース概要

DeepSeek V4は2026年3月7日時点でまだリリースされていません。

2026年3月7日の調査で、以下の公式ソースを確認しました:

  • DeepSeek公式サイト (deepseek.com): V3.2の発表のみ、V4への言及なし
  • GitHub (github.com/deepseek-ai): 最新リポジトリはDeepSeek-V3、DeepSeek-R1、V4への言及なし
  • API ドキュメント (api-docs.deepseek.com): モデルはdeepseek-chat/deepseek-reasoner(V3.2対応)のみ
  • HuggingFace (huggingface.co/deepseek-ai): 最新コレクションはDeepSeek-V3.2

最新版はDeepSeek-V3.2であり、V4に関する公式発表は一切存在しません。


現在の最新モデル構成

DeepSeekが現在提供している主要モデルは以下の通りです:

1. DeepSeek-V3.2(最新)

  • 総パラメータ数: 671B(アクティブ: 37B)
  • コンテキスト長: 128K
  • アーキテクチャ: Mixture-of-Experts (MoE)
  • 特徴: Multi-head Latent Attention (MLA)、補助損失なし負荷分散戦略
  • 学習データ: 14.8兆トークン

2. DeepSeek-R1(推論特化型)

  • ベースモデル: DeepSeek-V3-Base
  • 特徴: 大規模強化学習(RL)による推論能力の向上
  • 性能: OpenAI o1と同等の性能(数学・コード・推論タスク)
  • 派生モデル: 1.5B、7B、8B、14B、32B、70Bの蒸留モデルを公開

技術的ハイライト

FP8混合精度トレーニング

DeepSeek-V3は初めて超大规模モデルでFP8トレーニングの実用性を検証しました。

中国製ハードウェア対応

  • Huawei Ascend NPU: INT8/BF16での実行をサポート
  • AMD GPU: SGLang経由でFP8/BF16に対応
  • これにより、NVIDIA GPU以外での運用が可能になっています

高効率トレーニング

  • 事前学習に必要なGPU時間: 2.664M H800 GPU時間
  • トレーニングコストの大幅削減を実現

使い方

Web/アプリ

API

curl https://api.deepseek.com/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $DEEPSEEK_API_KEY" \
  -d '{
    "model": "deepseek-chat",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'
  • deepseek-chat: V3.2(非思考モード)
  • deepseek-reasoner: V3.2(思考モード)

ローカル実行

  • SGLang、vLLM、LMDeploy、TensorRT-LLMに対応
  • Hugging Faceからモデルをダウンロード可能

今後の展望

DeepSeekは急速にモデルを進化させており、V3.2へのアップデートからV4のリリースまでの期間は予測が困難です。R1の研究はNature 2025年号に掲載されるなど、学術的にも高い評価を受けています。V4のリリースについては、公式サイト(deepseek.com)およびGitHub(github.com/deepseek-ai)で公式発表を確認することをお勧めします。


参考リンク


最終更新: 2026年3月7日 04:44 JST
情報源: DeepSeek公式サイト、GitHub、HuggingFace、APIドキュメント、arXiv
調査方法: web_fetchによる公式サイト直接確認

コメント

タイトルとURLをコピーしました