Deepseekの手頃な価格は神話です。革新的なAIは実際には16億ドルの費用がかかります。

著者 : Benjamin Feb 20,2025

Deepseekの驚くほど安価なAIモデルであるDeepseek V3は、AI市場を揺さぶり、Nvidiaの株価の大幅な低下を引き起こしました。 Deepseekは、2048 GPUのみを使用して、600万ドルのトレーニングコストが非常に低いことを誇っていますが、より複雑な現実を照らしていると、見てみましょう。

DeepSeek Test画像:Ensigame.com

Deepseek V3の革新的なアーキテクチャは、そのパフォーマンスの鍵です。それは利用します:

  • マルチトークン予測(MTP):精度と効率の向上のために複数の単語を同時に予測します。
  • 専門家(MOE)の混合物: 256のニューラルネットワークを採用し、トークンごとに8つをアクティブにし、トレーニングを高速化し、パフォーマンスを向上させます。
  • マルチヘッドの潜在的な注意(MLA):情報の損失を最小限に抑え、重要なニュアンスをキャプチャするために、キー文の部分に繰り返し焦点を当てます。

DeepSeek V3画像:Ensigame.com

ただし、SemianalysisはDeepseekの大規模なインフラストラクチャを発見しました。H800、H100、およびH20ユニットを含む約50,000のNvidia Hopper GPUは、複数のデータセンターに広がっています。これは、サーバーの総投資額を約16億ドルで、運用費用は9億4,400万ドルと推定されています。 600万ドルの数値は、研究、洗練、データ処理、インフラストラクチャを除く、トレーニング前のGPUコストのみを反映しています。

中国のヘッジファンドであるHigh-Flyerの子会社であるDeepseekは、クラウドに依存している競合他社とは異なり、データセンターを所有しています。この所有権は、より大きな制御とより速いイノベーションを与えます。同社の自己資金モデルは、敏ility性を高めます。さらに、Deepseekはトップの才能を引き付け、一部の研究者は主に中国の大学から年間130万ドル以上を稼いでいます。

DeepSeek画像:Ensigame.com

Deepseekの主張は600万ドルのトレーニングコストが誤解を招くと主張していますが、全体的な投資は5億ドルを超えています。その無駄のない構造により、効率的な革新が可能になり、より多くの官僚的企業とは対照的です。

DeepSeek画像:Ensigame.com

Deepseekの成功は、資金提供された独立したAI企業の競争の可能性を強調しています。 「革新的な予算」の請求は誇張されていますが、その成果は否定できません。特に、競合他社の実質的に高いコストを考慮して(たとえば、DeepseekのR1モデルはChatGPT4の1億ドルに対して500万ドルの費用がかかります)。同社の成功は、重要な投資、技術的なブレークスルー、および強力なチームの証です。