DeepSeek의 경제성은 신화입니다. 혁명 AI는 실제로 개발하는 데 16 억 달러가 들었습니다.

작가 : Benjamin Feb 20,2025

DeepSeek의 놀랍도록 저렴한 AI 모델 인 DeepSeek V3는 AI 시장을 흔들어 Nvidia의 주가가 크게 감소했습니다. DeepSeek은 2048 GPU를 사용하여 6 백만 달러의 매우 낮은 교육 비용을 자랑하지만 더 복잡한 현실을 보여줍니다.

DeepSeek Test이미지 : ensigame.com

DeepSeek V3의 혁신적인 아키텍처는 성능의 핵심입니다. 사용합니다.

  • MTP (Multi-Token Prediction) : 정확도와 효율성을 높이기 위해 여러 단어를 동시에 예측합니다.
  • 전문가 혼합 (MOE) : 256 개의 신경망을 사용하여 각 토큰 당 8 개를 활성화하고 교육 속도를 높이고 성능 향상.
  • 멀티 헤드 잠재주의 (MLA) : 정보 손실을 최소화하고 중요한 뉘앙스를 포착하기 위해 주요 문장 부분에 반복적으로 집중합니다.

DeepSeek V3이미지 : ensigame.com

그러나 Semianalysis는 Deepseek의 대규모 인프라를 발견했습니다. H800, H100 및 H20 단위를 포함한 약 50,000 Nvidia Hopper GPU가 여러 데이터 센터에 퍼졌습니다. 이는 약 16 억 달러의 총 서버 투자를 나타내며 운영 비용은 9 억 9,400 만 달러로 추정됩니다. 6 백만 달러는 연구, 개선, 데이터 처리 및 인프라를 제외한 사전 훈련 GPU 비용 만 반영합니다.

중국 헤지 펀드 인 High-Flyer의 자회사 인 Deepseek는 클라우드 관련 경쟁 업체와 달리 데이터 센터를 소유하고 있습니다. 이 소유권은 더 큰 통제력과 더 빠른 혁신을 부여합니다. 회사의 셀프 펀딩 모델은 민첩성을 향상시킵니다. 또한 Deepseek은 최고의 인재를 유치하며 일부 연구자들은 주로 중국 대학에서 매년 130 만 달러 이상을 벌고 있습니다.

DeepSeek이미지 : ensigame.com

DeepSeek의 6 백만 달러의 훈련 비용이 오도되었다고 주장하지만 전체 투자는 5 억 달러를 초과합니다. 린 구조는 더 큰 관료적 회사와 대조되는 효율적인 혁신을 허용합니다.

DeepSeek이미지 : ensigame.com

DeepSeek의 성공은 잘 자금을 지원하는 독립 AI 회사의 경쟁 잠재력을 강조합니다. "혁명 예산"주장은 과장되지만, 특히 경쟁 업체의 실질적으로 더 높은 비용을 고려할 때 그 성과는 부인할 수 없습니다 (예 : DeepSeek의 R1 모델은 ChatGPT4의 1 억 달러에 비해 5 백만 달러입니다). 회사의 성공은 상당한 투자, 기술 혁신 및 강력한 팀에 대한 증거입니다.