L'abordabilité de Deepseek est un mythe: l'IA révolutionnaire a coûté 1,6 milliard de dollars pour développer

Auteur : Benjamin Feb 20,2025

Le modèle d'IA étonnamment bon marché de Deepseek, Deepseek V3, a ébranlé le marché de l'IA, provoquant des baisses importantes du cours de l'action de NVIDIA. Alors que Deepseek possède un coût de formation remarquablement faible de 6 millions de dollars, en utilisant seulement 2048 GPU, un examen plus approfondi révèle une réalité plus complexe.

DeepSeek Test Image: esigame.com

L'architecture innovante de Deepseek V3 est la clé de ses performances. Il utilise:

  • Prédiction multi-token (MTP): Prédire plusieurs mots simultanément pour une précision et une efficacité accrues.
  • Mélange d'experts (MOE): Utilisation de 256 réseaux de neurones, activant huit pour chaque jeton, accélérant la formation et améliorant les performances.
  • Attention latente multi-tête (MLA): Se concentrant à plusieurs reprises sur les pièces de phrase clés pour minimiser la perte d'informations et capturer des nuances cruciales.

DeepSeek V3 Image: esigame.com

Cependant, la semianalyse a découvert l'infrastructure massive de Deepseek: environ 50 000 GPU Nvidia Hopper, y compris les unités H800, H100 et H20, se répartissent sur plusieurs centres de données. Cela représente un investissement total de serveur d'environ 1,6 milliard de dollars, avec des dépenses opérationnelles estimées à 944 millions de dollars. Le chiffre de 6 millions de dollars ne reflète que les coûts GPU avant la formation, l'exclusion de la recherche, du raffinement, du traitement des données et des infrastructures.

Deepseek, une filiale de High Flyer, un fonds spéculatif chinois, possède ses centres de données, contrairement à des concurrents californiens. Cette propriété accorde un plus grand contrôle et une innovation plus rapide. Le modèle d'autofinancement de l'entreprise améliore l'agilité. En outre, Deepseek attire les meilleurs talents, certains chercheurs gagnant plus de 1,3 million de dollars par an, principalement des universités chinoises.

DeepSeek Image: esigame.com

Alors que le coût de formation de 6 millions de dollars a réclamé Deepseek, son investissement global dépasse 500 millions de dollars. Sa structure Lean permet une innovation efficace, contrastant avec des entreprises plus grandes et plus bureaucratiques.

DeepSeek Image: esigame.com

Le succès de Deepseek met en évidence le potentiel concurrentiel des sociétés d'IA indépendantes bien financées. Bien que la réclamation du «budget révolutionnaire» soit exagérée, ses réalisations sont indéniables, en particulier compte tenu des coûts sensiblement plus élevés des concurrents (par exemple, le modèle R1 de Deepseek coûte 5 millions de dollars contre les 100 millions de dollars de ChatGPT4). Le succès de l'entreprise témoigne de l'investissement important, des percées techniques et d'une équipe solide.