Доступность DeepSeek - это миф: революционный ИИ на самом деле стоит 1,6 миллиарда долларов на разработку
Удивительно недорогая модель искусственного интеллекта Deepseek, Deepseek V3, потряс рынок ИИ, вызывая значительные падения цен на акции Nvidia. В то время как Deepseek может похвастаться удивительно низкой стоимостью обучения в 6 миллионов долларов, используя только 2048 графических процессоров, более пристальный взгляд показывает более сложную реальность.
Изображение: Ensigame.com
Инновационная архитектура DeepSeek V3 является ключом к ее производительности. Он использует:
- Multi-Token Production (MTP): Прогнозирование нескольких слов одновременно для повышения точности и эффективности.
- Смесь экспертов (MOE): Использование 256 нейронных сетей, активируя восемь для каждого токена, ускоряя обучение и повышение производительности.
- Многополосное скрытое внимание (MLA): Неоднократно сосредотачиваясь на ключевых частях предложения, чтобы минимизировать потерю информации и захватить важные нюансы.
Изображение: Ensigame.com
Тем не менее, полуанализ обнаружил массивную инфраструктуру DeepSeek: приблизительно 50 000 графических процессоров Nvidia, включая H800, H100 и H20, распространяются по нескольким центрам обработки данных. Это составляет общие инвестиции в сервер в размере примерно 1,6 млрд. Долл. США, а эксплуатационные расходы оцениваются в 944 млн. Долл. США. Цифра в 6 миллионов долларов отражает только предварительные затраты на GPU, исключая исследования, уточнение, обработку данных и инфраструктуру.
DeepSeek, дочерняя компания High-Flyer, китайского хедж-фонда, владеет своими центрами обработки данных, в отличие от конкурентов. Это право собственности дает больший контроль и более быстрые инновации. Модель самофинансирования компании повышает гибкость. Кроме того, Deepseek привлекает лучших талантов, некоторые исследователи зарабатывают более 1,3 миллиона долларов в год, в основном из китайских университетов.
Изображение: Ensigame.com
В то время как DeepSeek заявила, что стоимость обучения в размере 6 миллионов долларов вводит в заблуждение, общие инвестиции превышают 500 миллионов долларов. Его бережливая структура позволяет эффективно инновациям, в отличие от более крупных, более бюрократических компаний.
Изображение: Ensigame.com
Успех DeepSeek подчеркивает конкурентный потенциал хорошо финансируемых независимых компаний искусственного интеллекта. Хотя претензия «революционного бюджета» преувеличена, его достижения неоспоримы, особенно учитывая, что конкуренты значительно более высокие затраты (например, модель Deepseek R1 стоила 5 миллионов долларов по сравнению с Catgpt4 на 100 миллионов долларов США). Успех компании является свидетельством значительных инвестиций, технических прорывов и сильной команды.