Доступность DeepSeek - это миф: революционный ИИ на самом деле стоит 1,6 миллиарда долларов на разработку
Удивительно недорогие модели ИИ Deepseek бросают вызов гигантам отрасли. Китайский стартап утверждает, что обучил свою мощную нейронную сеть Deepseek V3 всего за 6 миллионов долларов, используя только 2048 графических процессоров, что значительно подорвало конкурентов. Однако эта цифра вводит в заблуждение.
Изображение: Ensigame.com
DeepSeek V3 использует инновационные технологии: Multi-Token Prediction (MTP) для повышения точности и эффективности; Смесь экспертов (MOE) , используя 256 нейронных сетей, для ускорения обучения; и Многополосное скрытое внимание (MLA) , чтобы сосредоточиться на важных элементах предложения.
Изображение: Ensigame.com
Реальность, обнаруженная полуанализа, выявляет гораздо более существенные инвестиции. DeepSeek управляет массовой инфраструктурой в размере приблизительно 50 000 графических процессоров NVIDIA, оцениваемых примерно в 1,6 млрд. Долл. США, при этом годовые эксплуатационные расходы около 944 млн. Долл. США. Это включает в себя существенную зарплату, некоторые исследователи зарабатывают более 1,3 миллиона долларов в год. Самофинансируемый характер компании допускает гибкие инновации.
Изображение: Ensigame.com
Несмотря на то, что затраты на предварительное обучение DeepSeek 6 миллионов долларов составляют часть расходов конкурентов (например, 100 миллионов долларов США), общие инвестиции превышают 500 миллионов долларов. Успех компании связан с существенным финансированием, технологическими достижениями и высококвалифицированной командой, а не революционным подходом по сокращению затрат. Несмотря на это, его эксплуатационные расходы по -прежнему значительно подрывают расходы его конкурентов.
Изображение: Ensigame.com
В примере DeepSeek подчеркивается потенциал хорошо финансируемой независимой компании ИИ для эффективной конкуренции. Тем не менее, повествование об исключительно низких затратах на разработку требует тщательного изучения.