首页 新闻 DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

作者 : Victoria 更新日期 : Mar 01,2025

DeepSeek令人惊讶的是,廉价的AI模型挑战了行业巨头。这家中国初创公司声称已经培训了其强大的DeepSeek V3神经网络,仅利用2048 GPU,大大削弱了竞争对手,仅需600万美元。但是,这个数字具有误导性。

DeepSeek Test图像:ensigame.com

DeepSeek V3利用创新技术:多型预测(MTP),以提高准确性和效率; 专家(MOE)的混合物,采用256个神经网络来加速培训; 多头潜在注意力(MLA)专注于关键的句子元素。

DeepSeek V3图像:ensigame.com

通过半分析发现的现实表明,投资更为实质性。 DeepSeek运营着大约50,000个NVIDIA GPU的大规模基础设施,价值约16亿美元,年度运营成本接近9.44亿美元。这包括大量薪水,一些研究人员每年收入超过130万美元。但是,公司的自筹资金性质允许敏捷的创新。

DeepSeek图像:ensigame.com

虽然DeepSeek的600万美元培训成本是竞争对手支出的一小部分(例如Chatgpt-4的1亿美元),但总投资超过5亿美元。该公司的成功源于大量资金,技术进步和高技能的团队,而不是一种革命性的削减成本方法。尽管如此,其运营成本仍大大降低了其竞争对手的成本。

DeepSeek图像:ensigame.com

DeepSeek的示例强调了一家资金充足,独立的AI公司有效竞争的潜力。但是,出色的开发成本的叙述需要仔细审查。