DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元
DeepSeek令人惊讶的是,廉价的AI模型挑战了行业巨头。这家中国初创公司声称已经培训了其强大的DeepSeek V3神经网络,仅利用2048 GPU,大大削弱了竞争对手,仅需600万美元。但是,这个数字具有误导性。
图像:ensigame.com
DeepSeek V3利用创新技术:多型预测(MTP),以提高准确性和效率; 专家(MOE)的混合物,采用256个神经网络来加速培训; 多头潜在注意力(MLA)专注于关键的句子元素。
图像:ensigame.com
通过半分析发现的现实表明,投资更为实质性。 DeepSeek运营着大约50,000个NVIDIA GPU的大规模基础设施,价值约16亿美元,年度运营成本接近9.44亿美元。这包括大量薪水,一些研究人员每年收入超过130万美元。但是,公司的自筹资金性质允许敏捷的创新。
图像:ensigame.com
虽然DeepSeek的600万美元培训成本是竞争对手支出的一小部分(例如Chatgpt-4的1亿美元),但总投资超过5亿美元。该公司的成功源于大量资金,技术进步和高技能的团队,而不是一种革命性的削减成本方法。尽管如此,其运营成本仍大大降低了其竞争对手的成本。
图像:ensigame.com
DeepSeek的示例强调了一家资金充足,独立的AI公司有效竞争的潜力。但是,出色的开发成本的叙述需要仔细审查。