DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元
DeepSeek令人驚訝的是,廉價的AI模型挑戰了行業巨頭。這家中國初創公司聲稱已經培訓了其強大的DeepSeek V3神經網絡,僅利用2048 GPU,大大削弱了競爭對手,僅需600萬美元。但是,這個數字具有誤導性。
圖像:ensigame.com
DeepSeek V3利用創新技術:多型預測(MTP),以提高準確性和效率; 專家(MOE)的混合物,采用256個神經網絡來加速培訓; 多頭潛在注意力(MLA)專注於關鍵的句子元素。
圖像:ensigame.com
通過半分析發現的現實表明,投資更為實質性。 DeepSeek運營著大約50,000個NVIDIA GPU的大規模基礎設施,價值約16億美元,年度運營成本接近9.44億美元。這包括大量薪水,一些研究人員每年收入超過130萬美元。但是,公司的自籌資金性質允許敏捷的創新。
圖像:ensigame.com
雖然DeepSeek的600萬美元培訓成本是競爭對手支出的一小部分(例如Chatgpt-4的1億美元),但總投資超過5億美元。該公司的成功源於大量資金,技術進步和高技能的團隊,而不是一種革命性的削減成本方法。盡管如此,其運營成本仍大大降低了其競爭對手的成本。
圖像:ensigame.com
DeepSeek的示例強調了一家資金充足,獨立的AI公司有效競爭的潛力。但是,出色的開發成本的敘述需要仔細審查。