दीपसेक की सामर्थ्य एक मिथक है: क्रांतिकारी एआई वास्तव में विकसित करने के लिए $ 1.6 बिलियन का खर्च आता है
दीपसेक की आश्चर्यजनक रूप से सस्ती एआई मॉडल चुनौतियां उद्योग के दिग्गजों को चुनौती देती हैं। चीनी स्टार्टअप का दावा है कि उसने अपने शक्तिशाली दीपसेक वी 3 न्यूरल नेटवर्क को केवल $ 6 मिलियन के लिए प्रशिक्षित किया है, केवल 2048 जीपीयू का उपयोग करते हुए, प्रतियोगियों को काफी कम कर दिया है। हालांकि, यह आंकड़ा भ्रामक है।
छवि: ensigame.com
दीपसेक वी 3 अभिनव प्रौद्योगिकियों का लाभ उठाता है: मल्टी-टोकन भविष्यवाणी (एमटीपी) बेहतर सटीकता और दक्षता के लिए; विशेषज्ञों का मिश्रण (एमओई) , प्रशिक्षण में तेजी लाने के लिए 256 तंत्रिका नेटवर्क को नियोजित करना; और मल्टी-हेड लेटेंट ध्यान (एमएलए) महत्वपूर्ण वाक्य तत्वों पर ध्यान केंद्रित करने के लिए।
छवि: ensigame.com
वास्तविकता, सेमियालिसिस द्वारा उजागर की गई, एक अधिक पर्याप्त निवेश का पता चलता है। दीपसेक लगभग 50,000 एनवीडिया जीपीयू का एक विशाल बुनियादी ढांचा संचालित करता है, जिसका मूल्य लगभग 1.6 बिलियन डॉलर है, जिसमें वार्षिक परिचालन लागत $ 944 मिलियन है। इसमें पर्याप्त वेतन शामिल है, कुछ शोधकर्ताओं ने सालाना $ 1.3 मिलियन से अधिक कमाई। कंपनी की स्व-वित्त पोषित प्रकृति, हालांकि, चुस्त नवाचार के लिए अनुमति देती है।
छवि: ensigame.com
जबकि दीपसेक की $ 6 मिलियन की पूर्व-प्रशिक्षण लागत प्रतियोगियों के खर्चों का एक अंश है (जैसे, CHATGPT-4 का $ 100 मिलियन), समग्र निवेश $ 500 मिलियन से अधिक है। कंपनी की सफलता एक क्रांतिकारी लागत-कटौती दृष्टिकोण के बजाय पर्याप्त धन, तकनीकी प्रगति और एक उच्च कुशल टीम से उपजी है। इसके बावजूद, इसकी परिचालन लागत अभी भी अपने प्रतिद्वंद्वियों को काफी कम कर देती है।
छवि: ensigame.com
दीपसेक का उदाहरण प्रभावी ढंग से प्रतिस्पर्धा करने के लिए एक अच्छी तरह से वित्त पोषित, स्वतंत्र एआई कंपनी की क्षमता पर प्रकाश डालता है। हालांकि, असाधारण रूप से कम विकास लागतों की कथा के लिए सावधानीपूर्वक जांच की आवश्यकता होती है।
नवीनतम लेख