दीपसेक की सामर्थ्य एक मिथक है: क्रांतिकारी एआई वास्तव में विकसित करने के लिए $ 1.6 बिलियन का खर्च आता है
दीपसेक की आश्चर्यजनक रूप से सस्ती एआई मॉडल चुनौतियां उद्योग के दिग्गजों को चुनौती देती हैं। चीनी स्टार्टअप का दावा है कि उसने अपने शक्तिशाली दीपसेक वी 3 न्यूरल नेटवर्क को केवल $ 6 मिलियन के लिए प्रशिक्षित किया है, केवल 2048 जीपीयू का उपयोग करते हुए, प्रतियोगियों को काफी कम कर दिया है। हालांकि, यह आंकड़ा भ्रामक है।
छवि: ensigame.com
दीपसेक वी 3 अभिनव प्रौद्योगिकियों का लाभ उठाता है: मल्टी-टोकन भविष्यवाणी (एमटीपी) बेहतर सटीकता और दक्षता के लिए; विशेषज्ञों का मिश्रण (एमओई) , प्रशिक्षण में तेजी लाने के लिए 256 तंत्रिका नेटवर्क को नियोजित करना; और मल्टी-हेड लेटेंट ध्यान (एमएलए) महत्वपूर्ण वाक्य तत्वों पर ध्यान केंद्रित करने के लिए।
छवि: ensigame.com
वास्तविकता, सेमियालिसिस द्वारा उजागर की गई, एक अधिक पर्याप्त निवेश का पता चलता है। दीपसेक लगभग 50,000 एनवीडिया जीपीयू का एक विशाल बुनियादी ढांचा संचालित करता है, जिसका मूल्य लगभग 1.6 बिलियन डॉलर है, जिसमें वार्षिक परिचालन लागत $ 944 मिलियन है। इसमें पर्याप्त वेतन शामिल है, कुछ शोधकर्ताओं ने सालाना $ 1.3 मिलियन से अधिक कमाई। कंपनी की स्व-वित्त पोषित प्रकृति, हालांकि, चुस्त नवाचार के लिए अनुमति देती है।
छवि: ensigame.com
जबकि दीपसेक की $ 6 मिलियन की पूर्व-प्रशिक्षण लागत प्रतियोगियों के खर्चों का एक अंश है (जैसे, CHATGPT-4 का $ 100 मिलियन), समग्र निवेश $ 500 मिलियन से अधिक है। कंपनी की सफलता एक क्रांतिकारी लागत-कटौती दृष्टिकोण के बजाय पर्याप्त धन, तकनीकी प्रगति और एक उच्च कुशल टीम से उपजी है। इसके बावजूद, इसकी परिचालन लागत अभी भी अपने प्रतिद्वंद्वियों को काफी कम कर देती है।
छवि: ensigame.com
दीपसेक का उदाहरण प्रभावी ढंग से प्रतिस्पर्धा करने के लिए एक अच्छी तरह से वित्त पोषित, स्वतंत्र एआई कंपनी की क्षमता पर प्रकाश डालता है। हालांकि, असाधारण रूप से कम विकास लागतों की कथा के लिए सावधानीपूर्वक जांच की आवश्यकता होती है।