L'accessibilità economica di DeepSeek è un mito: l'intelligenza artificiale rivoluzionaria in realtà costa $ 1,6 miliardi per lo sviluppo
Il modello AI sorprendentemente economico di Deepseek sfida i giganti del settore. La startup cinese afferma di aver formato la sua potente rete neurale DeepSeek V3 per soli $ 6 milioni, utilizzando solo 2048 GPU, sottovalutando significativamente i concorrenti. Tuttavia, questa cifra è fuorviante.
Immagine: Ensigame.com
DeepSeek V3 sfrutta le tecnologie innovative: Previsione multi-token (MTP) per una migliore precisione ed efficienza; Miscela di esperti (MOE) , impiegando 256 reti neurali, per accelerare la formazione; e Attenzione latente multi-testa (MLA) per concentrarsi su elementi di frase cruciali.
Immagine: Ensigame.com
La realtà, scoperta dalla semianalisi, rivela un investimento molto più sostanziale. DeepSeek gestisce una massiccia infrastruttura di circa 50.000 GPU NVIDIA, del valore di circa $ 1,6 miliardi, con costi operativi annuali per $ 944 milioni. Ciò include salari sostanziali, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno. La natura autofinanziata dell'azienda, tuttavia, consente l'innovazione agile.
Immagine: Ensigame.com
Mentre il costo di pre-allenamento di $ 6 milioni di Deepseek è una frazione delle spese dei concorrenti (ad esempio, $ 100 milioni di CHATGPT-4), l'investimento complessivo supera i $ 500 milioni. Il successo dell'azienda deriva da finanziamenti sostanziali, progressi tecnologici e un team altamente qualificato, piuttosto che da un approccio rivoluzionario per la riduzione dei costi. Nonostante ciò, i suoi costi operativi sono ancora significativamente ridotti quelli dei suoi rivali.
Immagine: Ensigame.com
L'esempio di Deepseek evidenzia il potenziale di una società di intelligenza artificiale ben finanziata e indipendente di competere in modo efficace. Tuttavia, la narrazione di costi di sviluppo eccezionalmente bassi richiede un attento esame.
Ultimi articoli