Deepseek'in karşılanabilirliği bir efsanedir: Devrimci AI aslında 1,6 milyar dolara mal oldu
Deepseek'in şaşırtıcı derecede ucuz AI modeli endüstri devlerine meydan okuyor. Çinli girişim, güçlü Deepseek V3 sinir ağını sadece 6 milyon dolarlık eğittiğini iddia ediyor, sadece 2048 GPU kullanıyor ve rakipleri önemli ölçüde azaltıyor. Ancak, bu rakam yanıltıcıdır.
%İmgp%resim: ensigame.com
Deepseek V3 Yenilikçi Teknolojilerden yararlanır: Çoklu Tokul Tahmin (MTP) Geliştirilmiş doğruluk ve verimlilik için; Eğitimi hızlandırmak için 256 sinir ağı istihdam eden uzmanların (MOE) karışımı; ve Çok Başlı Gizli Dikkat (MLA) Önemli cümle unsurlarına odaklanmak için.
%İmgp%resim: ensigame.com
Semanaliz tarafından ortaya çıkarılan gerçeklik, çok daha önemli bir yatırım ortaya koyuyor. Deepseek, yaklaşık 1.6 milyar dolar değerinde yaklaşık 50.000 NVIDIA GPU'luk büyük bir altyapı işletiyor ve yıllık operasyonel maliyetler 944 milyon dolara yaklaşıyor. Bu, bazı araştırmacıların yıllık 1,3 milyon doların üzerinde kazandığı önemli maaşları içerir. Ancak şirketin kendi kendini finanse ettiği doğası çevik inovasyona izin veriyor.
%İmgp%resim: ensigame.com
Deepseek'in 6 milyon dolarlık eğitim öncesi maliyeti rakiplerin giderlerinin bir kısmı olsa da (örneğin, ChatGPT-4'ün 100 milyon dolar), toplam yatırım 500 milyon doları aşıyor. Şirketin başarısı, devrimci bir maliyet düşürme yaklaşımından ziyade önemli finansman, teknolojik gelişmeler ve yüksek vasıflı bir ekipten kaynaklanmaktadır. Buna rağmen, operasyonel maliyetleri hala rakiplerinin maliyetlerini önemli ölçüde azaltıyor.
%İmgp%resim: ensigame.com
Deepseek'in örneği, iyi finanse edilmiş, bağımsız bir AI şirketinin etkili bir şekilde rekabet etme potansiyelini vurgular. Bununla birlikte, olağanüstü düşük kalkınma maliyetlerinin anlatısı dikkatli bir inceleme gerektirir.
En son makaleler