Deepseek'in çığır açan AI modeli endüstri normlarına meydan okuyor. Başlangıçta sadece 6 milyon dolar için eğitilmiş bir bütçe harikası olarak lanse edilen gerçeklik, çok daha önemli bir yatırım ortaya koyuyor. Bu makale, Deepseek'in ilk iddiaları ile sofistike yapay zekalarını geliştirmede yer alan gerçek maliyetler arasındaki tutarsızlıkları araştırmaktadır.
Etkileyici yeteneklerle övünen Deepseek chatbot, hızla önemli bir oyuncu haline geldi ve hatta Nvidia için önemli hisse senedi fiyat düşüşlerine neden oldu. Başarısı, yenilikçi teknolojilerin eşsiz bir kombinasyonundan kaynaklanmaktadır:
- Çoklu Tokul Tahmin (MTP): Aynı anda birden fazla kelimeyi tahmin etmek, doğruluğu ve hızı önemli ölçüde iyileştirir.
- Uzmanların (MOE) karışımı: Gelişmiş performans ve eğitim verimliliği için görev başına sekiz etkinleştirilmiş 256 sinir ağını kullanarak.
- Çok Başlı Gizli Dikkat (MLA): Bilgi kaybını en aza indirmek ve nüanslı anlayışı iyileştirmek için önemli ayrıntıları tekrar tekrar çıkarma.
%İmgp%resim: ensigame.com
Deepseek'in Deepseek V3 için 6 milyon dolarlık bir eğitim maliyeti iddiası yanıltıcı. Bu rakam eğitim öncesi GPU kullanımını yansıtabilirken, önemli masrafları atlar: araştırma, arıtma, veri işleme ve büyük altyapı. Semianalysis, Deepseek'in birden fazla veri merkezinde yaklaşık 50.000 NVIDIA Hopper GPU'ları (H800, H100 ve H20 birimleri dahil) kullanan geniş bir hesaplama altyapısı işlettiğini ortaya koydu. Bu altyapı, yaklaşık 1,6 milyar dolarlık toplam sunucu yatırımını temsil eder ve operasyonel maliyetlerin 944 milyon dolar olduğu tahmin edilmektedir.
%İmgp%resim: ensigame.com
Şirketin yapısı, Çin Hedge Fonu High-Flyer'in bir yan kuruluşu olarak başarısına katkıda bulunur. Veri merkezlerine sahip olmak, benzersiz kontrol ve daha hızlı inovasyon uygulaması sağlar. Kendi kendini finanse eden doğası çeviklik ve hızlı karar vermeye izin verir. Dahası, Deepseek en iyi yetenekleri çekiyor ve bazı araştırmacılar yılda 1.3 milyon doların üzerinde kazanıyor.
%İmgp%resim: ensigame.com
Deepseek'in AI gelişimine yapılan toplam yatırımı 500 milyon doları aşıyor. Aracı yapısı, daha büyük şirketlerin bürokratik yükleriyle zıt olan etkili bir yeniliği sağlar. Bununla birlikte, "devrimci bütçe" anlatısı, önemli kaynak taahhüdünün aşırı derecede basitleştirilmesidir.
%İmgp%resim: ensigame.com
Deepseek'in başarısı, iyi finanse edilen bağımsız AI şirketlerinin devlerle rekabet etme potansiyelini gösterirken, hikayesi bu tür başarılar için gerekli önemli yatırımın altını çiziyor. Deepseek'in kontrast R1 için 5 milyon dolar ve ChatGpt4o için tahmini 100 milyon dolar, Deepseek'in önemli yatırımıyla bile önemli maliyet farklılıklarını vurgulamaktadır. Bu nedenle, ilk düşük maliyetli iddianın genel önemli yatırım bağlamında görülmesi gerekmektedir.