Il modello AI rivoluzionario di Deepseek sfida le norme del settore. Inizialmente propagandata come una meraviglia budget, formata per soli $ 6 milioni, la realtà rivela un investimento molto più sostanziale. Questo articolo esplora le discrepanze tra le affermazioni iniziali di Deepseek e i costi effettivi coinvolti nello sviluppo della loro sofisticata intelligenza artificiale.
Il chatbot di DeepSeek, che vanta capacità impressionanti, è diventato rapidamente un attore importante, causando anche significativi calo dei prezzi delle azioni per Nvidia. Il suo successo deriva da una combinazione unica di tecnologie innovative:
- Previsione multi-token (MTP): Previsione simultanea di più parole, migliorando significativamente l'accuratezza e la velocità.
- Miscela di esperti (MOE): Utilizzo di 256 reti neurali, con otto attivate per attività, per una migliore prestazione e efficienza di allenamento.
- Attenzione latente multi-testa (MLA): Estrazione ripetuta dei dettagli chiave per ridurre al minimo la perdita di informazioni e migliorare la comprensione sfumata.
Immagine: Ensigame.com
L'affermazione di Deepseek di un costo di allenamento di $ 6 milioni per DeepSeek V3 è fuorviante. Sebbene questa cifra possa riflettere l'utilizzo della GPU pre-allenamento, omette spese sostanziali: ricerca, perfezionamento, elaborazione dei dati e infrastruttura massiccia. La semianalisi ha rivelato che DeepSeek gestisce una vasta infrastruttura computazionale, utilizzando circa 50.000 GPU Nvidia Hopper (tra cui unità H800, H100 e H20) su più data center. Questa infrastruttura rappresenta un investimento di server totale di circa $ 1,6 miliardi, con costi operativi stimati in $ 944 milioni.
Immagine: Ensigame.com
La struttura dell'azienda, come consociata dell'hedge fund cinese, contribuisce al suo successo. Possedere i suoi data center fornisce un controllo senza pari e un'implementazione più rapida dell'innovazione. La sua natura autofinanziata consente l'agilità e il rapido processo decisionale. Inoltre, DeepSeek attira i migliori talenti, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno.
Immagine: Ensigame.com
L'investimento totale di Deepseek nello sviluppo dell'IA supera $ 500 milioni. La sua struttura aerodinamica consente un'efficace innovazione, in contrasto con gli oneri burocratici di società più grandi. Tuttavia, la narrazione del "bilancio rivoluzionario" è una semplificazione eccessiva del suo sostanziale impegno delle risorse.
Immagine: Ensigame.com
Mentre il successo di Deepseek dimostra il potenziale di società di intelligenza artificiale indipendenti ben finanziate per competere con i giganti, la sua storia sottolinea il significativo investimento necessario per tali risultati. Il contrasto tra i 5 milioni di dollari di Deepseek ha registrato $ 5 milioni per R1 e i $ 100 milioni stimati per Chatgpt4o evidenziano le differenze di costo sostanziali, anche con l'investimento sostanziale di Deepseek. L'affermazione iniziale a basso costo, pertanto, deve essere vista nel contesto dell'investimento complessivo.