Ang groundbreaking AI Model ng Deepseek ay naghahamon sa mga pamantayan sa industriya. Sa una ay na -tout bilang isang badyet ng badyet, sinanay para sa isang $ 6 milyon lamang, ang katotohanan ay nagpapakita ng isang mas malaking pamumuhunan. Ang artikulong ito ay galugarin ang mga pagkakaiba -iba sa pagitan ng mga paunang pag -angkin ng Deepseek at ang aktwal na gastos na kasangkot sa pagbuo ng kanilang sopistikadong AI.
Ang Deepseek Chatbot, na ipinagmamalaki ang mga kahanga -hangang kakayahan, ay mabilis na naging isang pangunahing manlalaro, kahit na nagdudulot ng makabuluhang pagbagsak ng presyo ng stock para sa NVIDIA. Ang tagumpay nito ay nagmula sa isang natatanging kumbinasyon ng mga makabagong teknolohiya:
- Multi-Token Prediction (MTP): Paghuhulaan ng maraming mga salita nang sabay-sabay, makabuluhang pagpapabuti ng kawastuhan at bilis.
- Paghahalo ng mga eksperto (MOE): Paggamit ng 256 Neural Networks, na may walong na -aktibo sa bawat gawain, para sa pinahusay na kahusayan sa pagganap at pagsasanay.
- Multi-head Latent attention (MLA): Paulit-ulit na kinukuha ang mga pangunahing detalye upang mabawasan ang pagkawala ng impormasyon at pagbutihin ang nakakainis na pag-unawa.
Imahe: ensigame.com
Ang pag -angkin ng Deepseek ng isang $ 6 milyong gastos sa pagsasanay para sa Deepseek V3 ay nakaliligaw. Habang ang figure na ito ay maaaring sumasalamin sa pre-training na paggamit ng GPU, tinanggal nito ang malaking gastos: pananaliksik, pagpipino, pagproseso ng data, at ang napakalaking imprastraktura. Ang Semianalysis ay nagsiwalat ng Deepseek ay nagpapatakbo ng isang malawak na imprastraktura ng computational, na gumagamit ng humigit -kumulang na 50,000 NVIDIA HOPPER GPUs (kabilang ang H800, H100, at H20 unit) sa maraming mga sentro ng data. Ang imprastraktura na ito ay kumakatawan sa isang kabuuang pamumuhunan ng server na humigit -kumulang na $ 1.6 bilyon, na may mga gastos sa pagpapatakbo na tinatayang $ 944 milyon.
Imahe: ensigame.com
Ang istraktura ng kumpanya, bilang isang subsidiary ng Chinese Hedge Fund High-flyer, ay nag-aambag sa tagumpay nito. Ang pagmamay -ari ng mga sentro ng data nito ay nagbibigay ng walang kaparis na kontrol at mas mabilis na pagpapatupad ng pagbabago. Ang kalikasan na pinondohan ng sarili ay nagbibigay-daan para sa liksi at mabilis na paggawa ng desisyon. Bukod dito, ang Deepseek ay nakakaakit ng nangungunang talento, na may ilang mga mananaliksik na kumikita ng higit sa $ 1.3 milyon taun -taon.
Imahe: ensigame.com
Ang kabuuang pamumuhunan ng Deepseek sa pag -unlad ng AI ay higit sa $ 500 milyon. Ang naka -streamline na istraktura nito ay nagbibigay -daan sa mahusay na pagbabago, na kaibahan sa burukratikong pasanin ng mas malalaking korporasyon. Gayunpaman, ang salaysay na "rebolusyonaryong badyet" ay isang labis na pag -iimpluwensya ng malaking pangako ng mapagkukunan.
Imahe: ensigame.com
Habang ang tagumpay ng Deepseek ay nagpapakita ng potensyal ng mahusay na pinondohan na independiyenteng mga kumpanya ng AI upang makipagkumpetensya sa mga higante, ang kwento nito ay binibigyang diin ang makabuluhang pamumuhunan na kinakailangan para sa mga naturang tagumpay. Ang kaibahan sa pagitan ng iniulat ng Deepeek na $ 5 milyon para sa R1 at ang tinatayang $ 100 milyon para sa Chatgpt4O ay nagtatampok ng malaking pagkakaiba sa gastos, kahit na sa malaking pamumuhunan ng Deepseek. Samakatuwid, ang paunang pag-angkin ng mababang gastos, ay kailangang matingnan sa loob ng konteksto ng pangkalahatang malaking pamumuhunan.