訊息 DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

作者 : Ava Feb 25,2025

DeepSeek開創性的AI模型挑戰了行業規範。最初被吹捧為預算奇跡,接受了600萬美元的培訓,現實顯示出了更大的投資。本文探討了DeepSeek的最初主張與開發其複雜AI的實際成本之間的差異。

DeepSeek聊天機器人具有令人印象深刻的能力,很快就成為了主要參與者,甚至導致Nvidia的股價大幅下跌。它的成功源於創新技術的獨特組合:

  • 多語預測(MTP):同時預測多個單詞,可顯著提高準確性和速度。
  • 專家(MOE)的混合物:利用256個神經網絡,每項任務激活了8個,以提高性能和訓練效率。
  • 多頭潛在注意力(MLA):反複提取關鍵細節,以最大程度地減少信息丟失並改善細微的理解。

DeepSeek Test圖像:ensigame.com

DeepSeek對DeepSeek V3的600萬美元培訓成本的主張具有誤導性。盡管該數字可能反映了培訓前的GPU使用情況,但它忽略了大量費用:研究,改進,數據處理和大規模的基礎架構。半分析顯示,DeepSeek運營著龐大的計算基礎架構,利用大約50,000個NVIDIA HOPPER GPU(包括H800,H100和H20單元)跨多個數據中心。該基礎設施的總投資總額約為16億美元,運營成本估計為9.44億美元。

DeepSeek V3圖像:ensigame.com

作為中國對衝基金高級基金的子公司,該公司的結構為其成功做出了貢獻。擁有其數據中心提供了無與倫比的控製和更快的創新實現。它的自資助性質允許敏捷和快速決策。此外,DeepSeek吸引了頂尖人才,一些研究人員每年收入超過130萬美元。

DeepSeek圖像:ensigame.com

DeepSeek對AI開發的總投資超過了5億美元。它的簡化結構可實現有效的創新,與大公司的官僚負擔形成鮮明對比。但是,“革命預算”的敘述是對其實質資源承諾的過度簡化。

DeepSeek圖像:ensigame.com

盡管DeepSeek的成功表明了資金充足的獨立AI公司與巨人競爭的潛力,但其故事強調了這項成就所必需的重大投資。 DeepSeek報告說,R1的500萬美元與估計的ChatGpt4O估計$ 1億美元之間的對比凸顯了巨大的成本差異,即使DeepSeek的大量投資也是如此。因此,需要在總體大量投資的背景下查看最初的低成本索賠。

最新文章
  • RYFT:聲音操控的聽覺奇遇

    ​你在一個宅邸中醒來,對自己是誰或如何到來的毫無記憶。你的逃脫取決於解開一系列多樣而複雜的謎題。僅使用語音命令作為你的唯一控制方式,來體驗整個旅程。獨立開發者 Alexander Lerman 揭曉了他們的最新作品《RYFT: A Timely Manor》。這是一款完全由你的聲音控制的音頻驅動冒險遊戲。無需點擊或觸控,你只需說出指令來調查房間、檢查物品並破解謎題。隨著你的進展,完整的配音陣容將使這座宅邸及其故事栩栩如生,營造出一個聲音即是一切的沉浸式世界。你在一個令人不安的宅邸中醒來,完全不記得

    by Hannah Dec 17,2025

  • iPad Air 與第 11 代 iPad 現已於 Amazon 開放預訂

    ​Apple 已推出兩款升級版 iPad 型號,將於 3 月 12 日上市,現已開放預訂。搭載 M3 晶片的 iPad Air 起價為 599 美元,而入門級第 11 代 iPad 則從 349 美元起。雖然並非革命性的重新設計,但這些 2025 年型號相較前代提供了升級規格,使其成為 Apple 購物者值得考慮的平板電腦。精選型號Apple iPad(第 11 代)亞馬遜售價 349 美元11 吋 iPad Air 搭載 M3 晶片亞馬遜售價 599 美元13 吋 iPad Air 搭載 M3

    by Finn Dec 17,2025

最新遊戲
Empire of Bones

卡牌  /  1.0.8  /  80.80M

下載
Slot World

卡牌  /  1.04  /  16.00M

下載