โมเดล AI ที่ก้าวล้ำของ Deepseek ท้าทายบรรทัดฐานของอุตสาหกรรม เริ่มแรกได้รับการขนานนามว่าเป็นงบประมาณที่น่าอัศจรรย์ซึ่งได้รับการฝึกฝนมาเพียง 6 ล้านเหรียญสหรัฐความเป็นจริงเผยให้เห็นการลงทุนที่สำคัญยิ่งกว่า บทความนี้สำรวจความแตกต่างระหว่างการเรียกร้องเริ่มต้นของ Deepseek และค่าใช้จ่ายจริงที่เกี่ยวข้องในการพัฒนา AI ที่ซับซ้อนของพวกเขา
Chatbot Deepseek ซึ่งมีความสามารถที่น่าประทับใจได้กลายเป็นผู้เล่นหลักอย่างรวดเร็วแม้จะทำให้ราคาหุ้นลดลงอย่างมากสำหรับ Nvidia ความสำเร็จของมันเกิดจากการผสมผสานที่เป็นเอกลักษณ์ของเทคโนโลยีที่เป็นนวัตกรรม:
- การทำนายแบบมัลติเทน (MTP): ทำนายหลายคำพร้อมกันปรับปรุงความแม่นยำและความเร็วอย่างมีนัยสำคัญ
- ส่วนผสมของผู้เชี่ยวชาญ (MOE): ใช้เครือข่ายประสาท 256 แห่งโดยมีการเปิดใช้งานแปดต่องานเพื่อเพิ่มประสิทธิภาพและประสิทธิภาพการฝึกอบรม
- ความสนใจแฝงหลายหัว (MLA): การสกัดรายละเอียดสำคัญซ้ำ ๆ เพื่อลดการสูญเสียข้อมูลและปรับปรุงความเข้าใจที่เหมาะสม
IMGP%Image: Ensigame.com
การเรียกร้องค่าใช้จ่ายในการฝึกอบรมของ Deepseek สำหรับ Deepseek V3 นั้นทำให้เข้าใจผิด ในขณะที่ตัวเลขนี้อาจสะท้อนถึงการใช้งาน GPU ก่อนการฝึกอบรม แต่มันก็ละเว้นค่าใช้จ่ายที่สำคัญ: การวิจัยการปรับแต่งการประมวลผลข้อมูลและโครงสร้างพื้นฐานขนาดใหญ่ Semianalysis เปิดเผย Deepseek ดำเนินการโครงสร้างพื้นฐานการคำนวณที่กว้างใหญ่โดยใช้ GPU Nvidia Hopper ประมาณ 50,000 Nvidia (รวมถึง H800, H100 และ H20 หน่วย) ในหลายศูนย์ข้อมูล โครงสร้างพื้นฐานนี้แสดงถึงการลงทุนเซิร์ฟเวอร์ทั้งหมดประมาณ 1.6 พันล้านดอลลาร์โดยมีค่าใช้จ่ายในการดำเนินงานประมาณ 944 ล้านดอลลาร์
IMGP%Image: Ensigame.com
โครงสร้างของ บริษัท ในฐานะ บริษัท ย่อยของกองทุนป้องกันความเสี่ยงของจีนที่มีการขับไล่สูงซึ่งก่อให้เกิดความสำเร็จ การเป็นเจ้าของศูนย์ข้อมูลให้การควบคุมที่ไม่มีใครเทียบและการใช้นวัตกรรมที่เร็วขึ้น ธรรมชาติที่ได้รับการสนับสนุนตนเองช่วยให้ความคล่องตัวและการตัดสินใจอย่างรวดเร็ว นอกจากนี้ Deepseek ยังดึงดูดความสามารถสูงสุดโดยนักวิจัยบางคนมีรายได้มากกว่า $ 1.3 ล้านต่อปี
IMGP%Image: Ensigame.com
การลงทุนทั้งหมดของ Deepseek ในการพัฒนา AI นั้นสูงกว่า 500 ล้านดอลลาร์ โครงสร้างที่มีความคล่องตัวช่วยให้นวัตกรรมมีประสิทธิภาพตรงกันข้ามกับภาระของระบบราชการของ บริษัท ขนาดใหญ่ อย่างไรก็ตามการเล่าเรื่อง "งบประมาณปฏิวัติ" คือการทำให้มีความมุ่งมั่นในการใช้ทรัพยากรอย่างมาก
IMGP%Image: Ensigame.com
ในขณะที่ความสำเร็จของ Deepseek แสดงให้เห็นถึงศักยภาพของ บริษัท AI อิสระที่ได้รับการสนับสนุนอย่างดีในการแข่งขันกับยักษ์ ความแตกต่างระหว่าง Deepseek รายงาน 5 ล้านดอลลาร์สำหรับ R1 และประมาณ $ 100 ล้านสำหรับ ChatGPT4O เน้นความแตกต่างของต้นทุนที่สำคัญแม้จะมีการลงทุนที่สำคัญของ Deepseek ดังนั้นการเรียกร้องต้นทุนต่ำเริ่มต้นจึงต้องมีการดูภายในบริบทของการลงทุนโดยรวม