Het baanbrekende AI -model van Deepseek daagt de normen van de industrie uit. Aanvankelijk aangeprezen als een budget Marvel, getraind voor slechts $ 6 miljoen, onthult de realiteit een veel meer substantiële investering. Dit artikel onderzoekt de discrepanties tussen Deepseek's eerste claims en de werkelijke kosten die betrokken zijn bij het ontwikkelen van hun geavanceerde AI.
De Deepseek -chatbot, met indrukwekkende mogelijkheden, is snel een belangrijke speler geworden en veroorzaakt zelfs aanzienlijke aandelenkoersdaling voor NVIDIA. Het succes komt voort uit een unieke combinatie van innovatieve technologieën:
- Multi-Token Prediction (MTP): Het tegelijkertijd voorspellen van meerdere woorden, waardoor de nauwkeurigheid en snelheid aanzienlijk wordt verbeterd.
- Mix van experts (MOE): Gebruikt 256 neurale netwerken, met acht geactiveerde per taak, voor verbeterde prestaties en trainingsefficiëntie.
- Multi-head latente aandacht (MLA): Herhaaldelijk extraheren van belangrijke details om informatieverlies te minimaliseren en genuanceerd begrip te verbeteren.
afbeelding: ensigame.com
Deepseek's claim van een trainingskosten van $ 6 miljoen voor Deepseek V3 is misleidend. Hoewel dit cijfer mogelijk een weerspiegeling is van het gebruik van GPU-gebruik voor de training, laat het aanzienlijke kosten weg: onderzoek, verfijning, gegevensverwerking en de massale infrastructuur. Semianyse onthulde dat Deepseek een enorme computationele infrastructuur heeft, met behulp van ongeveer 50.000 NVIDIA -hopper GPU's (inclusief H800-, H100- en H20 -eenheden) over meerdere datacenters. Deze infrastructuur vertegenwoordigt een totale serverinvestering van ongeveer $ 1,6 miljard, met operationele kosten geschat op $ 944 miljoen.
afbeelding: ensigame.com
De structuur van het bedrijf, als dochteronderneming van het High Flyer van het Chinese hedgefonds, draagt bij aan het succes ervan. Het bezitten van zijn datacenters biedt ongeëvenaarde controle en snellere innovatie -implementatie. De zelf gefinancierde aard zorgt voor behendigheid en snelle besluitvorming. Bovendien trekt Deepseek toptalent aan, waarbij sommige onderzoekers jaarlijks meer dan $ 1,3 miljoen verdienen.
afbeelding: ensigame.com
De totale investering van Deepseek in AI -ontwikkeling overtreft $ 500 miljoen. De gestroomlijnde structuur maakt efficiënte innovatie mogelijk, in tegenstelling tot de bureaucratische lasten van grotere bedrijven. Het verhaal "revolutionaire budget" is echter een te vereenvoudigende vereenvoudiging van de substantiële toewijding van hulpbronnen.
afbeelding: ensigame.com
Hoewel het succes van Deepseek het potentieel van goed gefinancierde onafhankelijke AI-bedrijven aantoont om te concurreren met reuzen, onderstreept het verhaal de belangrijke investering die nodig is voor dergelijke prestaties. Het contrast tussen Deepseek's gerapporteerde $ 5 miljoen voor R1 en de geschatte $ 100 miljoen voor chatgpt4o benadrukt de substantiële kostenverschillen, zelfs met de substantiële investering van Deepseek. De eerste goedkope claim moet daarom worden bekeken in de context van de totale substantiële investering.