Przełomowy model AI Deepseek rzuca wyzwanie normom branżowym. Początkowo reklamowany jako cud budżetowy, przeszkolony za zaledwie 6 milionów dolarów, rzeczywistość ujawnia znacznie bardziej znaczącą inwestycję. W tym artykule bada rozbieżności między początkowymi roszczeniami Deepseek a faktycznymi kosztami związanymi z rozwojem ich wyrafinowanej sztucznej inteligencji.
Głębokie chatbot, który szczyci się imponującymi możliwościami, szybko stał się głównym graczem, nawet powodując znaczne spadki cen akcji dla NVIDIA. Jego sukces wynika z unikalnej kombinacji innowacyjnych technologii:
- Prognozowanie wielu tokenów (MTP): Prognozowanie wielu słów jednocześnie, znacznie poprawiając dokładność i szybkość.
- Mieszanka ekspertów (MOE): Wykorzystanie 256 sieci neuronowych, z ośmioma aktywowanymi na zadanie, dla zwiększonej wydajności i wydajności treningu.
- Uczciwa uwaga z wieloma głównymi (MLA): Wielokrotne wyodrębnienie kluczowych szczegółów w celu zminimalizowania utraty informacji i poprawy dopracowanego zrozumienia.
Obraz: engame.com
Roszczenie Deepseek o 6 milionów dolarów kosztów szkolenia Deepseek V3 wprowadza w błąd. Chociaż liczba ta może odzwierciedlać użycie GPU przed treningiem, pomija znaczne wydatki: badania, udoskonalenie, przetwarzanie danych i masywną infrastrukturę. Semianaliza ujawniła, że DeepSeek prowadzi ogromną infrastrukturę obliczeniową, wykorzystując około 50 000 GPU Nvidia Hopper (w tym jednostki H800, H100 i H20) w wielu centrach danych. Ta infrastruktura stanowi całkowitą inwestycję serwera w wysokości około 1,6 miliarda USD, a koszty operacyjne wynoszą 944 mln USD.
Obraz: engame.com
Struktura firmy, jako spółka zależna chińskiego funduszu hedgingowego, przyczynia się do jej sukcesu. Posiadanie centrów danych zapewnia niezrównaną kontrolę i szybszą wdrażanie innowacji. Jego samofinansowany charakter pozwala na zwinność i szybkie podejmowanie decyzji. Ponadto Deepseek przyciąga najlepszych talentów, a niektórzy badacze zarabiają ponad 1,3 miliona dolarów rocznie.
Obraz: engame.com
Całkowita inwestycja Deepseek w rozwój sztucznej inteligencji przekracza 500 milionów dolarów. Jego usprawniona struktura umożliwia wydajne innowacje, kontrastując z biurokratycznymi obciążeniami większych korporacji. Jednak narracja „rewolucyjnego budżetu” stanowi nadmierne uproszczenie jej znacznego zaangażowania zasobów.
Obraz: engame.com
Podczas gdy sukces Deepseek pokazuje potencjał dobrze finansowanych niezależnych firm AI do konkurowania z gigantami, jej historia podkreśla znaczące inwestycje niezbędne do takich osiągnięć. Kontrast między zgłoszonym 5 milionami dolarów Deepseeka za R1 a szacowaną 100 milionów dolarów na Chatgpt4o podkreśla znaczne różnice kosztów, nawet przy znacznych inwestycjach Deepseek. W związku z tym początkowe tanie roszczenie należy postrzegać w kontekście ogólnej znacznej inwestycji.