Новаторская модель искусственного интеллекта DeepSeek бросает вызов отраслевым нормам. Первоначально рекламируемое как бюджетное чудо, обученное всего за 6 миллионов долларов, реальность раскрывает гораздо более существенные инвестиции. В этой статье рассматриваются расхождения между первоначальными претензиями DeepSeek и фактическими затратами, связанными с разработкой их сложного ИИ.
Чат -бот DeepSeek, обладающий впечатляющими возможностями, быстро стал крупным игроком, даже вызывая значительные снижения цен на акции для NVIDIA. Его успех связан с уникальным сочетанием инновационных технологий:
- Multi-Token Production (MTP): Прогнозирование нескольких слов одновременно, значительно повышая точность и скорость.
- Смесь экспертов (MOE): Использование 256 нейронных сетей, с восемью активированными на задачу, для повышения эффективности и эффективности обучения.
- Многополосное скрытое внимание (MLA): Повторно извлечение ключевых деталей, чтобы минимизировать потерю информации и улучшить нюансированное понимание.
Изображение: Ensigame.com
Заявление DeepSeek о стоимости обучения в 6 миллионов долларов для Deepseek V3 вводит в заблуждение. Хотя этот рисунок может отражать предварительное использование графического процессора, он пропускает существенные расходы: исследования, уточнение, обработка данных и массивная инфраструктура. Семианализ выявил DeepSeek управляет обширной вычислительной инфраструктурой с использованием приблизительно 50 000 графических процессоров Nvidia Hopper (включая H800, H100 и H20) в нескольких центрах обработки данных. Эта инфраструктура представляет собой общие инвестиции в сервер в размере примерно 1,6 млрд. Долл. США, при этом эксплуатационные расходы оцениваются в 944 млн. Долл. США.
Изображение: Ensigame.com
Структура компании, как дочерняя компания китайского хедж-фонда, способствует его успеху. Владение его центрами обработки данных обеспечивает беспрецедентный контроль и более быструю инновационную реализацию. Его самофинансируемая природа допускает ловкость и быстрое принятие решений. Кроме того, DeepSeek привлекает лучших талантов, некоторые исследователи зарабатывают более 1,3 миллиона долларов в год.
Изображение: Ensigame.com
Общая инвестиция DeepSeek в развитие искусственного интеллекта превышает 500 миллионов долларов. Его оптимизированная структура обеспечивает эффективные инновации, в отличие от бюрократического бремени более крупных корпораций. Тем не менее, повествование «революционный бюджет» является упрощением его существенной приверженности ресурсам.
Изображение: Ensigame.com
В то время как успех Deepseek демонстрирует потенциал хорошо финансируемых независимых компаний искусственного интеллекта, чтобы конкурировать с гигантами, его история подчеркивает значительные инвестиции, необходимые для таких достижений. Контраст между Deepseek сообщил о 5 миллионах долларов США для R1 и оценкой 100 миллионов долларов для Chatgpt4o, подчеркивает существенные различия в стоимости, даже при существенных инвестициях Deepseek. Следовательно, первоначальное недорогое требование должно рассматриваться в контексте общих существенных инвестиций.