هزینههای واقعی توسعه هوش مصنوعی DeepSeek؛ احتمالاً ۱.۶ میلیارد دلار
شرکت چینی DeepSeek اخیراً صنعت هوش مصنوعی را متحول کرده و با انتشار مدل R1، به رقیبی جدی برای مدل o1 از OpenAI تبدیل شده است. این مدل با استفاده از 2,048 پردازنده گرافیکی Nvidia H800 و با هزینهای اعلامشده 5.576 میلیون دلاری آموزش دیده است. اما یک گزارش جدید نشان میدهد که هزینه واقعی …
شرکت چینی DeepSeek اخیراً صنعت هوش مصنوعی را متحول کرده و با انتشار مدل R1، به رقیبی جدی برای مدل o1 از OpenAI تبدیل شده است. این مدل با استفاده از 2,048 پردازنده گرافیکی Nvidia H800 و با هزینهای اعلامشده 5.576 میلیون دلاری آموزش دیده است. اما یک گزارش جدید نشان میدهد که هزینه واقعی توسعه این مدل حدود 1.6 میلیارد دلار بوده و این شرکت به حدود 50,000 واحد پردازنده Hopper دسترسی دارد.
ادعای اولیه مبنی بر اینکه DeepSeek توانسته R1 را با منابعی بسیار کمتر از شرکتهای بزرگ فناوری توسعه دهد، در یک روز باعث سقوط 600 میلیارد دلاری ارزش سهام انویدیا شد. این سؤال مطرح شد که اگر یک استارتاپ چینی میتواند مدلی قدرتمند را بدون صرف میلیاردها دلار برای پردازندههای قدرتمند هوش مصنوعی انویدیا بسازد، چه چیزی مانع از آن میشود که دیگران همین کار را انجام دهند؟
اما آیا DeepSeek واقعاً مدل Mixture-of-Experts را که همچنان در صدر فهرست اپلیکیشنهای اپاستور اپل قرار دارد، با چنین هزینه پایینی توسعه داده است؟ تحلیلگران SemiAnalysis میگویند که این ادعا صحت ندارد.
دسترسی DeepSeek به پردازندههای گرافیکی قدرتمند
طبق گزارش SemiAnalysis، DeepSeek به حدود 50,000 پردازنده گرافیکی Hopper دسترسی دارد که شامل 10,000 واحد H800 و 10,000 واحد H100 است. همچنین این شرکت سفارشهای گستردهای برای مدلهای H20 مخصوص چین دارد. پردازندههای گرافیکی این شرکت میان DeepSeek و High-Flyer (یک صندوق پوششی کمی که پشت DeepSeek قرار دارد) تقسیم شدهاند و در چندین مرکز داده در نقاط مختلف جغرافیایی برای معاملات مالی، پردازشهای هوش مصنوعی، آموزش مدلها و تحقیقات علمی استفاده میشوند.
سرمایهگذاری DeepSeek فراتر از 5.5 میلیون دلار
برخلاف رقم 5.5 میلیون دلاری که باعث شوک در بازار بورس شد، گزارش SemiAnalysis نشان میدهد که این رقم تنها بخشی جزئی از کل هزینههای پیشپردازش بوده است. بر اساس این گزارش:
• مجموع سرمایهگذاری DeepSeek در سرورها حدود 1.6 میلیارد دلار برآورد شده است.
• 944 میلیون دلار از این مبلغ صرف هزینههای عملیاتی شده است.
• بیش از 500 میلیون دلار از این مبلغ به سرمایهگذاری در پردازندههای گرافیکی اختصاص یافته است.
تفاوت DeepSeek با سایر شرکتهای هوش مصنوعی
به عنوان مقایسه، مدل Claude 3.5 Sonnet شرکت Anthropic با دهها میلیون دلار هزینه آموزش دیده است، اما این شرکت همچنان نیازمند میلیاردها دلار سرمایهگذاری از سوی گوگل و آمازون بود. این در حالی است که DeepSeek توانسته است بخش عمدهای از فرآیند توسعه خود را بهصورت مستقل مدیریت کند.
یکی از نکات کلیدی دیگر این است که DeepSeek تمامی استعدادهای خود را از چین جذب کرده است، در حالی که شرکتهایی مانند هواوی برای جذب استعدادهای خارجی، به ویژه از تایوان و شرکت TSMC، تلاش زیادی کردهاند. DeepSeek به برخی از متخصصان خود حقوقی بیش از 1.3 میلیون دلار پیشنهاد داده است که بسیار بالاتر از میانگین پرداختی در شرکتهای هوش مصنوعی چینی است.
همچنین، این شرکت بیشتر مراکز داده خود را بهصورت مستقل اداره میکند و نیازی به تکیه بر ارائهدهندگان سرویسهای ابری خارجی ندارد. این موضوع به آن امکان میدهد که آزمایشات و نوآوریهای بیشتری را در سطح محصولات هوش مصنوعی خود انجام دهد. به گفته SemiAnalysis، DeepSeek در حال حاضر بهترین آزمایشگاه “مدلهای متن باز” در دنیا محسوب میشود و حتی از پروژههایی مانند Llama متا و Mistral عملکرد بهتری دارد.
واکنش شما چیست؟