هزینه‌های واقعی توسعه هوش مصنوعی DeepSeek؛ احتمالاً ۱.۶ میلیارد دلار

شرکت چینی DeepSeek اخیراً صنعت هوش مصنوعی را متحول کرده و با انتشار مدل R1، به رقیبی جدی برای مدل o1 از OpenAI تبدیل شده است. این مدل با استفاده از 2,048 پردازنده گرافیکی Nvidia H800 و با هزینه‌ای اعلام‌شده 5.576 میلیون دلاری آموزش دیده است. اما یک گزارش جدید نشان می‌دهد که هزینه واقعی …

tnas

۱۶ بهمن , ۱۴۰۳ - 14:00

0 3

هزینه‌های واقعی توسعه هوش مصنوعی DeepSeek؛ احتمالاً ۱.۶ میلیارد دلار

شرکت چینی DeepSeek اخیراً صنعت هوش مصنوعی را متحول کرده و با انتشار مدل R1، به رقیبی جدی برای مدل o1 از OpenAI تبدیل شده است. این مدل با استفاده از 2,048 پردازنده گرافیکی Nvidia H800 و با هزینه‌ای اعلام‌شده 5.576 میلیون دلاری آموزش دیده است. اما یک گزارش جدید نشان می‌دهد که هزینه واقعی توسعه این مدل حدود 1.6 میلیارد دلار بوده و این شرکت به حدود 50,000 واحد پردازنده Hopper دسترسی دارد.

ادعای اولیه مبنی بر اینکه DeepSeek توانسته R1 را با منابعی بسیار کمتر از شرکت‌های بزرگ فناوری توسعه دهد، در یک روز باعث سقوط 600 میلیارد دلاری ارزش سهام انویدیا شد. این سؤال مطرح شد که اگر یک استارتاپ چینی می‌تواند مدلی قدرتمند را بدون صرف میلیاردها دلار برای پردازنده‌های قدرتمند هوش مصنوعی انویدیا بسازد، چه چیزی مانع از آن می‌شود که دیگران همین کار را انجام دهند؟

اما آیا DeepSeek واقعاً مدل Mixture-of-Experts را که همچنان در صدر فهرست اپلیکیشن‌های اپ‌استور اپل قرار دارد، با چنین هزینه پایینی توسعه داده است؟ تحلیلگران SemiAnalysis می‌گویند که این ادعا صحت ندارد.

دسترسی DeepSeek به پردازنده‌های گرافیکی قدرتمند

طبق گزارش SemiAnalysis، DeepSeek به حدود 50,000 پردازنده گرافیکی Hopper دسترسی دارد که شامل 10,000 واحد H800 و 10,000 واحد H100 است. همچنین این شرکت سفارش‌های گسترده‌ای برای مدل‌های H20 مخصوص چین دارد. پردازنده‌های گرافیکی این شرکت میان DeepSeek و High-Flyer (یک صندوق پوششی کمی که پشت DeepSeek قرار دارد) تقسیم شده‌اند و در چندین مرکز داده در نقاط مختلف جغرافیایی برای معاملات مالی، پردازش‌های هوش مصنوعی، آموزش مدل‌ها و تحقیقات علمی استفاده می‌شوند.

سرمایه‌گذاری DeepSeek فراتر از 5.5 میلیون دلار

برخلاف رقم 5.5 میلیون دلاری که باعث شوک در بازار بورس شد، گزارش SemiAnalysis نشان می‌دهد که این رقم تنها بخشی جزئی از کل هزینه‌های پیش‌پردازش بوده است. بر اساس این گزارش:

• مجموع سرمایه‌گذاری DeepSeek در سرورها حدود 1.6 میلیارد دلار برآورد شده است.

• 944 میلیون دلار از این مبلغ صرف هزینه‌های عملیاتی شده است.

• بیش از 500 میلیون دلار از این مبلغ به سرمایه‌گذاری در پردازنده‌های گرافیکی اختصاص یافته است.

تفاوت DeepSeek با سایر شرکت‌های هوش مصنوعی

به عنوان مقایسه، مدل Claude 3.5 Sonnet شرکت Anthropic با ده‌ها میلیون دلار هزینه آموزش دیده است، اما این شرکت همچنان نیازمند میلیاردها دلار سرمایه‌گذاری از سوی گوگل و آمازون بود. این در حالی است که DeepSeek توانسته است بخش عمده‌ای از فرآیند توسعه خود را به‌صورت مستقل مدیریت کند.

یکی از نکات کلیدی دیگر این است که DeepSeek تمامی استعدادهای خود را از چین جذب کرده است، در حالی که شرکت‌هایی مانند هواوی برای جذب استعدادهای خارجی، به ویژه از تایوان و شرکت TSMC، تلاش زیادی کرده‌اند. DeepSeek به برخی از متخصصان خود حقوقی بیش از 1.3 میلیون دلار پیشنهاد داده است که بسیار بالاتر از میانگین پرداختی در شرکت‌های هوش مصنوعی چینی است.

همچنین، این شرکت بیشتر مراکز داده خود را به‌صورت مستقل اداره می‌کند و نیازی به تکیه بر ارائه‌دهندگان سرویس‌های ابری خارجی ندارد. این موضوع به آن امکان می‌دهد که آزمایشات و نوآوری‌های بیشتری را در سطح محصولات هوش مصنوعی خود انجام دهد. به گفته SemiAnalysis، DeepSeek در حال حاضر بهترین آزمایشگاه “مدل‌های متن باز” در دنیا محسوب می‌شود و حتی از پروژه‌هایی مانند Llama متا و Mistral عملکرد بهتری دارد.

منبع خبر