هزینه آموزش هوش مصنوعی DeepSeek فراتر از ۶ میلیون دلار است
یک گزارش جدید نشان میدهد که هزینه واقعی آموزش مدل هوش مصنوعی DeepSeek V3 برخلاف ادعای ۶ میلیون دلاری، در واقع ۱.۳ میلیارد دلار است. به گزارش تکناک، شرکت تحقیقاتی مستقل SemiAnalysis، هوشی مصنوعی DeepSeek را که بهعنوان بازیگری نوظهور در حوزه هوش مصنوعی شناخته میشود، مورد بررسی قرار داده است. این گزارش بسیاری از […] نوشته هزینه آموزش هوش مصنوعی DeepSeek فراتر از ۶ میلیون دلار است اولین بار در تک ناک - اخبار تکنولوژی روز جهان و ایران. پدیدار شد.
یک گزارش جدید نشان میدهد که هزینه واقعی آموزش مدل هوش مصنوعی DeepSeek V3 برخلاف ادعای ۶ میلیون دلاری، در واقع ۱.۳ میلیارد دلار است.
به گزارش تکناک، شرکت تحقیقاتی مستقل SemiAnalysis، هوشی مصنوعی DeepSeek را که بهعنوان بازیگری نوظهور در حوزه هوش مصنوعی شناخته میشود، مورد بررسی قرار داده است.
این گزارش بسیاری از دیدگاههای رایج پیرامون هزینههای DeepSeek را به چالش کشیده و آنها را با فناوریهای رقیب مقایسه کرده است.بر اساس ادعای مطرحشده ، هزینه آموزش مدل DeepSeek V3 حدود ۶ میلیون دلار برآورد شده است.بااینحال، گزارش SemiAnalysis این رقم را مورد بازبینی قرار داده و تأکید کرده است که در برآورد فوق، چندین عامل کلیدی نادیده گرفته شدهاند.
افسانه ۶ میلیون دلاری DeepSeek
برآورد ۶ میلیون دلاری صرفاً هزینههای مربوط به پیشآموزش GPU را در بر میگیرد و سرمایهگذاریهای عمده در تحقیق و توسعه، زیرساخت و سایر هزینههای عملیاتی این شرکت را لحاظ نکرده است.
این گزارش نشان میدهد که مجموع سرمایهگذاری DeepSeek در حوزه سرورها به رقم چشمگیر ۱.۳ میلیارد دلار رسیده است.بخش عمدهای از این هزینه صرف راهاندازی و نگهداری خوشههای بزرگ GPU شده است که زیربنای قدرت محاسباتی این شرکت را تشکیل میدهند.
DeepSeek به حدود ۵۰,۰۰۰ پردازنده گرافیکی Hopper دسترسی دارد، اما این عدد باعث ایجاد برخی برداشتهای نادرست در صنعت شده است.SemiAnalysis توضیح داده است که برخلاف برخی تصورات، این شرکت ۵۰,۰۰۰ عدد H100 در اختیار ندارد، بلکه موجودی GPU آن ترکیبی از مدلهای H800، H100 و H20 است که انویدیا برای پاسخ به محدودیتهای صادراتی ایالاتمتحده طراحی کرده است.
درک دقیق از این ترکیب سختافزاری، استراتژی DeepSeek را در تأمین منابع و بهینهسازی عملیاتی روشن میسازد.ساختار سازمانی DeepSeek و چابکی عملیاتی آن یکی از نکات مهم این گزارش، بررسی ساختار سازمانی DeepSeek است.
برخلاف برخی آزمایشگاههای بزرگ هوش مصنوعی، این شرکت مدیریت مراکز داده خود را بر عهده دارد و از یک مدل عملیاتی ساده و کارآمد بهره میبرد که باعث افزایش سرعت و انعطافپذیری آن شده است.با توجه به افزایش رقابت در حوزه هوش مصنوعی، توانایی سازگاری سریع، یکی از مزایای کلیدی DeepSeek محسوب میشود.
توانایی استدلال و رقابت با مدلهای مطرح
ازنظر عملکرد، تحلیلها نشان میدهند که مدل DeepSeek R1 در استدلال و پردازش دادهها عملکردی مشابه OpenAI’s o1 دارد.بااینحال، این گزارش DeepSeek را بهعنوان پیشتاز مطلق در تمامی بنچمارک های عملکردی معرفی نمیکند.
درحالیکه استراتژی قیمتگذاری این شرکت موردتوجه و تحسین قرار گرفته است، نکتهای مهم نیز وجود دارد: Gemini Flash 2.0 از شرکت گوگل که قابلیتهای مشابهی دارد، هنگام استفاده از API، هزینهای مقرونبهصرفهتر دارد.این مسئله DeepSeek را در موقعیتی حساس قرار داده است که در آن، ایجاد توازن میان هزینه و عملکرد، نقش مهمی در آینده این شرکت خواهد داشت.
کاهش چشمگیر هزینههای پردازش با فناوری نوین
یکی از برجستهترین نوآوریهایی که در گزارش به آن اشاره شده، فناوری Multi-Head Latent Attention (MLA) است.این فناوری پیشرفته، هزینههای پردازش و استنتاج را با کاهش ۹۳.۳ درصدی استفاده از حافظه نهان کلید-مقدار (KV) بهطور چشمگیری کاهش میدهد و نقطه عطفی در توسعه راهکارهای هوش مصنوعی مقرونبهصرفه محسوب میشود.
کارشناسان پیشبینی میکنند که نوآوریهای DeepSeek بهسرعت موردتوجه و بهرهبرداری آزمایشگاههای هوش مصنوعی غربی قرار بگیرد که به دنبال حفظ جایگاه رقابتی خود هستند.
درحالیکه آینده این شرکت امیدوارکننده به نظر میرسد، SemiAnalysis به برخی چالشهای خارجی نیز اشاره کرده است.بر اساس این گزارش، هزینههای عملیاتی دیپسیک ممکن است تا پایان سال پنج برابر دیگر کاهش یابد، زیرا این شرکت نسبت به رقبای بزرگتر خود، انعطافپذیری بیشتری در بهینهسازی هزینهها دارد.
نوشته هزینه آموزش هوش مصنوعی DeepSeek فراتر از ۶ میلیون دلار است اولین بار در تک ناک - اخبار تکنولوژی روز جهان و ایران. پدیدار شد.
واکنش شما چیست؟