هزینه آموزش هوش مصنوعی DeepSeek فراتر از ۶ میلیون دلار است

یک گزارش جدید نشان می‌دهد که هزینه واقعی آموزش مدل هوش مصنوعی DeepSeek V3 برخلاف ادعای ۶ میلیون دلاری، در واقع ۱.۳ میلیارد دلار است. به گزارش تکناک، شرکت تحقیقاتی مستقل SemiAnalysis، هوشی مصنوعی DeepSeek را که به‌عنوان بازیگری نوظهور در حوزه هوش مصنوعی شناخته می‌شود، مورد بررسی قرار داده است. این گزارش بسیاری از […] نوشته هزینه آموزش هوش مصنوعی DeepSeek فراتر از ۶ میلیون دلار است اولین بار در تک ناک - اخبار تکنولوژی روز جهان و ایران. پدیدار شد.

tnas

۱۳ بهمن , ۱۴۰۳ - 17:00

0 3

هزینه آموزش هوش مصنوعی DeepSeek فراتر از ۶ میلیون دلار است

یک گزارش جدید نشان می‌دهد که هزینه واقعی آموزش مدل هوش مصنوعی DeepSeek V3 برخلاف ادعای ۶ میلیون دلاری، در واقع ۱.۳ میلیارد دلار است.

به گزارش تکناک، شرکت تحقیقاتی مستقل SemiAnalysis، هوشی مصنوعی DeepSeek را که به‌عنوان بازیگری نوظهور در حوزه هوش مصنوعی شناخته می‌شود، مورد بررسی قرار داده است.

این گزارش بسیاری از دیدگاه‌های رایج پیرامون هزینه‌های DeepSeek را به چالش کشیده و آن‌ها را با فناوری‌های رقیب مقایسه کرده است.بر اساس ادعای مطرح‌شده ، هزینه آموزش مدل DeepSeek V3 حدود ۶ میلیون دلار برآورد شده است.بااین‌حال، گزارش SemiAnalysis این رقم را مورد بازبینی قرار داده و تأکید کرده است که در برآورد فوق، چندین عامل کلیدی نادیده گرفته شده‌اند.

افسانه ۶ میلیون دلاری DeepSeek

برآورد ۶ میلیون دلاری صرفاً هزینه‌های مربوط به پیش‌آموزش GPU را در بر می‌گیرد و سرمایه‌گذاری‌های عمده در تحقیق و توسعه، زیرساخت و سایر هزینه‌های عملیاتی این شرکت را لحاظ نکرده است.

این گزارش نشان می‌دهد که مجموع سرمایه‌گذاری DeepSeek در حوزه سرورها به رقم چشمگیر ۱.۳ میلیارد دلار رسیده است.بخش عمده‌ای از این هزینه صرف راه‌اندازی و نگهداری خوشه‌های بزرگ GPU شده است که زیربنای قدرت محاسباتی این شرکت را تشکیل می‌دهند.

DeepSeek به حدود ۵۰,۰۰۰ پردازنده گرافیکی Hopper دسترسی دارد، اما این عدد باعث ایجاد برخی برداشت‌های نادرست در صنعت شده است.SemiAnalysis توضیح داده است که برخلاف برخی تصورات، این شرکت ۵۰,۰۰۰ عدد H100 در اختیار ندارد، بلکه موجودی GPU آن ترکیبی از مدل‌های H800، H100 و H20 است که انویدیا برای پاسخ به محدودیت‌های صادراتی ایالات‌متحده طراحی کرده است.

درک دقیق از این ترکیب سخت‌افزاری، استراتژی DeepSeek را در تأمین منابع و بهینه‌سازی عملیاتی روشن می‌سازد.ساختار سازمانی DeepSeek و چابکی عملیاتی آن یکی از نکات مهم این گزارش، بررسی ساختار سازمانی DeepSeek است.

برخلاف برخی آزمایشگاه‌های بزرگ هوش مصنوعی، این شرکت مدیریت مراکز داده خود را بر عهده دارد و از یک مدل عملیاتی ساده و کارآمد بهره می‌برد که باعث افزایش سرعت و انعطاف‌پذیری آن شده است.با توجه به افزایش رقابت در حوزه هوش مصنوعی، توانایی سازگاری سریع، یکی از مزایای کلیدی DeepSeek محسوب می‌شود.

توانایی استدلال و رقابت با مدل‌های مطرح

ازنظر عملکرد، تحلیل‌ها نشان می‌دهند که مدل DeepSeek R1 در استدلال و پردازش داده‌ها عملکردی مشابه OpenAI’s o1 دارد.بااین‌حال، این گزارش DeepSeek را به‌عنوان پیشتاز مطلق در تمامی بنچمارک های عملکردی معرفی نمی‌کند.

درحالی‌که استراتژی قیمت‌گذاری این شرکت موردتوجه و تحسین قرار گرفته است، نکته‌ای مهم نیز وجود دارد: Gemini Flash 2.0 از شرکت گوگل که قابلیت‌های مشابهی دارد، هنگام استفاده از API، هزینه‌ای مقرون‌به‌صرفه‌تر دارد.این مسئله DeepSeek را در موقعیتی حساس قرار داده است که در آن، ایجاد توازن میان هزینه و عملکرد، نقش مهمی در آینده این شرکت خواهد داشت.

کاهش چشمگیر هزینه‌های پردازش با فناوری نوین

یکی از برجسته‌ترین نوآوری‌هایی که در گزارش به آن اشاره شده، فناوری Multi-Head Latent Attention (MLA) است.این فناوری پیشرفته، هزینه‌های پردازش و استنتاج را با کاهش ۹۳.۳ درصدی استفاده از حافظه نهان کلید-مقدار (KV) به‌طور چشمگیری کاهش می‌دهد و نقطه عطفی در توسعه راهکارهای هوش مصنوعی مقرون‌به‌صرفه محسوب می‌شود.

کارشناسان پیش‌بینی می‌کنند که نوآوری‌های DeepSeek به‌سرعت موردتوجه و بهره‌برداری آزمایشگاه‌های هوش مصنوعی غربی قرار بگیرد که به دنبال حفظ جایگاه رقابتی خود هستند.

درحالی‌که آینده این شرکت امیدوارکننده به نظر می‌رسد، SemiAnalysis به برخی چالش‌های خارجی نیز اشاره کرده است.بر اساس این گزارش، هزینه‌های عملیاتی دیپ‌سیک ممکن است تا پایان سال پنج برابر دیگر کاهش یابد، زیرا این شرکت نسبت به رقبای بزرگ‌تر خود، انعطاف‌پذیری بیشتری در بهینه‌سازی هزینه‌ها دارد.

نوشته هزینه آموزش هوش مصنوعی DeepSeek فراتر از ۶ میلیون دلار است اولین بار در تک ناک - اخبار تکنولوژی روز جهان و ایران. پدیدار شد.

منبع خبر