دیپسیک ادعا میکند که مدل «استدلالی» آن در برخی معیارها از مدل o1 اوپنای آی پیشی گرفته است.
به گزارش داتیکا به نقل از تک رانچ مدل R1 از طریق پلتفرم توسعه هوش مصنوعی هاجینگ فیس تحت مجوز MIT در دسترس است، به این معنی که میتوان از آن بهطور تجاری بدون محدودیت استفاده کرد. طبق گفته دیپسیک، R1 در معیارهای AIME، MATH-500 و SWE-bench Verified از o1 بهتر عمل میکند. AIME از... The post دیپسیک ادعا میکند که مدل «استدلالی» آن در برخی معیارها از مدل o1 اوپنای آی پیشی گرفته است. appeared first on داتیکا | اخبار فناوری اطلاعات و ارتباطات.
به گزارش داتیکا به نقل از تک رانچ مدل R1 از طریق پلتفرم توسعه هوش مصنوعی هاجینگ فیس تحت مجوز MIT در دسترس است، به این معنی که میتوان از آن بهطور تجاری بدون محدودیت استفاده کرد. طبق گفته دیپسیک، R1 در معیارهای AIME، MATH-500 و SWE-bench Verified از o1 بهتر عمل میکند. AIME از مدلهای دیگر برای ارزیابی عملکرد یک مدل استفاده میکند، در حالی که MATH-500 شامل مسائل کلامی است. SWE-bench Verified نیز بر روی وظایف برنامهنویسی تمرکز دارد.
به عنوان یک مدل استدلالی، R1 بهطور مؤثری خود را تأیید میکند، که به آن کمک میکند تا از برخی دامهایی که معمولاً مدلها را به چالش میکشند، دوری کند. مدلهای استدلالی معمولاً برای رسیدن به راهحلها کمی زمان بیشتری میبرند — معمولاً چند ثانیه تا چند دقیقه بیشتر — در مقایسه با یک مدل غیر استدلالی معمولی. مزیت این است که آنها معمولاً در حوزههایی مانند فیزیک، علوم و ریاضیات قابل اعتمادتر هستند.
دیپسیک در یک گزارش فنی اعلام کرد که R1 شامل ۶۷۱ میلیارد پارامتر است. پارامترها بهطور تقریباً معادل با مهارتهای حل مسأله یک مدل هستند و مدلهایی که پارامترهای بیشتری دارند معمولاً عملکرد بهتری نسبت به مدلهایی با پارامترهای کمتر دارند.
۶۷۱ میلیارد پارامتر عددی بسیار بزرگ است، اما دیپسیک همچنین نسخههای «پالایششده» R1 را با اندازههایی از ۱.۵ میلیارد پارامتر تا ۷۰ میلیارد پارامتر منتشر کرده است. کوچکترین آنها میتواند بر روی یک لپتاپ اجرا شود. اما R1 کامل به سختافزار قویتری نیاز دارد، اما از طریق API دیپسیک با قیمتهایی ۹۰٪ تا ۹۵٪ ارزانتر از o1 اوپنای آی در دسترس است.
یک نقطه ضعف برای R1 وجود دارد. به عنوان یک مدل چینی، تحت ارزیابیهای نهاد نظارتی اینترنت چین قرار دارد تا اطمینان حاصل شود که پاسخهای آن «ارزشهای اصلی سوسیالیستی» را تجسم میکند. به عنوان مثال، R1 به سوالات مربوط به میدان تیانآنمن یا خودمختاری تایوان پاسخ نمیدهد.
بسیاری از سیستمهای هوش مصنوعی چینی، از جمله سایر مدلهای استدلالی، از پاسخ به موضوعاتی که ممکن است خشم نهادهای نظارتی در کشور را برانگیزد، مانند گمانهزنی درباره رژیم شی جینپینگ، خودداری میکنند.
مدل R1 چند روز پس از آنکه دولت بایدن قوانین و محدودیتهای سختتری را برای صادرات فناوریهای هوش مصنوعی به شرکتهای چینی پیشنهاد کرد، منتشر شد. شرکتهای چینی قبلاً از خرید تراشههای پیشرفته هوش مصنوعی منع شده بودند، اما اگر قوانین جدید بهصورت نوشته شده به اجرا درآید، شرکتها با محدودیتهای سختتری در زمینه فناوری نیمهرسانا و مدلهای لازم برای راهاندازی سیستمهای پیچیده هوش مصنوعی مواجه خواهند شد.
در یک سند سیاستی در هفته گذشته، اوپنای آی از دولت ایالات متحده خواست که از توسعه هوش مصنوعی آمریکایی حمایت کند، در غیر این صورت مدلهای چینی ممکن است در قابلیتها به آنها برسند یا آنها را پشت سر بگذارند. در یک مصاحبه با The Information، کریس لهین، معاون سیاست اوپنای آی، High Flyer Capital Management، شرکت مادر دیپسیک، را به عنوان سازمانی با نگرانی خاص معرفی کرد.
تا کنون، حداقل سه آزمایشگاه چینی — دیپسیک، علیبابا و کیمی، که متعلق به یونیکورن چینی Moonshot AI است — مدلهایی را تولید کردهاند که ادعا میکنند با o1 رقابت میکنند. (شایان ذکر است که دیپسیک اولین بود — این شرکت در اواخر نوامبر پیشنمایشی از R1 را اعلام کرد.) در پستی در X، دین بال، محقق هوش مصنوعی در دانشگاه جرج میسون، گفت که این روند نشان میدهد آزمایشگاههای هوش مصنوعی چینی بهطور مداوم «دنبالهروهای سریع» خواهند بود.
“عملکرد چشمگیر مدلهای پالایششده دیپسیک […] به این معنی است که استدلالکنندههای بسیار توانمند همچنان بهطور گستردهای گسترش خواهند یافت و میتوانند بر روی سختافزار محلی اجرا شوند”، بال نوشت، “دور از چشم هرگونه کنترل از بالا.”
The post دیپسیک ادعا میکند که مدل «استدلالی» آن در برخی معیارها از مدل o1 اوپنای آی پیشی گرفته است. appeared first on داتیکا | اخبار فناوری اطلاعات و ارتباطات.
واکنش شما چیست؟