دیپ‌سیک ادعا می‌کند که مدل «استدلالی» آن در برخی معیارها از مدل o1 اوپن‌ای آی پیشی گرفته است.

به گزارش داتیکا به نقل از تک رانچ مدل R1 از طریق پلتفرم توسعه هوش مصنوعی هاجینگ فیس تحت مجوز MIT در دسترس است، به این معنی که می‌توان از آن به‌طور تجاری بدون محدودیت استفاده کرد. طبق گفته دیپ‌سیک، R1 در معیارهای AIME، MATH-500 و SWE-bench Verified از o1 بهتر عمل می‌کند. AIME از... The post دیپ‌سیک ادعا می‌کند که مدل «استدلالی» آن در برخی معیارها از مدل o1 اوپن‌ای آی پیشی گرفته است. appeared first on داتیکا | اخبار فناوری اطلاعات و ارتباطات.

۰۲ بهمن , ۱۴۰۳ - 10:00
 0  6
دیپ‌سیک ادعا می‌کند که مدل «استدلالی» آن در برخی معیارها از مدل o1 اوپن‌ای آی پیشی گرفته است.

به گزارش داتیکا به نقل از تک رانچ مدل R1 از طریق پلتفرم توسعه هوش مصنوعی هاجینگ فیس تحت مجوز MIT در دسترس است، به این معنی که می‌توان از آن به‌طور تجاری بدون محدودیت استفاده کرد. طبق گفته دیپ‌سیک، R1 در معیارهای AIME، MATH-500 و SWE-bench Verified از o1 بهتر عمل می‌کند. AIME از مدل‌های دیگر برای ارزیابی عملکرد یک مدل استفاده می‌کند، در حالی که MATH-500 شامل مسائل کلامی است. SWE-bench Verified نیز بر روی وظایف برنامه‌نویسی تمرکز دارد.

به عنوان یک مدل استدلالی، R1 به‌طور مؤثری خود را تأیید می‌کند، که به آن کمک می‌کند تا از برخی دام‌هایی که معمولاً مدل‌ها را به چالش می‌کشند، دوری کند. مدل‌های استدلالی معمولاً برای رسیدن به راه‌حل‌ها کمی زمان بیشتری می‌برند — معمولاً چند ثانیه تا چند دقیقه بیشتر — در مقایسه با یک مدل غیر استدلالی معمولی. مزیت این است که آن‌ها معمولاً در حوزه‌هایی مانند فیزیک، علوم و ریاضیات قابل اعتمادتر هستند.

دیپ‌سیک در یک گزارش فنی اعلام کرد که R1 شامل ۶۷۱ میلیارد پارامتر است. پارامترها به‌طور تقریباً معادل با مهارت‌های حل مسأله یک مدل هستند و مدل‌هایی که پارامترهای بیشتری دارند معمولاً عملکرد بهتری نسبت به مدل‌هایی با پارامترهای کمتر دارند.

۶۷۱ میلیارد پارامتر عددی بسیار بزرگ است، اما دیپ‌سیک همچنین نسخه‌های «پالایش‌شده» R1 را با اندازه‌هایی از ۱.۵ میلیارد پارامتر تا ۷۰ میلیارد پارامتر منتشر کرده است. کوچک‌ترین آن‌ها می‌تواند بر روی یک لپ‌تاپ اجرا شود. اما R1 کامل به سخت‌افزار قوی‌تری نیاز دارد، اما از طریق API دیپ‌سیک با قیمت‌هایی ۹۰٪ تا ۹۵٪ ارزان‌تر از o1 اوپن‌ای آی در دسترس است.

یک نقطه ضعف برای R1 وجود دارد. به عنوان یک مدل چینی، تحت ارزیابی‌های نهاد نظارتی اینترنت چین قرار دارد تا اطمینان حاصل شود که پاسخ‌های آن «ارزش‌های اصلی سوسیالیستی» را تجسم می‌کند. به عنوان مثال، R1 به سوالات مربوط به میدان تیان‌آن‌من یا خودمختاری تایوان پاسخ نمی‌دهد.

بسیاری از سیستم‌های هوش مصنوعی چینی، از جمله سایر مدل‌های استدلالی، از پاسخ به موضوعاتی که ممکن است خشم نهادهای نظارتی در کشور را برانگیزد، مانند گمانه‌زنی درباره رژیم شی جین‌پینگ، خودداری می‌کنند.

مدل R1 چند روز پس از آنکه دولت بایدن  قوانین و محدودیت‌های سخت‌تری را برای صادرات فناوری‌های هوش مصنوعی به شرکت‌های چینی پیشنهاد کرد، منتشر شد. شرکت‌های چینی قبلاً از خرید تراشه‌های پیشرفته هوش مصنوعی منع شده بودند، اما اگر قوانین جدید به‌صورت نوشته شده به اجرا درآید، شرکت‌ها با محدودیت‌های سخت‌تری در زمینه فناوری نیمه‌رسانا و مدل‌های لازم برای راه‌اندازی سیستم‌های پیچیده هوش مصنوعی مواجه خواهند شد.

در یک سند سیاستی در هفته گذشته، اوپن‌ای آی از دولت ایالات متحده خواست که از توسعه هوش مصنوعی آمریکایی حمایت کند، در غیر این صورت مدل‌های چینی ممکن است در قابلیت‌ها به آنها برسند یا آنها را پشت سر بگذارند. در یک مصاحبه با The Information، کریس لهین، معاون سیاست اوپن‌ای آی، High Flyer Capital Management، شرکت مادر دیپ‌سیک، را به عنوان سازمانی با نگرانی خاص معرفی کرد.

تا کنون، حداقل سه آزمایشگاه چینی — دیپ‌سیک، علی‌بابا و کیمی، که متعلق به یونیکورن چینی Moonshot AI است — مدل‌هایی را تولید کرده‌اند که ادعا می‌کنند با o1 رقابت می‌کنند. (شایان ذکر است که دیپ‌سیک اولین بود — این شرکت در اواخر نوامبر پیش‌نمایشی از R1 را اعلام کرد.) در پستی در X، دین بال، محقق هوش مصنوعی در دانشگاه جرج میسون، گفت که این روند نشان می‌دهد آزمایشگاه‌های هوش مصنوعی چینی به‌طور مداوم «دنباله‌روهای سریع» خواهند بود.

“عملکرد چشمگیر مدل‌های پالایش‌شده دیپ‌سیک […] به این معنی است که استدلال‌کننده‌های بسیار توانمند همچنان به‌طور گسترده‌ای گسترش خواهند یافت و می‌توانند بر روی سخت‌افزار محلی اجرا شوند”، بال نوشت، “دور از چشم هرگونه کنترل از بالا.”

The post دیپ‌سیک ادعا می‌کند که مدل «استدلالی» آن در برخی معیارها از مدل o1 اوپن‌ای آی پیشی گرفته است. appeared first on داتیکا | اخبار فناوری اطلاعات و ارتباطات.

واکنش شما چیست؟

like

dislike

love

funny

angry

sad

wow