مایکروسافت مدل زبانی کوچک پیشرفته با ۱۴ میلیارد پارامتر معرفی کرد

مایکروسافت مدل زبانی پیشرفته Phi-4 را با ۱۴ میلیارد پارامتر معرفی کرده است. این مدل کوچک و بهینه با تمرکز بر کاهش مصرف منابع و حفظ دقت زیاد برای کاربردهای متنوع در پردازش زبان طبیعی طراحی شده است. به گزارش تک‌ناک، مایکروسافت جدیدترین مدل زبانی خود، Phi-4 را رونمایی کرد. این مدل زبانی کوچک با ۱۴ […] نوشته مایکروسافت مدل زبانی کوچک پیشرفته با ۱۴ میلیارد پارامتر معرفی کرد اولین بار در تک ناک. پدیدار شد.

۲۳ آذر , ۱۴۰۳ - 21:00
 0  2
مایکروسافت مدل زبانی کوچک پیشرفته با ۱۴ میلیارد پارامتر معرفی کرد

مایکروسافت مدل زبانی پیشرفته Phi-4 را با ۱۴ میلیارد پارامتر معرفی کرده است. این مدل کوچک و بهینه با تمرکز بر کاهش مصرف منابع و حفظ دقت زیاد برای کاربردهای متنوع در پردازش زبان طبیعی طراحی شده است.

به گزارش تک‌ناک، مایکروسافت جدیدترین مدل زبانی خود، Phi-4 را رونمایی کرد. این مدل زبانی کوچک با ۱۴ میلیارد پارامتر، در آزمون‌های هوش مصنوعی MATH و GPQA عملکردی بهتر از مدل بزرگ GPT-4 شرکت OpenAI از خود نشان داده و توانسته است جایگاه ویژه‌ای در عرصه فناوری مدل‌های زبانی به دست آورد.

معرفی Phi-4 و ویژگی‌های برتر آن

به نقل از نئووین، مایکروسافت در اوایل سال جاری خانواده مدل‌های زبانی کوچک Phi-3 را معرفی کرد و اکنون با انتشار Phi-4، سطح جدیدی از توانایی‌های مدل‌های زبانی را در دسترس قرار داده است. این مدل پیشرفته به لطف استفاده از داده‌های مصنوعی باکیفیت و گزینش دقیق داده‌های ارگانیک و بهینه‌سازی پس‌از آموزش توانسته به نتایج درخورتوجهی دست یابد.

معرفی Phi-4 و ویژگی‌های برتر آن

دلایل موفقیت Phi-4 در آزمون‌های ریاضی

مایکروسافت اعلام کرده است که عملکرد قوی Phi-4 در مسائل مرتبط با ریاضیات به‌دلیل بهره‌گیری از داده‌های مصنوعی پیشرفته‌ای است که با تکنیک‌هایی مانند بازبینی چندعاملی و فرایندهای خودبازبینی و معکوس‌سازی دستورالعمل‌ها تولید شده‌اند. این داده‌های مصنوعی بخش عمده‌ای از داده‌های آموزشی این مدل را تشکیل می‌دهند.

مایکروسافت برای اطمینان از صحت ارزیابی‌های خود، فرایند پاک‌سازی داده‌ها را برای Phi-4 بهبود بخشیده تا از تأثیر ناعادلانه داده‌های آزمون بر نتایج جلوگیری کند. این شرکت مدل Phi-4 را در رقابت‌های ریاضی AMC-10 و AMC-12 که در نوامبر ۲۰۲۴ برگزار شد، ارزیابی کرد. این رقابت‌ها پس‌از جمع‌آوری داده‌های آموزشی مایکروسافت برگزار شده‌اند و نتایج نشان می‌دهد که Phi-4 بدون مشکل بیش‌برازش عملکرد برتری داشته است.

دلایل موفقیت Phi-4 در آزمون‌های ریاضی

مقایسه با سایر مدل‌ها

براساس اطلاعات منتشرشده، Phi-4 نه‌تنها در مقایسه با مدل‌های مشابه با اندازه یا وزن باز عملکرد بهتری دارد؛ بلکه از مدل‌های بزرگ‌تر و پیشرفته‌ای مانند جمنای ۱.۵ پرو نیز پیشی گرفته است. این دستاورد نشان‌دهنده کیفیت و توانایی برتر Phi-4 در مواجهه با مسائل پیچیده ریاضی است.

با وجود این دستاوردها، Phi-4 همچنان با محدودیت‌هایی روبه‌رو است. اندازه کوچک این مدل باعث می‌شود تا در برخی مواقع، مانند ارائه اطلاعات واقعی، دچار توهم شود و توانایی کمتری در پیروی دقیق از دستورالعمل‌های پیچیده داشته باشد. برای شناسایی خطرهای احتمالی، تیم Phi-4 با همکاری AI Red Team (AIRT) مایکروسافت، خطرات ایمنی و امنیتی این مدل را در سناریوهای مختلف بررسی کرده است.

دسترسی و انتشار

مایکروسافت Phi-4 را اکنون تحت توافق‌نامه مجوز تحقیقاتی مایکروسافت (MSRLA) از‌طریق Azure AI Foundry در دسترس قرار داده است. همچنین، این مدل هفته آینده در Hugging Face منتشر خواهد شد و در اختیار علاقه‌مندان به تحقیق و توسعه قرار می‌گیرد.

نوشته مایکروسافت مدل زبانی کوچک پیشرفته با ۱۴ میلیارد پارامتر معرفی کرد اولین بار در تک ناک. پدیدار شد.

واکنش شما چیست؟

like

dislike

love

funny

angry

sad

wow