Z.ai با مدل متن‌باز GLM-4.5، دنیای مدل‌های زبان بزرگ را به‌هم ریخت

مدل متن‌باز GLM-4.5 با قابلیت‌های استثنایی در استدلال پیچیده و تولید محتوا، به‌سرعت در حال تبدیل به رقیب جدی برای مدل‌های GPT-4 و Claude است. به گزارش تک‌ناک، در ادامه موج پیشرفت‌های سریع در حوزه مدل‌های زبان بزرگ (LLM) در چین، استارتاپ چینی Z.ai اخیراً از انتشار خانواده مدل‌های قدرتمند و متن‌باز GLM-4.5 خبر داده […] نوشته Z.ai با مدل متن‌باز GLM-4.5، دنیای مدل‌های زبان بزرگ را به‌هم ریخت اولین بار در تک ناک - اخبار تکنولوژی روز جهان و ایران. پدیدار شد.

tnas

۰۷ مرداد , ۱۴۰۴ - 21:00

Z.ai با مدل متن‌باز GLM-4.5، دنیای مدل‌های زبان بزرگ را به‌هم ریخت

مدل متن‌باز GLM-4.5 با قابلیت‌های استثنایی در استدلال پیچیده و تولید محتوا، به‌سرعت در حال تبدیل به رقیب جدی برای مدل‌های GPT-4 و Claude است.

به گزارش تک‌ناک، در ادامه موج پیشرفت‌های سریع در حوزه مدل‌های زبان بزرگ (LLM) در چین، استارتاپ چینی Z.ai اخیراً از انتشار خانواده مدل‌های قدرتمند و متن‌باز GLM-4.5 خبر داده است. این مدل‌ها شامل GLM-4.5 و نسخه سبک‌تر GLM-4.5-Air هستند و با تمرکز بر استدلال پیچیده، برنامه‌نویسی، رفتار عامل‌محور و تولید محتوا، به‌عنوان رقیبی جدی برای مدل‌های اختصاصی غربی وارد میدان شده‌اند.

معرفی مدل‌ها و قابلیت‌ها

مدل GLM-4.5 با هدف رقابت با مدل‌های مطرحی همچون Claude 4 Sonnet و Claude 4 Opus و Gemini 2.5 Pro طراحی شده و طبق اعلام رسمی Z.ai، در آزمون‌های استانداردی نظیر BrowseComp و AIME24 و SWE-bench Verified، نتایجی هم‌سطح یا حتی بهتر از این مدل‌ها کسب کرده است. این مدل در میان ۱۲ معیار صنعتی، رتبه سوم را کسب کرده و تنها از GPT-4 شرکت OpenAI و Grok 4 شرکت xAI عقب‌تر مانده است.

ونچربیت می‌نویسد که نسخه سبک‌تر، GLM-4.5-Air، نیز عملکرد رضایت‌بخشی از خود نشان داده و در رتبه ششم قرار گرفته است. این مدل برای تیم‌هایی طراحی شده است که به‌دنبال راهکار مقرون‌به‌صرفه‌تری با نیاز منابع کمتر و سرعت بالاتر در پاسخ‌گویی هستند.

ازجمله ویژگی‌های برجسته هر دو مدل می‌توان به قابلیت اجرای خودکار دو حالت «تفکر» (برای تحلیل و استدلال پیچیده) و «بی‌تفکر» (برای پاسخ‌گویی سریع) اشاره کرد. همچنین، این مدل‌ها می‌توانند تنها با دریافت یک عنوان، ارائه‌های پاورپوینت کامل تولید کنند که آن‌ها را برای جلسه‌های کاری و آموزش و گزارش‌دهی داخلی بسیار مفید می‌سازد.

علاوه‌بر این، قابلیت‌هایی مانند تولید محتوای خلاقانه، نگارش احساسی، تولید فیلم‌نامه، توسعه شخصیت‌های مجازی و ایجاد گفت‌وگوهای نوبتی در این مدل‌ها تعبیه شده‌اند. این ویژگی‌ها به‌ویژه در زمینه‌های تبلیغات، خدمات مشتریان، تعامل هواداران و روایت دیجیتالی کاربرد دارند.

عملکرد فنی و جایگاه رقابتی

مدل GLM-4.5 با برخورداری از ۳۵۵ میلیارد پارامتر (۳۲ میلیارد پارامتر فعال) و معماری Mixture-of-Experts طراحی شده است. نسخه ایر این مدل با ۱۰۶ میلیارد پارامتر (۱۲ میلیارد فعال)، عملکرد مناسبی با منابع کمتر ارائه می‌دهد. در آزمون‌های دقیق عملکردی، GLM-4.5 موفق شده است در وظایف عامل‌محور، دقت ۲۶/۴ درصد در BrowseComp (در مقابل ۱۸/۸ درصد Claude 4 Opus)، دقت ۹۸/۲ درصد در MATH 500 و ۹۱ درصد در AIME24 و ۷۹/۱ درصد در GPQA را به دست آورد.

در حوزه برنامه‌نویسی نیز، نرخ موفقیت ۶۴/۲ درصد در SWE-bench Verified و ۳۷/۵ درصد در Terminal-Bench را ثبت کرده است. در مقایسه‌های دوتایی، این مدل Qwen3-Coder را در ۸۰/۸ درصد وظایف و Kimi K2 را در ۵۳/۹ درصد وظایف شکست داده است. ازنظر یکپارچه‌سازی ابزارها نیز، مدل با Claude Code و Roo Code و CodeGeex سازگاری دارد و نرخ موفقیت ۹۰/۶ درصد در فراخوانی ابزار از خود نشان داده است.

زیرساخت و آموزش و بهره‌وری

فرایند آموزش این مدل شامل پیش‌تمرین با ۲۲ تریلیون توکن و آموزش میانی با ۱/۱ تریلیون توکن دیگر از منابع کد و داده‌های مصنوعی و متون زمینه‌دار بوده است. Z.ai از زیرساخت تقویتی اختصاصی خود به نام Slime نیز بهره گرفته تا فرایند آموزش مدل را بهینه‌سازی کند. این شرکت از تکنیک‌هایی مانند Rollouts با دقت مختلط و یادگیری تدریجی تطبیقی برای ارتقای توانایی مدل در وظایف پیچیده استفاده کرده است.

مدیرعامل Z.ai، ژانگ پنگ، اعلام کرده است که مدل GLM-4.5 فقط با هشت GPU مدل H20 انویدیا اجرا می‌شود که مخصوص بازار چین و مطابق با محدودیت‌های صادراتی ایالات متحده آمریکا طراحی شده‌اند. این میزان سخت‌افزار حدوداً نصف نیاز مدل‌های مشابه در بازار است.

دسترسی و قیمت‌ و مجوز

مدل‌های خانواده GLM-4.5 تحت مجوز Apache 2.0 منتشر شده‌اند که یکی از مجوزهای آزاد و سازگار برای استفاده تجاری محسوب می‌شود. این مجوز به کاربران اجازه می‌دهد تا مدل‌ها را آزادانه استفاده و اجرا و توزیع کنند و تغییر دهند. علاقه‌مندان می‌توانند این مدل‌ها را ازطریق API ابری Z.ai یا مستقیماً از وبسایت آن استفاده کنند. قیمت‌گذاری رسمی مدل‌های مذکور از این قرار است:

GLM-4.5: بین ۰/۶۰ تا ۲/۲۰ دلار به‌ازای یک‌میلیون توکن
GLM-4.5-Air: بین ۰/۲۰ تا ۱/۱۰ دلار به‌ازای یک‌میلیون توکن

طبق برخی منابع، نرخ مدل ایر حتی می‌تواند تا ۰/۱۱ دلار برای ورودی و ۰/۲۸ دلار برای خروجی کاهش یابد؛ البته مشروط به محدودبودن توکن‌ها در هر درخواست.

جایگاه در بازار و پیامدهای جهانی

این مدل‌های متن‌باز چینی در‌حالی منتشر می‌شوند که بازار مدل‌های متن‌باز در چین با سرعت در حال رشد است. شرکت علی‌بابا نیز هم‌زمان چهار مدل جدید معرفی کرده است که در برخی بنچمارک‌ها حتی از مدل‌های OpenAI و گوگل پیشی گرفته‌اند. این رقابت فزاینده فشار بیشتری بر شرکت‌های آمریکایی وارد می‌کند تا درزمینه مدل‌های متن‌باز فعال‌تر شوند. در‌حالی‌که شرکت‌هایی مانند متا با مدل Llama 4 با انتقادهای کاربران هوش مصنوعی مواجه شده‌اند، OpenAI نیز اعلام کرده که انتشار اولین مدل متن‌باز خود پس‌از ChatGPT با تأخیر مواجه شده است.

نوشته Z.ai با مدل متن‌باز GLM-4.5، دنیای مدل‌های زبان بزرگ را به‌هم ریخت اولین بار در تک ناک - اخبار تکنولوژی روز جهان و ایران. پدیدار شد.

منبع خبر