گوگل با این قابلیت هزینه‌ استفاده از مدل‌های هوش مصنوعی جدید را کاهش می دهد

گوگل ویژگی جدیدی به نام «ذخیره‌سازی ضمنی» (Implicit Caching) را برای API مدل‌های زبانی Gemini 2.5 Pro و 2.5 Flash معرفی کرد. این قابلیت به‌صورت خودکار فعال بوده و با شناسایی بخش‌های تکراری در درخواست‌ها، هزینه پردازش را تا ۷۵ درصد کاهش می‌دهد. به گزارش تکناک، این ویژگی جدید به طور خاص برای مدل‌های جمنی […] نوشته گوگل با این قابلیت هزینه‌ استفاده از مدل‌های هوش مصنوعی جدید را کاهش می دهد اولین بار در تک ناک - اخبار تکنولوژی روز جهان و ایران. پدیدار شد.

tnas

۱۹ اردیبهشت , ۱۴۰۴ - 15:00

گوگل با این قابلیت هزینه‌ استفاده از مدل‌های هوش مصنوعی جدید را کاهش می دهد

گوگل ویژگی جدیدی به نام «ذخیره‌سازی ضمنی» (Implicit Caching) را برای API مدل‌های زبانی Gemini 2.5 Pro و 2.5 Flash معرفی کرد. این قابلیت به‌صورت خودکار فعال بوده و با شناسایی بخش‌های تکراری در درخواست‌ها، هزینه پردازش را تا ۷۵ درصد کاهش می‌دهد.

به گزارش تکناک، این ویژگی جدید به طور خاص برای مدل‌های جمنی ۲.۵ پرو و ۲.۵ فلش طراحی شده است و به کاربران امکان می‌دهد تا در صورت ارسال درخواست‌های مشابه یا تکراری، از صرفه‌جویی ۷۵ درصدی در هزینه‌ها بهره‌مند شوند. گوگل توضیح داده است که کشینگ ضمنی به طور خودکار برای کاربران فعال می‌شود و در مقایسه با کشینگ صریح، نیاز به تنظیمات دستی کمتری دارد.

کشینگ، که یک روش استاندارد در صنعت هوش مصنوعی است، به طور کلی به معنای ذخیره‌سازی داده‌های تکراری یا محاسبات از پیش انجام‌شده است تا نیاز به پردازش مجدد اطلاعات کاهش یابد. به‌عنوان مثال، اگر کاربری سوالی را از یک مدل هوش مصنوعی بپرسد که قبلاً پاسخ داده شده است، کش می‌تواند آن پاسخ را ذخیره کرده و دوباره محاسبه نشود.

«ذخیره‌سازی ضمنی» (Implicit Caching) برای API مدل‌های زبانی Gemini 2.5 Pro و 2.5 Flash

در گذشته، گوگل ویژگی کشینگ پروپمپت را معرفی کرده بود که توسعه‌دهندگان مجبور بودند خودشان درخواست‌های پر تکرار را تعریف کنند. این ویژگی اگرچه منجر به صرفه‌جویی در هزینه‌ها می‌شد، اما نیاز به کار دستی زیادی داشت. از سوی دیگر، کشینگ ضمنی به طور خودکار و بدون نیاز به تنظیمات دستی عمل می‌کند.

به نقل از تک‌کرانچ، گوگل در پست وبلاگی خود توضیح داد که زمانی که یک درخواست جدید به مدل‌های جمنی ۲.۵ ارسال می‌شود و آن درخواست با یکی از درخواست‌های قبلی هم‌پوشانی داشته باشد، هزینه‌های مربوط به آن درخواست کاهش پیدا می‌کند. این ویژگی از حداقل ۱۰۲۴ توکن برای مدل ۲.۵ فلش و ۲۰۴۸ توکن برای مدل ۲.۵ پرو پشتیبانی می‌کند. توکن‌ها در واقع بخش‌های داده‌ای هستند که مدل‌های هوش مصنوعی با آنها کار می‌کنند، و ۱۰۰۰ توکن معادل حدود ۷۵۰ کلمه است.

با این حال، این ویژگی جدید بدون چالش نبوده است. گوگل توصیه کرده است که توسعه‌دهندگان زمینه‌های تکراری را در ابتدای درخواست‌ها قرار دهند تا احتمال کشینگ افزایش یابد. زمینه‌هایی که ممکن است در درخواست‌های مختلف تغییر کنند، باید در انتهای درخواست اضافه شوند. همچنین، گوگل هیچ تاییدیه‌ای از طرف سوم برای تضمین صحت عملکرد کشینگ ضمنی ارائه نکرده است، بنابراین باید منتظر تجربیات اولیه کاربران و ارزیابی‌های آنها بود.

ویژگی کشینگ ضمنی در زمان افزایش هزینه‌های استفاده از مدل‌های پیشرفته هوش مصنوعی، می‌تواند به توسعه‌دهندگان کمک کند تا از بار مالی ناشی از استفاده مکرر از مدل‌ها بکاهند. در حال حاضر، با توجه به نگرانی‌ها درباره هزینه‌های بالای API، این ویژگی جدید می‌تواند برای بسیاری از توسعه‌دهندگان خوشایند باشد.

نوشته گوگل با این قابلیت هزینه‌ استفاده از مدل‌های هوش مصنوعی جدید را کاهش می دهد اولین بار در تک ناک - اخبار تکنولوژی روز جهان و ایران. پدیدار شد.

منبع خبر