OpenAI از مدل جدید و پیشرفتهی «o3-pro» رونمایی کرد
شرکت OpenAI مدل جدیدی از نسل سیستمهای هوش مصنوعی خود را با نام o3-pro معرفی کرده که به گفتهی این شرکت، پیشرفتهترین و توانمندترین مدلی است که تاکنون توسعه دادهاند. این مدل نسخه ارتقاءیافتهای از مدل «o3» است که اوایل سال جاری معرفی شده بود و اکنون در اختیار کاربران ChatGPT Pro و Team قرار …

شرکت OpenAI مدل جدیدی از نسل سیستمهای هوش مصنوعی خود را با نام o3-pro معرفی کرده که به گفتهی این شرکت، پیشرفتهترین و توانمندترین مدلی است که تاکنون توسعه دادهاند. این مدل نسخه ارتقاءیافتهای از مدل «o3» است که اوایل سال جاری معرفی شده بود و اکنون در اختیار کاربران ChatGPT Pro و Team قرار گرفته است. کاربران سازمانی و آموزشی نیز از هفته آینده به این مدل دسترسی خواهند داشت.
مدلهای استدلالی مانند o3-pro، برخلاف مدلهای سنتی، مسائل را مرحله به مرحله تحلیل میکنند. همین ویژگی باعث میشود در حوزههایی مانند ریاضیات، فیزیک، برنامهنویسی و تحلیل منطقی عملکرد دقیقتری داشته باشند. به گفتهی OpenAI، ارزیابان حرفهای در تمام دستههای تستشده، o3-pro را نسبت به نسخه قبلی آن یعنی o3، ترجیح دادهاند و عملکرد آن را بهویژه در زمینههای علمی، آموزشی، تجاری و نگارشی بهتر ارزیابی کردهاند.
قیمتگذاری این مدل نیز برای استفاده از طریق API مشخص شده است: ۲۰ دلار برای هر یک میلیون توکن ورودی و ۸۰ دلار برای هر یک میلیون توکن خروجی. برای درک بهتر این ارقام، باید گفت که یک میلیون توکن ورودی معادل تقریباً ۷۵۰ هزار کلمه (کمی بیشتر از حجم کتاب «جنگ و صلح») است. این مدل همچنین از امروز در محیط API OpenAI نیز فعال شده و قابل استفاده برای توسعهدهندگان است.
مدل o3-pro قابلیتهایی مانند جستوجو در وب، تحلیل فایل، پردازش ورودیهای تصویری، اجرای کد پایتون و شخصیسازی پاسخها با استفاده از حافظه را پشتیبانی میکند. با این حال، برخی محدودیتها نیز وجود دارد؛ از جمله غیرفعال بودن چتهای موقت به دلیل یک «مشکل فنی»، عدم توانایی در تولید تصویر و عدم پشتیبانی از قابلیت Canvas، فضای کاری هوشمند OpenAI. همچنین زمان پاسخگویی این مدل نسبت به مدل قبلی (o1-pro) طولانیتر است.
با وجود این محدودیتها، OpenAI تأکید دارد که o3-pro در آزمایشهای مرجع عملکردی درخشان داشته است. در آزمون AIME 2024، که توانایی مدلها در ریاضیات را ارزیابی میکند، o3-pro عملکردی بهتر از مدل پیشرفتهی گوگل یعنی Gemini 2.5 Pro داشته است. همچنین در آزمون GPQA Diamond، که برای ارزیابی دانش در سطح دکترای علوم طراحی شده، این مدل توانسته رقیب خود یعنی Claude 4 Opus از شرکت Anthropic را نیز پشت سر بگذارد.
واکنش شما چیست؟






