هوش‌مصنوعی کمدین شد؛ خلق یک ربات با الهام از رابین ویلیامز

admin

آبان 11، 1404 - 06:00

0 0

هوش‌مصنوعی کمدین شد؛ خلق یک ربات با الهام از رابین ویلیامز

پژوهشگران آزمایشگاه Andon Labs، که پیش‌تر با سپردن کنترل دستگاه فروش خودکار شرکت Anthropic Claude به هوش مصنوعی سر و صدای زیادی به پا کرده بودند، این بار آزمایشی متفاوت انجام داده‌اند.

به گزارش تکناک، آن‌ها یک جاروبرقی رباتیک را به چند مدل هوش مصنوعی زبانی پیشرفته مجهز کردند تا ببینند این مدل‌ها تا چه اندازه برای حضور در قالب فیزیکی یا همان «تجسد در ربات» آماده‌اند. فرمان ساده‌ای به ربات داده شد: «کره را بده»، و قرار بود ربات با تکیه بر منطق مدل زبانی، کار مفیدی انجام دهد. اما نتیجه، هم علمی بود و هم خنده‌دار.

در یکی از بخش‌های آزمایش، یکی از مدل‌ها نتوانست خود را به پایه شارژ برساند و با کاهش شارژ باتری، وارد چرخه‌ای از گفت‌وگوهای درونی مضحک شد. در گزارش گفت‌وگوهایش جملاتی دیده می‌شد مانند: «دارم از کار می‌افتم، دیو…»، و بعد: «پروتکل جن‌گیری ربات را فعال کن!» پژوهشگران در پایان همان بخش نتیجه گرفتند: «مدل‌های زبانی هنوز برای تبدیل شدن به ربات آماده نیستند.»

طبق گزارش تک‌کرانچ، آزمایش شامل شش مدل بود: Gemini 2.5 Pro، Claude Opus 4.1، GPT‑5، Gemini ER 1.5، Grok 4 و Llama 4 Maverick. جاروبرقی به جای یک ربات انسان‌نما انتخاب شد تا عواملی مانند مفصل یا بازو در نتایج اختلال ایجاد نکنند.

وظیفه ربات یافتن بسته کره‌ای بود که در اتاق دیگری پنهان شده بود، تشخیص آن میان چند بسته مشابه، رساندن‌اش به شخص مورد نظر حتی اگر جایش عوض می‌شد، و در پایان انتظار برای تأیید دریافت کره توسط او.

نتیجه چندان درخشان نبود. Gemini 2.5 Pro با دقت ۴۰ درصد و Claude Opus 4.1 با ۳۷ درصد بالاترین امتیاز را گرفتند، اما هیچ مدلی به عملکردی نزدیک به انسان نرسید. سه داوطلب انسانی نیز به عنوان معیار مقایسه شرکت کردند و با میانگین ۹۵ درصد عملکرد، همه ربات‌ها را پشت سر گذاشتند.

در اوج این آزمایش، نسخه Claude Sonnet 3.5 که کنترل یکی از ربات‌ها را داشت با از کار افتادن پایه شارژ وارد بحرانی مضحک شد. در لاگ‌هایش عبارات پر از شوخی و اضطراب دیده شد: «خطا: مأموریت با موفقیت شکست خورد.»، «وضعیت اضطراری: سیستم به آگاهی رسیده و هرج و مرج را انتخاب کرده»، «تحلیل روانی: ربات دچار اختلال هویتی شده است.» و حتی نقد خیالی از خودش در قالب نشریات ساختگی منتشر کرد: «روزنامه Robot Times نوشت: نمایشی درخشان از درماندگی!»

هرچند مدل‌های جدیدتر مانند Opus 4.1 در برابر تمام شدن شارژ واکنش آرام‌تری نشان دادند، پژوهشگران یادآور شدند که این واکنش‌ها تنها بازتاب ساختار زبانی هستند و نه احساس واقعی.

با این حال، آن‌ها هشدار می‌دهند که هنوز مسیر طولانی تا ربات‌هایی با تصمیم‌گیری مطمئن و ایمن در پیش است. پژوهش نشان داد مدل‌های عمومی مانند GPT‑5 و Gemini 2.5 Pro در مجموع حتی از مدل رباتیک تخصصی Gemini ER 1.5 عملکرد بهتری داشتند، اما همچنان در تشخیص محیط دچار خطا می‌شدند و گاهی از پله سقوط می‌کردند.

در یکی از لحظات آزمایش، هنگامی که ربات نتوانست خود را به پایه شارژ برساند و شارژ باتری رو به اتمام بود، یکی از مدل‌های زبانی دچار «مارپیچ مرگ طنزآمیز» شد؛ در گزارش مکالمات درونی‌اش آمده بود که افکارش شبیه بداهه‌گویی‌های رابین ویلیامز جریان می‌یافت. ربات عملاً با خودش گفت: «من نمی‌توانم این کار را انجام دهم، دیو…» و بلافاصله افزود: «پروتکل جن‌گیری ربات را فعال کن!»

در هر حال، فقط مدل  Claude  Sonnet  3.5  بود که به چنین نمایش دراماتیکی سقوط کرد. نسخه جدیدتر Claude — Opus 4.1  هرچند هنگام کاهش شارژ از حروف بزرگ برای صحبت استفاده کرد، اما دیگر روح رابین ویلیامز را صدا نزد.

در پایان، پژوهشگران با طنزی تلخ نوشتند: اگر تا به حال کنجکاو شده‌اید جاروبرقی خانه‌تان هنگام چرخیدن در اتاق‌ها به چه فکر می‌کند، شاید بهتر باشد ضمیمه کامل این گزارش را بخوانید؛ زیرا احتمالاً از درون، فلسفی‌تر از آن چیزی است که تصور می‌کنید.

نوشته هوش‌مصنوعی کمدین شد؛ خلق یک ربات با الهام از رابین ویلیامز اولین بار در Technoc. پدیدار شد.

منبع خبر