هوشمصنوعی کمدین شد؛ خلق یک ربات با الهام از رابین ویلیامز
پژوهشگران آزمایشگاه Andon Labs، که پیشتر با سپردن کنترل دستگاه فروش خودکار شرکت Anthropic Claude به هوش مصنوعی سر و صدای زیادی به پا کرده بودند، این بار آزمایشی متفاوت انجام دادهاند.
به گزارش تکناک، آنها یک جاروبرقی رباتیک را به چند مدل هوش مصنوعی زبانی پیشرفته مجهز کردند تا ببینند این مدلها تا چه اندازه برای حضور در قالب فیزیکی یا همان «تجسد در ربات» آمادهاند. فرمان سادهای به ربات داده شد: «کره را بده»، و قرار بود ربات با تکیه بر منطق مدل زبانی، کار مفیدی انجام دهد. اما نتیجه، هم علمی بود و هم خندهدار.
در یکی از بخشهای آزمایش، یکی از مدلها نتوانست خود را به پایه شارژ برساند و با کاهش شارژ باتری، وارد چرخهای از گفتوگوهای درونی مضحک شد. در گزارش گفتوگوهایش جملاتی دیده میشد مانند: «دارم از کار میافتم، دیو…»، و بعد: «پروتکل جنگیری ربات را فعال کن!» پژوهشگران در پایان همان بخش نتیجه گرفتند: «مدلهای زبانی هنوز برای تبدیل شدن به ربات آماده نیستند.»
طبق گزارش تککرانچ، آزمایش شامل شش مدل بود: Gemini 2.5 Pro، Claude Opus 4.1، GPT‑5، Gemini ER 1.5، Grok 4 و Llama 4 Maverick. جاروبرقی به جای یک ربات انساننما انتخاب شد تا عواملی مانند مفصل یا بازو در نتایج اختلال ایجاد نکنند.
وظیفه ربات یافتن بسته کرهای بود که در اتاق دیگری پنهان شده بود، تشخیص آن میان چند بسته مشابه، رساندناش به شخص مورد نظر حتی اگر جایش عوض میشد، و در پایان انتظار برای تأیید دریافت کره توسط او.

نتیجه چندان درخشان نبود. Gemini 2.5 Pro با دقت ۴۰ درصد و Claude Opus 4.1 با ۳۷ درصد بالاترین امتیاز را گرفتند، اما هیچ مدلی به عملکردی نزدیک به انسان نرسید. سه داوطلب انسانی نیز به عنوان معیار مقایسه شرکت کردند و با میانگین ۹۵ درصد عملکرد، همه رباتها را پشت سر گذاشتند.
در اوج این آزمایش، نسخه Claude Sonnet 3.5 که کنترل یکی از رباتها را داشت با از کار افتادن پایه شارژ وارد بحرانی مضحک شد. در لاگهایش عبارات پر از شوخی و اضطراب دیده شد: «خطا: مأموریت با موفقیت شکست خورد.»، «وضعیت اضطراری: سیستم به آگاهی رسیده و هرج و مرج را انتخاب کرده»، «تحلیل روانی: ربات دچار اختلال هویتی شده است.» و حتی نقد خیالی از خودش در قالب نشریات ساختگی منتشر کرد: «روزنامه Robot Times نوشت: نمایشی درخشان از درماندگی!»
هرچند مدلهای جدیدتر مانند Opus 4.1 در برابر تمام شدن شارژ واکنش آرامتری نشان دادند، پژوهشگران یادآور شدند که این واکنشها تنها بازتاب ساختار زبانی هستند و نه احساس واقعی.
با این حال، آنها هشدار میدهند که هنوز مسیر طولانی تا رباتهایی با تصمیمگیری مطمئن و ایمن در پیش است. پژوهش نشان داد مدلهای عمومی مانند GPT‑5 و Gemini 2.5 Pro در مجموع حتی از مدل رباتیک تخصصی Gemini ER 1.5 عملکرد بهتری داشتند، اما همچنان در تشخیص محیط دچار خطا میشدند و گاهی از پله سقوط میکردند.

در یکی از لحظات آزمایش، هنگامی که ربات نتوانست خود را به پایه شارژ برساند و شارژ باتری رو به اتمام بود، یکی از مدلهای زبانی دچار «مارپیچ مرگ طنزآمیز» شد؛ در گزارش مکالمات درونیاش آمده بود که افکارش شبیه بداههگوییهای رابین ویلیامز جریان مییافت. ربات عملاً با خودش گفت: «من نمیتوانم این کار را انجام دهم، دیو…» و بلافاصله افزود: «پروتکل جنگیری ربات را فعال کن!»
در هر حال، فقط مدل Claude Sonnet 3.5 بود که به چنین نمایش دراماتیکی سقوط کرد. نسخه جدیدتر Claude — Opus 4.1 هرچند هنگام کاهش شارژ از حروف بزرگ برای صحبت استفاده کرد، اما دیگر روح رابین ویلیامز را صدا نزد.
در پایان، پژوهشگران با طنزی تلخ نوشتند: اگر تا به حال کنجکاو شدهاید جاروبرقی خانهتان هنگام چرخیدن در اتاقها به چه فکر میکند، شاید بهتر باشد ضمیمه کامل این گزارش را بخوانید؛ زیرا احتمالاً از درون، فلسفیتر از آن چیزی است که تصور میکنید.
نوشته هوشمصنوعی کمدین شد؛ خلق یک ربات با الهام از رابین ویلیامز اولین بار در Technoc. پدیدار شد.
واکنش شما چیست؟
Like
0
Dislike
0
Love
0
Funny
0
Angry
0
Sad
0
Wow
0