تعامل زنده با هوش مصنوعی گوگل از طریق دوربین گوشی امکان‌پذیر می‌شود

در کنگره جهانی موبایل، گوگل تأیید کرد که قابلیت جدیدی از هوش مصنوعی Gemini که اولین‌بار نزدیک به یک سال پیش معرفی شد، اکنون آماده عرضه است. این قابلیت که با نامGemini Live شناخته می‌شود، به‌زودی امکان مشاهده ویدئو زنده و اشتراک‌گذاری صفحه نمایش را خواهد داشت. این ویژگی که پیش‌تر در قالب پروژه Astra …

tnas

۱۵ اسفند , ۱۴۰۳ - 19:00

0 3

تعامل زنده با هوش مصنوعی گوگل از طریق دوربین گوشی امکان‌پذیر می‌شود

در کنگره جهانی موبایل، گوگل تأیید کرد که قابلیت جدیدی از هوش مصنوعی Gemini که اولین‌بار نزدیک به یک سال پیش معرفی شد، اکنون آماده عرضه است. این قابلیت که با نامGemini Live شناخته می‌شود، به‌زودی امکان مشاهده ویدئو زنده و اشتراک‌گذاری صفحه نمایش را خواهد داشت. این ویژگی که پیش‌تر در قالب پروژه Astra به نمایش گذاشته شده بود، به کاربران اجازه می‌دهد به‌جای توصیف مسائل، آن‌ها را مستقیماً از طریق دوربین به هوش مصنوعی نشان دهند.

در حال حاضر، هوش مصنوعی چندوجهی (Multimodal) گوگل قادر به پردازش متن، تصاویر و انواع مختلف اسناد است. اما قابلیت پردازش ویدئو همچنان محدود است و عملکرد آن در خلاصه‌سازی ویدئوها، مانند محتوای YouTube، ناپایدار بوده است. با این حال، گوگل اعلام کرده که تا پایان ماه مارس، اپلیکیشن Gemini در اندروید یک به‌روزرسانی مهم دریافت خواهد کرد که امکان استفاده از دوربین برای نمایش ویدئو زنده یا اشتراک‌گذاری صفحه نمایش در زمان واقعی را فراهم می‌کند. کاربران می‌توانند در حین فیلم‌برداری، سؤالات خود را از Gemini بپرسند و پاسخ بگیرند.

Google به دنبال تبدیل Gemini به یک “دستیار واقعی”

نمایش اولیه Project Astra در رویداد Google I/O 2024 توجه زیادی را به خود جلب کرد، زیرا شیوه‌ای طبیعی‌تر برای تعامل با هوش مصنوعی را نشان داد. در آن ویدئو، Gemini Live توانست در حین حرکت دوربین در یک اتاق، به سؤالات کاربر پاسخ دهد، کدهای روی صفحه نمایش را تفسیر کند، عملکرد بلندگوها را توضیح دهد و حتی به کاربر یادآوری کند که عینک خود را کجا گذاشته است.

بااین‌حال، هنوز مشخص نیست که نسخه‌ای که به اپلیکیشن Gemini اضافه خواهد شد، تا چه اندازه به عملکرد نسخه نمایشی گوگل نزدیک باشد. گوگل ادعا کرده که این به‌روزرسانی برای پلتفرم Gemini 2.0، این مدل هوش مصنوعی را به یک “دستیار واقعی” تبدیل خواهد کرد. این شرکت پیشنهاد می‌دهد که کاربران می‌توانند در حین گردش در مکان‌های جدید یا خرید آنلاین لباس با کمک اشتراک‌گذاری صفحه نمایش، با Gemini مکالمه‌ای تعاملی داشته باشند.

نسخه پیشرفته Gemini Live اواخر این ماه در اپلیکیشن Gemini برای گوشی‌های اندرویدی منتشر خواهد شد. بااین‌حال، پردازش ویدئو زنده نیازمند قدرت پردازشی بیشتری نسبت به پردازش متن است و این ویژگی بخشی از Gemini Advanced خواهد بود. برای دسترسی به این قابلیت، کاربران باید اشتراک AI Premium را با هزینه ماهانه ۲۰ دلار تهیه کنند که شامل دسترسی به مدل‌های هوش مصنوعی بزرگ‌تر و پیشرفته‌تر گوگل نیز می‌شود.

گوگل در رقابت با OpenAI به دنبال افزایش کاربران است

با وجود هزینه اشتراک، احتمالاً این قابلیت جدید باعث افزایش هزینه‌های عملیاتی گوگل خواهد شد. تاکنون هیچ شرکتی مدل اقتصادی پایداری برای هوش مصنوعی مولد (Generative AI) پیدا نکرده است و افزودن قابلیت ویدئویی می‌تواند هزینه‌های گوگل را افزایش دهد. بااین‌حال، این قابلیت می‌تواند تعداد کاربران فعال Gemini را افزایش دهد و به رقابت گوگل با OpenAI کمک کند. در حال حاضر، تعداد کاربران ماهانه Gemini تنها چند ده میلیون نفر است که در مقایسه با ابزارهای OpenAI، اختلاف زیادی دارد.

منبع خبر