جنون هوش مصنوعی مولد؛ از ChatGPT تا تولید ویدئو

تب هوش مصنوعی مولد، که ابتدا با پاسخ‌های متنی ChatGPT آغاز شد، به سرعت به دیگر عرصه‌ها گسترش یافته و اکنون شامل تولید تصویر و حتی تولید ویدئو شده است. به گزارش تکناک،این تحول سریع در صنعت تکنولوژی باعث شده است که شرکت‌های بزرگی همچون آمازون، یوتیوب، علی بابا و استودیوی فیلم‌سازی Lionsgate وارد این […] نوشته جنون هوش مصنوعی مولد؛ از ChatGPT تا تولید ویدئو اولین بار در تک ناک. پدیدار شد.

tnas

۰۲ مهر , ۱۴۰۳ - 11:00

0 1

جنون هوش مصنوعی مولد؛ از ChatGPT تا تولید ویدئو

تب هوش مصنوعی مولد، که ابتدا با پاسخ‌های متنی ChatGPT آغاز شد، به سرعت به دیگر عرصه‌ها گسترش یافته و اکنون شامل تولید تصویر و حتی تولید ویدئو شده است.

به گزارش تکناک،این تحول سریع در صنعت تکنولوژی باعث شده است که شرکت‌های بزرگی همچون آمازون، یوتیوب، علی بابا و استودیوی فیلم‌سازی Lionsgate وارد این حوزه شوند و ابزارهای جدیدی برای تولید محتوای ویدئویی از طریق توضیحات متنی ارائه دهند.اما این فناوری هنوز راه درازی تا تکامل دارد.

معرفی ابزارهای جدید هوش مصنوعی ویدئویی

هفته گذشته، چهار ابزار جدید توسط این شرکت‌های بزرگ معرفی شدند. این ابزارها قادر به تولید ویدئو از توضیحات نوشتاری ساده هستند.

به عنوان مثال، شما می‌توانید عبارتی مانند «ویدئویی از سگی که توپ می‌گیرد بساز» را وارد کنید و این ابزارها بر اساس آن یک ویدئو تولید می‌کنند. با این حال، این فناوری هنوز در مراحل ابتدایی خود قرار دارد و نیاز به پیشرفت‌های بیشتری دارد.

یکی از این ابزارها، Veo، محصول YouTube است. این ابزار فعلاً تنها قادر به ایجاد پس‌زمینه‌ای به سبک پرده سبز برای کلیپ‌های عمودی کوتاه (Shorts) است. اما قرار است در سال ۲۰۲۴ قابلیت تولید کلیپ‌های کامل (تا شش ثانیه طول) نیز به این ابزار اضافه شود.

این ویدئو توسط هوش مصنوعی Veo’گوگل تنها با یک خط فرمان:Timelapse of the northern lights dancing across the Arctic sky, stars twinkling, snow-covered landscap ساخته شده است

از سوی دیگر، ابزار Amazon به فروشندگان این امکان را می‌دهد تا تبلیغات ساده‌ای ایجاد کنند. یکی از نمونه‌های ارائه شده توسط این ابزار، ویدئویی از یک فنجان قهوه در حال بخار کردن در پس‌زمینه‌ای مصنوعی است. جزئیات درباره ابزار Alibaba هنوز به طور کامل فاش نشده است، اما معرفی آن همراه با انتشار ۱۰۰ مدل متن‌باز توسط این شرکت انجام شده است.

رقابت OpenAI و دیگران در عرصه تولید ویدئو

با وجود این پیشرفت‌ها، ابزارهای ذکر شده در مقایسه با آنچه که OpenAI با مولد ویدئویی Sora وعده داده است، بسیار ساده به نظر می‌رسند. Sora می‌تواند ویدئوهای بی‌صدای تا ۶۰ ثانیه تولید کند.

این ابزار که در فوریه امسال معرفی شد، توجه بسیاری را به خود جلب کرد. با استفاده از Sora، حتی شرکت Toys R Us توانست یک تبلیغ کامل با داستانی کامل و انیمیشنی بی‌نقص تولید کند.

هرچند Sora هنوز برای استفاده عمومی عرضه نشده است، Mira Murati، مدیر فناوری OpenAI اعلام کرده که این ابزار تا پایان امسال در دسترس عموم قرار خواهد گرفت. همچنین، قابلیت تولید صدا نیز به زودی به آن اضافه خواهد شد.

در این بین، OpenAI تمرکز خود را روی انتشار دو مدل جدید هوش مصنوعی گذاشته است: GPT-4o و GPT-o1. مدل دوم، که با نام “Strawberry” شناخته می‌شود، به طور خاص برای دانشمندان و مهندسانی طراحی شده که با مسائل پیچیده استدلالی سر و کار دارند.

آیا آمازون و یوتیوب از OpenAI جلوتر هستند؟

در حال حاضر، با توجه به عرضه عمومی ابزارهای Amazon و YouTube برای تولید ویدئو، این شرکت‌ها در ارائه ابزارهای عملی برای عموم از OpenAI جلوتر هستند. حتی اگر Sora از نظر فنی ابزار بهتری برای تولید ویدئو باشد، ادغام ابزارهای Amazon و YouTube در سایت‌های پرطرفدار و پرمخاطب ممکن است باعث شود که این دو شرکت استفاده بیشتری از ابزارهای خود ببرند.

به علاوه، هنوز مشخص نیست هزینه استفاده از Sora چقدر خواهد بود و چه محدودیت‌هایی برای کاربران وجود خواهد داشت.

چالش‌های امنیتی و اخلاقی

تولید ویدئوهای هوش مصنوعی نگرانی‌های بسیاری را درباره ویدئوهای جعلی (deepfakes) افزایش داده است. از گذشته، ویدئوها به عنوان منبع نهایی حقیقت در نظر گرفته می‌شدند. در حالی که ایمیل‌ها، متون و عکس‌ها می‌توانند به راحتی دستکاری شوند، دستکاری ویدئوها دشوارتر بود. اما با پیشرفت این فناوری، امکان ساخت ویدئوهای جعلی از افراد به وجود آمده است که می‌تواند به تخریب یا سوءتعبیر از آن‌ها منجر شود.

اگرچه این فناوری برخی استفاده‌های مثبت نیز داشته است؛ برای مثال، روزنامه‌نگاران در ونزوئلا از آن برای تولید ویدئوهای خبری استفاده کرده‌اند. اما به نظر می‌رسد که پتانسیل سوءاستفاده‌های احتمالی از این فناوری بیشتر از مزایای آن باشد.

چالش‌های قانونی و آینده

در ایالات متحده، هنوز قوانین مشخصی برای نظارت بر این فناوری وجود ندارد و سودآوری همچنان انگیزه اصلی شرکت‌هاست. برخی شرکت‌ها مانند Google با ابزار Gemini محدودیت‌هایی برای تولید تصاویر افراد عمومی، از جمله نامزدهای ریاست جمهوری، وضع کرده‌اند. اما چت بات Grok AI متعلق به ایلان ماسک به کاربران اجازه می‌دهد که تصاویر افراد معروف را، بدون توجه به میزان عجیب بودن درخواست، تولید کنند.

بدون هیچ‌گونه قانون‌گذاری و با انگیزه‌های عظیم سودآوری، این سوال مطرح می‌شود که این فناوری چگونه به پیش خواهد رفت و چه مشکلاتی ممکن است در آینده ایجاد کند؟

در حالی که شرکت‌های بزرگ تکنولوژی همچون Amazon، YouTube، و OpenAI در حال رقابت برای تسلط بر بازار تولید ویدئوهای هوش مصنوعی هستند، همچنان سوالات زیادی درباره تأثیرات اجتماعی، اخلاقی و امنیتی این فناوری وجود دارد.

این ابزارها به سرعت در حال گسترش هستند و ممکن است در آینده‌ای نزدیک تحولی بزرگ در نحوه تولید و مصرف محتوای دیجیتال ایجاد کنند. اما باید دید که آیا قوانین و مقررات لازم برای نظارت بر این فناوری‌ها وضع خواهند شد یا خیر.

نوشته جنون هوش مصنوعی مولد؛ از ChatGPT تا تولید ویدئو اولین بار در تک ناک. پدیدار شد.

منبع خبر