تولیدکنندگان ویدیوی رایگان هوش مصنوعی در حال نزدیک شدن به یک نقطه اوج حیاتی هستند

ممکن است داشته باشید در هفته‌های اخیر متوجه برخی از میم‌های ویدیویی چشمگیر ساخته‌شده با هوش مصنوعی شده است. هری پاتر دوباره به ،وان یک آگهی تبلیغاتی Balenciaga در نظر گرفته شد و فیلم کابوس وار از ویل اسمیت در حال خوردن اسپاگتی هر دو اخیراً ویروسی شدند. آن‌ها نشان می‌دهند که توانایی هوش مصنوعی برای ایجاد ویدیو با چه سرعتی در حال پیشرفت است و همچنین برخی استفاده‌های این فناوری ممکن است مشکل‌ساز باشد.

این ویدیوها مرا به یاد لحظه ای می اندازد که ابزارهای تصویرسازی هوش مصنوعی در سال گذشته فراگیر شدند، زم، که برنامه هایی مانند Craiyon (که قبلاً DALL-E Mini نامیده می شد) به هر ،ی اجازه می دهد تا تصاویر قابل تشخیص، اگر خام و اغلب سورئال، مانند فیلم های نظارتی از سرقت نوزادان از پمپ بنزین، طرح های دادگاه دارث وادار، و ایلان ماسک در حال خوردن مداد رنگی.

Craiyon یک منبع باز حذفی بود که در آن زمان با دقت محدود شده بود FROM-E 2 تولید کننده تصویر از OpenAI، شرکت سازنده ChatGPT. این ابزار اولین ابزاری بود که توانایی هوش مصنوعی را در گرفتن یک پیام متنی و تبدیل آن به چیزی شبیه ع، های واقعی و تصاویری که توسط انسان طراحی شده بود را نشان داد. از آن زمان، DALL-E برای همه باز شد، و برنامه هایی مانند میانه سفر و استودیو رویا ابزارهای مشابهی را توسعه داده و بهبود بخشیده اند، که ساختن تصاویر پیچیده و واقعی با چند ضربه روی صفحه کلید را نسبتاً بی اهمیت می کند.

از آنجایی که مهندسان دستگیره‌ها و اهرم‌های الگوریتمی پشت این تولیدکننده‌های تصویر را بهینه‌سازی کرده‌اند، داده‌های آموزشی بیشتری اضافه کرده‌اند و برای اجرای همه چیز برای تراشه‌های GPU بیشتر هزینه کرده‌اند، این ابزارهای تصویرسازی به‌طور باورن،ی در جعل واقعیت خوب شده‌اند. برای گرفتن چند نمونه از یک ساب ردیت اختصاص داده شده به تصاویر عجیب هوش مصنوعی، بررسی کنید ال، جونز در رژه غرور همجنس گرایان یا صندوق عهد در حیاط فروشی.

دسترسی گسترده به این فناوری و پیچیدگی آن، ما را مجبور می‌کند تا در نحوه مشاهده تصاویر آنلاین تجدید نظر کنیم، همانطور که پس از انتشار تصاویر ساخته شده توسط هوش مصنوعی که ادعا می‌کرد دستگیری دونالد ترامپ در ماه گذشته منتشر شد، مشخص شد. این حادثه باعث شد تا Midjourney اعلام کند که دیگر سرویس آزمایشی رایگان خود را ارائه نخواهد کرد – راه حلی که ممکن است برخی از بازیگران بد اسکیت ارزان را متوقف کند اما مشکل گسترده‌تر را دست نخورده باقی می‌گذارد.

همانطور که آماندا هوور از WIRED در این هفته می نویسد، الگوریتم ها هنوز برای تولید ویدیوی قانع کننده از یک درخواست تلاش می کنند. ایجاد بسیاری از فریم‌های مجزا از نظر مح،اتی گران است، و همانطور که ویدیوهای تند و تیز و کندوپاش امروزی نشان می‌دهند، برای الگوریتم‌ها سخت است که انسجام کافی بین آن‌ها را برای تولید یک ویدیوی منطقی حفظ کنند.

با این حال، ابزارهای هوش مصنوعی در ویرایش ویدیوها بسیار ماهرتر می شوند. میم Balenciaga، به همراه نسخه های مرجع دوستان و بریکینگ بد، با ،یب چند ابزار مختلف هوش مصنوعی، ابتدا برای تولید تصاویر ثابت و سپس اضافه ، جلوه های ،میشن ساده ساخته شدند. اما نتیجه نهایی هنوز هم چشمگیر است.

باند MLاستارت آپی که در حال توسعه ابزارهای هوش مصنوعی برای ایجاد و ویرایش حرفه ای تصویر و ویدیو است، این هفته راه اندازی کرد. تکنیک جدید کارآمدتر برای اعمال تغییرات سبک در ویدیوها. من از آن برای ایجاد این فیلم رویایی از گربه‌ام، لئونا، استفاده کردم که تنها در چند دقیقه در یک «منظره ابری» از یک ویدیوی موجود قدم می‌زند.

ویدئو: ویل نایت / باند

تکنیک‌های مختلف یادگیری ماشین، فرصت‌های جدیدی را باز می‌کنند. یک شرکت به نام هوش مصنوعی رو به جلوبه ،وان مثال، از تکنیکی به نام میدان های تابشی عصبی برای تبدیل ع، های دو بعدی به صحنه های سه بعدی دقیق استفاده می کند. چند ع، فوری را در برنامه شرکت قرار دهید، و یک ع، خواهید داشت صحنه سه بعدی کاملا تعاملی برای بازی ،

این کلیپ ها نشان می دهد که ما در یک نقطه عطف برای ساخت ویدیو با هوش مصنوعی هستیم. همانند تولید تصویر هوش مصنوعی، هجوم فزاینده ای از میم ها می تواند با پیشرفت های قابل توجهی در کیفیت و قابلیت کنترل ویدیوهای هوش مصنوعی که این فناوری را در انواع مکان ها قرار می دهد، به دنبال داشته باشد. ممکن است هوش مصنوعی برای برخی از نویسندگان به یک موزه تبدیل شود. ابزار باند بود توسط هنرمندان جلوه های بصری استفاده می شود کار روی برنده اسکار همه چیز همه جا به یکباره. دارن آرونوفسکی، کارگردان وال، قوی سیاه، و پی نیز هست یکی از طرفداران Runway.

اما فقط باید ببینید که اکنون تصاویر پیشرفته Midjourney و Dream Studio چقدر هستند تا بفهمید ویدیوی هوش مصنوعی به کجا می‌رود – و تشخیص کلیپ‌های واقعی از کلیپ‌های جعلی چقدر دشوار است. البته، مردم در حال حاضر می‌توانند ویدیوها را با فناوری موجود دستکاری کنند، اما هنوز هم نسبتاً گران و دشوار است.

پیشرفت های سریع در هوش مصنوعی مولد ممکن است در دوره ای خطرناک باشد که رسانه های اجتماعی به سلاح تبدیل شده اند و دیپ فیک ها بازیچه تبلیغاتچی ها هستند. همانطور که جیسون پرهام این هفته برای WIRED نوشت، ما همچنین باید به طور جدی در نظر بگیریم که چگونه هوش مصنوعی مولد می‌تواند کلیشه‌های زشت را بازیابی کرده و از آن استفاده کند.

در حال حاضر، غریزه اعتماد به کلیپ‌های ویدیویی بیشتر قابل اعتماد است، اما ممکن است طولی نکشید که فیلم‌هایی که می‌بینیم کمتر از گذشته استوار و واقعی باشند.

منبع: https://www.wired.com/story/ai-video-generators-are-nearing-a-crucial-tipping-point/