ممکن است داشته باشید در هفتههای اخیر متوجه برخی از میمهای ویدیویی چشمگیر ساختهشده با هوش مصنوعی شده است. هری پاتر دوباره به ،وان یک آگهی تبلیغاتی Balenciaga در نظر گرفته شد و فیلم کابوس وار از ویل اسمیت در حال خوردن اسپاگتی هر دو اخیراً ویروسی شدند. آنها نشان میدهند که توانایی هوش مصنوعی برای ایجاد ویدیو با چه سرعتی در حال پیشرفت است و همچنین برخی استفادههای این فناوری ممکن است مشکلساز باشد.
این ویدیوها مرا به یاد لحظه ای می اندازد که ابزارهای تصویرسازی هوش مصنوعی در سال گذشته فراگیر شدند، زم، که برنامه هایی مانند Craiyon (که قبلاً DALL-E Mini نامیده می شد) به هر ،ی اجازه می دهد تا تصاویر قابل تشخیص، اگر خام و اغلب سورئال، مانند فیلم های نظارتی از سرقت نوزادان از پمپ بنزین، طرح های دادگاه دارث وادار، و ایلان ماسک در حال خوردن مداد رنگی.
Craiyon یک منبع باز حذفی بود که در آن زمان با دقت محدود شده بود FROM-E 2 تولید کننده تصویر از OpenAI، شرکت سازنده ChatGPT. این ابزار اولین ابزاری بود که توانایی هوش مصنوعی را در گرفتن یک پیام متنی و تبدیل آن به چیزی شبیه ع، های واقعی و تصاویری که توسط انسان طراحی شده بود را نشان داد. از آن زمان، DALL-E برای همه باز شد، و برنامه هایی مانند میانه سفر و استودیو رویا ابزارهای مشابهی را توسعه داده و بهبود بخشیده اند، که ساختن تصاویر پیچیده و واقعی با چند ضربه روی صفحه کلید را نسبتاً بی اهمیت می کند.
از آنجایی که مهندسان دستگیرهها و اهرمهای الگوریتمی پشت این تولیدکنندههای تصویر را بهینهسازی کردهاند، دادههای آموزشی بیشتری اضافه کردهاند و برای اجرای همه چیز برای تراشههای GPU بیشتر هزینه کردهاند، این ابزارهای تصویرسازی بهطور باورن،ی در جعل واقعیت خوب شدهاند. برای گرفتن چند نمونه از یک ساب ردیت اختصاص داده شده به تصاویر عجیب هوش مصنوعی، بررسی کنید ال، جونز در رژه غرور همجنس گرایان یا صندوق عهد در حیاط فروشی.
دسترسی گسترده به این فناوری و پیچیدگی آن، ما را مجبور میکند تا در نحوه مشاهده تصاویر آنلاین تجدید نظر کنیم، همانطور که پس از انتشار تصاویر ساخته شده توسط هوش مصنوعی که ادعا میکرد دستگیری دونالد ترامپ در ماه گذشته منتشر شد، مشخص شد. این حادثه باعث شد تا Midjourney اعلام کند که دیگر سرویس آزمایشی رایگان خود را ارائه نخواهد کرد – راه حلی که ممکن است برخی از بازیگران بد اسکیت ارزان را متوقف کند اما مشکل گستردهتر را دست نخورده باقی میگذارد.
همانطور که آماندا هوور از WIRED در این هفته می نویسد، الگوریتم ها هنوز برای تولید ویدیوی قانع کننده از یک درخواست تلاش می کنند. ایجاد بسیاری از فریمهای مجزا از نظر مح،اتی گران است، و همانطور که ویدیوهای تند و تیز و کندوپاش امروزی نشان میدهند، برای الگوریتمها سخت است که انسجام کافی بین آنها را برای تولید یک ویدیوی منطقی حفظ کنند.
با این حال، ابزارهای هوش مصنوعی در ویرایش ویدیوها بسیار ماهرتر می شوند. میم Balenciaga، به همراه نسخه های مرجع دوستان و بریکینگ بد، با ،یب چند ابزار مختلف هوش مصنوعی، ابتدا برای تولید تصاویر ثابت و سپس اضافه ، جلوه های ،میشن ساده ساخته شدند. اما نتیجه نهایی هنوز هم چشمگیر است.
باند MLاستارت آپی که در حال توسعه ابزارهای هوش مصنوعی برای ایجاد و ویرایش حرفه ای تصویر و ویدیو است، این هفته راه اندازی کرد. تکنیک جدید کارآمدتر برای اعمال تغییرات سبک در ویدیوها. من از آن برای ایجاد این فیلم رویایی از گربهام، لئونا، استفاده کردم که تنها در چند دقیقه در یک «منظره ابری» از یک ویدیوی موجود قدم میزند.
ویدئو: ویل نایت / باند
تکنیکهای مختلف یادگیری ماشین، فرصتهای جدیدی را باز میکنند. یک شرکت به نام هوش مصنوعی رو به جلوبه ،وان مثال، از تکنیکی به نام میدان های تابشی عصبی برای تبدیل ع، های دو بعدی به صحنه های سه بعدی دقیق استفاده می کند. چند ع، فوری را در برنامه شرکت قرار دهید، و یک ع، خواهید داشت صحنه سه بعدی کاملا تعاملی برای بازی ،
این کلیپ ها نشان می دهد که ما در یک نقطه عطف برای ساخت ویدیو با هوش مصنوعی هستیم. همانند تولید تصویر هوش مصنوعی، هجوم فزاینده ای از میم ها می تواند با پیشرفت های قابل توجهی در کیفیت و قابلیت کنترل ویدیوهای هوش مصنوعی که این فناوری را در انواع مکان ها قرار می دهد، به دنبال داشته باشد. ممکن است هوش مصنوعی برای برخی از نویسندگان به یک موزه تبدیل شود. ابزار باند بود توسط هنرمندان جلوه های بصری استفاده می شود کار روی برنده اسکار همه چیز همه جا به یکباره. دارن آرونوفسکی، کارگردان وال، قوی سیاه، و پی نیز هست یکی از طرفداران Runway.
اما فقط باید ببینید که اکنون تصاویر پیشرفته Midjourney و Dream Studio چقدر هستند تا بفهمید ویدیوی هوش مصنوعی به کجا میرود – و تشخیص کلیپهای واقعی از کلیپهای جعلی چقدر دشوار است. البته، مردم در حال حاضر میتوانند ویدیوها را با فناوری موجود دستکاری کنند، اما هنوز هم نسبتاً گران و دشوار است.
پیشرفت های سریع در هوش مصنوعی مولد ممکن است در دوره ای خطرناک باشد که رسانه های اجتماعی به سلاح تبدیل شده اند و دیپ فیک ها بازیچه تبلیغاتچی ها هستند. همانطور که جیسون پرهام این هفته برای WIRED نوشت، ما همچنین باید به طور جدی در نظر بگیریم که چگونه هوش مصنوعی مولد میتواند کلیشههای زشت را بازیابی کرده و از آن استفاده کند.
در حال حاضر، غریزه اعتماد به کلیپهای ویدیویی بیشتر قابل اعتماد است، اما ممکن است طولی نکشید که فیلمهایی که میبینیم کمتر از گذشته استوار و واقعی باشند.
منبع: https://www.wired.com/story/ai-video-generators-are-nearing-a-crucial-tipping-point/