مسلح به یک با اعتقاد به پتانسیل مولد فناوری، گروه رو به رشدی از محققان و شرکت ها قصد دارند با ایجاد تصاویر مصنوعی از افراد رنگین پوست، مشکل سوگیری در هوش مصنوعی را حل کنند. طرفداران استدلال می کنند که ژنراتورهای مبتنی بر هوش مصنوعی می توانند شکاف های تنوع موجود در پایگاه داده های تصاویر موجود را با تکمیل آنها با تصاویر مصنوعی اصلاح کنند. مقداری محققان از معماریهای یادگیری ماشین برای ترسیم ع،های موجود از افراد در نژادهای جدید استفاده میکنند تا “توازن توزیع قومی” مجموعه دادهها را ایجاد کنند. دیگران، مانند رسانه تولید شده و آزمایشگاه قووس، از فناوریهای مشابه برای ایجاد پرترههای کاملاً جدید برای بانکهای تصویر خود استفاده میکنند، همانطور که آزمایشگاه Qoves میگوید، «ساختن چهرههای هر نژاد و قومیتی» برای اطمینان از «دادههای چهره واقعاً منصفانه». همانطور که آنها می بینند، این ابزارها با تولید ارزان و کارآمد تصاویر متنوع بر اساس دستور، سوگیری های داده را حل می کنند.
مسئله ای که این فناوران به دنبال رفع آن هستند، موضوعی حیاتی است. هوش مصنوعی مملو از نقص است و قفل تلفن ها را باز می کند شخص اشتباه چون نمی توانند چهره های آسیایی را از هم تشخیص دهند، متهم ، به دروغ افرادی از جنایاتی که مرتکب نشدهاند، و افراد تیرهپوست را اشتباه گرفتهاند برای گوریل ها. این ،ابیهای دیدنی ناهنجاری نیستند، بلکه پیامدهای اجتنابناپذیر هوش مصنوعی دادههایی هستند که در بیشتر موارد به شدت سفید و مرد را منحرف میکنند – و این ابزارها را برای هر،ی که با این کهن الگوی باریک سازگاری ندارد، ابزاری غیردقیق میکند. در تئوری، راه حل ساده است: ما فقط باید مجموعه های آموزشی متنوع تری را پرورش دهیم. با این حال، در عمل، به دلیل مقیاس ورودیهایی که چنین سیستمهایی نیاز دارند، و همچنین میزان حذفیات فعلی در دادهها، ثابت شده است که این یک کار فوقالعاده کار فشرده است (برای مثال، تحقیقات IBM نشان داد که شش از هشت مجموعه داده های برجسته صورت از بیش از 80 درصد چهره هایی با پوست روشن تر تشکیل شده است. بنابراین، این امکان وجود دارد که مجموعه داده های متنوعی بدون منبع یابی دستی ایجاد شوند.
با این حال، همانطور که به روشهایی که این پیشنهاد ممکن است بر ابزارها و روابط ما با آنها تأثیر بگذارد، نگاه میکنیم، سایههای طول، این راهحل به ظاهر راحت شروع به شکلگیری ترسناک میکنند.
بینایی کامپیوتری دارد از اواسط قرن بیستم به نوعی در حال توسعه بوده است. در ابتدا، محققان تلاش ،د تا ابزارهایی را از بالا به پایین بسازند و به صورت دستی قو،نی را تعریف کنند (“چهره های انسان دو چشم متقارن دارند”) تا طبقه مورد نظر از تصاویر را شناسایی کنند. این قو،ن به یک فرمول مح،اتی تبدیل میشوند، سپس به یک کامپیوتر برنامهریزی میشوند تا به آن کمک کند ال،ای پی،لی را که مطابق با ال،ای شی توصیفشده است، جستجو کند. این رویکرد اما ثابت کرد تا حد زیادی ناموفق با توجه به تنوع بسیار زیاد سوژه ها، زاویه ها و شرایط نوری که می توانند یک ع، را تشکیل دهند – و همچنین دشواری ترجمه حتی قو،ن ساده به فرمول های منسجم.
با گذشت زمان، افزایش تصاویر در دسترس عموم، فرآیند پایین به بالا را از طریق یادگیری ماشینی ممکن کرد. با این روش، انبوهی از داده های بر،ب گذاری شده به یک سیستم وارد می شود. از طریق “یادگیری تحت نظارتالگوریتم این داده ها را می گیرد و به خود می آموزد که بین دسته بندی های مورد نظر تعیین شده توسط محققان تمایز قائل شود. این تکنیک بسیار انعطافپذیرتر از روش بالا به پایین است زیرا بر قو،نی که ممکن است در شرایط مختلف متفاوت باشند متکی نیست. با آموزش خود بر روی انواع ورودیها، ماشین میتواند شباهتهای مربوطه بین تصاویر یک ک، مشخص را بدون اینکه صریحاً به آن شباهتها گفته شود شناسایی کند و مدلی بسیار سازگارتر ایجاد کند.
با این حال، روش پایین به بالا کامل نیست. به طور خاص، این سیستم ها تا حد زیادی توسط داده هایی که ارائه می کنند محدود می شوند. به ،وان نویسنده فناوری راب هورنینگ آن را قرار می دهد، فناوری هایی از این نوع “یک سیستم بسته را فرض می کنند.” آنها در برون یابی فراتر از پارامترهای داده شده خود مشکل دارند که منجر به عملکرد محدود وقتی با موضوعاتی مواجه می شوند که در مورد آنها به خوبی آموزش ندیده اند. به ،وان مثال، اختلاف در داده ها منجر شد FaceDetect مایکروسافت نرخ خطای ۲۰ درصدی برای ،ن با پوست تیرهتر، در حالی که نرخ خطای آن برای مردان سفیدپوست حدود ۰ درصد است. اثرات موجی این سوگیری های آموزشی بر عملکرد دلیلی است که متخصصان اخلاق فناوری شروع به تبلیغ اهمیت تنوع مجموعه داده ها ،د و چرا شرکت ها و محققان در حال رقابت برای حل این مشکل هستند. همانطور که ضرب المثل رایج در هوش مصنوعی می گوید: “، داخل، ، بیرون”.
این اصل به همان اندازه برای تولیدکنندههای تصویر صدق میکند، که همچنین به مجموعه دادههای بزرگی نیاز دارند تا خود را در هنر نمایش فوتورئالیستی آموزش دهند. ا،ر ژنراتورهای صورت امروزه استفاده می کنند شبکه های متخاصم مولد (یا GAN ها) به ،وان معماری پایه آنها. در هسته خود، GAN ها با داشتن دو شبکه، یک Generator و یک Discriminator، در بازی با یکدیگر کار می کنند. در حالی که Generator تصاویر را از ورودی های نویز تولید می کند، یک Discriminator تلاش می کند تا تقلبی های تولید شده را از تصاویر واقعی ارائه شده توسط یک مجموعه آموزشی مرتب کند. با گذشت زمان، این “شبکه متخاصم” ژنراتور را قادر میسازد تا تصاویری را بهبود بخشد و ایجاد کند که یک Discriminator قادر به شناسایی آنها به ،وان جعلی نیست. ورودی های اولیه به ،وان لنگر برای این فرآیند عمل می کنند. تاریخی، دهها هزار از این تصاویر برای تولید نتایج به اندازه کافی واقعی مورد نیاز بوده است که نشان دهنده اهمیت مجموعه آموزشی متنوع در توسعه من، این ابزارها است.
منبع: https://www.wired.com/story/synthetic-image-media-bias-artificial-intelligence/