فیس بوک در حال کار بر روی ابزارهای هوش مصنوعی برای رفع مشکل عکس هایی که با پلک زدن خراب شده اند

این کار می تواند چشمان بسته را با دقت شگفت انگیزی باز کند.


فیس بوک در حال کار بر روی ابزارهای هوش مصنوعی برای رفع مشکل عکس هایی که با پلک زدن خراب شده اند

ابزار هوش مصنوعی فیسبوک برای درست کردن پلک زدن
فیس بوک با استفاده از مجموعه داده های مختلف هوش مصنوعی خود را آموزش داده است،
از جمله برخی از مجموعه ها که متشکل از افراد شناخته شده و مشهور در سراسر جهان است.
Facebook

گرفتن یک عکس خوب از یک فرد به گونه شگفت انگیزی دشوار است. بسیاری از اشتباهات می توانند عکس را از خراب کنند، از نورپردازی بد تا یک حالت ناخوشایند. با این وجود، هیچ چیز پرتره مانند یک پلک زدن بی موقع یک عکس از صورت را خراب نمی کند. بخش تحقیقات فیس بوک در حال کار بر روی یک روش برای جایگزینی چشمان بسته شما با جشمان باز با استفاده از ابزارهای مبتنی بر AI است که تلاش می کند فراتر از صرفا کپی کردن و چسباندن چشمان جدید باشد.

باز کردن چشمان بسته در یک پرتره ایده تازه ای نیست، اما این فرآیند معمولا شامل کشیدن بخش مورد نظر به طور مستقیم از یک عکس دیگر و پیوند زدن آن به عکس همراه با پلک زدن است. به عنوان مثال، نرم افزار Adobe Photoshop Elements نرم افزار (یک نسخه ساده شده از نرم افزار ویرایش عکس حرفه ای ادوبی) دارای یک ویژگی  است که به طور ویژه برای این منظور ساخته شده است. هنگامی که از آن استفاده می کنید، برنامه از شما می خواهد عکس دیگری را از همان جلسه انتخاب کنید (فرض کنید بر این است که بیش از یک عکس گرفته اید) که چشم های شخص در آن باز است. پس از آن می توانید فن آوری هوش مصنوعی Adobe که آن را سنسی (Sensi) نامیده می شود را به کار ببرید تا چشم ها را از تصویر قبلی به عکس توأم با پلک زدن ترکیب کنید.

این عملکردی است که به طرزی شگفت آور برای رفع عیب سریع خوب است. به ویژه هنگامی که شما در نظر بگیرید که با استفاده از نسخه کامل فوتوشاپ چسباندن و ترکیب با دقت مجموعه جدید چشم ها چند گام طول می کشد. اما جزئیات کوچک وجود دارد که همیشه این کار به درستی انجام نمی شود، مثل شرایط خاص روشنایی  و یا جهت جهت سایه ها.

فیس بوک در حال کار بر روی ابزارهای هوش مصنوعی برای رفع مشکل عکس هایی که با پلک زدن خراب شده اند

این سیستم همیشه کامل و بی عیب عمل نمی کند
گاهی اوقات AI رنگ چشم افراد را (تصویر بالایی) اشتباه تشخیص
می دهد یا موانعی مانند مو (پایین) را به درستی اصلاح نمی کند.

هانی فرید، استاد علوم رایانه در کالج دارتموث و متخصص عکس در پزشکی قانونی می گوید: "درک سایه ها کاملا بصری است." "من می توانم با نگاه به سایه تشخیص دهم که منبع نور کجاست." هنگامی که یک تکنسین مجموعه ای از چشم ها را کپی و آن را در یک عکس دیگر می چسباند، ممکن است همیشه چیزهایی مانند تغییرات جزئی در سایه ها را در نظر نگیرد. همان گونه که مطالعه نشان می دهد، این مشکل گاهی اوقات باعث می شود که  تصویر نهایی تقریبا درست به نظر برسد، اما هنوز به گونه غیر قابل توضیحی عجیب است. همانطور که گفته شد، این یک شکاف جدی است که محققان امیدوارند از آن جلوگیری کنند.

یک مقاله اخیر منتشر شده توسط بخش تحقیقات فیسبوک یک نوع راه حل متفاوت دیگر را برای جایگزینی چشمان بسته فراهم می کند که بستگی به یک شبکه عصبی عمیق دارد که می تواند داده های گمشده را با استفاده از محتویات تمام تصویر، و نه فقط منطقه آسیب دیده بسازد. فیس بوک با استفاده از یک فن آوری به نام شبکه دفاعی عمومی (GAN) برای پر کردن این داده ها استفاده می کند. این همان تکنولوژی بنیانی است که برای موج جدیدی از فیلم های "جعلی عمیق" که در آن افراد مشهور به نظر می رسند که حرف هایی می زنند که در واقعیت نزده اند و کارهایی می کنند که نکرده اند.

مدل نمونه GAN که آنها استفاده می کنن، داده را از عکس های دیگر همان شخص بیرون می کشد، اما از آن تنها به عنوان مرجعی استفاده می کند که یاد بگیرد شخص مورد نظر چگونه به نظر می رسد و چه علائم شناسایی ممکن است در چهره او وجود داشته باشد. سپس از یک فرآیند به نام نقاشی (in-painting) استفاده می شود تا اطلاعات مورد نیاز را برای جایگزینی پلک با چشم های واقعی تولید کند. این نوع یادگیری عمیق نیاز به مرجعی بیش از یک تصویر ساده دارد که با زیرساخت فیس بوک که به طور معمول می تواند تصاویر مختلفی از یک کاربر را اغلب با موقعیت های متفاوت نورپردازی، تجزیه و تحلیل کند، به خوبی متناسب است.

نتایج اولیه فیس بوک، اگرچه ناقص ولی چشمگیر هستند. اما محققان هنوز هم به دنبال پیدا کردن بهترین روش های آموزشی برای الگوریتم های پشت پرده فرایند و هدایت متغیر های غیر قابل پیش بینی مانند عکس هایی که در آن قسمتی از چشم با مو یا عینک پوشیده می شود، هستند.

با این حال، شرکت معتقد است که این نوع محاسبات (کامپیوتری) مفید هستند، حتی فراتر از تصحیح یک عکس در بحث پلک زدن. شاید AI در آینده بتواند کاری کند که همه ما در تصاویر نمایه خود حتی بهتر به نظر برسیم. حتی فراتر از عکس ها، این شرکت در حال کار بر روی ابزارهای مشابه هوش مصنوعی است که موسیقی را از یک سبک به سبک دیگر ترجمه کند.

برگرفته از Popular Science