ویدئوهای ساختگی از انسانهای واقعی — و نحوه تشخیص آنها
(ویدیو) باراک اوباما: برای کمکبه آنها که باید وام خود را تجدید کرده یا روی تولید به کمک فناوریهای روز دنیا انرژیهای پاک و زیرساختها برای مشاغل تازه سرمایهگذاری کنند.
سوپاسورن سوواجاناکورن: کسی فهمید؟ جواب صحیح هیچکدام از آنها است.
(خنده)
هیچ یک واقعی نیست. فکر میکنید چطور به اینجا رسیدیم. الهام بخش من برای آغاز این کار پروژهای بود برای آنکه آخرین یافتههای مادرباره هولوکاست را حفظ کند آنهم از زبان شاهدان زنده آن. این پروژه که ابعاد جدید شهادت نام داشت، به کاربران اجازه میدادصحبتی رودررو و کاملا تعاملی با هولوگرام بازمانده واقعیاز هولوکاست داشته باشند.
(ویدیو) مرد: چطور از هولوکاستجان سالم به در بردی؟
(ویدیو) هولوگرام:چطور جان سالم به در بردم؟ من زنده ماندم، چون اعتقاد داشتم، در پناه خدا و فرشتگان هستم.
س س: حقیقت اینست که این پاسخهااز قبل در استودیو ضبط شده بودند. با این حال اثر آنها بینظیر بود. این مرد میتوانست احساس همدردیو نوع دوستی شما را برانگیزد. باید چیزی خارقالعاده در تعامل میان انسانها وجود داشته باشد که آن را این همه قوی و شخصی میکند بیشتر از تمام چیزی که از کتابهاسخنرانیها و فیلمها یاد گرفتهاید.
پس از دیدن این فیلم به فکر فرو رفتم، که آیا میتوان مدلی شببه به آن رابرای هر کسی خلق کرد؟ مدلی که بتواند مانند آنها نگاه کردهحرف زده و واکنش نشان بدهد؟ و تلاش کردم تا به نتیجه برسم در نهایت به راهحل تازهای رسیدم که میتوانست مدلی از یک فرد را با استفاده از حداقلها ایجاد کند: عکسها و ویدئوهایی که از او وجود داشت. اگر بتوانید به بهترین شکل از این دادهها استفاده کنید، تنها عکسها و ویدئوهاییکه در اختیار دارید، ابزار کافی است.
حالا در اینجا ریچارد فاینمن را داریم، یک فیزیکدان برنده جایزه نوبل و استادی افسانهای. به نظرتان عالی نیستکه او را به حیات برگردانیم تا برایمان سخنرانی کند و میلیونهاکودک را تحت تأثیر قرار بدهد، آنهم نه تنها به زبان انگلیسیبلکه به تمامی زبانها؟ یا اینکه پای صحبتهای شیرینپدربزرگها و مادربزرگهایمان بنشینیم در حالی که دیگر در قید حیات نیستند؟ یا از این تکنیک برای جان دادن به نویسندگان محبوبمان استفاده کنیم، تا کتابهایشان را با صدای خود برای علاقمندان بازخوانی کنند.
ایدههای خلاقانه بسیاریدر این حیطه وجود دارند، و به شخصه برای من بسیار جذاب هستند. حالا به شیوه کار بپردازیم.
در ابتدا تکنیک تازهای خلق کردیم که میتوانست طرح سه بعدی دقیقیاز هر تصویری را بازسازی کند بدون آنکه به اسکن سه بعدی فردنیازی داشته باشد. این همان مدل نهایی از زوایای گوناگون است. همین تکنیک در ویدئو کاربرد دارد، با به کارگیری الگوریتمی یکساندر هر فریم از ویدئو و خلق یک مدل سه بعدی متحرک. این همان محصول نهایی است که از زوایای گوناگون دیده میشود.
به نظر میرسد این معما بسیار پیچیده باشد، اما فوت کوزهگری اینست که ما به بررسی مجموعه گستردهای از تصاویر خواهیم پرداخت. برای جرج دبلیو. بوشتنها به جستجو در گوگل اکتفا کردیم، و به کمک همانها، موفق به ساخت مدلی متوسط شدیم، یک مدل شسته رفته و تعاملیکه به خوبی میتواند جزئیاتی ریز مانند چینو چروک صورت را نشان بدهد. نکته جالب توجه اینکه مجموعه عکسها میتواند از عکسهایروزمره شما گردآوری شود. این مهم نیست که حالاتچهره شما چگونه است یا کجا این عکسها را گرفتهاید. مهم اینست که تعداد زیادیدر اختیار داشته باشید. حالا نوبت به رنگها میرسد، ما از تکنیکی برایترکیب آنها استفاده کردهایم که از روشهای متوسط کنونی به مراتب بهتر است و بافت و رنگی زنده به چهره فرد میدهد. و میتواند برای تمامی حالات استفاده شود.
حالا ما کنترل یک مدلانسانی را در اختیار داریم، این کنترل به وسیله توالی از تصاویر ایستا ایجاد میشود. به ظاهر و پنهان شدن چین و چروکهادر هنگام تغییر حالات دقت کنید. علاوه بر این میتوانیم از ویدئوبرای مدل خود استفاده کنیم.
(ویدیو) دنیل کریگ: درسته، ولی گاهی، باید آدم های فوقالعاده بیشتری جذب کنیم.
س س: باز هم یک دموی جذاب دیگر. چیزی که اینجا میبینیدمدلهای قابل کنترل هستند آنها را به کمک تصاویر موجوددر اینترنت درست کردهام. حالا اگر حرکت را از ویدئوی ورودیبه اینجا منتقل کنیم، همه چیز کامل خواهد شد.
جرج دبلیو. بوش:تصویب این لایحه ساده نیست، چون اجزای پیچیده بسیاری وجود دارد، و فرایندهای قضایی میتواند ناخوشایند باشد.
(تشویق)
س س: بیایید کمی به عقب برگردیم، هدف نهایی ما در اینجا،تبعیت کامل از رفتار این افراد و شیوه یگانه هر یک از آنهادر صحبت و لبخند زدن است. برای رسیدن به آن آیا میشودبه رایانه یاد بدهیم که شیوه حرف زدن فرد را تقلید کرده و این کار را تنها به کمکنمایش ویدئوها انجام بدهیم؟ این دقیقا کاری بود که من کردم،اجازه دادم که رایانه ۱۴ ساعت از صحبتهای اوباما را تماشا کند. تنها کاری که باقی مانده بوداضافه کردن صدا بود.
(ویدیو) ب ا: نتیجه مشخص است. کسب و کارهای آمریکایی۱۴/۵ میلیون شغل جدید ایجاد کردهاند در طی ۷۵ ماه.
س س: تنها چیزی که در این ویدئوها طراحی شده دهان اوباما است، و شیوه کار به این ترتیب است. سیستم ما از شبکه عصبی استفاده میکند تا صدا را تبدیل کرده و آن را به اجزای دهان منتقل کند.
(ویدیو) ب ا: ما تلاش میکنیمبیمه ملی را توسعه بدهیم.
پس از آن بافت را همگون کرده،و جزئیاتی مانند دندانها، نحوه قرار گرفتن آنها در صورتو پشت زمینه را تصحیح میکنیم.
(ویدیو) ب ا: زنان میتوانندبه چک آپ رایگان، دسترسی داشته و هزینه بیشتریبه دلیل زن بودن نداشته باشند. جوانان هم می توانند تا ۲۶ سالگی از بیمه والدین خود استفاده کنند،
س س: به نظرم این نتایجبسیار واقعی و قابل درک است، و همزمان نگران کننده، حتی برای من. هدف اصلی ما ساخت مدلی دقیق از فرد استنه اینکه چهرهای غلط از او نمایش بدهیم. چیزی که باعث نگرانی من میشوداحتمال سوءاستفاده است. ما شاهد نمونههای متعددیدر طول زمان بودهایم، از همان زمانی که فتوشاپ وارد بازار شد. من به عنوان محقق به شیوههایی برای خلق فناوریهای مقابلهای فکر میکنم، و از سوی دیگر جزئی ازبنیاد هوش مصنوعی هستم، که با استفاده از یادگیری ماشینو اپراتورهایی که انسان هستند ویدئوها و تصاویر ساختگی را تشخیص داده، به نوعی با کار خود من مقابله میکند. یکی از ابزارهایی که طراحی کردهایم«محافظ واقعیت» نام دارد، که بر روی مرورگر نصب شده و میتواندمحتوای ساختگی احتمالی را نشان بدهد خودکار و درست روی مرورگر.
(تشویق)
با تمام این تلاشها، باز هم ویدئوهای ساختگی میتوانند، خرابیهای بسیاری راپیش از تشخیص به بار بیاورند، میبینید که آگاه کردن کاربران بسیار مهم است از اتفاقی که میتواند بیفتد پس با آگاهی است که میتوانیمدرست تشخیص داده و با دقت ببینیم.
برای طراحی مدلهای انسانیهنوز راهی طولانی در پیش داریم پیش از آن میتوانیم در موردامنیت این روش به نتیجه برسیم. اما من مشتاق و امیدوار هستم، چون اگر از این ابزاردرست و با دقت استفاده کنیم، میتواند به هر فردی اجازه بدهدکه تأثیر مثبتی روی جهان بگذارد و در همه جای جهان دیده شود و آینده ما را به آن شکلیکه انتظار داریم شکل بدهد.
متشکرم.
(تشویق)