این اپلیکیشن میداند شما چطور احساس میکنید— با نگاه کردن به چهرهتان
چهرهی انسان، یکی از قویترین کانالهاست که همهی ما از آن استفاده میکنیم، تا حالتهای اجتماعی و احساسی را ابراز کنیم، همهچیز، شوق و شگفتیِمان، همدلی و کنجکاویمان. در دانش احساسات، ما به هر حرکت عضلات صورتیک واحد حرکت میگوییم. در نتیجه، برای مثال، حرکتِ واحدِ ۱۲، یک فیلم پرفروش هالیوودی نیست، بلکه در حقیقت، بالا رفتن گوشهی لب است، که یک جزٔ اصلی لبخند است. همه امتحانش کنید. بیاییدچندین لبخند داشتهباشیم. مثال دیگر، حرکتِ واحدِ ۴ است،که حرکتِ چروک انداختن ابرو است. زمانی که شما ابروهایتان را درهم میکشید و همهی این الگوها و چینها را میسازید. ما اخم را دوست نداریم، ولی این حرکت نشانگری قوی برای احساسات منفی است. ما حدود ۴۵ واحد حرکتی داریم، و همهی آنها با هم ترکیب میشوند تا صدها احساس را ابراز و بیان کنند.
آموزش خواندن احساسات چهره به یک کامپیوتر سخت است، زیرا این واحدهای حرکتی میتوانند سریع، دقیق، و ماهرانه باشند. و به شکلهای مختلف با هم ترکیب شوند. برای مثال، لبخند و پوزخند زدن را در نظر بگیرید. آنها از جهاتی، شبیه به هم هستند،ولی معانی کاملا متفاوتی دارند. (خندهی حضار) لبخند مثبت است، و پوزخند معمولاً منفی. بعضی اوقات، یک پوزخند میتواند شما را معروف کند. ولی جداً، برای یک کامپیوتر مهم است که بتواند دو حالت متفاوت را از هم تشخیص دهد.
حال، ما این کار را چگونهانجام میدهیم؟ ما به الگوریتمهایمان دهها مثال از صدها مثالی که مردم در آنها میخندند را میدهیم، از فرهنگها، سنین، و جنسیتهای متفاوت، و همین کار را برای پوزخندها انجام میدهیم. و سپس، با کمک یادگیری عمیق، الگوریتمْ به همهی این الگوها و چینوچروکها و تغییرات قالبِ چهرهمان نگاه میکند، و به طور اساسی یاد میگیرد که همهی لبخندها ویژگیهای مشابهی دارند و همهی پوزخندها، ویژگیهای ماهرانه، اما متفاوتی دارند. و دفعهی بعد که یک چهرهی جدید را میبیند، ضرورتاً میفهمد که این چهره، ویژگیهای یک لبخند را دارد، و میگوید: «آها، من این را تشخیص میدهم. این جلوهی یک لبخند است.»
پس بهترین راه برای نشاندادن چگونگی عملکرد این تکنولوژی اجرای یک نمایش زنده است، پس من یک داوطلب میخواهم، ترجیحاً فردی با یک صورت. (خندهی حضار) کلوی داوطلب امروز ما خواهد بود.
در پنج سالِ گذشته، ما از یک پروژهی تحقیقاتی در MIT، به یک شرکت تبدیل شدیم، جایی که تیم من، به سختی کار کردهاست تا این تکنولوژی کار کند، که چیزی است که میخواهیمدر واقعیت بگوییم تا در تئوری. همچنین ما، آن را کوچک کردهایم تا هستهی موتور احساسات روی هر دستگاه موبایلِ مجهز به دوربین،مانند این آیپد، کار کند. پس بیایید امتحانش کنیم.
همانطور که میتوانید مشاهدهکنید، الگوریتم صورت کلوی را یافته است، پس این جعبهی سفید کادر صورت را نشان میدهد، که دارد خصوصیات اصلی صورتش رادنبال میکند؛ ابروهایش، چشمانش، دهانش، و دماغش. سؤال این است که آیا میتواند احساساتش را نیز شناسایی کند؟ پس ما دستگاه را تست میکنیم. اول از همه، صورت بدون احساست رابه من نشان بده. بله، عالی است! (خندهی حضار) حالا او میخندد،این یک خندهی خالص است، عالی است. میتوانید ببینید که نوار سبزبا خندیدن او بزرگ میشود. این یک خندهی بزرگ بود. میتوانی کمی ملایم بخندی تا ببینیم کامپیوتر میتواند آن را شناسایی کند؟ بله، میتواند خندهی ماهرانه را همبه همین ترتیب شناسایی کند. ما واقعا سخت کار کردهایم تا این کار را انجام دهیم. و بعد، بالا رفتن ابروها، که نشاندهندهی شگفتی است. چینخوردگی پیشانی،نشاندهندهی گیجی است. رو ترش کُن. بله، عالی است. پس اینها همهی واحدهایِ حرکتیِ متفاوتهستند. چندین حرکت دیگر نیز وجود دارد. این یک نمایش کوچکشده است. ما به هر خواندن، یک نقطهی دادهی احساسات میگوییم. و این نقاط میتوانند با هم ترکیب شوند تا نشاندهندهی احساسات متفاوت باشند. پس در سمتِ راستِ نمونهی نمایشی--نشان بده که خوشحالی. این شوق است. شوق زیاد میشود. و حالا به من یک صورت منزجر نشان بده. احساست را، زمانی که زِین، گروهِ واندایرِکشن را ترک کرد، به خاطر بیاور. (خندهی حضار) بله، دماغت را چین بده. عالی است. و نشانگر ظرفیت تا حدودی منفی شد، پس حتما یک طرفدار واقعی هستی. معیارِ ظرفیت، مثبت یا منفی بودنِ تجربه رانشان میدهد، و معیارِ درگیری نشاندهندهی تأثیری است که حالت صورت فرد خواهد گذاشت. پس زمانی را تصور کنید که کلویبه این رشتهی احساسات بیدرنگ دسترسی داشت، و میتوانست آن را با هر کسی که میخواهددر میان بگذارد. متشکرم. (تشویق حضار)
تابهحال، ما ۱۲ میلیارد از این نقاطِ احساسی را جمعآوری کردهایم. این مجموعه، بزرگترین پایگاهدادهی احساسات در دنیاست. آن را از ۲/۹ میلیون ویدیوی چهرهجمعآوری کردهایم، که شرکتکنندگان با در اختیار گذاشتناحساساتشان موافقت کردهاند، و از ۷۵ کشور در سراسر جهان شرکت کردهاند. این مجموعه، هر روز رو به رشد است. مغزم منفجر میشود، زمانی که فکر میکنم که ما میتوانیم چیزی خصوصی مانند احساسات را تا این حد، اندازه بگیریم.
تا به حال چه آموختهایم؟ جنسیت. دادههای ما، چیزهایی که ممکن استدر آنها شک داشته باشید را، تأیید میکنند. خانمها از آقایان واضحترابراز احساسات میکنند. نه تنها بیشتر لبخند میزنند، بلکه لبخندهایشان با دوامتر است. و ما میتوانیم ارزیابی کنیم، که زنان و مردان به چه چیزهایی واکنشهای متفاوتی نشان میدهند. بیایید فرهنگ را بررسی کنیم:در ایالات متحده، زنان ۴۰ درصد بیشتر از مرداندر بیان احساسات خود گویا هستند، ولی به شکل عجیبی، هیچ تفاوتی بین زنان و مردان در انگلستان، مشاهده نمیشود. (خندهی حضار) سن: کسانی که ۵۰ سال یا بیشترسن دارند، ۲۵ درصد بیشتر از افراد جوانتراحساساتی هستند. زنان در دههی بیستسالگیشان، بسیار بیشتر از مردان با سن مشابه لبخند میزنند. شاید این یکی از الزامات معاشرت است. اما شاید آنچه از بیشتر دربارهی ایندادهها شگفتزدهمان کرد این بود که ما در تمام مدت در حالابرازِ احساساتیم، حتی زمانی که به تنهایی در مقابل دستگاهمان نشستهایم، و نه تنها زمانی که داریم ویدیوی یک گربهرا در فیسبوک میبینیم، بلکه همیشه. ما هنگام ایمیل زدن،پیامک زدن،خرید آنلاین، یا حتی پرداخت مالیات، در حال ابراز احساساتیم.
امروزه، این دادههادر کجا استفاده میشود؟ در فهم این که ما چگونه با رسانهها در ارتباطیم، در فهم الگوهای اشتراکگذاریِ ویدیوهاو رأی دادن؛ و همچنین قدرت دادن یا احساسی کردن تکنولوژی، میخواهم چند مثال با شما در میان بگذارمکه قلبم را درهم میفشارند. عینکهای هوشمند از نظر احساساتمیتوانند به افرادی که از نظر بینایی مشکل دارند، در فهمِ احساساتِدیگران، یاری برسانند، و به افراد مبتلا به اوتیسم نیز در قالبِ مترجم احساسات کمک کنند، مشکلی که واقعاً این افراد دارند با آن دست و پنجه نرم میکنند. در آموزش: اگر شما در حال یادگیری هستید،اپلیکیشنها سردرگمی شما را احساس میکنندو سرعتشان کم میشود. یا اگر حوصلهتان سر رفتهسرعتشان بالا میرود، مانند یک معلم عالی در کلاس درس. چه میشد اگر ساعت مچی شما احساساتتان را درک میکرد، یا ماشینتان میفهمید که شما خسته هستید، یا یخچالتان میفهمید که شما مضطرب هستید، و بهطور خودکار بسته میشد تا از پرخوری شما جلوگیری کند. (خندهی حضار) من این را دوست دارم، بله. چه میشد اگر زمانی که من در کمبریج بودم، به رشتهی احساسات بیدرنگم دسترسی داشتم، و میتوانستم آن را با خانوادهام در خانهبه صورت طبیعی در میان بگذارم، همانطور که انگاربا آنها در یک اتاق هستم؟
فکر میکنم که ۵ سال دیگر از الان، همهی وسایل ما یک تراشهی احساسات خواهند داشت، و ما دیگر زمانی را بهیاد نمیآوریم که نمیتوانستیم به وسیلهمان اخم کنیم، و وسیلهمان به ما میگوید: «هممم، این را دوست نداشتی، نه؟» بزرگترین چالش ماکاربردهای زیاد این تکنولوژی است. من و تیمم به این نتیجه رسیدیم که نمیتوانیمهمهی اپلیکیشنها را خودمان بسازیم، پس این تکنولوژی را در دسترس قرار دادیم تا سایر توسعهدهندگان بتوانند این برنامهها را بسازندو خلاق باشند. ما متوجه شدیم که امکان خطر و همچنین سؤاستفاده وجود دارد، ولی بهشخصه، بعد از چندین سال انجام این کار، باور دارم که این تکنولوژی مزایایی برایانسانیت دارد و داشتن تکنولوژی هوشمند احساسی ارزشمندتر امکان سؤاستفاده است. من شما را دعوت میکنمکه بخشی از این گفتوگو شوید. این که افراد بیشتری دربارهیاین تکنولوژی بدانند، کمک میکند تا بیشتر بتوانیم بگوییم که چگونه از آن استفاده میشود. همانطور که زندگیمانبیشتر و بیشتر دیجیتالی میشود، در یک جنگ شکست خورده مبارزه میکنیم تا از استفاده از وسایل در زندگیمان کم کنیم به این منظور که احساساتمان را بازگردانیم. چیزی که من در عوض برایش تلاش میکنم این است که احساسات را به درون تکنولوژی بیاورم و کاری کنم که تکنولوژیهایمان پاسخگوتر باشد. پس میخواهم وسایلی که ما را از هم جدا کردهاند، دوباره ما را به هم بازگردانند. با انسانی کردن تکنولوژی، این فرصت طلایی را داریم که دوباره دربارهی ارتباطمانبا ماشینها فکر کنیم، و در نهایت، این که چگونه ما،به عنوان انسانها، با یکدیگر ارتباط برقرار میکنیم.
متشکرم.
(تشویق حضار)