هاد لیپسون (Hod Lipson) روبات های خودآگاه می سازد
متن سخنرانی :
خب، پس روبات ها کجا هستند؟ 40 سال است که به ما می گویند روبات ها به زودی خواهند آمد. خیلی زود آنها همه کار برای ما انجام خواهند داد. آنها آشپزی خواهد کرد، گردگیری، خرید، ساخت. اما آنها اینجا نیستند. در عین حال، مهاجر های غیر قانونی داریم که همه ی کار ها را انجام می دهند. اما ما هیچ روباتی نداریم. پس ما چه کار می توانیم بکنیم؟ چه می توانیم بگوییم؟ خب من می خواهم دیدگاه دیگری را به شما نشان بدهم از این که چگونه ما میتوانیم به این مسائل از بعد دیگری نگاه کنیم. این یک تصویر اشعه ایکس است از یک سوسک و یک ساعت سوئیسی سال 88. به آن نگاه کنید -- آن چه در آن زمان درست بود امروز مسلماً همچنان درست است. ما همچنان می توانیم قطعات را بسازیم، می توانیم قطعات درست را بسازیم، می توانیم مداری با قدرت محاسباتی مناسب درست کنیم، اما در واقع نمی توانیم آنها را به هم بچسبانیم تا چیزی بسازیم به طوری که واقعا مثل این سیستم ها کار کند و قابلیت انطباق داشته باشد.پس بگذارید به آن از یک زاویه ی دیگر نگاه کنیم. بگذارید بهترین طراح را فرابخوانیم، مادر همه ی طراح ها: بگذارید ببینیم تکامل برای ما چه کار می تواند بکند. پس ما شروع کردیم -- ما سوپی از عناصر اولیه ساختیم با تعداد بسیار زیادی از قطعات روبات ها: با میله ها، با موتور ها، با نورون ها. همه ی این ها را کنار هم گذاشتیم، و همه ی این ها را تحت انتخاب طبیعی قرار دادیم. تحت جهش های ساختاری. و به چیز ها بر اساس این که چقدر خوب می توانند جلو بروند پاداش می دادیم. یک کار بسیار ساده. خیلی جالب است ببینید که چه چیز هایی از آب درآمدند!
خب اگر ملاحظه کنید، ماشین های بسیار متفاوتی را میبینید که از این طرح منتج شدند. همه ی آنها حرکت می کنند، همه ی آنها به طریقی می خزند، و در سمت راست می بینید که ... ما درعمل بعضی از این ها را ساختیم، و آنها در عمل هم کار می کنند. اینها روبات های خیلی خارق العاده ای نیستند، اما این ها رشد کرده اند تا دقیقا همان کاری را بکنند که برای آن به آنها پاداش داده بودیم:
به سمت جلو حرکت کنند. خب همه ی آنها در شبیه سازی انجام شده بود، اما ما می توانیم چنین کاری را در یک ماشین واقعی هم انجام دهیم. این یک روبات واقعی است که در آن ما یک تعداد مغز قرار دادیم که روی ماشین با هم رقابت می کنند ، و رشد می کنند. آن مانند مسابقه ی گاوهای وحشی است: همه ی آنها می توانند یک بار سوار ماشین شوند، و آنها بر اساس این که چقدر سریع و چه مسافتی بتوانند باعث جلو رفتن ماشین شوند پاداش می گیرند. و می بینید که این روبات ها آماده نیستند تا کنترل جهان را به دست بگیرند، هنوز. اما! آنها کم کم یاد میگیرند چگونه به جلو حرکت کنند، و آنها این کار را کاملا خودمختار انجام می دهند.
پس در این دو مثال، ما درواقع ماشین هایی داشتیم که در شبیه سازی یاد گرفتند که چگونه حرکت کنند، و ماشین هایی که یاد گرفتند که چگونه در دنیای واقعی حرکت کنند. اما من می خواهم روال دیگری را به شما نشان بدهم، منظورم این روبات است، همین جا، که چهار تا پا دارد ... هشت موتور دارد، چهار تا در زانو ها و چهار تا در باسن. دو تا هم حسگر شیب سنج هم دارد که به ماشین می گوید به کدام جهت کج شده است.
اما این ماشین نمی داند چه شکلی است. شما به آن نگاه می کنید و می بینید که چهار تا پا دارد، ماشین نمی داند آیا یک مار است، یا یک درخت است و یا ...، هیچ ایده ای ندارد که چه شکلی است، اما می خواهد سعی کند تا آن را بفهمد. در ابتدا چند حرکت تصادفی انجام می دهد، و بعد سعی می کند بفهمد چه شکلی ممکن است باشد -- و می بینید که چیز های زیادی از ذهنش عبور می کند، تعداد زیادی مدل هایی از خودش که سعی می کنند ارتباط ها را توضیح دهند ارتباط های میان حرکت ها و چیز های حس شده -- و بعد سعی می کند حرکتی را انجام دهد که بیشترین تضاد را با پیش بینی های مدل های موجود داشته باشد. مانند یک دانشمند در یک آزمایشگاه. بعد آن حرکت را انجام می دهد سعی می کند توضیحی برای آن بیابد، و برخی از مدل های خودش را حذف کند.
این آخرین چرخه است، و می بینید که آن بسیار خوب توانشته تشخیص بدهد چه شکلی است و رمانی که ان بداند چه شکلی دارد می تواند از ان استفاده کند و الگویی از حرکت ها را ایجاد کند. خب، این چیزی که اینجا می بینید چند ماشین است -- و یک الگوی حرکت. ما امیدوار بودیم که آن نوعی حرکت خبیثانه شبیه راه رفتن عنکبوت داشته باشد، اما به جای آن ، او این روش حرکت لنگ لنگ را تولید کرده است تا به جلو برود.
اما وقتی به آن نگاه می کنید، باید به خاطر داشته باشید که این ماشین هیچ تمرین فیزیکی نکرد که ببیند چگونه به جلو می رود، و حتی این که او هیچ مدلی از خودش را در اختیار نداشته است. تقریبا می شود گفت او خودش فهمیده است چه شکلی است، و چگونه می تواند به جلو برود، ودر نهایت آن را امتحان کرده است. (تشویق)
ما به سوی ایده ی متفاوتی جلو می رویم. آن همان چیزی است که اتفاق افتاده است وقتی ما چند تا -- آن چیزی است که اتفاق افتاده است وقتی شما چند تا -- خب، خب، خب -- (خنده) -- آنها همدیگر رو دوست ندارند. یک روبات متفاوت دیگر هم هست. این اتفاقی است که وقتی روبات ها در واقع برای کاری که می کنند پاداش می گیرند. اما اگر برای هیچ چیزی به آنها پاداش ندهید چه اتفاقی می افتد؟
خب ما این مکعب ها را داریم، مانند تصویر اینجا. مکعب می تواند روی محور بچرخد و یا این که روی ضلعش جا به جا شود، ما 1000 تا از این مکعب ها را در یک معجون می ریزیم -- این شبیه سازی است -- و برای هیچ چیزی به آنها پاداش نمی دهیم، فقط به آنها اجازه می دهیم بچرخند. به این معجون انرژی وارد می کنیم و می بینیم که بعد از چند جهش چه اتفاقی می افتد. در ابتدا، هیچ اتفاقی نمی افتد، آنها فقط در حال چرخیدن حول و حوش خودشان هستند. اما پس از زمان کوتاهی، این آبی ها را مشاهده می کنید در سمت راست آنها شروع به رشد قلمرو خود می کنند.
آنها شروع به تولید نوع خود می کنند. پس در شرایط نبود پاداش، پاداش ذاتی تولید هم نوع خود است. و ما در واقع چند تا از این ها را ساخته ایم، و این بخشی از یک روبات بزرگ تر است که از این مکعب ها ساخته شده است، این یک نمای سریع شده است، که در آن می بینید که روبات در واقع در حال طی مرحله ای از تولید نوع خود است. پس شما به آن مواد اولیه ی بیشتری می دهید -- مکعب در این نمونه -- و انرژی بیشتر، و او می تواند روبات دیگری مانند خود را بسازد. البته این ماشین بسیار ساده و ابتدایی است، اما ما در حال کار بر روی نمونه ی بسیار ریز این ها هستیم، و امیدواریم که این مکعب ها مانند پودری باشند که بتوان آنها را در همه جا ریخت.
خب، پس ما چی می توانیم یاد بگیریم؟ این روبات ها مسلما خودشان خیلی مفید نیستند، اما می توانند چیزی را به ما بیاموزند این که چگونه می توانیم روبات های بهتری بسازیم، و شاید این که چطور انسان ها، حیوانات، مدل خود را می سازند و یاد میگیرند. و یکی از چیز هایی که من فکر می کنم مهم است این است که ما باید از از این ایده جدا شویم این که ماشین ها را دستی طراحی کنیم، به جای آن باید به آنها اجازه داد تا رشد کنند و یاد بگیرند، مانند بچه ها، و احتمالا این همان راهی است که ما را به آن هدف می رساند. متشکرم. (تشویق)