چگونه می توانیم دادههای دیجیتالی را در دی.ان.ای ذخیره کنیم؟
متن سخنرانی :
من میتوانم تمام فیلمهایی که تا به حالساخته شده را در این تیوب بگنجانم. اگر شما قادر به دیدن آن نیستید،نکته همین است!(خنده حضار)
قبل از اینکه بفهمیمچنین چیزی چطور ممکن است، درک ارزش این شاهکار اهمیت دارد. این روزها تمام اعمال و افکار ما، از طریق عکسها و ویدئوها-- حتی فعالیتهای تناسب انداممان-- بهعنوان دادههای دیجیتالی ذخیره میشوند. بهجز تمام شدن حافظه تلفنهایمان، ما بهندرت درباره آثار دیجیتالی خودفکر میکنیم اما جامعه انسانی دادههای بیشتری را در چند سال اخیر نسبت به تمام تاریخ بشری تولید کرده است.
دادههای بزرگ به معضل بزرگی تبدیل شده است. ذخیرهسازی دیجیتالی واقعاً گرانقیمت است، و هیچکدام از این دستگاههایی که داریمآنچنان قادر به تحمل آزمون زمان نیستند. وبسایت عامالمنفعهی "Internet Archive"را در نظر بگیرید. که علاوه بر کتابها و فیلمها، امکان دسترسی به صفحات وبی کهدر سال ۱۹۹۶ نوشتهشدهاند را فراهم میکند. حالا، این خیلی وسوسهانگیز است، اما تصمیم گرفتم به عقب برگردم وشروع فروتنانه وبسایت TED را ببینم. همانطور که ملاحظه میکنید،در ۳۰ سال گذشته تغییرات اندکی داشته است. و این کار، من رابه اولین سخنرانی TED، در ۱۹۸۴ هدایت کرد و تصادفاً یکی از مجریان شرکت سونی در حال توضیح دادننحوه عملکرد یک دیسک فشرده بود.
(خنده حضار)
توانایی عقب رفتن در زمان و دستیابی به این لحظهبسیار فوقالعاده است. همچنین واقعاً شگفتآور است کهپس از ۳۰ سال، بعد از اولین سخنرانی TED، ما هنوز هم درباره ذخیرهسازی دیجیتالی بحث میکنیم.
حال، اگر به یکی دیگر از وقایع۳۰ سال قبل نگاهی بیندازیم، شرکت IBM اولین سختافزار جهان در سال ۱۹۵۶ را مطرح کرد. در اینجا دستگاه در مقابل تعدادی تماشاچیدر حال بارگیری برای انتقال است. این دستگاه توانایی نگهداریمعادل یک آهنگ MP3، و بیش از یک تن وزن داشت. و قیمتش به ازای هر مگابایت۱۰۰۰۰ دلار بود، گمان نمیکنم کسی از افراد این سالنعلاقهای به خرید این دستگاه داشته باشد، مگر اینکه یک مجموعهدار باشد. اما این بهترین کاری بوده کهدر آن زمان قابل انجام بوده است.
ما در ذخیرهسازی دادهراه درازی را طی کردهایم. دستگاهها بهطور چشمگیری پیشرفت کردهاند. اما تمام رسانهها درنهایت از بین میروندیا منسوخ میشوند. اگر امروز کسی برای تهیه نسخه پشتیبانبه شما یک درایو فلاپی بدهد، احتمالاً به آنها عجیبوغریب نگاه کنید،شاید بخندید، اما چارهای جزاستفاده از این شیء لعنتی ندارید. این دستگاهها دیگر نمیتوانندنیازهای ذخیرهسازی ما را برآورده کنند، هرچند برخی از آنها میتوانندبا اهداف دیگری به کار گرفته شوند. تمام فناوریها درنهایتمیمیرند یا از بین میروند، و به همراه اطلاعات، تمام خاطرات ما هم از بین میروند. همچنان این توهم وجود داردکه مشکل ذخیرهسازی حل شده است، اما درواقعیت، همه ما برای آنوجود خارجی قائل میشویم. ما نگران ذخیرهسازیایمیلها و عکسهایمان نیستیم. آنها روی فضای ابری (Cloud) هستند.
اما در پشتصحنه،ذخیرهسازی مشکلساز شده است. نهایتاً، فضای ابری (Cloud)هم از تعدادی سختافزار تولید شده است. اکنون، میتوانیم بحث کنیم که بیشترین اطلاعات دیجیتال واقعاً مهم نیست. قطعاً میتوانیم آن را حذف کنیم. اما چگونه میتوانیم بفهمیمامروز واقعاً چه چیزی اهمیت دارد؟ ما در مورد تاریخ بشریچیزهای زیادی یاد گرفتهایم از نقشها و نوشتههای درون غارها، و از لوحهای سنگی. ما زبانهای سنگ روزتا (Rosetta Stone) رارمزگشایی کردهایم. میدانید، با این وجود،هرگز کل داستان را نخواهیم داشت. دادههای ما، داستان ما است، حتی امروز بیشتر از قبل. ما رکوردهایمان را بر رویلوحهای سنگی نخواهیم داشت. اما مجبور نیستیم انتخاب کنیمدر حال حاضر چه چیزی مهم است. برای ذخیرهسازی همه اینهاراهی وجود دارد. به نظر میرسد که از چند میلیارد سال قبل راهحلی برای این موضوع وجود داشته است، که الآن در این تیوب است.
دی.ان. ای قدیمیترین ابزار ذخیرهسازی طبیعت است. که حاوی تمام اطلاعات لازم برای تولید و بقای یک انسان است. اما چه چیزی دی.ان.ای را انقدر بزرگ میکند؟ خب بهعنوانمثال بیایید به ژن خودمان نگاهی بیندازیم. اگر لازم بود تمام سه میلیارد حروف G،C،T، A ها را با فونت و فرمت استاندارد پرینت بگیریم، و سپس مجبور بهنگهداری از تمام آن کاغذها بودیم، ارتفاعی معادل ۱۳۰ متر داشت، چیزی بین مجسمه آزادی و اثر تاریخی واشنگتن. حال، اگر ما تمام این حروف G،C،T، A را به دادههای دیجیتالو ۰ و ۱ تبدیل کنیم کلاً چند گیگ فضا اشغال میکند. و در هریک از سلولهای بدن ما وجود دارد. هرکدام از ما بیش از ۳۰ هزار میلیاردسلول داریم. پس ایده را فهمیدید: DNA توان ذخیرهسازی حجم زیادی از اطلاعاتدر فضایی بسیار محدود را دارد.
DNA همچنین بسیار بادوام است، و برای ذخیرهسازی حتی به الکتریسیته نیاز ندارد. این را میدانیم چون دانشمندان دی.ان.ای انسانهای باستانی را به دست آوردهاند که صدها هزار سال قبل زندگی میکردهاند. یکی از آنها مرد یخی بنام Ötzi است. که به نظر میرسد اهل اتریش است.
(خنده حضار)
وی در ارتفاعات حفاظتشده کوهستانهای بین ایتالیاو اتریش کشف شده است. و به نظر میرسد که در اتریش امروزیخویشاوندان ژنتیکی زنده دارد. پس ممکن است یکی از شما عموزاده Ötzi باشد.
(خنده حضار)
نکته اینجاست که ما برای بازگردانی اطلاعاتشانس بهتری داریم آن هم از انسانهای باستانی تا آنچه از یک تلفن قدیمی به دست بیاید. همچنین احتمال از دست دادنتوانایی خواندن دی.ان.ای نسبت به هرکدام از دستگاههای ساخته دست بشربسیار کمتر است هرکدام از انواع حافظه نیازمندروشی جدید برای بازخوانی اطلاعات است. همیشه میتوانیم اطلاعات دی.ان.ای را بخوانیم. اگر بیشتر از این توالی ایجاد نکنیم،مشکلات بیشتری نسبت به نگرانی درباره ذخیرهسازی دادههاپیش رو خواهیم داشت.
ذخیره دادهها روی دی.ان.ای جدید نیست. طبیعت این کار را برایچندین میلیارد سال انجام داده است. درواقع، هر موجود زندهیک دستگاه ذخیره دی.ان.ای است. اما ما چطور میتوانیمدادهها را روی دی.ان.ای ذخیره کنیم؟ این شکل ۵۱ است. که اولین عکس از دی.ان.ای است، که حدوداً ۶۰ سال پیش ثبت شده است. که تقریباً مصادف با زمانی است کهاولین سختافزار توسط IBM ارائه شد. بنابراین، درک ما از ذخیرهسازی دیجیتالیو دی.ان.ای همزمان باهم رشد کرده است. ابتدا در مورد توالی، یا خواندن دی.ان.ای، و خیلی زود درباره چطور نوشتن یا سنتز آنها یاد گرفتیم. این کار بسیار شبیه این است کهچطور یک زبان جدید یاد میگیریم. و حالا توانایی داریم که دی.ان.ایرا بخوانیم، بنویسیم و کپی کنیم. همیشه در آزمایشگاهاین کار را انجام میدهیم. پس هر چیزی، واقعاً هر چیزی،که بتواند بصورت۰ و ۱ ذخیره شود، را میتوان در دی.ان.ای ذخیره کرد.
برای اینکه چیزی مثل این عکسرا دیجیتالی ذخیره کنیم، ما آن را به بیتها یاارقام دوتایی (صفر و یک) تبدیل میکنیم. هر پیکسل یک عکس سیاهوسفیدرا میتوان۰ و ۱1 در نظر گرفت. مشابه چاپ حروف روی کاغذ توسط پرینتر جوهری،میتوانیم دی.ان.ای را بنویسیم. فقط کافی است دادهها را،تمام آن ۰ و ۱ها را، به حروف G،C،T، A تبدیل کنیم. و سپس آن را به یک شرکت سنتز ارسال کنیم. پس کد را مینویسیم ومیتوانیم آن را ذخیره کنیم، و وقتی بخواهیم دادهها را بازیابیکنیم، کافی است به آن توالی بدهیم.
حالا، قسمت جالب ماجرا انتخاب این است کهچه فایلهایی را در نظر بگیریم. ما دانشمندانی جدی هستیم، پس لازم بودکه برای آیندگان خوب، یک نسخه خطی را در نظر بگیریم. ما همچنین یک کارت هدیه آمازون۵۰ دلاری در نظر گرفتیم-- خیلی هیجانزده نشوید، چون تا الآنخرج شده است، کسی آن را رمزگشایی کرد-- به همین ترتیب یک سیستم در حال کار، یکی از اولین فیلمهایی که ساختهشده، و یک لوح پایونیر هم در نظر گرفتیم. شاید بعضی از شمااین را دیده باشید. این لوح تصاویری ازیک مرد و زن برهنه، و موقعیت تقریبی ما رادر منظومه شمسی نشان میدهد، تا در صورت رسیدن به موجودات فرازمینیپیامی تصویری از بشریت را به آنها برسانند.
بعدازاینکه تصمیم گرفتیمچه چیزهایی را میخواهیم کد نویسی کنیم، دادهها را طبقهبندی کرده، و ۰ و ۱ ها را به حروفG،C،T، A تبدیل میکنیم، و سپس این فایل رابه شرکت سنتز ارسال میکنیم. و این چیزی است که به دست آوردیم. فایلهای ما در این تیوب قرار داشتند. تنها کافی بود که به آن توالی بدهیم. تمام اینها بسیار ساده به نظر میرسند، اما تفاوت بینیک ایده واقعاً جذاب و سرگرمکننده، و چیزی که واقعاًبتوانیم از آن استفاده کنیم، غلبه بر این چالشهای حقیقی است.
حال، هرچند دی.ان.ای نسبت بههر دستگاه ساخته دست بشر قدرتمندتر است، اما بینقص نیست. البته که نقاط ضعفی دارد. پس ما پیام خود رابا توالی یابی دی.ان.ای بازیابی میکنیم، و تکتک دادههای زمانی بازیابی میشوند، دی.ان.ای را از دست میدهیم. این جزئی از فرایند توالی یابی است. ما نمیخواهیم از دادهها بگذریم، اما خوشبختانه، برای کپی کردن دی.ان.اییک راه هست که حتی ارزانتر و آسانتراز سنتز کردن آن است. روشی را برای تهیه ۲۰۰ هزار میلیارد کپیاز فایلهایمان امتحان کردهایم، و تمام دادهها رابدون خطا بازیابی کردهایم. بنابراین، توالی دهی خطاهاییرا هم در دی.ان.ای ما ایجاد میکند، خطاهایی در G،C،T، A ها. طبیعت برای این مشکلدر سلولهای ما راهحلی دارد. اما دادههای ما در دی.ان.ای سنتز شدهداخل تیوب ذخیره شده است، پس ما برای غلبه این مسئلهمجبور بودیم راهحل خودمان را بیابیم. ما تصمیم گرفتیم از الگوریتمی کهبرای پخش ویدئو استفاده میشود، بهره ببریم. وقتی یک ویدئو را پخش میکنید، اساساً در تلاش هستید تاویدئوی اصلی، فایل اصلی، را بازیابی کنید. وقتی ما تلاش میکنیمکه فایل اصلی را بازیابی کنیم، داریم توالی دهی میکنیم. اما درواقع، هردوی این فرایندها،درباره بازیابی تعداد کافی ۰ و ۱ است تا دادههایمان رامجدداً کنار هم بچینیم. و بنابراین، به خاطر استراتژی کد نویسیمان، میتوانستیم تمام دادههایمانرا طوری بستهبندی کنیم که به ما امکان ایجادمیلیونها وهزاران میلیارد را کپی دهد و درعینحال همیشه بتوانیمتمام فایلهایمان را پس بگیریم.
این فیلمی است که کدنویسی کردهایم. که یکی از اولین فیلمهای ساختهشده است، و اکنون اولین فیلمی است که بیش از ۲۰۰ هزار میلیارد بار روی دی.ان.ای کپی شده.
بافاصله کمی بعد از انتشار مطالعاتمان، در رویداد "هرچه میخواهی از من بپرس"وبسایت reddit شرکت کردیم. اگر شما یکی از همکاران ما باشید،با این وبسایت بسیار آشنا هستید. بیشتر سؤالها متفکرانه بودند. و بعضی خندهدار... برای مثال، کاربری میخواست بداند کی میتوانددرایو لمسی واقعی خود را داشته باشد. حالا، مسئله این است، الان دی.ان.ای هر چیز لازم برای تبدیل مابه کسی که هستیم، را ذخیره میکند. ذخیره دادهها روی تمام فایلهایتانسنتز شده داخل یک تیوب بسیار ایمنتر است.
الان مسلماً نوشتن وخواندن دادهروی دی.ان.ای نسبت به ذخیره تمام فایلهایتان بر روی سختافزار زمان بیشتری میبرد. پس، ابتدا باید برذخیرهسازی طولانیمدت تمرکز کنیم. اغلب دادهها زودگذر هستند. فهمیدن آنچه امروز مهم است، یا آنچه برای نسل بعد اهمیت خواهد داشت،واقعاً سخت است. اما نکته این است کهمجبور نیستیم همین امروز انتخاب کنیم. یونسکو برنامهای عالیبه نام "حافظه جهان" دارد. این برنامه برای حفظموارد تاریخیای ایجاد شده است که برای تمام بشریت ارزشمند هستند. از آیتمهایی برای افزوده شدنبه این مجموعه نام برده شده است، ازجمله فیلمی که ما آن را کد نویسی کردیم. در شرایطی که این برنامه یک راه فوقالعادهبرای حفظ میراث انسانی است، اما الزامی برای انتخاب آن وجود ندارد. در عوض پرسش از نسل حاضر-ما- که چه چیزی ممکن است در آینده اهمیت داشته باشد، میتوانیم همهچیز را دردی.ان.ای ذخیره کنیم.
ذخیرهسازی نه تنهافقط در مورد تعداد بایتها، بلکه درباره این است که ما دادهها رابا چه کیفیتی ذخیره و بازیابی میکنیم. همیشه تنشی وجود داشته استبین مقدار دادهای که میتوانیم تولید کنیم، و چقدر از آن رامیتوانیم بازیابی و چقدر را میتوانیم ذخیرهسازی کنیم، هر پیشرفتی در نوشتن دادهها،نیازمند روشی جدید برای خواندن آنهاست. ما دیگر نمیتوانیمرسانههای قدیمی را بخوانیم. چند نفر از شما روی لپتاپتاندیسک درایو دارید؟ چه برسد به درایو فلاپی! این اتفاق برای دی.ان.ایهرگز روی نخواهد داد. تا زمانی که ما هستیم، دی.ان.اینیز وجود دارد و راهی خواهیم یافت تا آن را توالیدهی کنیم.
بایگانی کردن جهان اطراف،بخشی از ذات انسان است. این پیشرفتی است که ما طی ۶۰ سال،از زمان شروع به شناخت دی.ان.ای، در ذخیرهسازی دیجیتالی به آن دستیافتهایم. هنوز درزمینهٔ توالیهای دی.ان.ای،در نصف این زمان به پیشرفت مشابهی دستیافتیم و تا زمانی که باشیم،دی.ان.ای هرگز منسوخ نخواهد شد.
متشکرم.
(تشویق حضار)