چگونه می توانیم داده‌های دیجیتالی را در دی.‌ان.‌ای ذخیره کنیم؟

متن سخنرانی :
من می‌توانم تمام فیلم‌هایی که تا به‌ حالساخته‌ شده را در این تیوب بگنجانم. اگر شما قادر به دیدن آن نیستید،نکته همین است!
(خنده حضار)
قبل از اینکه بفهمیمچنین چیزی چطور ممکن است، درک ارزش این شاهکار اهمیت دارد. این روزها تمام اعمال و افکار ما، از طریق عکس‌ها و ویدئوها-- حتی فعالیت‌های تناسب انداممان-- به‌عنوان داده‌های دیجیتالی ذخیره می‌شوند. به‌جز تمام شدن حافظه تلفن‌هایمان، ما به‌ندرت درباره آثار دیجیتالی خودفکر می‌کنیم اما جامعه انسانی داده‌های بیشتری را در چند سال اخیر نسبت به تمام تاریخ بشری تولید کرده است.
داده‌های بزرگ به معضل بزرگی تبدیل شده است. ذخیره‌سازی دیجیتالی واقعاً گران‌قیمت است، و هیچ‌کدام از این دستگاه‌هایی که داریمآن‌چنان قادر به تحمل آزمون زمان نیستند. وب‌سایت عام‌المنفعه‌ی "Internet Archive"را در نظر بگیرید. که علاوه بر کتاب‌ها و فیلم‌ها، امکان دسترسی به صفحات وبی کهدر سال ۱۹۹۶ نوشته‌شده‌اند را فراهم می‌کند. حالا، این خیلی وسوسه‌انگیز است، اما تصمیم گرفتم به عقب برگردم وشروع فروتنانه وب‌سایت TED را ببینم. همان‌طور که ملاحظه می‌کنید،در ۳۰ سال گذشته تغییرات اندکی داشته است. و این کار، من رابه اولین سخنرانی TED، در ۱۹۸۴ هدایت کرد و تصادفاً یکی از مجریان شرکت سونی در حال توضیح دادننحوه عملکرد یک دیسک فشرده بود.
(خنده حضار)
توانایی عقب رفتن در زمان و دستیابی به این لحظهبسیار فوق‌العاده است. همچنین واقعاً شگفت‌آور است کهپس از ۳۰ سال، بعد از اولین سخنرانی TED، ما هنوز هم درباره ذخیره‌سازی دیجیتالی بحث می‌کنیم.
حال، اگر به یکی دیگر از وقایع۳۰ سال قبل نگاهی بیندازیم، شرکت IBM اولین سخت‌افزار جهان در سال ۱۹۵۶ را مطرح کرد. در اینجا دستگاه در مقابل تعدادی تماشاچیدر حال بارگیری برای انتقال است. این دستگاه توانایی نگه‌داریمعادل یک آهنگ MP3، و بیش از یک تن وزن داشت. و قیمتش به ازای هر مگابایت۱۰۰۰۰ دلار بود، گمان نمی‌کنم کسی از افراد این سالنعلاقه‌ای به خرید این دستگاه داشته باشد، مگر اینکه یک مجموعه‌دار باشد. اما این بهترین کاری بوده کهدر آن زمان قابل انجام بوده است.
ما در ذخیره‌سازی دادهراه درازی را طی کرده‌ایم. دستگاه‌ها به‌طور چشمگیری پیشرفت کرده‌اند. اما تمام رسانه‌ها درنهایت از بین می‌روندیا منسوخ می‌شوند. اگر امروز کسی برای تهیه نسخه پشتیبانبه شما یک درایو فلاپی بدهد، احتمالاً به آن‌ها عجیب‌وغریب نگاه کنید،شاید بخندید، اما چاره‌ای جزاستفاده از این شیء لعنتی ندارید. این دستگاه‌ها دیگر نمی‌توانندنیازهای ذخیره‌سازی ما را برآورده کنند، هرچند برخی از آن‌ها می‌توانندبا اهداف دیگری به کار گرفته شوند. تمام فناوری‌ها درنهایتمی‌میرند یا از بین می‌روند، و به همراه اطلاعات، تمام خاطرات ما هم از بین می‌روند. همچنان این توهم وجود داردکه مشکل ذخیره‌سازی حل شده است، اما درواقعیت، همه ما برای آنوجود خارجی قائل می‌شویم. ما نگران ذخیره‌سازیایمیل‌ها و عکس‌هایمان نیستیم. آن‌ها روی فضای ابری (Cloud) هستند.
اما در پشت‌صحنه،ذخیره‌سازی مشکل‌ساز شده است. نهایتاً، فضای ابری (Cloud)هم از تعدادی سخت‌افزار تولید شده است. اکنون، می‌توانیم بحث کنیم که بیشترین اطلاعات دیجیتال واقعاً مهم نیست. قطعاً می‌توانیم آن را حذف کنیم. اما چگونه می‌توانیم بفهمیمامروز واقعاً چه چیزی اهمیت دارد؟ ما در مورد تاریخ بشریچیزهای زیادی یاد گرفته‌ایم از نقش‌ها و نوشته‌های درون غارها، و از لوح‌های سنگی. ما زبان‌های سنگ روزتا (Rosetta Stone) رارمزگشایی کرده‌ایم. می‌دانید، با این‌ وجود،هرگز کل داستان را نخواهیم داشت. داده‌های ما، داستان ما است، حتی امروز بیشتر از قبل. ما رکوردهایمان را بر رویلوح‌های سنگی نخواهیم داشت. اما مجبور نیستیم انتخاب کنیمدر حال حاضر چه چیزی مهم است. برای ذخیره‌سازی همه این‌هاراهی وجود دارد. به نظر می‌رسد که از چند میلیارد سال قبل راه‌حلی برای این موضوع وجود داشته است، که الآن در این تیوب است.
دی.‌ان. ای قدیمی‌ترین ابزار ذخیره‌سازی طبیعت است. که حاوی تمام اطلاعات لازم برای تولید و بقای یک انسان است. اما چه چیزی دی.‌ان‌.ای را انقدر بزرگ می‌کند؟ خب به‌عنوان‌مثال بیایید به ژن خودمان نگاهی بیندازیم. اگر لازم بود تمام سه میلیارد حروف G،C،T، A ها را با فونت و فرمت استاندارد پرینت بگیریم، و سپس مجبور بهنگه‌داری از تمام آن کاغذها بودیم، ارتفاعی معادل ۱۳۰ متر داشت، چیزی بین مجسمه آزادی و اثر تاریخی واشنگتن. حال، اگر ما تمام این حروف G،C،T، A را به داده‌های دیجیتالو ۰ و ۱ تبدیل کنیم کلاً چند گیگ فضا اشغال می‌کند. و در هریک از سلول‌های بدن ما وجود دارد. هرکدام از ما بیش از ۳۰ هزار میلیاردسلول داریم. پس ایده را فهمیدید: DNA توان ذخیره‌سازی حجم زیادی از اطلاعاتدر فضایی بسیار محدود را دارد.
DNA همچنین بسیار بادوام است، و برای ذخیره‌سازی حتی به الکتریسیته نیاز ندارد. این را می‌دانیم چون دانشمندان دی.‌ان.ای انسان‌های باستانی را به دست آورده‌اند که صدها هزار سال قبل زندگی می‌کرده‌اند. یکی از آن‌ها مرد یخی بنام Ötzi است. که به نظر می‌رسد اهل اتریش است.
(خنده حضار)
وی در ارتفاعات حفاظت‌شده کوهستان‌های بین ایتالیاو اتریش کشف شده است. و به نظر می‌رسد که در اتریش امروزیخویشاوندان ژنتیکی زنده دارد. پس ممکن است یکی از شما عموزاده Ötzi باشد.
(خنده حضار)
نکته اینجاست که ما برای بازگردانی اطلاعاتشانس بهتری داریم آن هم از انسان‌های باستانی تا آنچه از یک تلفن قدیمی به دست بیاید. همچنین احتمال از دست دادنتوانایی خواندن دی.‌ان.ای نسبت به هرکدام از دستگاه‌های ساخته دست بشربسیار کمتر است هرکدام از انواع حافظه نیازمندروشی جدید برای بازخوانی اطلاعات است. همیشه می‌توانیم اطلاعات دی.‌ان.ای را بخوانیم. اگر بیشتر از این توالی ایجاد نکنیم،مشکلات بیشتری نسبت به نگرانی درباره ذخیره‌سازی داده‌هاپیش رو خواهیم داشت.
ذخیره داده‌ها روی دی.‌ان.ای جدید نیست. طبیعت این کار را برایچندین میلیارد سال انجام داده است. درواقع، هر موجود زندهیک دستگاه ذخیره دی.‌ان.ای است. اما ما چطور می‌توانیمداده‌ها را روی دی.‌ان.ای ذخیره کنیم؟ این شکل ۵۱ است. که اولین عکس از دی.‌ان.ای است، که حدوداً ۶۰ سال پیش ثبت شده است. که تقریباً مصادف با زمانی است کهاولین سخت‌افزار توسط IBM ارائه شد. بنابراین، درک ما از ذخیره‌سازی دیجیتالیو دی.‌ان.ای هم‌زمان باهم رشد کرده است. ابتدا در مورد توالی، یا خواندن دی.‌ان.ای، و خیلی زود درباره چطور نوشتن یا سنتز آن‌ها یاد گرفتیم. این کار بسیار شبیه این است کهچطور یک زبان جدید یاد می‌گیریم. و حالا توانایی داریم که دی.‌ان.ایرا بخوانیم، بنویسیم و کپی کنیم. همیشه در آزمایشگاهاین کار را انجام می‌دهیم. پس هر چیزی، واقعاً هر چیزی،که بتواند بصورت۰ و ۱ ذخیره شود، را می‌توان در دی.‌ان.ای ذخیره کرد.
برای اینکه چیزی مثل این عکسرا دیجیتالی ذخیره کنیم، ما آن را به بیت‌ها یاارقام دوتایی (صفر و یک) تبدیل می‌کنیم. هر پیکسل یک عکس سیاه‌وسفیدرا می‌توان۰ و ۱1 در نظر گرفت. مشابه چاپ حروف روی کاغذ توسط پرینتر جوهری،می‌توانیم دی.‌ان.ای را بنویسیم. فقط کافی است داده‌ها را،تمام آن ۰ و ۱ها را، به حروف G،C،T، A تبدیل کنیم. و سپس آن را به یک شرکت سنتز ارسال کنیم. پس کد را می‌نویسیم ومی‌توانیم آن را ذخیره کنیم، و وقتی بخواهیم داده‌ها را بازیابیکنیم، کافی است به آن توالی بدهیم.
حالا، قسمت جالب ماجرا انتخاب این است کهچه فایل‌هایی را در نظر بگیریم. ما دانشمندانی جدی هستیم، پس لازم بودکه برای آیندگان خوب، یک نسخه خطی را در نظر بگیریم. ما همچنین یک کارت هدیه آمازون۵۰ دلاری در نظر گرفتیم-- خیلی هیجان‌زده نشوید، چون تا الآنخرج شده است، کسی آن را رمزگشایی کرد-- به همین ترتیب یک سیستم در حال کار، یکی از اولین فیلم‌هایی که ساخته‌شده، و یک لوح پایونیر هم در نظر گرفتیم. شاید بعضی از شمااین را دیده باشید. این لوح تصاویری ازیک مرد و زن برهنه، و موقعیت تقریبی ما رادر منظومه شمسی نشان می‌دهد، تا در صورت رسیدن به موجودات فرازمینیپیامی تصویری از بشریت را به آن‌ها برسانند.
بعدازاینکه تصمیم گرفتیمچه چیزهایی را می‌خواهیم کد نویسی کنیم، داده‌ها را طبقه‌بندی کرده، و ۰ و ۱ ها را به حروفG،C،T، A تبدیل می‌کنیم، و سپس این فایل رابه شرکت سنتز ارسال می‌کنیم. و این چیزی است که به دست آوردیم. فایل‌های ما در این تیوب قرار داشتند. تنها کافی بود که به آن توالی بدهیم. تمام این‌ها بسیار ساده به نظر می‌رسند، اما تفاوت بینیک ایده واقعاً جذاب و سرگرم‌کننده، و چیزی که واقعاًبتوانیم از آن استفاده کنیم، غلبه بر این چالش‌های حقیقی است.
حال، هرچند دی.‌ان.ای نسبت بههر دستگاه ساخته دست بشر قدرتمندتر است، اما بی‌نقص نیست. البته که نقاط ضعفی دارد. پس ما پیام خود رابا توالی یابی دی.‌ان.ای بازیابی می‌کنیم، و تک‌تک داده‌های زمانی بازیابی می‌شوند، دی.‌ان.ای را از دست می‌دهیم. این جزئی از فرایند توالی یابی است. ما نمی‌خواهیم از داده‌ها بگذریم، اما خوشبختانه، برای کپی کردن دی.‌ان.اییک‌ راه هست که حتی ارزان‌تر و آسان‌تراز سنتز کردن آن است. روشی را برای تهیه ۲۰۰ هزار میلیارد کپیاز فایل‌های‌مان امتحان کرده‌ایم، و تمام داده‌ها رابدون خطا بازیابی کرده‌ایم. بنابراین، توالی دهی خطاهاییرا هم در دی.‌ان.ای ما ایجاد می‌کند، خطاهایی در G،C،T، A ها. طبیعت برای این مشکلدر سلول‌های ما راه‌حلی دارد. اما داده‌های ما در دی.‌ان.ای سنتز شدهداخل تیوب ذخیره شده است، پس ما برای غلبه این مسئلهمجبور بودیم راه‌حل خودمان را بیابیم. ما تصمیم گرفتیم از الگوریتمی کهبرای پخش ویدئو استفاده می‌شود، بهره ببریم. وقتی یک ویدئو را پخش می‌کنید، اساساً در تلاش هستید تاویدئوی اصلی، فایل اصلی، را بازیابی کنید. وقتی ما تلاش می‌کنیمکه فایل اصلی را بازیابی کنیم، داریم توالی دهی می‌کنیم. اما درواقع، هردوی این فرایندها،درباره بازیابی تعداد کافی ۰ و ۱ است تا داده‌هایمان رامجدداً کنار هم بچینیم. و بنابراین، به خاطر استراتژی کد نویسی‌مان، می‌توانستیم تمام داده‌هایمانرا طوری بسته‌بندی کنیم که به ما امکان ایجادمیلیون‌ها وهزاران میلیارد را کپی دهد و درعین‌حال همیشه بتوانیمتمام فایل‌هایمان را پس بگیریم.
این فیلمی است که کدنویسی کرده‌ایم. که یکی از اولین فیلم‌های ساخته‌شده است، و اکنون اولین فیلمی است که بیش از ۲۰۰ هزار میلیارد بار روی دی.‌ان.‌ای کپی شده.
بافاصله کمی بعد از انتشار مطالعاتمان، در رویداد "هرچه می‌خواهی از من بپرس"وب‌سایت reddit شرکت کردیم. اگر شما یکی از همکاران ما باشید،با این وب‌سایت بسیار آشنا هستید. بیشتر سؤال‌ها متفکرانه بودند. و بعضی خنده‌دار... برای مثال، کاربری می‌خواست بداند کی می‌توانددرایو لمسی واقعی خود را داشته باشد. حالا، مسئله این است، الان دی.‌ان.‌ای هر چیز لازم برای تبدیل مابه کسی که هستیم، را ذخیره می‌کند. ذخیره داده‌ها روی تمام فایل‌هایتانسنتز شده داخل یک تیوب بسیار ایمن‌تر است.
الان مسلماً نوشتن وخواندن دادهروی دی.‌ان.ای نسبت به ذخیره تمام فایل‌هایتان بر روی سخت‌افزار زمان بیشتری می‌برد. پس، ابتدا باید برذخیره‌سازی طولانی‌مدت تمرکز کنیم. اغلب داده‌ها زودگذر هستند. فهمیدن آنچه امروز مهم است، یا آنچه برای نسل بعد اهمیت خواهد داشت،واقعاً سخت است. اما نکته این است کهمجبور نیستیم همین امروز انتخاب کنیم. یونسکو برنامه‌ای عالیبه نام "حافظه جهان" دارد. این برنامه برای حفظموارد تاریخی‌ای ایجاد شده است که برای تمام بشریت ارزشمند هستند. از آیتم‌هایی برای افزوده شدنبه این مجموعه نام برده شده است، ازجمله فیلمی که ما آن را کد نویسی کردیم. در شرایطی که این برنامه یک راه فوق‌العادهبرای حفظ میراث انسانی است، اما الزامی برای انتخاب آن وجود ندارد. در عوض پرسش از نسل حاضر-ما- که چه چیزی ممکن است در آینده اهمیت داشته باشد، می‌توانیم همه‌چیز را دردی.‌ان.ای ذخیره کنیم.
ذخیره‌سازی نه ‌تنهافقط در مورد تعداد بایت‌ها، بلکه درباره این است که ما داده‌ها رابا چه کیفیتی ذخیره و بازیابی می‌کنیم. همیشه تنشی وجود داشته استبین مقدار داده‌ای که می‌توانیم تولید کنیم، و چقدر از آن رامی‌توانیم بازیابی و چقدر را می‌توانیم ذخیره‌سازی کنیم، هر پیشرفتی در نوشتن داده‌ها،نیازمند روشی جدید برای خواندن آن‌هاست. ما دیگر نمی‌توانیمرسانه‌های قدیمی را بخوانیم. چند نفر از شما روی لپ‌تاپتاندیسک درایو دارید؟ چه برسد به درایو فلاپی! این اتفاق برای دی.‌ان.ایهرگز روی نخواهد داد. تا زمانی که ما هستیم، دی.‌ان.اینیز وجود دارد و راهی خواهیم یافت تا آن را توالی‌دهی کنیم.
بایگانی کردن جهان اطراف،بخشی از ذات انسان است. این پیشرفتی است که ما طی ۶۰ سال،از زمان شروع به شناخت دی.‌ان.ای، در ذخیره‌سازی دیجیتالی به آن دست‌یافته‌ایم. هنوز درزمینهٔ توالی‌های دی.‌ان.ای،در نصف این زمان به پیشرفت مشابهی دست‌یافتیم و تا زمانی که باشیم،دی.‌ان.ای هرگز منسوخ نخواهد شد.
متشکرم.
(تشویق حضار)

دیدگاه شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *