من میتوانم تمام فیلمهایی که تا به حال ساخته شده را در این تیوب بگنجانم. اگر شما قادر به دیدن آن نیستید، نکته همین است!
قبل از اینکه بفهمیم چنین چیزی چطور ممکن است، درک ارزش این شاهکار اهمیت دارد. این روزها تمام اعمال و افکار ما، از طریق عکسها و ویدئوها– حتی فعالیتهای تناسب انداممان– بهعنوان دادههای دیجیتالی ذخیره میشوند. بهجز تمام شدن حافظه تلفنهایمان، ما بهندرت درباره آثار دیجیتالی خود فکر میکنیم اما جامعه انسانی دادههای بیشتری را در چند سال اخیر نسبت به تمام تاریخ بشری تولید کرده است.
دادههای بزرگ به معضل بزرگی تبدیل شده است. ذخیرهسازی دیجیتالی واقعاً گرانقیمت است، و هیچکدام از این دستگاههایی که داریم آنچنان قادر به تحمل آزمون زمان نیستند. وبسایت عامالمنفعهی “Internet Archive” را در نظر بگیرید. که علاوه بر کتابها و فیلمها، امکان دسترسی به صفحات وبی که در سال ۱۹۹۶ نوشتهشدهاند را فراهم میکند. حالا، این خیلی وسوسهانگیز است، اما تصمیم گرفتم به عقب برگردم و شروع فروتنانه وبسایت TED را ببینم. همانطور که ملاحظه میکنید، در ۳۰ سال گذشته تغییرات اندکی داشته است. و این کار، من را به اولین سخنرانی TED، در ۱۹۸۴ هدایت کرد و تصادفاً یکی از مجریان شرکت سونی در حال توضیح دادن نحوه عملکرد یک دیسک فشرده بود.
توانایی عقب رفتن در زمان و دستیابی به این لحظه بسیار فوقالعاده است. همچنین واقعاً شگفتآور است که پس از ۳۰ سال، بعد از اولین سخنرانی TED، ما هنوز هم درباره ذخیرهسازی دیجیتالی بحث میکنیم.
حال، اگر به یکی دیگر از وقایع ۳۰ سال قبل نگاهی بیندازیم، شرکت IBM اولین سختافزار جهان در سال ۱۹۵۶ را مطرح کرد. در اینجا دستگاه در مقابل تعدادی تماشاچی در حال بارگیری برای انتقال است. این دستگاه توانایی نگهداری معادل یک آهنگ MP3، و بیش از یک تن وزن داشت. و قیمتش به ازای هر مگابایت ۱۰۰۰۰ دلار بود، گمان نمیکنم کسی از افراد این سالن علاقهای به خرید این دستگاه داشته باشد، مگر اینکه یک مجموعهدار باشد. اما این بهترین کاری بوده که در آن زمان قابل انجام بوده است.
ما در ذخیرهسازی داده راه درازی را طی کردهایم. دستگاهها بهطور چشمگیری پیشرفت کردهاند. اما تمام رسانهها درنهایت از بین میروند یا منسوخ میشوند. اگر امروز کسی برای تهیه نسخه پشتیبان به شما یک درایو فلاپی بدهد، احتمالاً به آنها عجیبوغریب نگاه کنید، شاید بخندید، اما چارهای جز استفاده از این شیء لعنتی ندارید. این دستگاهها دیگر نمیتوانند نیازهای ذخیرهسازی ما را برآورده کنند، هرچند برخی از آنها میتوانند با اهداف دیگری به کار گرفته شوند. تمام فناوریها درنهایت میمیرند یا از بین میروند، و به همراه اطلاعات، تمام خاطرات ما هم از بین میروند. همچنان این توهم وجود دارد که مشکل ذخیرهسازی حل شده است، اما درواقعیت، همه ما برای آن وجود خارجی قائل میشویم. ما نگران ذخیرهسازی ایمیلها و عکسهایمان نیستیم. آنها روی فضای ابری (Cloud) هستند.
اما در پشتصحنه، ذخیرهسازی مشکلساز شده است. نهایتاً، فضای ابری (Cloud) هم از تعدادی سختافزار تولید شده است. اکنون، میتوانیم بحث کنیم که بیشترین اطلاعات دیجیتال واقعاً مهم نیست. قطعاً میتوانیم آن را حذف کنیم. اما چگونه میتوانیم بفهمیم امروز واقعاً چه چیزی اهمیت دارد؟ ما در مورد تاریخ بشری چیزهای زیادی یاد گرفتهایم از نقشها و نوشتههای درون غارها، و از لوحهای سنگی. ما زبانهای سنگ روزتا (Rosetta Stone) را رمزگشایی کردهایم. میدانید، با این وجود، هرگز کل داستان را نخواهیم داشت. دادههای ما، داستان ما است، حتی امروز بیشتر از قبل. ما رکوردهایمان را بر روی لوحهای سنگی نخواهیم داشت. اما مجبور نیستیم انتخاب کنیم در حال حاضر چه چیزی مهم است. برای ذخیرهسازی همه اینها راهی وجود دارد. به نظر میرسد که از چند میلیارد سال قبل راهحلی برای این موضوع وجود داشته است، که الآن در این تیوب است.
دی.ان. ای قدیمیترین ابزار ذخیرهسازی طبیعت است. که حاوی تمام اطلاعات لازم برای تولید و بقای یک انسان است. اما چه چیزی دی.ان.ای را انقدر بزرگ میکند؟ خب بهعنوانمثال بیایید به ژن خودمان نگاهی بیندازیم. اگر لازم بود تمام سه میلیارد حروف G،C،T، A ها را با فونت و فرمت استاندارد پرینت بگیریم، و سپس مجبور به نگهداری از تمام آن کاغذها بودیم، ارتفاعی معادل ۱۳۰ متر داشت، چیزی بین مجسمه آزادی و اثر تاریخی واشنگتن. حال، اگر ما تمام این حروف G،C،T، A را به دادههای دیجیتال و ۰ و ۱ تبدیل کنیم کلاً چند گیگ فضا اشغال میکند. و در هریک از سلولهای بدن ما وجود دارد. هرکدام از ما بیش از ۳۰ هزار میلیارد سلول داریم. پس ایده را فهمیدید: DNA توان ذخیرهسازی حجم زیادی از اطلاعات در فضایی بسیار محدود را دارد.
DNA همچنین بسیار بادوام است، و برای ذخیرهسازی حتی به الکتریسیته نیاز ندارد. این را میدانیم چون دانشمندان دی.ان.ای انسانهای باستانی را به دست آوردهاند که صدها هزار سال قبل زندگی میکردهاند. یکی از آنها مرد یخی بنام Ötzi است. که به نظر میرسد اهل اتریش است.
وی در ارتفاعات حفاظتشده کوهستانهای بین ایتالیا و اتریش کشف شده است. و به نظر میرسد که در اتریش امروزی خویشاوندان ژنتیکی زنده دارد. پس ممکن است یکی از شما عموزاده Ötzi باشد.
نکته اینجاست که ما برای بازگردانی اطلاعات شانس بهتری داریم آن هم از انسانهای باستانی تا آنچه از یک تلفن قدیمی به دست بیاید. همچنین احتمال از دست دادن توانایی خواندن دی.ان.ای نسبت به هرکدام از دستگاههای ساخته دست بشر بسیار کمتر است هرکدام از انواع حافظه نیازمند روشی جدید برای بازخوانی اطلاعات است. همیشه میتوانیم اطلاعات دی.ان.ای را بخوانیم. اگر بیشتر از این توالی ایجاد نکنیم، مشکلات بیشتری نسبت به نگرانی درباره ذخیرهسازی دادهها پیش رو خواهیم داشت.
ذخیره دادهها روی دی.ان.ای جدید نیست. طبیعت این کار را برای چندین میلیارد سال انجام داده است. درواقع، هر موجود زنده یک دستگاه ذخیره دی.ان.ای است. اما ما چطور میتوانیم دادهها را روی دی.ان.ای ذخیره کنیم؟ این شکل ۵۱ است. که اولین عکس از دی.ان.ای است، که حدوداً ۶۰ سال پیش ثبت شده است. که تقریباً مصادف با زمانی است که اولین سختافزار توسط IBM ارائه شد. بنابراین، درک ما از ذخیرهسازی دیجیتالی و دی.ان.ای همزمان باهم رشد کرده است. ابتدا در مورد توالی، یا خواندن دی.ان.ای، و خیلی زود درباره چطور نوشتن یا سنتز آنها یاد گرفتیم. این کار بسیار شبیه این است که چطور یک زبان جدید یاد میگیریم. و حالا توانایی داریم که دی.ان.ای را بخوانیم، بنویسیم و کپی کنیم. همیشه در آزمایشگاه این کار را انجام میدهیم. پس هر چیزی، واقعاً هر چیزی، که بتواند بصورت۰ و ۱ ذخیره شود، را میتوان در دی.ان.ای ذخیره کرد.
برای اینکه چیزی مثل این عکس را دیجیتالی ذخیره کنیم، ما آن را به بیتها یا ارقام دوتایی (صفر و یک) تبدیل میکنیم. هر پیکسل یک عکس سیاهوسفید را میتوان۰ و ۱۱ در نظر گرفت. مشابه چاپ حروف روی کاغذ توسط پرینتر جوهری، میتوانیم دی.ان.ای را بنویسیم. فقط کافی است دادهها را، تمام آن ۰ و ۱ها را، به حروف G،C،T، A تبدیل کنیم. و سپس آن را به یک شرکت سنتز ارسال کنیم. پس کد را مینویسیم و میتوانیم آن را ذخیره کنیم، و وقتی بخواهیم دادهها را بازیابی کنیم، کافی است به آن توالی بدهیم.
حالا، قسمت جالب ماجرا انتخاب این است که چه فایلهایی را در نظر بگیریم. ما دانشمندانی جدی هستیم، پس لازم بود که برای آیندگان خوب، یک نسخه خطی را در نظر بگیریم. ما همچنین یک کارت هدیه آمازون ۵۰ دلاری در نظر گرفتیم– خیلی هیجانزده نشوید، چون تا الآن خرج شده است، کسی آن را رمزگشایی کرد– به همین ترتیب یک سیستم در حال کار، یکی از اولین فیلمهایی که ساختهشده، و یک لوح پایونیر هم در نظر گرفتیم. شاید بعضی از شما این را دیده باشید. این لوح تصاویری از یک مرد و زن برهنه، و موقعیت تقریبی ما را در منظومه شمسی نشان میدهد، تا در صورت رسیدن به موجودات فرازمینی پیامی تصویری از بشریت را به آنها برسانند.
بعدازاینکه تصمیم گرفتیم چه چیزهایی را میخواهیم کد نویسی کنیم، دادهها را طبقهبندی کرده، و ۰ و ۱ ها را به حروف G،C،T، A تبدیل میکنیم، و سپس این فایل را به شرکت سنتز ارسال میکنیم. و این چیزی است که به دست آوردیم. فایلهای ما در این تیوب قرار داشتند. تنها کافی بود که به آن توالی بدهیم. تمام اینها بسیار ساده به نظر میرسند، اما تفاوت بین یک ایده واقعاً جذاب و سرگرمکننده، و چیزی که واقعاً بتوانیم از آن استفاده کنیم، غلبه بر این چالشهای حقیقی است.
حال، هرچند دی.ان.ای نسبت به هر دستگاه ساخته دست بشر قدرتمندتر است، اما بینقص نیست. البته که نقاط ضعفی دارد. پس ما پیام خود را با توالی یابی دی.ان.ای بازیابی میکنیم، و تکتک دادههای زمانی بازیابی میشوند، دی.ان.ای را از دست میدهیم. این جزئی از فرایند توالی یابی است. ما نمیخواهیم از دادهها بگذریم، اما خوشبختانه، برای کپی کردن دی.ان.ای یک راه هست که حتی ارزانتر و آسانتر از سنتز کردن آن است. روشی را برای تهیه ۲۰۰ هزار میلیارد کپی از فایلهایمان امتحان کردهایم، و تمام دادهها را بدون خطا بازیابی کردهایم. بنابراین، توالی دهی خطاهایی را هم در دی.ان.ای ما ایجاد میکند، خطاهایی در G،C،T، A ها. طبیعت برای این مشکل در سلولهای ما راهحلی دارد. اما دادههای ما در دی.ان.ای سنتز شده داخل تیوب ذخیره شده است، پس ما برای غلبه این مسئله مجبور بودیم راهحل خودمان را بیابیم. ما تصمیم گرفتیم از الگوریتمی که برای پخش ویدئو استفاده میشود، بهره ببریم. وقتی یک ویدئو را پخش میکنید، اساساً در تلاش هستید تا ویدئوی اصلی، فایل اصلی، را بازیابی کنید. وقتی ما تلاش میکنیم که فایل اصلی را بازیابی کنیم، داریم توالی دهی میکنیم. اما درواقع، هردوی این فرایندها، درباره بازیابی تعداد کافی ۰ و ۱ است تا دادههایمان را مجدداً کنار هم بچینیم. و بنابراین، به خاطر استراتژی کد نویسیمان، میتوانستیم تمام دادههایمان را طوری بستهبندی کنیم که به ما امکان ایجاد میلیونها وهزاران میلیارد را کپی دهد و درعینحال همیشه بتوانیم تمام فایلهایمان را پس بگیریم.
این فیلمی است که کدنویسی کردهایم. که یکی از اولین فیلمهای ساختهشده است، و اکنون اولین فیلمی است که بیش از ۲۰۰ هزار میلیارد بار روی دی.ان.ای کپی شده.
بافاصله کمی بعد از انتشار مطالعاتمان، در رویداد “هرچه میخواهی از من بپرس” وبسایت reddit شرکت کردیم. اگر شما یکی از همکاران ما باشید، با این وبسایت بسیار آشنا هستید. بیشتر سؤالها متفکرانه بودند. و بعضی خندهدار… برای مثال، کاربری میخواست بداند کی میتواند درایو لمسی واقعی خود را داشته باشد. حالا، مسئله این است، الان دی.ان.ای هر چیز لازم برای تبدیل ما به کسی که هستیم، را ذخیره میکند. ذخیره دادهها روی تمام فایلهایتان سنتز شده داخل یک تیوب بسیار ایمنتر است.
الان مسلماً نوشتن وخواندن داده روی دی.ان.ای نسبت به ذخیره تمام فایلهایتان بر روی سختافزار زمان بیشتری میبرد. پس، ابتدا باید بر ذخیرهسازی طولانیمدت تمرکز کنیم. اغلب دادهها زودگذر هستند. فهمیدن آنچه امروز مهم است، یا آنچه برای نسل بعد اهمیت خواهد داشت، واقعاً سخت است. اما نکته این است که مجبور نیستیم همین امروز انتخاب کنیم. یونسکو برنامهای عالی به نام “حافظه جهان” دارد. این برنامه برای حفظ موارد تاریخیای ایجاد شده است که برای تمام بشریت ارزشمند هستند. از آیتمهایی برای افزوده شدن به این مجموعه نام برده شده است، ازجمله فیلمی که ما آن را کد نویسی کردیم. در شرایطی که این برنامه یک راه فوقالعاده برای حفظ میراث انسانی است، اما الزامی برای انتخاب آن وجود ندارد. در عوض پرسش از نسل حاضر-ما- که چه چیزی ممکن است در آینده اهمیت داشته باشد، میتوانیم همهچیز را در دی.ان.ای ذخیره کنیم.
ذخیرهسازی نه تنها فقط در مورد تعداد بایتها، بلکه درباره این است که ما دادهها را با چه کیفیتی ذخیره و بازیابی میکنیم. همیشه تنشی وجود داشته است بین مقدار دادهای که میتوانیم تولید کنیم، و چقدر از آن را میتوانیم بازیابی و چقدر را میتوانیم ذخیرهسازی کنیم، هر پیشرفتی در نوشتن دادهها، نیازمند روشی جدید برای خواندن آنهاست. ما دیگر نمیتوانیم رسانههای قدیمی را بخوانیم. چند نفر از شما روی لپتاپتان دیسک درایو دارید؟ چه برسد به درایو فلاپی! این اتفاق برای دی.ان.ای هرگز روی نخواهد داد. تا زمانی که ما هستیم، دی.ان.ای نیز وجود دارد و راهی خواهیم یافت تا آن را توالیدهی کنیم.
بایگانی کردن جهان اطراف، بخشی از ذات انسان است. این پیشرفتی است که ما طی ۶۰ سال، از زمان شروع به شناخت دی.ان.ای، در ذخیرهسازی دیجیتالی به آن دستیافتهایم. هنوز درزمینهٔ توالیهای دی.ان.ای، در نصف این زمان به پیشرفت مشابهی دستیافتیم و تا زمانی که باشیم، دی.ان.ای هرگز منسوخ نخواهد شد.