من می‌توانم تمام فیلم‌هایی که تا به‌ حال ساخته‌ شده را در این تیوب بگنجانم. اگر شما قادر به دیدن آن نیستید، نکته همین است!

قبل از اینکه بفهمیم چنین چیزی چطور ممکن است، درک ارزش این شاهکار اهمیت دارد. این روزها تمام اعمال و افکار ما، از طریق عکس‌ها و ویدئوها– حتی فعالیت‌های تناسب انداممان– به‌عنوان داده‌های دیجیتالی ذخیره می‌شوند. به‌جز تمام شدن حافظه تلفن‌هایمان، ما به‌ندرت درباره آثار دیجیتالی خود فکر می‌کنیم اما جامعه انسانی داده‌های بیشتری را در چند سال اخیر نسبت به تمام تاریخ بشری تولید کرده است.

داده‌های بزرگ به معضل بزرگی تبدیل شده است. ذخیره‌سازی دیجیتالی واقعاً گران‌قیمت است، و هیچ‌کدام از این دستگاه‌هایی که داریم آن‌چنان قادر به تحمل آزمون زمان نیستند. وب‌سایت عام‌المنفعه‌ی “Internet Archive” را در نظر بگیرید. که علاوه بر کتاب‌ها و فیلم‌ها، امکان دسترسی به صفحات وبی که در سال ۱۹۹۶ نوشته‌شده‌اند را فراهم می‌کند. حالا، این خیلی وسوسه‌انگیز است، اما تصمیم گرفتم به عقب برگردم و شروع فروتنانه وب‌سایت TED را ببینم. همان‌طور که ملاحظه می‌کنید، در ۳۰ سال گذشته تغییرات اندکی داشته است. و این کار، من را به اولین سخنرانی TED، در ۱۹۸۴ هدایت کرد و تصادفاً یکی از مجریان شرکت سونی در حال توضیح دادن نحوه عملکرد یک دیسک فشرده بود.

توانایی عقب رفتن در زمان و دستیابی به این لحظه بسیار فوق‌العاده است. همچنین واقعاً شگفت‌آور است که پس از ۳۰ سال، بعد از اولین سخنرانی TED، ما هنوز هم درباره ذخیره‌سازی دیجیتالی بحث می‌کنیم.

حال، اگر به یکی دیگر از وقایع ۳۰ سال قبل نگاهی بیندازیم، شرکت IBM اولین سخت‌افزار جهان در سال ۱۹۵۶ را مطرح کرد. در اینجا دستگاه در مقابل تعدادی تماشاچی در حال بارگیری برای انتقال است. این دستگاه توانایی نگه‌داری معادل یک آهنگ MP3، و بیش از یک تن وزن داشت. و قیمتش به ازای هر مگابایت ۱۰۰۰۰ دلار بود، گمان نمی‌کنم کسی از افراد این سالن علاقه‌ای به خرید این دستگاه داشته باشد، مگر اینکه یک مجموعه‌دار باشد. اما این بهترین کاری بوده که در آن زمان قابل انجام بوده است.

ما در ذخیره‌سازی داده راه درازی را طی کرده‌ایم. دستگاه‌ها به‌طور چشمگیری پیشرفت کرده‌اند. اما تمام رسانه‌ها درنهایت از بین می‌روند یا منسوخ می‌شوند. اگر امروز کسی برای تهیه نسخه پشتیبان به شما یک درایو فلاپی بدهد، احتمالاً به آن‌ها عجیب‌وغریب نگاه کنید، شاید بخندید، اما چاره‌ای جز استفاده از این شیء لعنتی ندارید. این دستگاه‌ها دیگر نمی‌توانند نیازهای ذخیره‌سازی ما را برآورده کنند، هرچند برخی از آن‌ها می‌توانند با اهداف دیگری به کار گرفته شوند. تمام فناوری‌ها درنهایت می‌میرند یا از بین می‌روند، و به همراه اطلاعات، تمام خاطرات ما هم از بین می‌روند. همچنان این توهم وجود دارد که مشکل ذخیره‌سازی حل شده است، اما درواقعیت، همه ما برای آن وجود خارجی قائل می‌شویم. ما نگران ذخیره‌سازی ایمیل‌ها و عکس‌هایمان نیستیم. آن‌ها روی فضای ابری (Cloud) هستند.

اما در پشت‌صحنه، ذخیره‌سازی مشکل‌ساز شده است. نهایتاً، فضای ابری (Cloud) هم از تعدادی سخت‌افزار تولید شده است. اکنون، می‌توانیم بحث کنیم که بیشترین اطلاعات دیجیتال واقعاً مهم نیست. قطعاً می‌توانیم آن را حذف کنیم. اما چگونه می‌توانیم بفهمیم امروز واقعاً چه چیزی اهمیت دارد؟ ما در مورد تاریخ بشری چیزهای زیادی یاد گرفته‌ایم از نقش‌ها و نوشته‌های درون غارها، و از لوح‌های سنگی. ما زبان‌های سنگ روزتا (Rosetta Stone) را رمزگشایی کرده‌ایم. می‌دانید، با این‌ وجود، هرگز کل داستان را نخواهیم داشت. داده‌های ما، داستان ما است، حتی امروز بیشتر از قبل. ما رکوردهایمان را بر روی لوح‌های سنگی نخواهیم داشت. اما مجبور نیستیم انتخاب کنیم در حال حاضر چه چیزی مهم است. برای ذخیره‌سازی همه این‌ها راهی وجود دارد. به نظر می‌رسد که از چند میلیارد سال قبل راه‌حلی برای این موضوع وجود داشته است، که الآن در این تیوب است.

دی.‌ان. ای قدیمی‌ترین ابزار ذخیره‌سازی طبیعت است. که حاوی تمام اطلاعات لازم برای تولید و بقای یک انسان است. اما چه چیزی دی.‌ان‌.ای را انقدر بزرگ می‌کند؟ خب به‌عنوان‌مثال بیایید به ژن خودمان نگاهی بیندازیم. اگر لازم بود تمام سه میلیارد حروف G،C،T، A ها را با فونت و فرمت استاندارد پرینت بگیریم، و سپس مجبور به نگه‌داری از تمام آن کاغذها بودیم، ارتفاعی معادل ۱۳۰ متر داشت، چیزی بین مجسمه آزادی و اثر تاریخی واشنگتن. حال، اگر ما تمام این حروف G،C،T، A را به داده‌های دیجیتال و ۰ و ۱ تبدیل کنیم کلاً چند گیگ فضا اشغال می‌کند. و در هریک از سلول‌های بدن ما وجود دارد. هرکدام از ما بیش از ۳۰ هزار میلیارد سلول داریم. پس ایده را فهمیدید: DNA توان ذخیره‌سازی حجم زیادی از اطلاعات در فضایی بسیار محدود را دارد.

DNA همچنین بسیار بادوام است، و برای ذخیره‌سازی حتی به الکتریسیته نیاز ندارد. این را می‌دانیم چون دانشمندان دی.‌ان.ای انسان‌های باستانی را به دست آورده‌اند که صدها هزار سال قبل زندگی می‌کرده‌اند. یکی از آن‌ها مرد یخی بنام Ötzi است. که به نظر می‌رسد اهل اتریش است.

وی در ارتفاعات حفاظت‌شده کوهستان‌های بین ایتالیا و اتریش کشف شده است. و به نظر می‌رسد که در اتریش امروزی خویشاوندان ژنتیکی زنده دارد. پس ممکن است یکی از شما عموزاده Ötzi باشد.

نکته اینجاست که ما برای بازگردانی اطلاعات شانس بهتری داریم آن هم از انسان‌های باستانی تا آنچه از یک تلفن قدیمی به دست بیاید. همچنین احتمال از دست دادن توانایی خواندن دی.‌ان.ای نسبت به هرکدام از دستگاه‌های ساخته دست بشر بسیار کمتر است هرکدام از انواع حافظه نیازمند روشی جدید برای بازخوانی اطلاعات است. همیشه می‌توانیم اطلاعات دی.‌ان.ای را بخوانیم. اگر بیشتر از این توالی ایجاد نکنیم، مشکلات بیشتری نسبت به نگرانی درباره ذخیره‌سازی داده‌ها پیش رو خواهیم داشت.

ذخیره داده‌ها روی دی.‌ان.ای جدید نیست. طبیعت این کار را برای چندین میلیارد سال انجام داده است. درواقع، هر موجود زنده یک دستگاه ذخیره دی.‌ان.ای است. اما ما چطور می‌توانیم داده‌ها را روی دی.‌ان.ای ذخیره کنیم؟ این شکل ۵۱ است. که اولین عکس از دی.‌ان.ای است، که حدوداً ۶۰ سال پیش ثبت شده است. که تقریباً مصادف با زمانی است که اولین سخت‌افزار توسط IBM ارائه شد. بنابراین، درک ما از ذخیره‌سازی دیجیتالی و دی.‌ان.ای هم‌زمان باهم رشد کرده است. ابتدا در مورد توالی، یا خواندن دی.‌ان.ای، و خیلی زود درباره چطور نوشتن یا سنتز آن‌ها یاد گرفتیم. این کار بسیار شبیه این است که چطور یک زبان جدید یاد می‌گیریم. و حالا توانایی داریم که دی.‌ان.ای را بخوانیم، بنویسیم و کپی کنیم. همیشه در آزمایشگاه این کار را انجام می‌دهیم. پس هر چیزی، واقعاً هر چیزی، که بتواند بصورت۰ و ۱ ذخیره شود، را می‌توان در دی.‌ان.ای ذخیره کرد.

برای اینکه چیزی مثل این عکس را دیجیتالی ذخیره کنیم، ما آن را به بیت‌ها یا ارقام دوتایی (صفر و یک) تبدیل می‌کنیم. هر پیکسل یک عکس سیاه‌وسفید را می‌توان۰ و ۱۱ در نظر گرفت. مشابه چاپ حروف روی کاغذ توسط پرینتر جوهری، می‌توانیم دی.‌ان.ای را بنویسیم. فقط کافی است داده‌ها را، تمام آن ۰ و ۱ها را، به حروف G،C،T، A تبدیل کنیم. و سپس آن را به یک شرکت سنتز ارسال کنیم. پس کد را می‌نویسیم و می‌توانیم آن را ذخیره کنیم، و وقتی بخواهیم داده‌ها را بازیابی کنیم، کافی است به آن توالی بدهیم.

حالا، قسمت جالب ماجرا انتخاب این است که چه فایل‌هایی را در نظر بگیریم. ما دانشمندانی جدی هستیم، پس لازم بود که برای آیندگان خوب، یک نسخه خطی را در نظر بگیریم. ما همچنین یک کارت هدیه آمازون ۵۰ دلاری در نظر گرفتیم– خیلی هیجان‌زده نشوید، چون تا الآن خرج شده است، کسی آن را رمزگشایی کرد– به همین ترتیب یک سیستم در حال کار، یکی از اولین فیلم‌هایی که ساخته‌شده، و یک لوح پایونیر هم در نظر گرفتیم. شاید بعضی از شما این را دیده باشید. این لوح تصاویری از یک مرد و زن برهنه، و موقعیت تقریبی ما را در منظومه شمسی نشان می‌دهد، تا در صورت رسیدن به موجودات فرازمینی پیامی تصویری از بشریت را به آن‌ها برسانند.

بعدازاینکه تصمیم گرفتیم چه چیزهایی را می‌خواهیم کد نویسی کنیم، داده‌ها را طبقه‌بندی کرده، و ۰ و ۱ ها را به حروف G،C،T، A تبدیل می‌کنیم، و سپس این فایل را به شرکت سنتز ارسال می‌کنیم. و این چیزی است که به دست آوردیم. فایل‌های ما در این تیوب قرار داشتند. تنها کافی بود که به آن توالی بدهیم. تمام این‌ها بسیار ساده به نظر می‌رسند، اما تفاوت بین یک ایده واقعاً جذاب و سرگرم‌کننده، و چیزی که واقعاً بتوانیم از آن استفاده کنیم، غلبه بر این چالش‌های حقیقی است.

حال، هرچند دی.‌ان.ای نسبت به هر دستگاه ساخته دست بشر قدرتمندتر است، اما بی‌نقص نیست. البته که نقاط ضعفی دارد. پس ما پیام خود را با توالی یابی دی.‌ان.ای بازیابی می‌کنیم، و تک‌تک داده‌های زمانی بازیابی می‌شوند، دی.‌ان.ای را از دست می‌دهیم. این جزئی از فرایند توالی یابی است. ما نمی‌خواهیم از داده‌ها بگذریم، اما خوشبختانه، برای کپی کردن دی.‌ان.ای یک‌ راه هست که حتی ارزان‌تر و آسان‌تر از سنتز کردن آن است. روشی را برای تهیه ۲۰۰ هزار میلیارد کپی از فایل‌های‌مان امتحان کرده‌ایم، و تمام داده‌ها را بدون خطا بازیابی کرده‌ایم. بنابراین، توالی دهی خطاهایی را هم در دی.‌ان.ای ما ایجاد می‌کند، خطاهایی در G،C،T، A ها. طبیعت برای این مشکل در سلول‌های ما راه‌حلی دارد. اما داده‌های ما در دی.‌ان.ای سنتز شده داخل تیوب ذخیره شده است، پس ما برای غلبه این مسئله مجبور بودیم راه‌حل خودمان را بیابیم. ما تصمیم گرفتیم از الگوریتمی که برای پخش ویدئو استفاده می‌شود، بهره ببریم. وقتی یک ویدئو را پخش می‌کنید، اساساً در تلاش هستید تا ویدئوی اصلی، فایل اصلی، را بازیابی کنید. وقتی ما تلاش می‌کنیم که فایل اصلی را بازیابی کنیم، داریم توالی دهی می‌کنیم. اما درواقع، هردوی این فرایندها، درباره بازیابی تعداد کافی ۰ و ۱ است تا داده‌هایمان را مجدداً کنار هم بچینیم. و بنابراین، به خاطر استراتژی کد نویسی‌مان، می‌توانستیم تمام داده‌هایمان را طوری بسته‌بندی کنیم که به ما امکان ایجاد میلیون‌ها وهزاران میلیارد را کپی دهد و درعین‌حال همیشه بتوانیم تمام فایل‌هایمان را پس بگیریم.

این فیلمی است که کدنویسی کرده‌ایم. که یکی از اولین فیلم‌های ساخته‌شده است، و اکنون اولین فیلمی است که بیش از ۲۰۰ هزار میلیارد بار روی دی.‌ان.‌ای کپی شده.

بافاصله کمی بعد از انتشار مطالعاتمان، در رویداد “هرچه می‌خواهی از من بپرس” وب‌سایت reddit شرکت کردیم. اگر شما یکی از همکاران ما باشید، با این وب‌سایت بسیار آشنا هستید. بیشتر سؤال‌ها متفکرانه بودند. و بعضی خنده‌دار… برای مثال، کاربری می‌خواست بداند کی می‌تواند درایو لمسی واقعی خود را داشته باشد. حالا، مسئله این است، الان دی.‌ان.‌ای هر چیز لازم برای تبدیل ما به کسی که هستیم، را ذخیره می‌کند. ذخیره داده‌ها روی تمام فایل‌هایتان سنتز شده داخل یک تیوب بسیار ایمن‌تر است.

الان مسلماً نوشتن وخواندن داده روی دی.‌ان.ای نسبت به ذخیره تمام فایل‌هایتان بر روی سخت‌افزار زمان بیشتری می‌برد. پس، ابتدا باید بر ذخیره‌سازی طولانی‌مدت تمرکز کنیم. اغلب داده‌ها زودگذر هستند. فهمیدن آنچه امروز مهم است، یا آنچه برای نسل بعد اهمیت خواهد داشت، واقعاً سخت است. اما نکته این است که مجبور نیستیم همین امروز انتخاب کنیم. یونسکو برنامه‌ای عالی به نام “حافظه جهان” دارد. این برنامه برای حفظ موارد تاریخی‌ای ایجاد شده است که برای تمام بشریت ارزشمند هستند. از آیتم‌هایی برای افزوده شدن به این مجموعه نام برده شده است، ازجمله فیلمی که ما آن را کد نویسی کردیم. در شرایطی که این برنامه یک راه فوق‌العاده برای حفظ میراث انسانی است، اما الزامی برای انتخاب آن وجود ندارد. در عوض پرسش از نسل حاضر-ما- که چه چیزی ممکن است در آینده اهمیت داشته باشد، می‌توانیم همه‌چیز را در دی.‌ان.ای ذخیره کنیم.

ذخیره‌سازی نه ‌تنها فقط در مورد تعداد بایت‌ها، بلکه درباره این است که ما داده‌ها را با چه کیفیتی ذخیره و بازیابی می‌کنیم. همیشه تنشی وجود داشته است بین مقدار داده‌ای که می‌توانیم تولید کنیم، و چقدر از آن را می‌توانیم بازیابی و چقدر را می‌توانیم ذخیره‌سازی کنیم، هر پیشرفتی در نوشتن داده‌ها، نیازمند روشی جدید برای خواندن آن‌هاست. ما دیگر نمی‌توانیم رسانه‌های قدیمی را بخوانیم. چند نفر از شما روی لپ‌تاپتان دیسک درایو دارید؟ چه برسد به درایو فلاپی! این اتفاق برای دی.‌ان.ای هرگز روی نخواهد داد. تا زمانی که ما هستیم، دی.‌ان.ای نیز وجود دارد و راهی خواهیم یافت تا آن را توالی‌دهی کنیم.

بایگانی کردن جهان اطراف، بخشی از ذات انسان است. این پیشرفتی است که ما طی ۶۰ سال، از زمان شروع به شناخت دی.‌ان.ای، در ذخیره‌سازی دیجیتالی به آن دست‌یافته‌ایم. هنوز درزمینهٔ توالی‌های دی.‌ان.ای، در نصف این زمان به پیشرفت مشابهی دست‌یافتیم و تا زمانی که باشیم، دی.‌ان.ای هرگز منسوخ نخواهد شد.