最近有一个消息让很多IT数码迷亢奋了:DNA可以替代移动硬盘存储信息。是不是有点不可思议,这可能吗?
计算机信息存储的本质是对二进制数进行存储,也就是说,所有信息都可以用0和1来表示。而DNA碱基具备可编码的基础。我们知道,DNA是由碱基、磷酸及脱氧核糖构成的,其中碱基既是DNA的重要组成部分,也是RNA(核糖核酸)的重要组成部分。并且,A-T、G-C碱基之间能够形成碱基对,呈现出螺旋状的结构。而构成DNA的常见碱基有4种:A(腺嘌呤)、T(胸腺嘧啶)、G(鸟嘌呤)、C(胞嘧啶)。
若是先把信息转化成0和1编码,再把0和1编码转化成A、T、C、G序列,从技术上看,用DNA实现信息的存储自然是完全可行的。
2013年1月,来自英国的一支科学家团队制作了一本真正意义上的简洁诗文集,他们成功地将莎士比亚的十四行诗编码在DNA片段上,这个片段用肉眼几乎看不到。进一步地,他们指出,这种方式适用于保存世界上所有的数字信息。这一发现有着标杆意义,它意味着信息存储即将迎来一个全新时代。
犹记得东汉时期,汉献帝为了避开“挟天子以令诸侯”的曹操,向外面传递信息,偷偷用鲜血写出诏书缝在衣带里,也就是所谓的“衣带诏”。而在近代的谍战片中,我们经常会看到革命英雄们为了避开敌人的耳目传递消息,甚至直接把信息条缝在身体的伤口里。
相信有了DNA存储技术的加持,信息传递的陈旧过去将一去不复返,呈现出的将是焕然一新的面貌。毕竟,我们完全可以把信息植入基因中去,完全不用担心信息会被窃取或拦截。到了收件人手里,他只需提取一个片段,把它翻译过来就可以了。
以大肠杆菌为例,它20~40分钟就能繁殖一代,所以其400万碱基的DNA完全复制一次只需要几分钟。我们可以把一部电影分解后植入很多大肠杆菌DNA中,想要看电影时,只需要把一段大肠杆菌DNA提取出来,然后测序解码,就能提取出整个信息来。2019年,华大团队就把《开国大典》的一段视频压缩到了DNA里,经过测序解码还原,得到了和原文件一样的视频。
此外,用DNA存储信息是非常可靠的,它的保存时间可能长达万年甚至更久,我们可以将其保存在液氮或者液氦里,甚至直接置于可控的外层空间中,其间并不需要太多能源维护。而那种因硬盘、光盘之类的数字介质损害导致存储信息丢失的情况,将成为历史。
人类目前的数字化介质,一克硬盘或者闪存(无机硅)最多可存储几十个GB的数据,一克石墨烯(无机碳)预计可存储1000个GB的数据,也就是达到一个TB,而一克DNA(有机碳),目前的理论存储极限可达到455个EB(1EB=1024PB
)的信息量,华大集团(以下简称“华大”)目前的技术已经超过432个EB,接近理论值。利用活细胞的DNA存储,它的存储方式和效率要远超目前我们已知的存储方式。有数据表明,随着大数据时代的推进,到2025年,全球数据信息总量预计达到163ZB(1ZB=1024EB)。数据信息的爆发性增长给传统的硅基储存方式带来很大挑战。而DNA有着海量数据长期存储的特性,DNA存储技术的发展有望解决储存资源不足的困境。
随着这项技术成本的持续下降,用基因做U盘的时代已经不远了,您做好准备了吗?