现在电脑的硬盘样子怎么样(世界上存储量最大的硬盘,就是你的DNA)
更多好玩的科普,快关注“差评”~
如果说小时候最想要什么东西,大概会是《哆啦A梦》里的记忆面包吧。
大家应该对记忆面包都不陌生,只要吃下印了课文内容的记忆面包,课文就记牢了,不仅能省下时间去玩,还能得到老师夸奖。
这块面包应该是很多人童年的梦了吧,“要是真有记忆面包就好了”。不知道多少人这样想过。
那如果想让记忆面包成真需要做到什么?
一.把信息存储到面包上
二.吃下面包,让信息进入人体
三.消化信息
简单看步骤的话,现在的科技就能做到前两步了,之前看到新闻,DNA存储技术已经能大规模写入数据了。
今年6月,美国科技公司Catalog将16gb的维基百科(英文版)全部文本保存到了一条人工合成的DNA中。
这滴液态呈现的DNA里有一整部维基百科
DNA存储最直接的优点是存储量大。上面那块黄黄的液体重3g,但是其中DNA重量微乎其微。根据纽约基因组中心的数据,一克DNA可存储2.15亿GB数据。
把这些数据存到1T容量,7mm规格的硬盘里,硬盘堆在一起,有1505米高。世界最高建筑,迪拜塔也只有828米。。。
用7mm厚的硬盘堆到两个迪拜塔高
想想都有些小刺激
DNA存储不仅存储量大,寿命还长。
不算吃U盘的怪兽,我一个U盘大概用5年。正常硬盘使用寿命在5-10年,遇到断电、冲击等情况还会更短。
常温下DNA的可读性能保持2000年。保存得当,简直一克永流传。。。甚至万年前的DNA都被还原了。
基因专家宣称,已破解70万年前史前马的DNA
以目前水平,DNA可以存一些政府文件,历史材料。估计以后也没什么历史、文化遗产之争了。
我是一只没有感情的粽子
随着技术发展,DNA存储可以取代数据中心。我刚刚才知道,原来卡车拉硬盘比光纤快多了。
1Gbps光纤直连,传送100万GB数据要20年,卡车只用几天就能从南拉到北,从白拉到黑。。。
满载硬盘的AWSSnowmobile卡车能携带100万GB数据
有了DNA存储后,这个时间只用以小时计了,数据随身就带走。
那电子数据是怎么存进DNA里的呢?记得生物课上讲过,DNA(脱氧核糖核酸)是一种双螺旋结构(doublehelix)的生物大分子,由碱基组成。
DNA链条上的长条就是碱基了~DNA中通常有四种碱基,大家直接理解成A,T,C,G就可以。
图片用不同颜色代表不同碱基
碱基的排列顺序,决定了长相、智力,不同病症的发病风险等。随便举个栗子,ACA的排列让人眼神不好,按CAC排能让人长高。其实就是遗传信息。
相信大家都明白了:DNA链条能储存遗传信息,那也能储存数字信息。
人工合成DNA进行数据写入,DNA测序进行数据读取
这么简单的逻辑,当时却根本没人细想,大家都在忙着破解“基因密码”。
只要找出碱基排列的规律和意义,就像拥有了人类修改器,改长相改素质改寿命,变白变美变高变长寿。
于是“人类基因组计划”开始了。
这项工程花费30亿美元和十几年时间,测出完整的人类基因序列。如果把破解碱基排列比作翻译一本书,此时相当于终于把书拿到手里了。。。
别笑,这是人类的一大步好么。
虽说没有立竿见影的成果,但这工程推动了DNA测序技术的发展。要知道在上世纪80年代,DNA测序还是全人工的。巨大需求量的刺激,让DNA测序进入了自动化时代。
早期的Sanger全程人工,过程复杂
不是老司机根本做不了
破解不了碱基序列,人们就变实际了。都要恰饭的嘛,能拿诺贝尔的发现,怎么不得利用起来?看不懂没关系啊,排成咱看得懂的样子,好歹当个U盘?于是DNA存储技术出现了。。。
虽然依然离不开人工,DNA测序高大上多了
如果把碱基看成A,T,C,G四个字母,碱基序列实际上就是一串英文。而数据实际上就是一串数字。把数字和碱基字母对应起来,重新排列,就能表达内容。
把碱基按新顺序排就成了糖葫芦,啊呸,是表达意义
相信大家小时候都做过这种题。。。
题目就不去算了~DNA存储就是类似的思路。
给水果赋予不同的数字,假如我想表达324121,只要排列水果就可以了。
知道转换规则,就能从排列中读取信息。DNA存储就是通过把碱基看成固定数字,将数字化的数据转换成碱基序列的方式。
把A,G视为0,C,T视为1,排列后合成。简单粗暴,这就是最早的DNA存储。
去年的时候,
catalog的DNA存储设备还是个概念
为了存储更多数据,人们尝试了把A,T,C,G看成0,1,2,3的四进制。
比如我们要转换四进制21130
虽然四进制能缩短数据长度,但同一碱基连续出现,会让序列不稳定,影响数据的准确。
四进制时相当于一个碱基表达两个二进制数字
更高的进制,四种碱基又不够用,为了解决这个问题,人们用了一种三进制的方案。这种方案里从第二位开始编码,以前一位碱基来决定后一位。前一位碱基是A,下一位就把A排除,用C,G,T来代表0,1,2。
我们可以试一试。刚才的数字用三进制表达是211101。假设碱基序列第一位是A,转换结果就是ATCTCGA。
这个结果是怎么得来的呢?第一个字母是A时,按照表格,代表2的字母是T,T后面代表1的字母是C,C后面代表1的是T,依此类推。
解决了编码问题,大家玩嗨了,动图、音频、电影先后被存入DNA。
哈佛大学存入大肠杆菌DNA的gif
2017年,纽约基因组中心将电影火车进站存入DNA。
存入数据大小的记录也快速刷新着,2012年哈佛650KB的记录很快被MB级碾压。
2016年记录到了百兆级,微软存了200M电子书,大概等同789本高中语文必修一。。。
今年微软做了个DNA自动存储系统。。。“hello”这5个字母的存储和读取花了21个小时。。。
价值一万美金的系统
Emm…这就是DNA存储的缺点了。。。
微软2016年的写入速度是每天20M,一共花了80万美刀的合成费用。又贵又慢。
但有关DNA存储的科技在不停进步。2001年至今,DNA测序从上亿美元降到了不到一千美元。今年Catalog的写入速度已经到了4M每秒。
Catalog用来把数据写入DNA的设备
成本降到十万分之一,写入速度快了千万倍。这种进步幅度,足以对DNA存储技术保持期待。在不久的将来,也许电脑里的硬盘就换成瓶装DNA了。
不过记忆面包的事还是忘了吧,至少靠DNA存储技术是没办法实现记忆面包的。
虽然DNA存在于人体每一个细胞中,但是大脑却无法读取dna中的任何信息。不信现在可以试试能不能从DNA里感受到你的遗传信息。
更何况,大脑完全读不懂我们设定的排列规则,在它眼里,这种DNA里大概是这样的。
所以,一直想着记忆面包,还不如好好学习。努努力说不定就背下来了。毕竟一辈子要背的东西,也就那么多。
“也许可以想想蓝胖子?”