在过去的70年中,
数据存储技术在快速发展中也面临挑战。现在有很多创新性技术可使每年的存储成本降低30%,但随着2010年创新的速度变缓,人们仍很难把这些设备的成本降得更低。20世纪70年代的影片可存在一张光碟上,但现在存在光盘中的信息很难被读取了。那么, 是否DNA才是真正的存储技术?在过去35亿年中DNA都是存在的,而且未来也会继续存在。相信未来我们依然需要借助DNA的力量。
理论上,DNA存储相对传统存储方式优势明显。一张光盘一旦出现刮痕就很难提取里面存储的信息,其实,任何数字技术都存在这样的问题。但是,DNA就靠谱得多,哪怕几千年前的残骸,今天都可以通过DNA来了解当时的情况。实际应用中,DNA是不是可以存储信息呢?如何打造基于DNA的文件?
DNA是一个序列,它是几种不同碱基的组合,这与计算机的存储理念不谋而合。计算机世界里,不管是文本还是歌曲,每个文件都可以转换成一个二进制的序列,由0和1组成,并可以这种形式存储。如果你想读取DNA信息的话,可以将其放到序列仪上,通过测序仪来读取存储的数据。现在我的团队希望能够将这一理念化为现实。此前,我们将一部电影放到DNA中,用计算机操作系统成功读取出来,并且没有任何数据缺失。
但是,这项技术也存在缺点。读取文件时,需要提取的DNA是在液体中的一部分,如果接连不断地测序的话,可能最终样本量会越来越少。怎么办?我们希望借助细胞增殖解决这一问题。细胞在增殖过程中不断地进行DNA的复制,我们可以通过聚合酶链式反应技术(PCR)做一个类似的扩增,这一工作可以在实验室完成。
如何避免DNA复制的错误?研究人员开发出一套纠错代码,即使复制过程中出现错误,也可以及时纠正过来。另外,我们做了一个实验,希望了解一个DNA最多可以储存多少信息。研究发现,每一个DNA上可以有125艾字节(EB)的信息。这是多少呢?如果一个房间里全都是笔记本电脑的话,它们所存储的所有信息都可以集中到一个DNA上。
人类所创造的数据总量大约是10的24次方,我们只需要10吨的DNA就可以储存所有的数字信息。这10吨的DNA可以装到一个大卡车上。那为什么不能让这项技术为更多人所用呢?把小小的DNA做成一般物品,以储存信息。我们希望解放试管中的DNA,把它放到很小的硅珠当中,然后用胶囊把硅珠封住,再把这些小珠放到聚合物里面,比如说塑料,最后把塑料做成我们想要的一些东西或者是形状。
这只3D打印的小兔子不一般,因为这只兔子的DNA里写了如何打印这只兔子的指令。也就是说,兔子里有生产它的具体指令,保存于硅珠中,硅珠里有DNA,这个DNA就是如何制造这只小兔子的生产信息。日常使用中,我们只需要把这只小兔子的耳朵折下一点,读取DNA信息,进行复制,就可以生产新的小兔子。 就像兔子繁殖一样,我们可以不断地复制、不断地迭代。
测试发现,生产了6代这样的兔子,我们还是能从最后一代兔子里提取到最原始的信息,没有任何的错误。
这项技术有何实际应用?首先,我们可以把各种材料的生产方式放到材料里面,比如可以在植入物中放入病人的诊疗信息。若干年后,可能患者的病历已经难以找到,但只需从这名患者体内拿出这个植入物就可以了解其过去的健康情况。我们也可以用同样的方式来生产汽车部件。
其次,可应用于隐藏信息。我们可以把一些常见的东西或物件当作隐藏信息的载体,比如鞋带、镜片、衬衣、扣子等,所有这些物件都可以帮助我们储存和隐藏信息。甚至我们可以像喝饮料一样,把硅珠喝到肚子里,需要的时候再把它排泄出来。再次,可应用于自我复制的机器人。通常机器人是无法自我复制的,但是自我复制机器人有能力把自己的生产方式传递给下一代机器人。
DNA有可能是我们终极的存储设备。它的存储密度要比其他存储技术高,存储时间也更久,而且提取简单。人类只要使用一台普通的DNA测序仪,就可以把信息解析出来。同时,由于没有材料或形状的限制,我们可以把DNA注入日常物件中,使存储信息成为我们生活的一部分。
关键词标签:海量存储 文件存储 分布式存储 国产存储 私有云 企业级存储 软件定义存储