13087713088 (黎经理)
官方微信
资讯中心

新一代数据存储技术远超你想象!1千克DNA,装下全球所有数据

2024-08-15

今年初,一家法国初创公司Biomemory宣布推出DNA数据存储卡——这张信用卡大小售价高达1000欧元的DNA存储卡仅拥有1KB的容量,每张卡的最短寿命为150年。这是DNA数据存储产品首次向公众开售。该公司表示,下一步将扩大设备的容量,以容纳家庭照片、文档和音视频文件,并计划将存储时间延长到1000年,蕞终延长到10000年。


从石头刻字,到纸张记录,再到如今的硬盘、光盘、USB存储数据,每次新的存储方式的出现都给社会带来深刻变革。下一个深刻改变我们生活的存储介质会是什么呢?蕞有可能的就是DNA存储技术,这种寿命更长、容量更大、体积更小、能耗更低的介质正是今天科学家们正在探索的数据存储新方式。


图书电影统统存进DNA

DNA存储的概念最早在上世纪60年代提出来,前苏联科学家哈伊尔·萨米奥维奇·纽曼大胆设想用DNA作为数据存储载体。在很长一段时间里,DNA存储只能是一个前沿的科学设想。


随着测序技术和DNA合成技术的问世,DNA存储由梦幻照进现实。


2012年,哈佛大学遗传学家乔治·丘奇将自己编写的图书《再生》顺利存进DNA中。该书有53426个单词和11个JPG图像,这些电子数据编辑成DNA形式导入大肠杆菌体内,并通过大肠杆菌繁殖得到了700亿份复制品。乔治·丘奇笑称,“这应该是出版史上的蕞高纪录了。”


2017年,乔治·丘奇团队更是成功地将世界上第一部电影《奔跑的马》存储到了大肠杆菌的DNA中。虽然基因被修改,这种细菌仍然“茁壮成长”和繁殖。研究团队发现,在细菌的每一代后代中,存储在基因中的电影都“完好如初”。这个成果代表了DNA信息存储技术的一个重要突破。


如何将图片和电影的电子数据存进DNA,又如何从DNA中读取数据?深圳华大生命科学研究院副研究员王雯博士表示:“DNA有4种碱基(A、T、C、G),从本质上来说,DNA是一个四进制的存储介质,我们可以将0、1的二进制形式的信息转换成四进制的ATCG序列,通过DNA合成技术合成任意的序列,实现数据存储。”


这些DNA分子可以通过溶液、干粉、纳米微球等形式进行存储,还可以将DNA植入到一些模式生物的细胞里(如大肠杆菌、酵母等),只需对这些生物体一直进行培养传代,便可将DNA数据一直保存下去。存储完毕后,可通过高通量测序技术读取数据,再根据存储使用的编码方式,进行反推解码,恢复原始信息。


DNA是个“超级硬盘”

为什么科学家要研究DNA存储?王雯认为,高密度、长久保留、低能耗,是数据存储的未来趋势。在此背景下,DNA因其较高的存储密度和稳定的性质,成为了解决问题的更优解。


数字信息存储面临三个难题:存储硬件的容量、大小和寿命。


目前,大多数硬盘的寿命一般在5年左右,闪存盘的寿命接近10年。硬盘发展几十年,虽然体积越来越小而容量越来越大,但作为硅基存储介质已经逼近极限。目前市场上一块主流硬盘容量为2TB,大概能存储几百部高清电影,但在这个信息大爆炸的时代则是杯水车薪,远远不能满足需求。比如一个存储量为10亿GB的大型数据中心,占地可达数个足球场,能耗巨大,建设和维护成本高达10亿美元。


DNA可以说是坐拥数十亿年经验的资深“前辈”。王雯表示,相较于现有的U盘、硬盘、磁带等介质,DNA具备无法比拟的优势:


超高的信息密度——研究指出,1克DNA理论上可以存储455EB数据,相当于数千万个1TB移动硬盘的大小,1千克的DNA可存储全球所有数据;


超长的待机时间——DNA作为相对稳定的分子,其半衰期长达521年,只需把它放入冰箱便可长久保存;


超强的生物兼容性——DNA作为绝大多数生物遗传信息的载体,相对无机物、金属等存储介质而言,具有更强的生物兼容性。


此外,DNA无处不在,生物体内均含有遗传物质。我们身体里小到一个细胞就存有了全套遗传密码。


王雯表示,我们正处于前所未有的信息大爆炸时代,据估算,2025年全球每天将产生491EB数据,相当于每日制造出2亿张DVD光盘。现在数据产生的速度,远远要超过我们生产这些存储介质的速度,所以必须要有新的介质来解决这个难题。而DNA就是这个新的介质。


DNA存储技术具有跨时代的意义,微软、拓唯思特、因美纳、西部数据等巨头企业联合50余家组织机构成立DNA数据存储产业联盟,以促进DNA存储技术融入常规数据存储体系。此外,以美国Catalog、Iridia、Molecular Assemblies,以及法国DNA Script等为代表的很多初创企业出现在DNA存储赛道上,开发底层关键技术推动DNA商业化落地。


中国方面,2021年,加快发展DNA存储技术也被写入了我国第十四个五年规划和《2035年远景目标纲要》,成为国家“生物技术+信息技术融合”的战略目标之一。


近年来,国内的北京大学、天津大学、哈尔滨工业大学、东南大学、清华大学、华大生命科学研究院、中国科学院深圳先进技术研究院等机构都开展了相关研究。华大在探索DNA信息存储的同时,也在DNA合成、DNA测序的装备与技术自主研发道路上持续深耕。华大开发了高密度、高稳定性的DNA存储比特-碱基编解码方法“阴阳码”,自主研发了MPS高通量DNA合成技术和DNBSEQ高通量测序技术,并建立了国内首套GB级DNA存储读写一体化系统,实现了DNA存储的全流程技术闭环。


2022年,中国科学院院士、天津大学副校长元英进教授团队利用DNA信息存储技术实现了人类文化遗产的长期保存——将敦煌研究院提供的10幅精选敦煌壁画存入DNA中。实验验证,通过DNA存储创新算法,壁画信息可在实验室常温下可靠保存超过千年,或9.4℃下保存2万年,让这些珍贵数据得以“存活”千万年。


DNA取代硬盘还要多久?

目前DNA存储技术的落地还存在一些技术难题,专家表示,在DNA存储的合成过程中,数据输入和读取的效率仍不高,耗费的时间较长、成本较高。


王雯表示,DNA作为存储介质,也有显著的弱点,就是其成本太高。比如,欧洲分子生物学实验室的实验费用高得惊人:每1兆字节的存储费用为12400美元,外加测序解读220美元。这是常规磁带存写费用的100多万倍。


王雯认为,不断提高存储效率可在一定程度上降低存储成本,DNA数据还要解决几方面难题:


一是DNA数据存储效率。这取决于DNA数据存储上下游的关键技术,包括数据写入方面,需进行合成技术合成装备的更新和迭代,提高准确性;数据读取方面,需进行测序效率、测序通量的提升,改善错误率,降低成本。


二是DNA数据存储标准化。目前DNA存储没有统一标准,DNA存储要进行大规模的应用,必然要有一个标准化的过程,制定这些应用的标准是非常重要的问题。


三是DNA存储数据安全。DNA具有生物特性,人工合成序列对环境是否有害需要评估。其次,存储数据的可靠性和隐私保护也需要关注,可能需要开发对于DNA数据的一些加密方式。此外,如何通过设计来防止非授权的复制及恶意篡改也至关重要。


王雯表示,在解决如上问题的基础上,DNA数据存储具备高可持续性、存储密度更高、占地空间更小等特点,在冷数据的存储场景中将会起到非常重要的作用,尤其是对不经常访问的历史性数据的存储,例如影像、图片等大数据。


DNA信息存储是一个新兴的、多学科深度交叉融合的研究方向。想要将DNA存储技术商用,还需要多领域的研究团队共同攻关。业内普遍认为,DNA存储技术仍有很长一段路要走,才能逐渐与现有硅基存储技术接轨,成为大规模数据长效稳定存储的主要力量,并进一步实现地外数据库、生物计算等技术。


南宁天泰智能科技有限公司


文章来源于:深圳特区报


版权所有:南宁天泰智能科技有限公司   网站地图