布朗大学逆天研究:用代谢分子存储照片,准确率达99%

2019-07-12 19:52
北京

栗子 安妮 发自 凹非寺

量子位 出品 | 公众号 QbitAI

小分子溶液,其实也有当“硬盘”的潜质。

布朗大学的Eamonn Kennedy等人的最新研究发现:不止DNA大分子能在有限的体积里存储大量信息,糖、氨基酸等代谢小分子也能用来存储信息。

这些平时装在容器中看似平平无奇的液体有这种功效?

研究人员就将这种技术,将埃及猫、北山羊和船锚图片存到了糖、氨基酸和其他小分子的混合溶液中,不仅可以成功存储,并且还能完成检索任务,读取准确率达到了99%,超过了DNA存储。

存入的猫片是这样的:

读取的图片几乎将猫片完全还原:
相比于此前用DNA分子存储16GB维基百科,这种方法有明显的优势。

布朗工程学院教授Rosenstein认为,与DNA相比,用代谢小分子存取数据具有低延迟性,可以从头到尾快速写入和读取数据。

用这种小分子溶液存取信息的方法,每秒可以写入5个字节,每秒可读取11个字节。而如果用DNA编码数据,再用DNA测序来读取,21小时也达不到5字节,成本还会十分可观。

并且,与双螺旋结构的DNA相比,代谢小分子的体型比DNA小得多,可以比DNA更密集地表示数据。

他还表示,这项挑战了在分子数据系统中存储信息的可行性,证明了不是只有DNA这样的遗传物质才能储存信息。

并且,还让离线非云存储大量数据成为可能,从而防止黑客的攻击。

这项研究成果在期刊PLoS ONE一发表,就迅速登上了科技新闻网站Techmeme的热度总榜第6名。

来看看这项神奇的研究。

这是1和0的世界

虽然DNA贵为遗传物质,但在生物体里存储数据的任务,不止DNA这样的大分子才能做到。

毕竟,数据的海洋里,只要有0和1就足够了。所以,不论是糖类,氨基酸,还是其他小分子,都能用存在和不存在来表示1和0。

布朗大学助理教授Jacob Rosenstein的实验室里,小伙伴们机智地发现了这一点。

至于,用什么物质做存储工具比较好,DNA下游的代谢物组 (Metabolome) ,便是信息量丰富的所在。

举个例子,伦敦国王学院的团队,2013年就曾经利用22种血液里的代谢物,来预测人的年龄和健康状况。

除此之外,团队说代谢物数据有低延迟的特点。并且,如果用代谢物写入数据,写好之后就不再需要任何的能量。

视环境而定,代谢物数据可能保存几个月、甚至几年。但团队说:在极端的温度、压力和机械力作用下,分子存储可能比电子元件更稳定。

那么,来看一下具体的做法吧:

怎么实现?

让溶液携带信息过程具体怎么实现的?在论文Encoding information in synthetic metabolomes中,揭秘了背后的实现过程。

先看在溶液中写入和读取信息流程大图:

这个过程并不复杂,先说信息写入过程。

研究人员把黑白图像的每一个像素点,用六种代谢物 (是否存在) ,在一块钢板上表示出来。

在这个实验中,钢板上有1024个点。6种代谢物分别是维生素、核苷、核苷酸、氨基酸、糖和代谢途径中间体 (metabolic pathway intermediates) ,这样每个点就可以编码6个像素的黑白。

于是,这样一张钢板就可以编码6×1024=6144个像素的图像了。

研究人员将用专门的液体处理机器人,将少量的混合溶液点在钢板(steel plate)上。

读取编码后的图像,需要借助化学分析方法基质辅助激光解吸/电离(MALDI)质谱(MS)分析来搞定。

这是一种用于质谱法的温和离子化技术,可以得到用常规离子化方法容易解离为碎片的一些完整大分子质谱讯息。

在这一步,研究人员观察得到的质谱峰,判断在溶液中到底存在哪些代谢物,然后恢复成原始图像。

最后,研究人员还提出了存储在合成代谢体中的千字节级图像数据集,在用多质量逻辑回归进行解码后,准确度达到了99%。

研究虽好,但还存在一定的局限性。

比如,当在一种溶液中加入多种小分子溶液时,许多代谢物彼此会发生化学反应,相互作用导致信息错误或数据丢失。

Rosenstein表示,使用分子进行计算是一项巨大的机会,而当前的研究还处于弄清如何利用它的阶段。未来,潜力无限。

DNA存储

用代谢物做存储工具,还是一种新鲜的方法。

而前辈DNA存储,已经是比较成熟的技术了。

DNA有4种碱基对:A-T、T-A、C-G、G-C,用来编码遗传信息。

用CRISPR基因编辑技术,可以制造出任何DNA序列,存储相应的数据。

去年,来自法国的高中生Adrien Locatelli,就曾经把《圣经》和《古兰经》的一部分内容用DNA链编了码,然后用AAV2病毒当载体注入自己的身体。

到了上个月底,哈佛系的初创公司Catalog已经把16GB的英文维基百科内容,编码在了DNA链上。

本月初,Catalog又宣布成功把1TB的数据,存到了重量能以克计的DNA上,并且表示明年就会开始商业化。

至于,存在DNA里的数据要怎样读取,哈佛大学的一组研究人员是这样展示的。

他们把一张骑马的动图,插入了大肠杆菌的DNA里。

又对细菌的基因组做了测序来重建图像。

重建的准确率达到90%:

再回头看代谢物数据提取的99%准确率,后生可畏。

传送门

布朗大学官方报道:

https://www.brown.edu/news/2019-07-03/molecules

论文本身:

https://journals.plos.org/plosone/article/authors?id=10.1371/journal.pone.0217364

— 完 —

阅读原文

    特别声明
    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。