你的DNA还可以做条形码!

“扫码”就能识别不同的人吗?

生活中,我们常常会做“扫码”这个动作:在商场购买商品时需要扫条形码结账;之后再扫二维码支付;疫情期间我们还拥有一个健康码,记录或显示自己的行程。

那么,你听说过DNA条形码吗?它是用来做什么的?和普通条形码有什么区别?这还得从条形码的工作原理说起。

条形码,图片来源 max.book118

条形码的工作原理

条形码随处可见,现在许多便利店都设置了自助结账机,很多人都有过亲手扫描条形码的经历。只要把条形码对准扫描器,“滴”地一声,商品的名称和价格便统统出现在显示器上。

超市常见的自助结账机,图片来源网络

不同的条形码在我们看来相差无几,由宽度不等的黑条和白条排成平行线图案。

之所以选择黑白两色(而不是其他颜色组合),是因为这两种颜色对光线的反射率差别大,有利于条码扫描器接收强弱不同的反射光信号。

这些光信号由光电转换器转换成相应的电信号,输出到放大整形电路进行进一步处理,转化成计算机系统能够识别的数字信号。

商品条形码组成及含义,图片来源 bu-shen

条形码中宽窄不同的黑白竖线是按照一定的编码规则排列的,竖条宽度不同,电信号持续时间就不同。

根据码制所对应的编码规则,译码器便可将数字信号翻译成数字以及字符信息,这就是条形码的工作原理。

什么是DNA条形码

那什么是DNA条形码呢?从字面上看,DNA条形码就像是要用DNA做出我们可以看到条形码,事实上却并非如此。

图片来源 australasianscience

DNA是一种存在于生物体内的、肉眼不可见的生物大分子,它看不见摸不着,并不能像商品条形码那样进行扫码识别。

我们知道,DNA由A、T、C、G四种碱基排列组合而成,如果能找到一段较短的序列,这段序列对不同生物来说,碱基的排列顺序不同(就像二维码竖条的排列顺序不同),那就可以用于区分不同的生物。

DNA碱基排列顺序,图片来源 guokr

假设有一段基因序列,小狗是AAAA,而小猫是TTTT,就可以利用这段基因区分小猫和小狗。

如果我们进一步找到一段足够区分所有生物(或大部分生物)的基因片段,就可以将其作为物种快速鉴定的标签,建立DNA序列和生物物种之间的一一对应关系,这就是“DNA条形码”的基本思路。

不同物种的同一基因片段存在差异,红绿蓝黑分别代表ATCG四种碱基,图片来源 uvmgg.fandom

简单来说,DNA条形码就是一段DNA序列,一段在不同物种间存在差异、但在种内高度保守且稳定遗传的DNA序列。这种DNA条形码并不会直接呈现在我们面前,但其信息可以储存在基因数据库中。

迄今为止,世界各地都建立了许多包含DNA条形码的数据库,例如加拿大生物多样性基因组学中心开发的BOLD数据库,美国国家生物技术信息中心建立的NCBI数据库,欧洲生物信息研究所的EMBL-EBI数据库等。

DNA条形码,图片来源见水印

怎么识别DNA条形码

相对于短小精干的DNA条形码,任何生物的基因组都是非常巨大的,我们怎么从庞大的基因组中,识别出特定的DNA条形码呢?

像大海捞针一样从头到尾检索整个基因组序列显然是不切实际的,这时,我们就需要借助特定的分子生物学技术了。其中最广为人知的一种方式就是聚合酶链式反应,也就是我们常说的PCR。

PCR是一种用于扩增特定DNA片段的分子生物学技术,它不仅可以从庞大的基因组中针对性地“找到”我们想要的目的基因片段,还可以将其大量复制,以提高碱基的响应值,便于读取基因信息。

应用DNA条形码鉴定微生物样品的操作流程,图片来源 DNA Bar-Code for Identification of Microbial Communities: A Mini-Review,Dhiraj Kumar Chaudhary and Ram Hari Dahal, April 2017; Project: Antimicrobial Resistance, Figure 1

DNA条形码应用广泛

有了PCR技术和包含各种DNA条形码的数据库,进行物种识别就容易多了。

首先,我们要提取待测个体的DNA,接着利用PCR技术,将DNA条形码从生物庞大的基因组中调取出来,并“读”出其碱基排列顺序。

然后,我们将这个序列与数据库中已有的数据进行比对,根据比对结果就能判断生物的物种信息了。

如果数据库中没有与这段序列相匹配的信息,那就要考虑是不是发现了新物种。

对于很多难以通过外观进行区分的物种(例如很多鸟类外形相似),DNA条形码能从遗传学意义上加以鉴别。

DNA条形码是如何工作的?(1:未知物种;2:DNA提取;3:PCR扩增;4:DNA测序;5:条码数据库比对;6:分析匹配度;7:确定物种)图片来源 DNA barcoding in the spotlight at 2018 FBIP Forum by Dane McDonald, Jul 19, 2018

早在2015年,中国科学院植物研究所就开通了“中国珍稀濒危植物DNA条形码鉴定平台”,为珍稀濒危植物的鉴定提供了技术支撑。

除了物种的鉴定与挖掘,DNA条形码技术还有很多其他应用。

比如检测肉类产品是否掺假,当肉类食品制作成肉丸或肉泥时,质检人员就很难通过外形判断肉的种类,DNA条形码这时候就派上用场了,哪怕只有微量的DNA,PCR技术也能捕捉并放大这种信息,让造假无处遁形。

再比如利用DNA条形码技术“检查入侵”,这里的“入侵”指的是外来物种入侵。我国是外来物种入侵最严重的国家之一,在出入境检疫过程中,有时会截获一些残缺不全的动物(尤其是节肢动物)组织。

由于残缺不全,通过传统的形态学鉴定很难判断这些组织究竟属于哪些物种。但DNA条形码技术不会受到样本不完整的影响,依旧可以准确识别物种信息,找出潜在的入侵物种。

综上,我们看到条形码是利用宽窄不同、黑白相间的线条来表示特定的商品,而DNA条形码则是利用不同物种特定的、与其他物种相区别的基因片段来标识身份。

相信在未来,随着我们对物种(尤其是其分子遗传特征)认识的不断深入,DNA条形码技术会得到更广泛的应用。

审核专家:纪十,生命领域观察者。