假基因是基因组进化的重要标记,也是多种疾病尤其是癌症的关键调节因子。然而,假基因的系统功能表征和进化在很大程度上仍未被探索。
2022年11月8日,华中农业大学陈振夏团队在Genome Biology 上在线发表题为“Evolution and function of developmentally dynamic pseudogenes in mammals”的研究论文,该研究基于结合全长PacBio测序、样本匹配的Illumina测序和公开的转录组数据的混合测序数据集,发现大量哺乳动物假基因可以被转录,这有助于器官识别的建立。
进一步研究表明,发育动态假基因在进化上是保守的,并在发育过程中不断增加。此外,它们还参与复杂的转录和转录后调节,表现出功能富集的特征。编码潜能评估表明,19%的人类假基因可被翻译,从而为蛋白质创新提供了新的途径。此外,假基因携带疾病相关的SNPs,并有助于癌症转录组的扰动。总之,该研究揭示了哺乳动物中异常丰富的可转录和翻译的假基因,这些假基因代表了一个新的调控层。此外,该研究还优先考虑了具有功能富集特征的发育动态假基因,并为未来进一步揭示其在器官发育和癌变中的生物学机制提供了重要信息。
假基因的定义是与功能基因相似、含有使基因丧失功能的突变并且缺乏转录或翻译所需的调节元件的基因组区域。不同的假基因根据其起源机制分为:(1)未加工的假基因,来源于片段复制和随后的突变;(2) mRNA逆转录转座形成的加工假基因;(3)单一假基因,通过突变直接来源于失活的功能基因;(4)在群体中同时作为假基因和完整等位基因分离的多态假基因。
此外,假基因是基因组重塑和动态的珍贵标记物,为人们提供了了解古代转录组进化和转座元件活性的新视角。之前的研究推导了人类和小鼠亲本基因的历史表达水平,发现其中3%在进化过程中发生了显著变化。未加工的假基因揭示了基因复制过程,这是新基因产生的主要来源。然而,假基因化是大多数复制基因的最终命运,某些拷贝可以保留在基因组中以维持祖先的功能或获得新的功能。
近年来,随着高通量测序技术的应用,越来越多的证据揭示了一些假基因在生理和病理条件下的功能。例如,一些研究表明假基因在癌症进展中发挥重要作用,并可以对肾癌亚型进行分层。此外,假基因在组织中特异性表达,表明它们具有不同的调控程序。然而,短读长测序的有限能力妨碍了对假基因转录的研究。目前的研究大多数集中在假基因在疾病中的功能,且局限于假基因与其亲本编码基因之间的相互作用,如竞争性内源RNA (ceRNA)行为。此外,对哺乳动物假基因的系统功能描述相对有限。假基因对器官发育的贡献在很大程度上还是未知的。
假基因的系统发育分布和基因组特征(图源自Genome Biology )
在该项研究中,研究人员系统地推断了人类和小鼠假基因的起源时间,并描述了它们的进化模式。利用PacBio全长测序数据,研究者们鉴定了全长假基因转录本。结合深度Illumina测序数据和公共发育RNA-seq数据,极大地扩展了分析的数据集,并分析了全基因组假基因的表达模式。
研究者们优先考虑了具有功能富集特征的发育动态假基因(developmental dynamic pseudogenes, DDPs),发现它们可能代表一个额外的调控层,并确定了它们在疾病中的意义。编码潜能评估显示,超过19%的假基因被翻译和编码具有潜在功能的肽。综上所述,该项杂交测序数据和大量具有功能特征的表达假基因将为确定这些假基因的生物学相关性和生物医学应用提供重要资源和参考。
参考信息:
https://doi.org/10.1186/s13059-022-02802-y
原标题:《【学术前沿】Genome Biology | 华中农业大学陈振夏团队揭示哺乳动物发育动态假基因的进化与功能》