人体定量蛋白质组图谱揭示不同组织中RNA与蛋白质水平差异

原创 李江雪 王振国 CellPress细胞科学 收录于话题#Cell Press青促会述评23#Cell Press论文速递62

生命科学

Life science

作为世界领先的全科学领域学术出版社,细胞出版社特与“中国科学院青年创新促进会”合作开设“青促会述评”专栏,以期增进学术互动,促进国际交流。

第二十三期专栏文章,由中国科学院上海营养与健康研究所、马普计算生物学伙伴研究所博士后 李江雪,中国科学院上海营养与健康研究所、马普计算生物学伙伴研究所博士研究生 王振国,就Cell 中的论文发表述评。

长按图片扫描二维码阅读论文

对不同组织中RNA和蛋白质水平的定量检测可以为理解人群疾病的发生提供基础,但到目前为止大多数研究都聚焦在RNA水平。例如,基因型-组织表达谱(GTEx)计划收集了来源于948位志愿者的54种组织样本,并且分析了这些组织的转录组特征。通常情况下RNA和蛋白质表达水平具有相关性,但是在包括细胞分化和应激状态在内的动态过程以及特定的组织中,转录后修饰往往会造成RNA和蛋白质水平的表达差异[1]。之前已有的大部分研究主要关注新分子的鉴定,缺乏较完整的蛋白质分子定量研究。而且,很多样本缺乏足够的与蛋白质组相对应的转录组信息进行比较。人类蛋白质图谱计划(HPA)在此有所突破,其基于转录组和抗体染色的结果能够对蛋白质的组织特异表达进行定量[2]。因此,结合不同组织具有特异性的RNA和蛋白质水平的定量数据对研究人类的生理病理过程非常重要,但至今为止仍缺乏相关的研究成果。

9月10日,Cell 在线发表了由两家研究机构合作完成的题为‘A Quantitative Proteome Map of the Human Body’的基于数据库资源的研究论文。文章作者在GTEx项目收集了人群不同组织样本的基础上,获得了不同组织蛋白质分子表达的定量数据,并与对应组织的RNA表达水平进行比较。通过对201个不同组织样本进行定量蛋白质组分析,获得了各样本与RNA表达水平对应的蛋白质分子的定量表达数据,发现了转录组和蛋白质组之间的大量差异。该研究首次通过蛋白质/RNA差异分布和富集的信息揭示了分泌型蛋白质分子如何在不同的位点合成、分泌并发挥功能。研究结果有助于我们进一步理解基因的转录后调控、生物学功能以及人类疾病的发生。

作者首先详细叙述不同组织蛋白质分子定量的过程和获得的蛋白质组的数据特征(图1)。在GTEx数据库的基础上,对来源于14位正常个体、32种不同组织的201个样本进行了蛋白质组测序。平均在每种组织中获得了超过7500种蛋白质的定量表达,其中6357种蛋白质在所有的32种组织中均有表达,说明大约有85%的蛋白质可以被检测到,而且个体组织蛋白质的表达更加依赖于不同组织的蛋白质相对富集程度[3]。在比较RNA表达丰度的基础上,他们发现RNA的表达丰度与蛋白质的表达水平并没有显著的相关性。

▲图1 不同组织蛋白质图谱的工作流程和结果概览

通过运用质谱定量分析技术,该研究进一步鉴定了在组织中富集以及组织特异性的蛋白(图2)。对检测到的所有蛋白聚类后发现,不同组织之间蛋白分布的差异要大于不同个体相同组织之间的差异,说明蛋白的分布对于定义组织之间相近的功能和作用非常有帮助。作者通过定义蛋白的组织特异性分数对不同组织的富集蛋白和特异性蛋白进行分类,并对不同组织的富集/特异蛋白及其信号通路进行了验证。

▲图2 不同组织蛋白质组的定量分析

在对蛋白质功能定义的基础上,作者对RNA和蛋白质的表达水平建立了相关性模型(图3)。在由同一组织产生的转录组和蛋白质组的数据中,大部分蛋白质分子和RNA分子的表达水平呈现正相关。与其他组织相比,脑组织不同结构中约有2/3到6/7的蛋白质分子只在蛋白质水平富集而不在RNA水平富集。此外,研究还发现很大一部分组织富集的蛋白质,在RNA表达水平上并没有显著的组织特异性。这些结果表明,对直接参与细胞功能的蛋白质分子定量可以获得与转录组水平不同的信息,可为直观地解释生物学功能提供帮助。特别是在对分泌型蛋白质分子的功能解释过程中,其与RNA分子的富集比例可以解释分泌型蛋白质的作用模式。该研究通过建立RNA和蛋白质定量的相关性模型,进一步验证不同组织中蛋白质的合成以及分泌的途径。

▲图3 不同组织蛋白质和RNA之间的相关性和一致性分析

与RNA水平的表达不同,对蛋白质表达的定位可以直观地反映其作用方式和效果,因而更加易于建立与疾病进程相关的诊断模型(图4)。从在线人类孟德尔遗传数据库(OMIM) 数据库中获得的与遗传疾病相关的基因表达图谱可以发现,在很多情况下与疾病发生相关蛋白质的变异确实在不同的组织中发生富集,并且与疾病的发展进程相关。特别是在那些已有研究与多基因相关的遗传疾病中,与RNA表达谱相比,蛋白质表达谱可以更加清晰地解释神经以及消化系统疾病的发生。在药物靶点的研究中,定量蛋白质图谱还可以分析不同组织中存在的药物靶向蛋白质的富集程度,以及可能发生不良反应的组织。在蛋白质和疾病相互作用之外,对蛋白质水平的定量还可以发现不同的蛋白质异构体,与已有的RNA水平的剪切异构体比较,可以验证哪些剪切的发生可以影响蛋白质水平的表达变化,这对疾病工具的开发是一个很好的补充。

▲图4 组织中富集的蛋白质和遗传疾病的相关性分析

总结全文,该研究系统地定量分析了人体32种正常组织的样本,并鉴定了在一个组织或者一些组织中富集或者特异分布的蛋白质分子及其生物学功能。通过使用包括TMT标记在内的方法增加组织中蛋白质识别的种类,并通过蛋白质和RNA的相关性分析发现了两种分子在不同组织中差异富集程度,这些富集程度的差异是由转录后调控、翻译后调控或者RNA和蛋白质分子的降解速度决定的。此外,作者通过对每一个组织中的蛋白质和RNA分子的打分较好地计算了蛋白质分布和富集的分数,并在网站上共享了其计算工具(http://snyderome.stanford.edu/TSomics.html)。借助这个方法,该研究阐明了分泌型蛋白质在合成和分泌过程中的生物学机制。组织特异性富集的蛋白质分子可以对了解复杂的生物学机制和不同组织之间的相互作用提供帮助,并能够为编码区域的基因变异和疾病的发生建立相关性。作者也提到了其研究的一些不足,例如,低表达蛋白质可能无法被检测到,组织样本存在细胞组成的异质性,以及模型缺乏表型数据的整合。尽管如此,数据本身的科学价值仍然是非常重要的。

本文参考文献(上下划动查看)

1. Liu, Y., Beyer, A., and Aebersold, R. (2016). On the Dependency of Cellular Protein Levels on mRNA Abundance. Cell 165, 535-550.

2. Uhlen, M., Fagerberg, L., Hallstrom, B.M., Lindskog, C., Oksvold, P., Mardinoglu, A., Sivertsson, A., Kampf, C., Sjostedt, E., Asplund, A., et al. (2015). Proteomics. Tissue-based map of the human proteome. Science 347, 1260419.

3. Wilhelm, M., Schlegl, J., Hahne, H., Gholami, A.M., Lieberenz, M., Savitski, M.M., Ziegler, E., Butzmann, L., Gessulat, S., Marx, H., et al. (2014). Mass-spectrometry-based draft of the human proteome. Nature 509, 582-587.

论文摘要

在RNA水平基础上,蛋白质水平的定量对理解疾病发生过程中生物学机制非常重要。文章作者通过对GTEx数据库中32种正常组织来源的超过12000个基因的蛋白质进行定量,并与分别在组织中特异表达和富集的转录本数据进行比较。很多在不同组织中普遍存在的转录本,其对应的蛋白质却具有组织特异性。这类RNA和蛋白质分布和富集不一致的基因,说明其蛋白质在合成以及发挥功能的位点具有特异性,也提示复杂生物学过程需要不同组织之间的相互作用和协调。更重要的是,蛋白质组织特异性富集和分布的信息可以解释很多无法由转录组信息获得的遗传疾病导致的表型。总的来说,文章的实验结果揭示了如何通过蛋白质表达水平的组织分布进一步了解基因的转录后调控,分泌组学,代谢组学以及人群疾病的发生。

Determining protein levels in each tissue and how they compare with RNA levels is important for understanding human biology and disease as well as regulatory processes that control protein levels. This paper quantified the relative protein levels from over 12,000 genes across 32 normal human tissues. Tissue-specific or tissue-enriched proteins were identified and compared to transcriptome data. Many ubiquitous transcripts are found to encode tissue-specific proteins. Discordance of RNA and protein enrichment revealed potential sites of synthesis and action of secreted proteins. The tissue-specific distribution of proteins also provides an in depth view of complex biological events that require the interplay of multiple tissues. Most importantly, our study demonstrated that protein tissue-enrichment information can explain phenotypes of genetic diseases, which cannot be obtained by transcript information alone. Overall, our results demonstrate how understanding protein levels can provide insights into regulation, secretome, metabolism, and human diseases.

向下滑动阅览摘要原文

中文内容仅供参考,请以英文原文为准

述评人简介

李江雪

中国科学院上海营养与健康研究所、马普计算生物学伙伴研究所博士后

李江雪,中国科学院上海营养与健康研究所、马普计算生物学伙伴研究所博士后,主要从事基因组的罕见遗传变异在人类疾病发生的调控作用及作用机制方面的研究,合作导师为李昕研究员。博士期间主要研究肿瘤免疫相关的课题,在Hepatology等杂志发表研究论文。现主要的研究方向为单细胞算法的开发和应用。

Dr. Jiangxue Li is a postdoc researcher in CAS-MPG Partner Institute for Computational Biology, Shanghai Institute of Nutrition and Health, Chinese Academy of Sciences (CAS). His research mainly focuses on rare genetic variations in the regulation of human diseases and co-supervisor is Prof. Xin Li. He studied tumor immunology in doctor program and published research article on Hepatology. Now his main research field is development and application of single cell analysis pipeline.

王振国

中国科学院上海营养与健康研究所、马普计算生物学伙伴研究所博士研究生

王振国,中国科学院上海营养与健康研究所、马普计算生物学伙伴研究所博士研究生,主要从事基因组的罕见遗传变异在人类疾病发生的调控作用及作用机制方面的研究,导师为李昕研究员。现主要的研究方向为线粒体基因组的遗传变异与调控。

Mr. Zhenguo Wang is a PhD candidate in CAS-MPG Partner Institute for Computational Biology, Shanghai Institute of Nutrition and Health, Chinese Academy of Sciences (CAS). His research mainly focuses on rare genetic variations in the regulation of human diseases and supervisor is Prof. Xin Li. Now his main research field is genetic variation and regulation of mitochondrial genome.

中国科学院青年创新促进会(Youth Innovation Promotion Association,Chinese Academy of Sciences)于2011年6月成立,是中科院对青年科技人才进行综合培养的创新举措,旨在通过有效组织和支持,团结、凝聚全院的青年科技工作者,拓宽学术视野,促进相互交流和学科交叉,提升科研活动组织能力,培养造就新一代学术技术带头人。

Youth Innovation Promotion Association (YIPA) was founded in 2011 by the Chinese Academy of Science (CAS). It aims to provide support for excellent young scientists by promoting their academic vision and interdisciplinary research. YIPA has currently more than 4000 members from 109 institutions and across multiple disciplines, including Life Sciences, Earth Science, Chemistry& Material, Mathematics & Physics, and Engineering. They are organized in 6 discipline branches and 13 local branches.