摘要:近日,一项发表在Science的工作结合蛋白语言模型[2]来解析蛋白在亚细胞compartments特异性定位的“编码”,预测蛋白定位;并进一步设计蛋白“靶向”特定的compartment;以及分析病理性变异对蛋白的compartments定位的影响[3]。
细胞内蛋白很多时候需要组装到不同的compartments来协作发挥功能[1],这些蛋白进入不同compartments的特异性是关键问题。
近日,一项发表在Science的工作结合蛋白语言模型[2]来解析蛋白在亚细胞compartments特异性定位的“编码”,预测蛋白定位;并进一步设计蛋白“靶向”特定的compartment;以及分析病理性变异对蛋白的compartments定位的影响[3]。
该模型,研究人员称之为- ProtGPS,的主要原理是“魔改”常规用于预测蛋白结构的语言模型来预测蛋白在亚细胞compartments的分布[2], [3]。
该项工作涉及到的compartments蛋白(粗体)[3]。
“魔改”蛋白语言模型来预测蛋白亚细胞compartments定位[3]。
通过ProtGPS进一步结合马尔可夫链蒙特卡洛算法(MCMC)[4]并同时考虑自然蛋白化学特性以及非有序性等信息,研究人员设计蛋白成功靶向核仁[3]。
ProtGPS结合MCMC设计蛋白靶向核仁[3]。
最后,研究人员通过ProtGPS来预测病理性变异[5]对蛋白定位的影响,发现大部分变异,特别是蛋白截短变异,大幅影响蛋白定位;并且后续通过实验对这些预测进行了验证[3]。
ProtGPS预测并实验验证病理性变异对蛋白定位的影响[3]。
该项工作的通讯作者是MIT的Richard A. Young、Regina Barzilay以及Henry R. Kilgore等研究人员;2025年2月6日在线发表在Science[3]。
作者们表示后续需要进一步的compartments注释、机器学习模型以及in vivocompartmentation分析方法等等来进一步提高预测效果,获取compartments组装原理新见解,乃至设计靶向特异compartments/condensates的药物[3]。
Comment(s):
视角宏大的工作;结合蛋白间的co-evolution或许有更好的预测效果。
不过该方法存在“固定”的蛋白序列和“动态”的compartments/condensates组成的矛盾。
参考文献:
[1] S. F. Banani, H. O. Lee, A. A. Hyman, and M. K. Rosen, “Biomolecular condensates: Organizers of cellular biochemistry,” Nature Reviews Molecular Cell Biology, vol. 18, no. 5. Nature Publishing Group, pp. 285–298, May 01, 2017. doi: 10.1038/nrm.2017.7.
[2] Z. Lin et al., “Evolutionary-scale prediction of atomic-level protein structure with a language model,” Science (80-. )., vol. 379, no. 6637, pp. 1123–1130, Mar. 2023, doi: 10.1126/science.ade2574.
[3] H. R. Kilgore et al., “Protein codes promote selective subcellular compartmentalization,” Science (80-. )., vol. 0, no. 0, p. eadq2634, Feb. 2025, doi: 10.1126/science.adq2634.
[4] S. Brooks, “Markov chain Monte Carlo method and its application,” J. R. Stat. Soc. Ser. D (The Stat., vol. 47, no. 1, pp. 69–100, Apr. 1998, doi: https://doi.org/10.1111/1467-9884.00117.
[5] M. J. Landrum et al., “ClinVar: improving access to variant interpretations and supporting evidence.,” Nucleic Acids Res., vol. 46, no. D1, pp. D1062–D1067, Jan. 2018, doi: 10.1093/nar/gkx1153.
原文链接:
来源:有味少年