通知公告 更多 >
  • 2024
    06.20
    泛素化修饰调节真核生物中约80%的蛋白质降解,蛋白质泛素化水平通过泛素连接酶介导的泛素化和去泛素化酶介导的去泛素化的精细平衡来精准控制。泛素化与去泛素化已经以PROTAC和DUBTAC技术的形式被巧妙地用于药物研发。相对于泛素连接酶-底物相互作用(ESI)的研究,人们对去泛素化酶-底物相互作用(DSI)的研究较少,由于缺乏足够的训练数据集,使用计算方法预测DSI遇到了极大挑战。近期,国家蛋白质科学中心(北京)的人工智能研究团队尝试利用深度迁移学习策略来解决这一挑战,构建了可进行全蛋白质组范围人类去泛素化酶-底物相互作用预测的π-TransDSI软件,该成果论文“A protein sequence-based deep transfer learning framework for identifying human proteome-wide deubiquitinase-substrate interactions”5月28日在线发表于Nature Communications期刊,该工作由该中心李栋研究员团队和张令强研究员团队合作完成,李栋研究员与崔春萍研究员为论文共同通讯作者,刘源助理研究员、李点可博士研究生和张新助理研究员为论文共同第一作者。这项工作得到了人体蛋白质组导航国际大科学计划(π-HuB)、国家蛋白质科学中心(北京)、国家重点研发计划与国家自然科学基金的联合支持。π-TransDSI软件基于TransDSI深度迁移学习模型构建,所有代码和数据都可以在GitHub网站上找到(https://github.com/LiDlab/TransDSI)。     TransDSI深度迁移学习模型构建 TransDSI基于20398个人类蛋白质的序列相似性网络,通过自监督学习进行预训练,获得蛋白质序列中包含的进化信息。通过863对已知的DSI对模型进行微调,进行去泛素化酶-底物相互作用预测。   图1 作者构建了基于深度迁移学习和变分图自编码器的TransDSI模型。 模型包含四个模块。(a)蛋白质编码模块:氨基酸序列采用CT编码转化为蛋白质序列特征,使用BLAST计算序列相似性矩阵。(b) 自监督学习模块:采用GCN编码器和点积解码器组成的变分图自编码器,用于学习蛋白质序列中的进化信息。(c) 预测DSI的半监督模块:使用从自监督模块传输的参数来初始化GCN编码器,使用DSI金标准数据集进行微调。(d) DSI结合位点推测模块:通过掩码扰动某些氨基酸序列特征来推测DUB与底物相互作用的结构基础。   TransDSI算法的性能评估 作者比较了TransDSI与其他多种机器学习方法(随机森林、支持向量机、XGBoost、逻辑回归和K最近邻)的性能,五倍交叉验证和独立测试的结果均表明TransDSI具有最佳的预测性能。   图2 TransDSI模型的预测性能评估。 (a-d)通过五倍交叉验证和独立测试,比较了多种模型(TransDSI,UB2和五种机器学习模型)预测DSIs的性能。五种机器学习模型分别是随机森林(RF),支持向量机(SVM),XGBoost,逻辑回归(LR)和K最近邻(KNN)。   “模拟敲除”探索去泛素化酶-底物相互作用的结构基础 蛋白质之间的相互作用往往由特定结构域和motif介导。作者基于TransDSI模型发展了一个可解释性模块,通过观察敲除特定序列片段对“TransDSI分数”的影响,在预测去泛素化酶-底物相互作用的同时推测决定相互作用的关键区域(图3a)。 图3b展示了DNMT1与去泛素化酶USP7结合过程中DNMT1自身序列上每个残基的重要性。TransDSI预测出DNMT1上的赖氨酸残基(K1111/K1113/K1115)具有较高的重要性,表明USP7和底物DNMT1之间的相互作用主要是由DNMT1的KG重复区的赖氨酸残基介导,这与之前的实验结果一致(Nat. Commun. 2015, 6:7023)。   图3 TransDSI部分揭示USP7-DNMT1相互作用的结构基础。 (a) 算法原理示意图:对于DUB和底物,一个包含3个残基的滑动窗口沿着蛋白质序列移动,通过除去滑动窗口内的某类三联体以外的所有残基特征来进行计算机模拟的“敲除”。在敲除后,“扰动分数”相对于"TransDSI分数"变化最小的区域更可能是DSI的结合位点(红箭头指示)。 (b) 这个热图可视化了DNMT1每个氨基酸残基(从940到1299)对USP7-DNMT1相互作用的影响,DNMT1的赖氨酸残基(K1111,K1113,K1115)(在蓝色框中)在重要性热图中得分相对较高。 (c) USP7-DNMT1的复合物结构(PDB id:4YOC)。颜色表示TransDSI给出的残基重要性,重要性从低(蓝色)到高(红色)显示。插图展示了USP7-DNMT1界面的细节,包括USP7的酸性口袋和DNMT1的KG重复区。   TransDSI预测结果(FOXP3潜在去泛素化酶)的实验验证 作者通过免疫共沉淀与Western blot等技术对TransDSI的部分预测结果进行了验证。转录因子叉头盒蛋白 P3 (FOXP3)调控调节性T细胞(Treg)功能,与肿瘤免疫反应相关。FOXP3功能与TGFR激活的 SMAD3/4和T细胞受体(TCR)激活的NFAT存在密切关联(图4a)。另外,FOXP3在多种肿瘤组织中表达水平的升高与患者较差的预后相关。由于FOXP3在免疫调节中起重要作用,其本身并不适合作为直接的药物靶点。 利用 TransDSI,作者预测出了FOXP3上游两个潜在的去泛素化酶,USP11与USP20。USP11先前被报道能够增强TGF-β介导的TH17细胞分化,并能稳定FOXP3表达,从而维持Treg的抑制能力,但其分子机制尚不清楚。通过实验,作者发现USP11可以直接结合FOXP3并去除FOXP3上结合的泛素,增强FOXP3的稳定性(图4b和c)。考虑到肿瘤浸润的 FOXP3+ Treg 细胞可能促进癌细胞的免疫逃逸,作者推测USP11 可能是治疗由FOXP3诱导的免疫逃逸肿瘤的新靶点。USP20已被证明在各种信号通路中发挥重要作用,例如通过去泛素化β-catenin来增强Wnt信号通路以促进肿瘤生长。然而, USP20与自身免疫性疾病之间的关联目前尚不清楚。作者发现USP20可以结合FOXP3并使其去泛素化,表明USP20可能在调节自身免疫过程中发挥作用,并可能成为抑制FOXP3诱导的肿瘤免疫逃逸的潜在靶点。   图4 FOXP3潜在去泛素化酶(USP11和USP20)的实验验证。 (a)  FOXP3在TGF-β通路中的位置,图中给出了FOXP3多个预测的去泛素化酶;(b/d) 使用免疫共沉淀实验验证USP11/USP20-FOXP3相互作用;(c/e) USP11/USP20可以去除FOXP3上的泛素。   TransDSI阐释肝细胞癌组学数据中显著失调分子PKM2的潜在调控机制 临床患者样本的组学数据分析是人们面临的一大挑战,对这些数据的分析通常从探索差异表达分子开始。实际上,这些差异表达分子的调控因子对于疾病机制的研究也同样重要,可以在更大范围内寻找可能的疾病标志物与潜在药物靶点。作者利用TransDSI对肝细胞癌组学数据提示的差异表达分子PKM2进行了分析,推测UCHL1为PKM2潜在的去泛素化酶,可作为肿瘤治疗的潜在药物靶点。   图5 丙酮酸激酶M2(PKM2)的调控分子UCHL1。  (a) PKM2是糖酵解通路中的关键限速酶,它在癌细胞中表达水平上调,与预后不良相关。TransDSI推测UCHL1可能是PKM2的去泛素化酶。(b) UCHL1和PKM2的蛋白表达水平呈现出正相关。 (c) 可以根据UCHL1和PKM2两个分子将肝癌样本分为两个亚型(G-I和G-II),这两个亚型具有不同的临床特征。 (d) G-I/G-II亚型的Kaplan-Meier曲线,G-II亚型具有更低的总生存率。 国家蛋白质科学中心(北京)长期致力于泛素-蛋白酶体系统中蛋白质相互作用的研究。2017年该中心贺福初院士与李栋研究员团队建立了首个人类泛素连接酶-底物相互作用预测模型UbiBrowser(Nat Commun 2017, 8: 347)。2022年,该中心贺福初院士、张令强研究员与李栋研究员团队联合将UbiBrowser体系拓展到39个真核生物(Nucleic Acids Research 2022, 50: D719 )。该中心本次推出了基于深度迁移学习框架的π-TransDSI。π-TransDSI软件名称中的π为人体蛋白质组导航国际大科学计划(π-HuB计划)。作为π-HuB软件家族新成员,π-TransDSI提供了全蛋白质组的去泛素化酶-底物信息,为全面研究蛋白质泛素化水平的精细调控提供了新的视角。   【论文链接:】https://doi.org/10.1038/S41467-024-48446-3
  • 2024
    06.20
    生命体系中的蛋白质并非单独发挥作用,往往组合在一起形成特定的功能模块(“蛋白质复合体”或“蛋白质机器”)。了解蛋白质复合物及其功能对于阐明生命过程的机制、疾病诊断与治疗以及药物开发至关重要。然而,目前的实验手段在鉴定蛋白质复合物方面存在诸多挑战和限制。因此,发展高效的计算方法来预测蛋白质复合物就显得极为重要。现有的蛋白质复合物预测算法忽略了蛋白质氨基酸序列对三维结构和生物化学性质的影响,这是影响蛋白质相互结合形成复合物的重要因素。为此,国家蛋白质科学中心(北京)的人工智能研究团队提研发了一种基于超图表示学习预测蛋白质复合体的软件π-HyperGraphComplex,该软件整合了蛋白质序列和蛋白质相互作用网络信息,不需要进行人为的特征提取就可以挖掘蛋白质复合物信息。π-HyperGraphComplex软件于2024年6月8日在Briefings in Bioinformatics期刊(5年IF=10.6)在线发表。       π-HyperGraphComplex通过超图变分自编码器(HGVAE) 系统学习已有蛋白质复合体涉及的蛋白质序列和相互作用知识,获得潜在蛋白质复合物的特征向量表示,再结合深度神经网络DNN推测可能的蛋白质复合物。该算法不依赖特征工程,而是完全由数据驱动。它有望理解蛋白质复合物形成的本质特征,揭示生命过程的分子基础,为疾病诊断和新药研发提供线索和靶点。值得注意的是,π-HyperGraphComplex预测出的高置信度蛋白质复合物,可作为AlphaFold3等复合物结构预测工具的优质输入。π-HyperGraphComplex已开源并上传至GitHub网站(https://github.com/LiDlab/HyperGraphComplex),用户可通过简单命令在本地部署使用。     图1. π-HyperGraphComplex的整体算法框架。 (A) 超图构建:以蛋白质相互作用(PPI)网络为输入,使用Cliques算法提取完全连接的蛋白质子网络作为超边,并将其转换为蛋白质超图。 (B) 蛋白质编码:以蛋白质的原始序列为输入,使用CT方法对蛋白质的氨基酸序列进行编码,获取蛋白质序列特征。 (C) 自监督模块用于获取蛋白质嵌入向量:采用超图变分自编码器(HGVAE),包括超图卷积编码器、注意力模块和点积解码器,基于超图的高阶拓扑属性和蛋白质序列特征生成蛋白质嵌入向量。 (D) 监督模块用于预测蛋白质复合物:给定蛋白质集合的嵌入向量被拼接并输入到一个DNN模块以预测给定蛋白质集合是否能够形成复合物   π-HyperGraphComplex中的π即为π-HuB计划。国家蛋白质科学中心人工智能研究团队已经连续推出了四个π软件,包括π-HelixNovo,π-DDK-Linker, π-TransDSI, 以及π-HyperGraphComplex,这些软件将助力实现π-HuB计划中“数据-信息-知识-智慧”(DIKW)的快速跃迁。国家蛋白质科学中心(北京)李栋研究员和刘源助理研究员为论文共同通讯作者,安徽医科大学硕士研究生夏思敏、中国农业大学博士研究生李点可以及国家蛋白质科学中心硕士研究生邓新茹为论文共同第一作者。该工作得到了人体蛋白质组导航国际大科学计划(π-HuB)、国家蛋白质科学中心(北京)、科技部重点研发计划和国家自然科学基金委的支持。   参考文献: 1. Yang T, Ling T, Sun B, Liang Z, Xu F, Huang X, Xie L, He Y, Li L, He F, Wang Y, Chang C. Introducing π-HelixNovo for practical large-scale de novo peptide sequencing. Brief Bioinform. 2024;25:bbae021 2. Kong X, Diao L, Jiang P, Nie S, Guo S, Li D. DDK-Linker: a network-based strategy identifies disease signals by linking high-throughput omics datasets to disease knowledge. Brief Bioinform. 2024, 25: bbae111. 3. Liu Y, Li D, Zhang X, Xia S, Qu Y, Ling X, Li Y, Kong X, Zhang L, Cui CP, Li D. A protein sequence-based deep transfer learning framework for identifying human proteome-wide deubiquitinase-substrate interactions. Nat Commun. 2024 May 28;15(1):4519. 4. Xia S, Li D, Deng X, Liu Z, Zhu H, Liu Y, Li D, Integration of protein sequence and protein–protein interaction data by hypergraph learning to identify novel protein complexes, Briefings in Bioinformatics. 2024, 25: bbae274.  
  • 2024
    04.22
    4月21日,在被誉为医学界最高级别的大会“2024年中国医学发展大会”上,中国医学科学院发布了《中国21世纪重要医学成就》和《中国2023年度重要医学进展》。其中,“创建蛋白质组学体系”入选为中国21世纪重要医学成就。     4月21日,中国医学科学院在2024年中国医学发展大会上发布了《中国21世纪重要医学成就》和《中国2023年度重要医学进展》。中国医学科学院副院长、中国医学科学院学术咨询委员会秘书长、中国医学科学院学部委员(以下简称“学部委员”)王健伟主持发布会。 王志珍学部委员发布《中国21世纪重要医学成就》。陈义汉、张志愿、林东昕、李松、顾东风、顾晓松6位学部委员分别发布临床医学、口腔医学、基础医学与生物学、药学、卫生健康与环境、生物医学工程与信息领域2023年度的重要医学进展。   王志珍学部委员发布本年度入选的《中国21世纪重要医学成就》   陈义汉学部委员发布临床医学领域2023年度重要医学进展   张志愿学部委员发布口腔医学领域2023年度重要医学进展   林东昕学部委员发布基础医学与生物学领域2023年度重要医学进展   李松学部委员发布药学领域2023年度重要医学进展    顾东风学部委员发布卫生健康与环境领域2023年度重要医学进展   顾晓松学部委员发布生物医学工程与信息领域2023年度重要医学进展           王健伟秘书长主持发布会并就遴选目的、思路、方法和程序等作详细说明   发布会前,王健伟秘书长代表学术咨询委员会对《中国21世纪重要医学成就》和《中国2023年度重要医学进展》遴选的目的、思路、方法和程序作出如下说明: 本次《中国21世纪重要医学成就》和《中国2023年度重要医学进展》坚持科学客观的医学科技评价导向,更加突出直接指标,更加强化情报学视域下量化评价基础上的多维综合评价。《中国21世纪重要医学成就》聚焦我国学者主要在本世纪完成的重大医学科技成果,应具备重大原创性、引领性,在支撑国家高水平科技自立自强、保障人民卫生健康重大需求方面产生深远影响,且经国内外较长阶段评价取得充分认可和应用。在评价过程中,采用情报学视域量化计算和成就征集两条技术路线独立开展、相互校验融合后,提交全体学部委员通讯评选,再经中国医学科学院学术咨询执行委员会(以下简称“执委会”)审定,最终本年度有3项重要医学成就入选。 《中国2023年度重要医学进展》聚焦我国学者在2023年度取得的重要成果,其对当前和未来可能产生重要影响,具有较高国际关注度或应用潜力。遴选采取多维量化与广义内容评价相结合的量化技术路线,以定量计算为主、定性分析为辅,无偏倚纳入多源数据建立候选成果数据库,包括我国学者在2023年度发表的医学研究论文、获批上市的国产药物产品、获批上市的国产创新医疗器械产品等,累计收集成果数据多达33万余条。在此基础上,由中国医学科学院医学信息研究所研究团队进行量化计算,形成《中国2023年度重要医学进展》备选成果清单,提交全体学部委员通讯评议,由执委会审定,最终有43项重要进展入选。  相比去年,本年度的遴选思路与方法做了进一步优化和创新。  在《中国21世纪重要医学成就》遴选方面,为进一步规范和指导遴选指标选择,研究团队在情报学视域下创新性提出“五度”概念模型,即评价指标应满足客观、可反映评价导向、指标之间独立、指标数值可获得、指标简洁。同时基于前期对诺贝尔生理学或医学奖获奖学者的代表性文献分析,提出了“原创性引领性”成果的评价量化指标,更加突出单篇文献被引频次排序前万分之五,且文献在发表5年及以上达被引峰值等评价指标。专家视域下,主要依据专家学术鉴赏力对成就的科学、技术、经济、社会和文化五元价值进行多维评价。最后综合情报视域和专家视域的分析和评议结果,形成候选成就清单。  在《中国2023年度重要医学进展》遴选方面,研究团队根据“大医学”发展规律和医学科技成果特点,构建了基于反映成果学术影响力、同行认可度、特殊关注度等的关键分析指标评价体系,分学部开展多维分析指标量化评价和广义内容分析。 科技创新是助推卫生健康事业发展的核心动能,科学有效的科技成果评价有助于营造科技创新良好生态。为客观评价我国医学界的科技贡献,导引中国医学科技创新的发展方向,中国医学科学院坚持“四个面向”,持续探索可体现医学科技成果特点的分类评价体系。作为中国医学科学院学术咨询委员会发挥高端智库作用的重要举措之一,《中国21世纪重要医学成就》今年连续第四年发布,《中国年度重要医学进展》连续第五年发布。 本文转载自  中国医学科学院新闻中心公众号  
进入仪器预约系统
设施介绍
仪器设备 更多 >