清华大学;北京水木分子生物科技有限公司聂再清获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华大学;北京水木分子生物科技有限公司申请的专利蛋白质突变效应的处理方法、装置及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119446262B 。
龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411341776.X,技术领域涉及:G16B20/50;该发明授权蛋白质突变效应的处理方法、装置及电子设备是由聂再清;周浩;黄婷婷;罗弈桢;聂子坤设计研发完成,并于2024-09-25向国家知识产权局提交的专利申请。
本蛋白质突变效应的处理方法、装置及电子设备在说明书摘要公布了:本发明涉及人工智能和生物技术的交叉技术领域,提供一种蛋白质突变效应的处理方法、装置及电子设备,该蛋白质突变效应的处理方法包括:获取突变前蛋白质的氨基酸序列与突变后蛋白质的氨基酸序列;通过预先训练的蛋白质语言模型,对突变前蛋白质的氨基酸序列与突变后蛋白质的氨基酸序列进行特征提取得到突变前蛋白质的特征与突变后蛋白质的特征;基于突变前蛋白质的特征与突变后蛋白质的特征确定蛋白质突变特征;将蛋白质突变特征输入预先训练的第一自然语言模型,生成蛋白质的突变对应的文本描述。该方法通过结合蛋白质语言模型和自然语言处理技术,提高了蛋白质突变效应的可解释性。
本发明授权蛋白质突变效应的处理方法、装置及电子设备在权利要求书中公布了:1.一种蛋白质突变效应的处理方法,其特征在于,包括: 获取突变前蛋白质的氨基酸序列与突变后蛋白质的氨基酸序列; 通过预先训练的蛋白质语言模型,对所述突变前蛋白质的氨基酸序列与所述突变后蛋白质的氨基酸序列进行特征提取得到突变前蛋白质的特征与突变后蛋白质的特征; 基于所述突变前蛋白质的特征与所述突变后蛋白质的特征确定蛋白质突变特征,包括: 确定所述突变前蛋白质的特征与所述突变后蛋白质的特征的特征差; 基于预先训练的编码器‑解码器架构的蛋白突变网络的编码器分支对所述特征差进行编码得到所述蛋白质突变特征; 将所述蛋白质突变特征输入预先训练的第一自然语言模型,生成蛋白质的突变对应的文本描述; 其中,所述蛋白突变网络与所述第一自然语言模型和用于将文本描述映射为突变特征的第二自然语言模型进行联合训练,通过向所述第二自然语言模型输入虚拟词得到突变特征,所述联合训练包括预训练阶段,在所述预训练阶段,接受样本蛋白质氨基酸序列和样本文献作为输入,分别通过条件控制的下一个词预测任务和条件控制的掩码预测任务进行训练,实现文本模态和蛋白序列模态的初步对齐; 其中,所述联合训练还包括微调阶段,所述微调阶段采用两轮对话的思维链形式,第一轮对话要求模型基于突变前蛋白对其功能进行预测,第二轮对话要求模型整合前一轮对话的结果,基于突变特征预测突变效应,或基于突变效应描述预测突变的位置和内容; 其中,所述样本蛋白质氨基酸序列和所述样本文献来源于预先建立的样本数据集,所述样本数据集的中数据的处理步骤包括: 从预先建立的蛋白质知识数据库中获取蛋白质的突变记录,所述突变记录包括突变效应的专家撰写的描述; 根据突变记录关联的参考信息进行检索,得到所述突变记录关联的出版物的摘要; 基于大型语言模型处理检索的出版物的摘要,得到丰富后的突变效应的描述; 通过为良性和恶性突变构建反向样本来平衡样本数据集; 通过大型语言模型去除样本数据集的描述中低质量的描述。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学;北京水木分子生物科技有限公司,其通讯地址为:100084 北京市海淀区清华园;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励