华东理工大学阮彤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华东理工大学申请的专利一种基于知识图谱的分子性质预测大语言模型构建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119446336B 。
龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411471393.4,技术领域涉及:G16C20/50;该发明授权一种基于知识图谱的分子性质预测大语言模型构建方法是由阮彤;蒲志立;胡航;邹奕楠;张沐;叶琪设计研发完成,并于2024-10-22向国家知识产权局提交的专利申请。
本一种基于知识图谱的分子性质预测大语言模型构建方法在说明书摘要公布了:本发明公开了一种基于知识图谱的分子性质预测大语言模型构建方法。该方法包括多个步骤:首先,利用高通量数据采集技术获取预训练语料,包括分子属性和代谢途径等相关数据。然后,基于这些数据构建关于十四个端点的知识图谱,知识图谱以三元组形式表示分子与其属性和端点间的关系。接着,使用LoRA技术对大语言模型进行预训练,采用增量学习策略优化模型,并形成专家大模型。随后,利用RAG技术从知识图谱中检索与目标端点相关的三元组,并对检索结果进行整理。通过提示词设计,专家大模型对检索到的三元组进行过滤,提取关键信息。最后,将过滤后的三元组列表转化为自然语言输入给专家大模型,生成分子性质的预测结果并提供推理依据。该方法显著提升了分子与端点化学反应预测的准确性和效率。
本发明授权一种基于知识图谱的分子性质预测大语言模型构建方法在权利要求书中公布了:1.一种基于知识图谱的分子性质预测大语言模型构建方法,其特征在于,包括: S1:数据获取;通过高通量数据采集,获取预训练语料和构建知识图谱所需的相关数据; S2:知识图谱构建;在数据准备阶段,利用收集的分子属性、代谢途径信息,构建关于端点的知识图谱;该知识图谱由三元组组成,定义了节点和关系,节点包括SMILES节点、属性节点、代谢途径节点和端点节点,关系包括“具有属性”、“经历”和“影响”类型,具体来说,通过“具有属性”关系关联SMILES节点与属性节点以及端点节点与属性节点,“经历”关系关联SMILES节点与代谢途径节点,“影响”关系关联SMILES节点与端点节点;知识图谱中共有十四个端点,包括雄激素受体、芳香烃受体、抗氧化应激反应元件、雄激素受体配体结合域、芳香化酶、ATP酶相关蛋白5、癌症、雌激素受体、雌激素受体配体结合域、糖皮质激素受体、热休克元件、基质金属蛋白酶、细胞周期蛋白53和甲状腺激素受体;具体三元组包括: SMILES,具有属性,属性节点;SMILES,经历,代谢途径;SMILES,影响,端点节点;端点节点,具有属性,属性节点; S3:预训练大语言模型;使用获取的语料对大语言模型进行预训练,利用LoRA技术对模型的所有层进行增量学习,训练后的模型为专家大模型; S4:利用RAG技术进行知识检索,从端点的知识图谱中检索出相关的三元组信息,并将结果整理为三元组列表; S5:过滤检索数据;构建合适的提示词prompt,让专家大模型对检索到的三元组列表进行过滤,得到过滤后的三元组列表; S6:分子性质预测及推理;将过滤后的三元组列表转化为自然语言描述,作为新的提示词输入专家大模型,得到分子性质的预测结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华东理工大学,其通讯地址为:200237 上海市徐汇区梅陇路130号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励