东北林业大学李洋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东北林业大学申请的专利基于提示学习的多模态细粒度分子预训练模型的分子结构预测系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119479906B 。
龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411539556.8,技术领域涉及:G16C20/70;该发明授权基于提示学习的多模态细粒度分子预训练模型的分子结构预测系统是由李洋;卫政鑫;汪国华设计研发完成,并于2024-10-31向国家知识产权局提交的专利申请。
本基于提示学习的多模态细粒度分子预训练模型的分子结构预测系统在说明书摘要公布了:基于提示学习的多模态细粒度分子预训练模型的分子结构预测系统,本发明涉及分子结构预测领域,特别涉及分子结构预测系统。本发明的目的是为了解决现有方法因数据稀缺和任务适用性不足导致在处理复杂分子数据时存在准确性和效率低,以及分子间相互作用预测准确性低的问题。系统包括:数据获取模块用于获取多模态分子预训练数据集内的样本数据以及下游任务数据集内的样本数据;处理模块用于建立基于提示学习的多模态细粒度分子预训练模型,并获取训练好的基于提示学习的多模态细粒度分子预训练模型;预测模块用于基于训练好的提示学习的多模态细粒度分子预训练模型对待测分子结构进行属性和药物相互作用关系的预测,获得预测结果。
本发明授权基于提示学习的多模态细粒度分子预训练模型的分子结构预测系统在权利要求书中公布了:1.基于提示学习的多模态细粒度分子预训练模型的分子结构预测系统,其特征在于: 所述系统包括:数据获取模块、处理模块、预测模块; 所述数据获取模块用于获取多模态分子预训练数据集内的样本数据以及下游任务数据集内的样本数据; 处理模块用于建立基于提示学习的多模态细粒度分子预训练模型,并获取训练好的基于提示学习的多模态细粒度分子预训练模型; 所述预测模块用于基于训练好的提示学习的多模态细粒度分子预训练模型对待测分子结构进行属性和药物相互作用关系的预测,获得预测结果; 所述数据获取模块用于获取多模态分子预训练数据集内的样本数据以及下游任务数据集内的样本数据; 具体过程为: 多模态分子预训练数据集内的样本数据为分子‑文本对; 下游任务数据集内的样本数据为分子结构; 所述处理模块用于建立基于提示学习的多模态细粒度分子预训练模型,并获取训练好的基于提示学习的多模态细粒度分子预训练模型; 具体过程为: 基于提示学习的多模态细粒度分子预训练模型包括:细粒度分子图构建模块、分子和文本描述表示学习模块、自监督协同对比优化模块、指令微调下游任务模块; 所述细粒度分子图构建模块采用特定的分解规则将多模态分子预训练数据集内的样本数据中的分子结构图G分解为子结构单元,基于子结构单元构建细粒度分子图G'; 所述分子和文本描述表示学习模块用于将多模态分子预训练数据集内的样本数据中的文本描述T输入文本编码器,文本编码器输出语义特征;将PubChem数据集中的165万个分子结构对应的细粒度分子图G″输入分子编码器,分子编码器输出分子特征向量;对分子编码器GIN进行训练,得到预训练好的分子编码器GIN; 所述自监督协同对比优化模块采用对比学习方法训练预训练好的分子编码器GIN和文本编码器,获得训练好的分子编码器GIN和文本编码器;训练好的分子编码器GIN和文本编码器构成多模态细粒度分子预训练模型; 所述指令微调下游任务模块用于采用提示学习引导多模态细粒度分子预训练模型理解下游任务,获得训练好的基于提示学习的多模态细粒度分子预训练模型; 所述细粒度分子图构建模块采用特定的分解规则将多模态分子预训练数据集内的样本数据中的分子结构图G分解为子结构单元,基于子结构单元构建细粒度分子图G'; 具体过程为: 1、基于RDKit工具获取多模态分子预训练数据集内的样本数据中的SMILES字符串表示的分子结构中每个原子的化学元素特征; 所述每个原子的化学元素特征包含原子的序号、连接度、原子间的键类型和原子成环类型; 将连接度特征作为节点特征; 将原子间的键类型和原子成环类型作为键特征; 所述连接度为与原子相连的化学键的数量; 2、基于RDKit工具将多模态分子预训练数据集内的样本数据中的SMILES字符串表示的分子结构转换为2D拓扑图G=V,E; 其中,V表示2D拓扑图G的节点集合,E表示2D拓扑图G的边集合; 3、基于BRICS分解方法对多模态分子预训练数据集内的样本数据中的分子结构进行分解,得到子结构单元;具体过程为: 基于BRICS分解方法对多模态分子预训练数据集内的样本数据中的分子结构进行初步分解,得到初步分解后的多个子结构单元; 对初步分解后的每个子结构单元进行分解,得到最小的多个子结构单元; 4、将子结构单元作为新节点Vf添加至拓扑图中; 将每个子结构单元与自身包含的节点的连接关系Ef作为新的边添加至拓扑图中; 构建空的图级节点Vg,将图级节点Vg与所有新节点Vf相连得到连接关系Eg,基于V,Vf,Vg,E,Ef,Eg形成细粒度分子图G'; G′=V′,E′,V′=[V,Vf,Vg],E′=[E,Ef,Eg]。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北林业大学,其通讯地址为:150040 黑龙江省哈尔滨市香坊区和兴路26号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励