恭喜浙江工业大学江颉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江工业大学申请的专利一种基于对比学习的专业领域术语挖掘方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115794998B 。
龙图腾网通过国家知识产权局官网在2025-05-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211632497.X,技术领域涉及:G06F16/334;该发明授权一种基于对比学习的专业领域术语挖掘方法是由江颉;王育涵;吕明琪;陈铁明设计研发完成,并于2022-12-19向国家知识产权局提交的专利申请。
本一种基于对比学习的专业领域术语挖掘方法在说明书摘要公布了:本发明公开了一种基于对比学习的专业领域术语挖掘方法,属于机器学习技术领域,包括基于专业领域的语料库形成术语列表;对术语列表中的术语进行领域分类;基于术语列表构建专业领域的树型术语关系树。本发明使用了bert预训练模型训练词向量,并且使用对比学习的方式训练句子向量,通过预训练,可以大大增强模型在下游任务进行分类和关系识别的能力,使模型达到最大的效果。同时考虑专业术语词向量和整体的文段向量,相互融合后提取征,有更好的预测性。
本发明授权一种基于对比学习的专业领域术语挖掘方法在权利要求书中公布了:1.一种基于对比学习的专业领域术语挖掘方法,其特征在于,所述基于对比学习的专业领域术语挖掘方法,包括:步骤1、基于专业领域的语料库形成术语列表;步骤1-1、采用信息熵算法和互信息算法挖掘语料库中的新短语;步骤1-2、将挖掘的新短语加入分词词库,以分词词库对语料库中所有语句进行分词,并提取每一分词词语中的关键词,对提取的关键词去重合并后形成关键词列表;步骤1-3、过滤关键词列表中的非专业词语,并进行词条匹配得到术语列表;步骤2、对术语列表中的术语进行领域分类;步骤2-1、取术语列表中每条术语对应的词条;步骤2-2、将词条分句,并将各分句输入基于对比学习的句向量学习模型,输出词条中各分句对应的句向量;步骤2-3、将术语对应的bert模型训练的词向量和术语对应词条中各分句对应的句向量拼接后输入分类模型,得到术语的领域分类结果;步骤3、基于术语列表构建专业领域的树型术语关系树;步骤3-1、根据领域分类结果对术语列表中的术语进行聚类;步骤3-2、将术语与术语所在的分句向量进行拼接,拼接后再与术语所在的文段向量进行拼接得到术语的特征向量;所述术语所在的分句向量由对比学习模型基于术语所在专业文献中的摘要部分训练得到,所述术语所在的文段向量由bert模型基于术语所在专业文献中的摘要部分训练得到;步骤3-3、将属于同一类别的术语的特征向量成对输入基于对比学习的关系识别模型,得到每对中两个术语之间的关系;步骤3-4、根据两两术语之间的关系,构建各个专业领域的树型术语关系树。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市下城区朝晖六区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。