首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

提升知识系统中自然语言处理准确性的方法、设备及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国科学技术大学

摘要:本发明公开一种提升知识系统中自然语言处理准确性的方法、设备及介质,方法包括:步骤1,将待处理知识系统的自然语言构建为待补全知识图谱;步骤2,获取每个三元组的语义模式;步骤3,用语义模式对三元组填充合适的词获得多个语义完整的候选句子;步骤4,添加提示句得出将任务形式转为掩蔽语言建模预训练任务的多个带有完整语义的提示句作为正、负训练样本;步骤5,将正、负训练样本输入预训练语言模型,用交叉熵损失训练预训练语言模型直到满足训练条件;步骤6,用训练好预训练语言模型补全待补全知识图谱;步骤7,处理补全后的知识图谱得出处理结果。该方法提升了智能知识系统中对应知识图谱的自然语言处理的准确性。

主权项:1.一种提升知识系统中自然语言处理准确性的方法,其特征在于,包括:步骤1,将根据知识系统中待处理的自然语言构建的知识图谱作为待补全的知识图谱,待补全的知识图谱中三元组数据的头实体、关系、尾实体分别对应待处理的自然语言的主语、谓语、宾语;步骤2,从步骤1构建的待补全知识图谱获取三元组数据,从获取的三元组数据中每一个三元组获取各三元组的语义模式;步骤3,利用步骤2获取的每个三元组的语义模式,对三元组填充合适的词获得语义完整的候选句子后从中选择多个合理的候选句子;步骤4,在步骤3选择的多个合理的候选句子后面均添加一个提示句,得出能将任务形式重制为掩蔽语言建模预训练任务的多个带有[MASK]标签的提示句作为正训练样本,并对各正训练样本进行负采样获得与正训练样本数量一致的多个负训练样本,将多个正、负训练样本随机打乱后作为最终训练样本;步骤5,用步骤4得到的最终训练样本,使用交叉熵损失对预训练语言模型进行训练直到满足训练结束条件,完成预训练语言模型的训练;步骤6,利用训练好的预训练语言模型对待补全知识图谱的三元组数据进行补全;步骤7,对补全后的知识图谱进行处理,得出该知识图谱对应的自然语言的处理结果。

全文数据:

权利要求:

百度查询: 中国科学技术大学 提升知识系统中自然语言处理准确性的方法、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。