首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于标签向量正交约束的司法关系要素抽取方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:人民法院信息技术服务中心;北京大学

摘要:本说明书涉及司法关系要素抽取技术领域,提供了一种基于标签向量正交约束的司法关系要素抽取方法及装置,该方法包括:对司法文本集合内每个司法文本中的实体对进行标注;在标注后的每个司法文本中增加针对所述实体对的关系提示语句;所述关系提示语句中的每个司法关系类型均由多个不同的掩码组成;将加入关系提示语句后的司法文本转换为向量化司法文本;以所述向量化司法文本为输入,以任务损失和正交损失共同作为优化参数,训练深度学习模型,以获得司法关系要素抽取模型;利用所述司法关系要素抽取模型,从待处理司法文本中抽取实体对的司法关系要素。本说明书实施例可以提高司法领域关系抽取要素的抽取精度。

主权项:1.一种基于标签向量正交约束的司法关系要素抽取方法,其特征在于,包括:对司法文本集合内每个司法文本中的实体对进行标注;在标注后的每个司法文本中增加针对所述实体对的关系提示语句;所述关系提示语句中的每个司法关系类型均由多个不同的掩码组成;将加入关系提示语句后的司法文本转换为向量化司法文本;以所述向量化司法文本为输入,以任务损失和正交损失共同作为优化参数,训练深度学习模型,以获得司法关系要素抽取模型;利用所述司法关系要素抽取模型,从待处理司法文本中抽取实体对的司法关系要素;其中,所述以所述向量化司法文本为输入,以任务损失和正交损失共同作为优化参数,训练深度学习模型,以获得司法关系要素抽取模型,包括:获取每个所述向量化司法文本中对应司法关系类型的掩码向量组,并初始化深度学习模型的关系要素标签向量矩阵;所述关系要素标签向量矩阵为全量候选关系要素标签的向量表示;将每个所述掩码向量组的每个掩码向量分别与所述关系要素标签向量矩阵进行内积并归一化,以对应获得所述关系要素标签向量矩阵中与每个所述掩码向量最匹配的目标关系要素标签;每个所述掩码向量最匹配的目标关系要素标签为:所述关系要素标签向量矩阵中与本掩码向量的内积归一化值最大者对应的关系要素标签;计算每个所述目标关系要素标签与真实关系要素标签的交叉熵损失值,并将同一掩码向量组内的所有交叉熵损失值的均值作为本掩码向量组的任务损失值;计算同一掩码向量组内的每两个掩码向量之间的内积值,并将同一掩码向量组内的所有内积值的均值,作为本掩码向量组的正交损失值;计算所有掩码向量组的任务损失值的第一均值,并计算所有掩码向量组的正交损失值的第二均值;当所述第一均值或所述第二均值不小预设阈值时,更新所述关系要素标签向量矩阵,并迭代计算,直至当前深度学习模型的关系要素标签向量矩阵下的第一均值和第二均值均小于预设阈值时,将当前深度学习模型作为司法关系要素抽取模型;其中,利用所述司法关系要素抽取模型,从待处理司法文本中抽取实体对的司法关系要素,包括:将待处理司法文本转换为司法文本向量;将所述司法文本向量输入至所述司法关系要素抽取模型,以预测所述司法文本向量中实体对的司法关系要素。

全文数据:

权利要求:

百度查询: 人民法院信息技术服务中心 北京大学 基于标签向量正交约束的司法关系要素抽取方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。