首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于再注意力机制和对比损失的法律案情要素抽取方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:湖南大学

摘要:本发明公开了一种基于再注意力机制和对比损失的法律案情要素抽取方法,包括法律文本预处理步骤、法律文本与法律案情要素标签联合嵌入步骤、法律案情要素标签表示提取步骤、法律文本表示精化步骤以及法律案情要素标签预测步骤,法律文本与法律案情要素标签联合嵌入步骤是使用预训练模型RoBERTa对法律文本和法律案情要素标签一起进行编码;法律案情要素标签表示提取步骤是从RoBERTa的输出中得到法律案情要素标签表示;法律文本表示精化步骤是使用法律案情要素标签表示来去除法律文本表示中的冗余信息;法律案情要素标签预测步骤则得到每个法律案情要素标签的概率分布。本发明可以有效的识别相似的法律案情要素标签和提升低频法律案情要素标签的预测性能。

主权项:1.一种基于再注意力机制和对比损失的法律案情要素抽取方法,其特征在于,包括以下步骤:步骤101:法律文本预处理步骤:获得法律文本数据集,去除法律文本数据集中重复的数据,法律文本数据集包括若干法律文本和对应的法律案情要素标签文本;步骤S102:对预训练模型RoBERTa进行训练,训练步骤如下:步骤1021:法律文本与法律案情要素标签联合嵌入步骤:将法律文本数据集一起输入到预训练模型RoBERTa中得到联合文本表示;步骤1022:法律案情要素标签表示提取步骤:从拼接文本表示里提取出法律案情要素标签表示,并使用对比损失对法律案情要素标签表示进行优化,得到法律文本表示;步骤1023:法律文本表示精化步骤:从法律文本与法律案情要素标签联合嵌入步骤中得到的拼接文本表示里提取出法律文本表示,将法律文本表示与法律案情要素表示进行两次交叉注意力得到去除冗余信息后的法律文本表示;步骤1024:将去除冗余信息的法律文本表示O输入到分类器中得到每一个法律案情要素标签的概率分布和分类器的损失得到模型的总损失λ是0到1之间的超参数;步骤1025:训练直至总损失小于预设值得到训练好的模型RoBERTa;步骤S103:将待抽取的法律案情要素的法律文本输入训练好的模型RoBERTa抽取得到对应的法律案情要素。

全文数据:

权利要求:

百度查询: 湖南大学 基于再注意力机制和对比损失的法律案情要素抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。