恭喜中国电子科技集团公司第十五研究所黄杨琛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中国电子科技集团公司第十五研究所申请的专利融合多任务和多标签学习的司法领域深度事件抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114580428B 。
龙图腾网通过国家知识产权局官网在2025-06-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210078832.X,技术领域涉及:G06F40/30;该发明授权融合多任务和多标签学习的司法领域深度事件抽取方法是由黄杨琛;王立才;郭前进;李孟书;李兴宇设计研发完成,并于2022-01-24向国家知识产权局提交的专利申请。
本融合多任务和多标签学习的司法领域深度事件抽取方法在说明书摘要公布了:本发明公开了融合多任务和多标签学习的司法领域深度事件抽取方法,能够基于BERT预训练模型与multi‑task实现触发词提取与事件分类,在增强后的数据上通过多标签分类实现事件要素提取的司法领域事件抽取。目前针对司法领域文本特点,提出一种基于预训练模型BERT的事件抽取模型,通过maskedLM方法在领域数据上对BERT进行调优,以学习到更适合领域知识的特征表示;将触发词提取和事件分类任务联合,以multi‑task的形式将两个任务统一到一个损失函数中,利用任务之间的相关性促进学习性能的提升;使用事件要素的start与end标注进行学习与预测,对于多个事件要素,分别设计对应的网络层进行抽取,减少不同要素之间的相互干扰。
本发明授权融合多任务和多标签学习的司法领域深度事件抽取方法在权利要求书中公布了:1.一种融合多任务学习和多标签学习的司法领域深度事件抽取方法,其特征在于,包括如下步骤 步骤1:取司法领域数据进行人工标注,所标注的标签包括事件类型和事件元素,获得司法领域数据集; 步骤2:利用中文预训练语言模型BERT在司法领域数据集上,采用MaskedLM语言学习模型进行网络调优,学习到适合司法领域知识的网络参数,从而得到司法领域BERT模型,利用所述司法领域BERT模型的输出为文本的语义信息; 步骤3:构建multi-task网络,所述multi-task网络采用所述司法领域BERT模型提取文本的语义信息作为输入,multi-task网络定义包含触发词起始位置预测、触发词结束位置预测以及事件类型预测三个任务共同定义的损失函数进行调优,multi-task网络的输出包括预测的事件类型、预测的触发词起始位置以及预测的触发词结束位置; 步骤4:根据事件类型确定事件要素,构建事件要素抽取模型,所述事件要素抽取模型以司法领域BERT模型提取的文本语义信息为输入,并为每一个事件要素学习专属的网络参数,在每个事件要素对应网络的最后一层,对每一个分词token分别预测是否属于当前事件要素的起始位置或者结束位置。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电子科技集团公司第十五研究所,其通讯地址为:100083 北京市海淀区北四环中路211号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。