买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:郑州大学
摘要:本发明涉及事件抽取领域,公开了一种基于预训练语言模型的中文事件抽取方法。首先,本发明提供一种基于预训练语言模型的事件抽取模型的构建方法:将事件抽取任务重新划分,并基于高质量预训练语言模型分别构建句级事件检测模型以及事件元素标注模型;其次,本发明提供一种基于预训练语言模型的事件抽取方法:通过句级事件检测模型对样本进行事件分类、通过事件元素标注模型对样本进行元素标注。本发明能够有效地在中文数据上进行事件抽取,并且通过多阶段数据增强,对当前事件抽取模型构建过程中因数据质量不足导致的过拟合问题进行了优化,提高事件抽取的准确度。
主权项:1.一种基于预训练语言模型的中文事件抽取模型构建方法,其特征在于,所述方法包括:使用遮罩语言模型MaskedLanguageModel,MLM任务对预训练语言模型Ernie-3.0-xbase-zh进行预训练阶段数据增强训练;基于数据增强后的Ernie-3.0-xbase-zh构建句级事件检测模型,使用目标数据集对模型进行训练并添加额外的事件平衡数据对模型进行句级事件检测阶段的数据增强训练,得到句级事件检测模型并保存;基于数据增强后的Ernie-3.0-xbase-zh构建事件元素标注模型,使用目标数据集对模型进行训练并使用额外的事件抽取数据集对模型进行事件元素标注阶段的数据增强训练,得到事件元素标注模型并保存。
全文数据:
权利要求:
百度查询: 郑州大学 一种基于预训练语言模型的中文事件抽取方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。