买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:吉林大学
摘要:本发明公开了一种基于知识蒸馏与变分自编码器的命名实体识别方法,属于人工智能的自然语言处理技术领域,包括以下步骤:构建有偏数据集对BERT‑large模型进行训练,获得有偏模型,作为教师模型;构建含跨域实体的数据集,结合变分自编码器对BERT‑large模型进行训练,获得学生模型;获取教师模型的输出特征,并从学生模型的变分自编码器的映射空间中解耦出鲁棒性特征和非鲁棒性特征;基于知识蒸馏将非鲁棒性特征与教师模型的输出特征进行拟合,进一步解耦出学生模型中更加鲁棒的特征,基于解耦出的鲁棒性特征进行命名实体识别。本发明实现了对命名实体识别任务中捷径学习的有效缓解,提升了命名实体识别任务的准确性。
主权项:1.一种基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,包括以下步骤:构建有偏数据集,基于所述有偏数据集对BERT-large模型进行训练,获得有偏模型,将所述有偏模型作为教师模型;构建含跨域实体的数据集,基于所述含跨域实体的数据集结合变分自编码器对BERT-large模型进行训练,获得学生模型;获取教师模型的输出特征,并从学生模型的变分自编码器的映射空间中初步解耦鲁棒性特征和非鲁棒性特征;基于知识蒸馏将初步解耦出的非鲁棒性特征与教师模型的输出特征进行拟合,进一步解耦出学生模型中非鲁棒性的特征;进而进一步解耦出学生模型中鲁棒性的特征,基于解耦出的鲁棒性特征进行命名实体识别。
全文数据:
权利要求:
百度查询: 吉林大学 一种基于知识蒸馏与变分自编码器的命名实体识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。