首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

正例未标注度量学习文档级关系抽取方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华东师范大学

摘要:本发明公开了一种正例未标注度量学习文档级关系抽取方法,用于不完全标注的文档级关系抽取的正样本增强和正样本mixup的正例未标注度量学习。本发明采用了正例未标注学习与ATLOP(AdaptiveThresholdingandLocalizedcontextPooling)结合的模型作为本方法的主要编码模型。首先将正例未标注学习与度量学习结合以将带有无类别关系的文档级关系抽取转化为一种基于代理的度量学习任务,学习到更加强大和鲁棒的数据表征,然后通过dropout数据增强,以及mixup增强与伪负样本,进一步增强模型的泛化能力,最后在关系抽取数据集DocRED,ChemDisGene,Re‑DocRED上的充分实验表明,本发明在不完全和完全标注的情景下都达到了最先进的结果,并且对先验估计偏差具有鲁棒性。

主权项:1.一种正例未标注度量学习文档级关系抽取方法,其特征在于,具体包括以下步骤:步骤1:正例未标记度量学习首先设置一个无类别关系数据中没有这种关系,然后分别为每个正类别关系和无类别关系设置一个锚点,通过改造正负度量学习的损失函数,将带有无类别关系的文档级关系抽取转化为一种基于代理的度量学习任务;步骤2:Dropout扰动正例增强使用dropout扰动来扩展正样本的分布转化为正样本增强正例未标注度量学习,缓解标注样本分布有偏的问题;步骤3:Mixup增强与伪负样本在每个类别的正负样本之间进行插值,进一步增强模型的关系抽取能力,使得模型最终抽取关系三元组的效果更好。

全文数据:

权利要求:

百度查询: 华东师范大学 正例未标注度量学习文档级关系抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。