买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于少数类识别所有类的零样本事件检测方法,涉及自然语言处理领域,包括:将数据集分为已知事件类型和未知事件类型;对已知事件类型的原始文本进行编码;通过原型网络获得原型集合;采用STIC算法从原型集合中提取原型子集;计算原始文本编码后的数据与原型子集的相似性,生成特征数据集;对特征数据集进行编码;将编码后的特征数据集输入到Transformer分类器中进行训练和分类。本发明利用原型网络和STIC算法提取原型子集,有效地捕捉了不同事件类型之间的相似性和差异性,在面对未知事件类型时仍能保持高度准确的分类能力,大大降低了误判率和漏检率,同时由于不依赖于大量的已标记样本数据,能够有效应对零样本事件检测的需求。
主权项:1.一种基于少数类识别所有类的零样本事件检测方法,其特征在于,所述方法包括以下步骤:步骤1、将数据集分为已知事件类型和未知事件类型;步骤2、对已知事件类型的原始文本进行编码;步骤3、通过原型网络获取已知事件类型的原型,获得原型集合;步骤4、采用STIC算法从原型集合中提取原型子集;步骤5、计算原始文本编码后的数据与所述原型子集的相似性,每个相似度值作为一个特征值,生成特征数据集;步骤6、对特征数据集进行编码;步骤7、将编码后的特征数据集输入到Transformer分类器中进行训练和分类。
全文数据:
权利要求:
百度查询: 上海交通大学 一种基于少数类识别所有类的零样本事件检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。