买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国科学院自动化研究所
摘要:本公开涉及自然语言处理技术领域,具体涉及一种因果关系的识别方法、装置、电子设备、存储介质和计算机程序产品,因果关系的识别方法包括:获取目标语言的待识别文本数据;基于源语言的文本数据训练得到的异构图交互网络,对待识别文本数据中事件间的因果关系进行识别,其中,目标语言包括与源语言不同的语言。可以通过构建异构图交互网络并对源语言中包含事件对的陈述、以及不包含事件对的陈述进行多语言复写后,在陈述层面使用对比学习的方式提高从源语言学习的因果知识的跨语言可迁移性;使得用源语言中的标注数据训练的异构图交互网络能够直接应用于目标语言,实现零样本跨语言的文档级因果识别模型,解决了低资源语言识别能力差的问题。
主权项:1.一种因果关系的识别方法,其特征在于,包括:获取目标语言的待识别文本数据;基于源语言的文本数据训练得到的异构图交互网络,对所述待识别文本数据中事件间的因果关系进行识别,其中,所述目标语言包括与所述源语言不同的语言;其中,所述异构图交互网络的训练步骤包括:获取所述源语言的文本数据;基于所述源语言的文本数据生成异构图交互网络,其中,所述异构图交互网络包括:与所述源语言的文本数据中的陈述对应的陈述节点,所述陈述为包含两个事件的句子;基于预训练的语言模型获取所述异构图交互网络中每个节点的初始特征向量;基于所述初始特征向量,使用图注意力网络通过优化损失函数来学习所述异构图交互网络中各节点的嵌入表示,以对所述异构图交互网络进行训练,其中,所述损失函数用于通过正负样本之间的对比学习来最大化正样本之间的相似度、最小化负样本之间的相似度,所述正样本包括基于所述源语言的文本数据中包含因果事件的陈述复写得到的多语言陈述文本,所述负样本包括基于所述源语言的文本数据中不包含因果事件的陈述复写得到的多语言陈述文本。
全文数据:
权利要求:
百度查询: 中国科学院自动化研究所 因果关系的识别方法、装置、电子设备、存储介质和计算机程序产品
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。