买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北方工业大学
摘要:本发明提供一种隐喻识别方法、系统及设备和存储介质,属于自然语言处理技术领域,通过对目标数据进行数据增强处理,丰富句子和目标词的语义表示,结合隐喻词的光泽度gloss信息,使用双编码器有效地捕捉了句子的语义细微差别和隐喻的语言特征,从而使训练得到的隐喻词识别公式中的参数更为精确,从而取得良好的隐喻识别效果。
主权项:1.一种隐喻识别方法,其特征在于,包括如下步骤:对目标输入语句进行增强处理,使目标输入语句生成相似语句,并将所述目标输入语句与所述相似语句进行拼接,得到增强的输入语句;其中,所述目标输入语句包括带有隐喻词标记的目标词、所述目标词的词性标签和所述目标词的释义;对所述增强的输入语句进行数据预处理,使所述增强的输入语句的长度为预设数据长度,得到预处理的输入语句;将所述预处理的输入语句输入预构建的隐喻词识别模型中,所述隐喻词识别模型包括左右编码层、与所述左右编码层连接的嵌入矩阵编码层、与所述嵌入矩阵编码层连接的向量表示提取层、与所述向量表示提取层连接的相似度计算表示层和与所述相似度计算表示层连接的线性函数层;在所述左右编码层中,分别通过左编码器和右编码器对所述预处理的输入语句进行编码处理,分别得到左编码和右编码;其中,所述左编码包括所述增强的输入语句的语意信息和增强的输入语句;所述右编码包括所述增强的输入语句的语意信息、所述目标词、所述目标词的词性标签、所述目标词的释义和所述目标词的基本含义;在所述嵌入矩阵编码层中,对所述左编码和所述右编码分别进行分割和嵌入矩阵编码处理,分别得到左嵌入矩阵和右嵌入矩阵;在所述向量表示提取层中,从所述左嵌入矩阵中提取所述目标词在上下文中的含义向量和增强的输入语句的上下文嵌入向量,以及从所述右嵌入矩阵中提取所述目标词的基本含义向量、所述目标词的词性标签向量和所述目标词的释义向量;在所述相似度计算表示层中,将所述目标词在上下文中的含义向量与所述目标词的基本含义向量代入预设的MIP相似度计算表示公式中,得到MIP向量表示,以及将所述增强的输入语句的上下文嵌入向量与所述目标词在上下文中的含义向量代入第一SPV相似度计算表示公式中,得到第一SPV向量表示,和将所述目标词的释义向量与所述目标词在上下文中的含义向量代入第二SPV相似度计算表示公式中,得到第二PVV向量表示;在所述线性函数层中,将所述MIP向量表示、第一SPV向量表示、第二SPV向量表示、以及所述目标词的词性标签向量代入预设的隐喻预测标签公式中,基于对所述目标词的预设结果数值,对所述隐喻预测标签公式中的参数值进行训练,并将训练后的参数值作为所述隐喻词识别模型的参数,得到训练好的隐喻词识别模型,并利用所述隐喻词识别模型对待识别的输入语句进行隐喻识别。
全文数据:
权利要求:
百度查询: 北方工业大学 隐喻识别方法、系统及设备和存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。