买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京明略科技有限公司
摘要:本发明公开了一种基于孪生网络的FAQ问答库匹配方法与系统,所述方法包括:在嵌入层中使用预训练的词向量和字向量对输入的两个问句做联合嵌入表示;在编码层利用孪生网络架构,使用两个双向的LSTM网络,分别对问句进行上下文编码,并进行特征提取,将LSTM网络每一个时间步的隐藏层状态值输入至注意力层;在注意力层将隐藏层状态值基于注意力机制进行加权求和,得到问句的语义表征向量;在特征融合层采用特征增强的方法将语义表征向量进行拼接,得到总的特征向量;在输出层通过全连接层对总的特征向量做线性变换来转换输出的维度,最后通过softmax函数得到两个问句的概率分布,输出两个问句的语义相似度。
主权项:1.一种基于孪生网络的FAQ问答库匹配方法,其特征在于,包括:输入步骤:在嵌入层中输入两个问句并对其进行处理,将处理完成后的所述问句中的词向量和字向量融合后输入至编码层;信息抽取步骤:在所述编码层利用孪生网络架构,使用两个双向的LSTM网络,分别从所述问句的两个方向对融合后的所述词向量和所述字向量进行上下文编码,并进行问句特征提取,将LSTM网络每一个时间步的隐藏层状态值输入至注意力层;语句加权步骤:在所述注意力层将所述隐藏层状态值基于注意力机制进行加权求和,得到所述问句的语义表征向量,将所述语义表征向量输入至特征融合层;所述语句加权步骤进一步包括:加权求和步骤,将所述隐藏层状态值与每个所述隐藏层状态值的权重参数进行加权求和,得到所述问句的语义表征向量;特征融合步骤:在所述特征融合层采用特征增强的方法将所述语义表征向量进行拼接,拼接后得到的特征向量输入至输出层;所述特征融合步骤进一步包括:特征增强步骤,将所述语义表征向量通过进行求和、求差与点积操作得到三个不同的特征向量,并对所述三个不同的特征向量进行拼接;输出步骤:在所述输出层通过全连接层对所述特征向量做线性变换来转换输出的维度,进而通过softmax函数得到两个所述问句的概率分布,输出两个所述问句的语义相似度;所述输出步骤进一步包括:线性变换步骤,拼接后的所述特征向量经过全连接层进行线性变换,将所述特征向量的维度变换到判断两个句子是否相似所需要的维度;概率分布获得步骤,基于线性变换后的所述特征向量通过所述softmax函数输出所述特征向量的概率分布;判断步骤,根据所述概率分布判断两个所述问句是否语义相似,若所述问句语义相似,则输出FAQ问答库中相应的解决方案;若所述问句语义无关,则通过之后的用户意图识别以及信息交互,返回用户所需要的解决方案。
全文数据:
权利要求:
百度查询: 南京明略科技有限公司 一种基于孪生网络的FAQ问答库匹配方法与系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。