买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种对话式知识库问答实现方法,步骤1:预先定义模糊推理语法体系;步骤2:获取待回答的当前问题、对话历史信息,通过GloVe模型得到向量表示;步骤3:得到编码器的隐状态向量;步骤4:从特征表示中识别出命名实体及其类型;步骤5:得到知识库中的实体ID;步骤6:得到问题在当前语法框架下的逻辑形式;步骤7:预测问题中的关系ID和实体类型ID;步骤8:得到可在知识库上执行的查询语句;步骤9:在知识库中执行该查询语句,得到当前问题对应的答案。与现有技术相比,本发明自动识别出对话中用户问题的意图,提高了对话中应答的准确率,适用于开放领域知识图谱问答,能提升用户体验满意度。
主权项:1.一种对话式知识库问答实现方法,其特征在于,该方法包括以下步骤:步骤1:预先定义模糊推理语法体系;步骤2:获取待回答的当前问题、对话历史信息,通过GloVe模型得到向量表示;步骤3:通过基于多头注意力机制的编码器,得到编码器的隐状态向量,表示如下:henc=encoderx;θenc其中,encoder是编码器函数,θdec是编码器函数的可训练参数;步骤4:通过基于LSTM的命名实体识别模型,从特征表示中识别出命名实体及其类型,具体包括以下操作:步骤S401:通过基于LSTM的命名实体识别模型,从特征表示中识别出命名实体及其类型,表示如下:hLSTM=LSTMhenc;θLSTM其中,LSTM是长短期记忆网络,θLSTM是LSTM的可训练参数,hLSTM是通过LSTM得到的隐状态向量;步骤S402:筛选识别出的实体,通过前馈神经网络,对问题中的实体进行筛选,表示如下:hFFN=LeakyReLUWFFN1[henc;hLSTM] 其中,LeakyReLU是带泄露修正线性单元,WFFN1和WFFN2是线性层1和2的可训练参数,用以变换矩阵维度,hFFN是前馈神经网络的隐状态向量,Py|ER|x表示yER相对于x的概率,x是输入序列,yER是命名实体识别任务的真实标签,是在时间步t的前馈神经网络隐状态向量;步骤5:通过基于XLNet的实体消歧模型,将识别出的实体链接到知识库中的实体,得到知识库中的实体ID;步骤6:根据编码器的隐状态向量,通过基于多头注意力机制的解码器,得到问题在当前语法框架下的逻辑形式;表示如下:zdec=decoderhenc;θdec 其中,decoder是解码器函数,θdec是编码器函数的可训练参数,zdec是解码器函数的隐状态向量,Pydec|x表示ydec相对于ydec的概率,ydec是输入序列,ydec是解码任务的真实标签,Wdec是一个线性层,用以转换解码器隐状态向量的维度;步骤7:根据编码器的隐状态向量最后一位、解码器的隐状态向量和知识库知识,预测问题中的关系ID和实体类型ID;步骤8:将实体ID、关系ID、实体类型ID与解码得到的逻辑形式整合,得到可在知识库上执行的查询语句;步骤9:在知识库中执行该查询语句,得到当前问题对应的答案。
全文数据:
权利要求:
百度查询: 天津大学 一种对话式知识库问答实现方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。