Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于历史对话和外部知识的多轮自然语言理解算法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本发明旨在解决现有方法在处理多轮对话场景中存在的问题和挑战。为了实现更好的多轮对话的场景,本发明对RCGT进行了轻量化改进,提出了RCGT‑MTMulti‑Turn的模型方案,具体技术方案包括:为了缓解下游的对话管理模块的差错累积问题,以及针对历史对话上下文信息没有得到充分利用的问题,本发明对历史对话上下文信息进行编码,并引入历史对话上下文注意力机制,对历史对话和对话行为进行编码,并通过上下文注意力机制聚合历史对话中的信息,为自然语言理解任务引入更丰富的信息,以缓解多轮对话中的差错累积和歧义问题。针对用户输入在不同领域的语境中存在歧义和缺少背景知识的问题,本发明采用了外部知识库用于引入专业的领域知识,特别是在用户提出的问题需要特定的背景信息才能正确理解时,能够帮助模型更好地理解用户的意图,并缓解歧义问题。为了解决随着对话轮次增加导致的历史上下文信息利用不充分的问题,本发明引入了全局注意力机制,用于计算每一轮历史对话信息的权重,更充分高效地实现历史对话信息的利用。

主权项:1.一种基于历史对话和外部知识的多轮自然语言理解算法,其特征在于包含以下步骤:步骤1:历史上下文编码层采用TOD-BERT对历史对话进行编码。历史上下文编码层的输入是历史对话文本Uprev={U1,U2,…,Ut-1},针对任意一轮历史对话Ui∈Uprev,在分词阶段引入[CLS]、[SYS]、[USR]标签,这一步的目的是为了引入更多的语义信息。在经过编码之后,历史轮次的上下文信息将被融合到[CLS]标签的嵌入中,将[CLS]标签的嵌入进行拼接,为了避免输入过大,输入的历史对话轮数是由超参数tH控制的,每次仅对最新的tH轮历史对话进行编码;步骤2:历史对话动作中同样也蕴含了信息,可以用于引导自然语言理解任务以提升当前轮次自然语言理解的效果,为了对对话动作和其对应的槽位进行编码,本发明在对话动作编码层中引入了两个嵌入矩阵和其中|labelA|和|labelS|分别表示对话动作的标签数和槽位的标签数。通过对话动作编码层,得到对话动作和对应槽位的嵌入,本发明采用GloVe300d作为外部知识库初始化嵌入矩阵。最后,将对话动作和对应槽位的嵌入向量求和,得到对话动作嵌入;步骤3:为了模拟查询专业背景知识能力,本发明提出了一种利用外部知识库来增强对话系统理解能力的方法。具体而言,选用DBPedia作为外部知识库,该知识库汇聚了来自维基百科的结构化信息,覆盖了广泛的领域和主题,能够为系统提供了丰富而广泛的知识基础;步骤4:为了有效地融合历史上下文信息,本发明设计了一种创新的注意力机制框架,结合了历史上下文注意力机制和对话动作注意力机制。在传统的历史上下文注意力机制中,各轮对话信息往往被等同对待,导致了潜在的问题:随着对话轮次的增加,与当前任务无关的历史信息被引入,可能会引起解析的歧义,并降低系统的准确性和效率;步骤5:输入经过词嵌入编码层、外部知识注意力层和全局-局部注意力层后,本步骤将得到的上下文向量进行拼接,为了获取句子中的时序特征,捕捉到句子中较长距离的依赖关系,对句子的上下文信息进行建模,将上下文向量通过Bi-LSTM捕获时序特征,本步骤复用了RCGT算法框架,该框架经由槽位-意图交互层对经过全注意力机制显式构建意图和槽位标签上下文向量,基于对话中的动态语境及槽位和意图间的双向依赖关系对槽位信息、历史上下文信息和外部知识进行融合,随后利用解码器推断出意图标签。得到意图标签后,算法进一步将其与包含了历史上下文信息和外部知识原始输入联合起来,送入意图-槽位交互层。捕捉当前输入的语义细节的同时,还整合了由意图识别层推断的意图标签所提供的意图上下文信息,并结合了历史上下文信息,从而优化了对槽位标签的预测;步骤6:将上述模块进行连接,鉴于实际对话场景中经常遇到的正负样本不均衡问题,即正类样本与负类样本的数量差异显著,选择了自适应选择性损失函数ASL作为优化目标。ASL通过引入学习权重γ+和γ-,能够增大对难以分类的样本的关注度的同时,对正简单样本的关注度也不会减少,以缓解正负样本不均衡带来的影响,从而提高算法在多意图识别场景下的鲁棒性和准确率。为了实现两个任务的联合优化,将两个任务的损失函数进行加权和,得到最终的损失函数。对于槽位填充任务,将其视为序列标注问题。为了更准确地捕捉标注序列中的依赖关系,并提供结构化的预测输出,采用了条件随机场CRF作为解码器。在CRF框架中,利用负对数似然损失函数,确保在模型训练过程中最小化预测序列与真实序列之间的概率偏差。

全文数据:

权利要求:

百度查询: 电子科技大学 一种基于历史对话和外部知识的多轮自然语言理解算法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。