一种基于历史对话和外部知识的多轮自然语言理解算法

导航：龙图腾网> 最新专利技术> 一种基于历史对话和外部知识的多轮自然语言理解算法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明旨在解决现有方法在处理多轮对话场景中存在的问题和挑战。为了实现更好的多轮对话的场景，本发明对RCGT进行了轻量化改进，提出了RCGT‑MTMulti‑Turn的模型方案，具体技术方案包括：为了缓解下游的对话管理模块的差错累积问题，以及针对历史对话上下文信息没有得到充分利用的问题，本发明对历史对话上下文信息进行编码，并引入历史对话上下文注意力机制，对历史对话和对话行为进行编码，并通过上下文注意力机制聚合历史对话中的信息，为自然语言理解任务引入更丰富的信息，以缓解多轮对话中的差错累积和歧义问题。针对用户输入在不同领域的语境中存在歧义和缺少背景知识的问题，本发明采用了外部知识库用于引入专业的领域知识，特别是在用户提出的问题需要特定的背景信息才能正确理解时，能够帮助模型更好地理解用户的意图，并缓解歧义问题。为了解决随着对话轮次增加导致的历史上下文信息利用不充分的问题，本发明引入了全局注意力机制，用于计算每一轮历史对话信息的权重，更充分高效地实现历史对话信息的利用。

主权项：1.一种基于历史对话和外部知识的多轮自然语言理解算法，其特征在于包含以下步骤：步骤1：历史上下文编码层采用TOD-BERT对历史对话进行编码。历史上下文编码层的输入是历史对话文本Uprev＝{U1,U2,…,Ut-1}，针对任意一轮历史对话Ui∈Uprev，在分词阶段引入[CLS]、[SYS]、[USR]标签，这一步的目的是为了引入更多的语义信息。在经过编码之后，历史轮次的上下文信息将被融合到[CLS]标签的嵌入中，将[CLS]标签的嵌入进行拼接，为了避免输入过大，输入的历史对话轮数是由超参数tH控制的，每次仅对最新的tH轮历史对话进行编码；步骤2：历史对话动作中同样也蕴含了信息，可以用于引导自然语言理解任务以提升当前轮次自然语言理解的效果，为了对对话动作和其对应的槽位进行编码，本发明在对话动作编码层中引入了两个嵌入矩阵和其中|labelA|和|labelS|分别表示对话动作的标签数和槽位的标签数。通过对话动作编码层，得到对话动作和对应槽位的嵌入，本发明采用GloVe300d作为外部知识库初始化嵌入矩阵。最后，将对话动作和对应槽位的嵌入向量求和，得到对话动作嵌入；步骤3：为了模拟查询专业背景知识能力，本发明提出了一种利用外部知识库来增强对话系统理解能力的方法。具体而言，选用DBPedia作为外部知识库，该知识库汇聚了来自维基百科的结构化信息，覆盖了广泛的领域和主题，能够为系统提供了丰富而广泛的知识基础；步骤4：为了有效地融合历史上下文信息，本发明设计了一种创新的注意力机制框架，结合了历史上下文注意力机制和对话动作注意力机制。在传统的历史上下文注意力机制中，各轮对话信息往往被等同对待，导致了潜在的问题：随着对话轮次的增加，与当前任务无关的历史信息被引入，可能会引起解析的歧义，并降低系统的准确性和效率；步骤5：输入经过词嵌入编码层、外部知识注意力层和全局-局部注意力层后，本步骤将得到的上下文向量进行拼接，为了获取句子中的时序特征，捕捉到句子中较长距离的依赖关系，对句子的上下文信息进行建模，将上下文向量通过Bi-LSTM捕获时序特征，本步骤复用了RCGT算法框架，该框架经由槽位-意图交互层对经过全注意力机制显式构建意图和槽位标签上下文向量，基于对话中的动态语境及槽位和意图间的双向依赖关系对槽位信息、历史上下文信息和外部知识进行融合，随后利用解码器推断出意图标签。得到意图标签后，算法进一步将其与包含了历史上下文信息和外部知识原始输入联合起来，送入意图-槽位交互层。捕捉当前输入的语义细节的同时，还整合了由意图识别层推断的意图标签所提供的意图上下文信息，并结合了历史上下文信息，从而优化了对槽位标签的预测；步骤6：将上述模块进行连接，鉴于实际对话场景中经常遇到的正负样本不均衡问题，即正类样本与负类样本的数量差异显著，选择了自适应选择性损失函数ASL作为优化目标。ASL通过引入学习权重γ+和γ-，能够增大对难以分类的样本的关注度的同时，对正简单样本的关注度也不会减少，以缓解正负样本不均衡带来的影响，从而提高算法在多意图识别场景下的鲁棒性和准确率。为了实现两个任务的联合优化，将两个任务的损失函数进行加权和，得到最终的损失函数。对于槽位填充任务，将其视为序列标注问题。为了更准确地捕捉标注序列中的依赖关系，并提供结构化的预测输出，采用了条件随机场CRF作为解码器。在CRF框架中，利用负对数似然损失函数，确保在模型训练过程中最小化预测序列与真实序列之间的概率偏差。

全文数据：

权利要求：

百度查询：电子科技大学一种基于历史对话和外部知识的多轮自然语言理解算法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：基于ODDM调制的MIMO系统信道估计方法和装置

下一篇：一种矿用随车吊吊臂及操作方法

相关技术

基于ODDM调制的MIMO系统信道估计方法和装置

一种矿用随车吊吊臂及操作方法

一种用于锂电池EIS检测的单电感多输入单输出DC-DC系统及其控制方法

网格网络的资源竞争和冲突解决方法、装置和存储介质

低温红外焦面高精度、低热串扰、集成式杜瓦封装结构

一种电缆插接套管打磨修复装置

基于云网络的数据流传输控制方法、装置及设备

具有锁水功能的卤水提升泵冲洗装置

一种芯片通用式具有压力调节功能的固晶设备及热压方法

一种高效智能条袋自动翻转运送机构

基于DPVS的负载均衡方法、装置、设备及存储介质

一种实木饰面贴合方法

自然相关技术

一种自然资源规划测量装置_山东省地质矿产勘查开发局第五地质大队(山东省第五地质矿产勘查院)_202411430925.X

复杂自然场景下的棉铃检测方法及系统_山东锋士信息技术有限公司_202210086584.3

一种自然孵化观察录像装置_深圳市积加创新技术有限公司_202420951225.4

富集自然杀伤细胞的全封闭方法及系统_杭州百瑞竞康生物技术有限公司_202411288100.9

一种护眼自然光显示器_深圳市鹰芒技术有限公司_202420970853.7

自然语言处理驱动的智能文本检索与分析系统_北京华档致远科技有限公司_202410500191.1

基于自然语言处理的程序语义混淆方法及系统_中国人民解放军网络空间部队信息工程大学_202210160695.4

一种自然资源模型展示用立体教具_中国地质调查局廊坊自然资源综合调查中心_202411434824.X

一种基于协议自然冗余的分组容错定界方法_中国人民解放军网络空间部队信息工程大学_202410389740.2

一种基于自然资源资产生态补偿成效的监测架_浙江文澜信息发展有限公司_202420381580.2

知识相关技术

基于多关系知识增强图卷积网络的知识图谱嵌入方法及系统_重庆邮电大学_202411219852.X

基于知识图谱的个性化推荐方法_中南大学_202210151759.4

基于知识图谱的语义通信方法和系统_中国人民解放军国防科技大学_202210461166.8

用于审计文书的知识图谱生成方法_汉中市审计局_202111180977.2

基于康养知识的大型语言模型问答系统_浙江孚宝智能科技有限公司_202411572571.2

基于模态层次融合的多模态知识图谱补全方法_福州大学_202411113918.7

一种基于物联网多维数据的知识智能生成系统_广州机智云物联网科技有限公司_202411017257.8

一种跨部门企业信用信息知识图谱多维度融合方法_湖南工商大学_202411574900.7

知识图谱辅助构建方法、装置、设备及存储介质_讯飞智元信息科技有限公司_202111298783.2

知识问答方法、装置、电子设备和可读存储介质_中国科学院自动化研究所_202211193891.8

语言相关技术

语言模型并行推理方法及系统_杭州征信有限公司_202411580652.7

基于跨语言统一词表示的远距离语言神经机器翻译方法_昆明理工大学_202411109377.0

一种用于多语言翻译的高资源语言优先的机器翻译方法_北京航空航天大学_202410417430.7

滥用语言检测方法、装置及存储介质_中国科学院自动化研究所_202310737400.X

基于大语言模型的问题生成方法_浙江工商大学_202411098663.1

用于多语言的语音识别方法_南京听说科技有限公司_202410998260.6

基于康养知识的大型语言模型问答系统_浙江孚宝智能科技有限公司_202411572571.2

基于视觉语言模型的船只目标检测方法_中国人民解放军海军航空大学_202411190239.X

大语言模型的优化方法、装置及相关设备_北京中科金得助智能科技有限公司_202411147753.5

一种语言模型的推理优化方法_上海稀宇科技有限公司_202411076211.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于历史对话和外部知识的多轮自然语言理解算法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务